نوع مقاله : مقاله پژوهشی

نویسندگان

گروه سیستم های اطلاعات مکانی، دانشکده مهندسی نقشه برداری، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران

چکیده

پیشینه و اهداف: پیش‌بینی دقیق میزان محصول کشاورزی یکی از ابزارهای اساسی برای مدیریت منابع کشاورزی، بهبود امنیت غذایی و افزایش بهره‌وری تجارت بین‌المللی محصولات است. با توجه به محدودیت‌های روش‌های سنتی در پیش‌بینی دقیق و سریع، تصاویر سنجش از دور ماهواره‌ای به دلیل توانایی پوشش مناطق وسیع و ارائه داده‌های دقیق، به‌طور گسترده‌ای جایگزین شده‌اند. در این میان، پیشرفت‌های یادگیری ماشین و یادگیری گروهی نقش مهمی در شناسایی روابط پیچیده میان متغیرهای محیطی و بازده محصولات ایفا کرده‌اند. مدل‌های نوین یادگیری گروهی، توانسته‌اند دقت پیش‌بینی‌ها را به‌طور قابل توجهی افزایش دهند و اطلاعات ارزشمندی برای کشاورزان و سیاست‌گذاران فراهم کنند. این پژوهش با هدف توسعه مدلی نوآورانه مبتنی بر ترکیب مدل XGBoost و الگوریتم بهینه‌سازی پلیکان (POA) به‌منظور پیش‌بینی دقیق‌تر میزان محصول ذرت در غرب میانه ایالات متحده انجام شده است. رویکرد پیشنهادی با بررسی تأثیر بازه‌های مختلف فنولوژی گیاه و انتخاب بازه بهینه (ژوئیه تا اوت)، امکان پیش‌بینی دقیق محصول را پیش از برداشت فراهم می‌کند. این مدل می‌تواند تصمیم‌گیری‌های مؤثری در زمینه مدیریت منابع، کاهش خسارات ناشی از نوسانات اقلیمی، و ارتقای سیاست‌های کشاورزی ارائه دهد.
روش و مواد‌: این پژوهش با هدف پیش‌بینی میزان محصول ذرت در پنج ایالت غرب میانه کشور آمریکا (ایلینوی، آیووا، مینه‌سوتا، داکوتای شمالی و داکوتای جنوبی) که از مناطق اصلی تولید ذرت هستند، انجام شده است. داده‌های استفاده‌شده شامل اطلاعات سنجش از دور (مانند شاخص نرمال شده تفاوت پوشش گیاهی (NDVI)، شاخص پوشش گیاهی بهبود یافته (EVI)، شاخص سطح برگ (LAI)، شاخص جزء جذب‌شده تابش فتوسنتز فعال (FPAR)، تولید اولیه ناخالص (GPP)، و تبخیر و تعرق (ET))، داده‌های آب‌وهوایی (نظیر دما و بارش)، داده‌های زمین‌های زراعی، و بازده محصول، طی بازه زمانی 2011 تا 2020 و فصل رشد (اواسط اردیبهشت تا اواسط مهر) جمع‌آوری شده‌اند. مدل‌سازی با استفاده از الگوریتم یادگیری گروهی XGBoost انجام شد و تنظیم پارامترهای آن با استفاده از الگوریتم بهینه‌سازی پلیکان (POA) برای بهبود دقت صورت گرفت. داده‌ها ابتدا با شاخص VFI فیلتر شده و از 9 سال به‌عنوان داده آموزشی و یک سال به‌عنوان داده آزمون استفاده شد. عملکرد مدل با شاخص‌هایی نظیر MAPE، MBE، MAE، RMSE و ضریب همبستگی ارزیابی شد.
یافته‌ها: نتایج ارزیابی مدل POA-XGBoost نشان داد که این روش عملکردی برجسته در پیش‌بینی میزان محصول ذرت دارد. در بازه زمانی 2011 تا 2020، روند اعتبارسنجی پیش‌بینی میزان محصول ذرت نشان‌دهنده تغییرات در دقت پیش‌بینی‌ها و بایاس بود. در سال‌های ابتدایی (2011 تا 2014)، مقادیر خطاها کاهش و دقت پیش‌بینی‌ها بهبود یافت؛ به‌طوری‌که در سال 2014 مقدار MAPE به 26/6% و ضریب همبستگی به 9372/0 رسید. در سال‌های میانی (2015 تا 2018)، افزایش خطاها و بایاس مثبت به همراه کاهش دقت پیش‌بینی‌ها مشاهده شد، به‌ویژه در سال 2018 که مقدار MBE به 8039/0 و ضریب همبستگی به 8083/0 کاهش یافت. در سال‌های پایانی (2019 و 2020)، بهبود قابل‌توجهی در دقت پیش‌بینی‌ها مشاهده شد؛ به‌طوری‌که در سال 2020 مقدار MAPE به 57/6% و ضریب همبستگی به 9237/0 رسید.
نتیجه‌گیری: مدل بهینه POA-XGBoost توانایی بالایی در پیش‌بینی بازده محصول ذرت در شرایط مختلف آب‌وهوایی نشان داده است و می‌تواند در آینده برای پیش‌بینی سایر محصولات کشاورزی نیز گسترش یابد. استفاده از تکنیک‌های پیشرفته یادگیری گروهی و داده‌های متنوع مانند تصاویر ماهواره‌ای و داده‌های هواشناسی، راه‌حل‌های مؤثری برای بهبود پیش‌بینی بازده محصولات ارائه می‌دهد. این پژوهش بر ضرورت توسعه مدل‌های ترکیبی جدید تأکید دارد که می‌توانند به کشاورزان و مدیران در مدیریت منابع، افزایش بهره‌وری، و کاهش ریسک کمک کنند.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Predicting Corn Yield Using Ensemble Learning with Satellite and Meteorological Data

نویسندگان [English]

  • A. Sabzali Yameqani
  • A. A. Alesheikh

Department of Geospatial Information Systems, Faculty of Geodesy and Geomatics Engineering, K. N. Toosi University of Technology, Tehran, Iran

چکیده [English]

Background and Objectives: Precise agricultural yield prediction is among the most important tools for managing agricultural resources, improving food security, and enhancing the productivity of international trade in agricultural products. The satellite remote sensing images has become widely adopted because traditional methods cannot provide the needed accurate and timely predictions, and it covers large areas while providing accurate data. The advances in machine learning and ensemble learning have identified the complex interaction of environmental variables with crop yield. In modern times, ensemble learning models have achieved much higher prediction accuracy and provided useful insights to farmers and policy makers.
This study aims to develop an innovative model that combines the XGBoost algorithm with the Pelican Optimization Algorithm (POA) to predict corn yields more accurately in the U.S. Midwest. The approach will provide an opportunity for the pre-harvest yield prediction by considering the plant phenological stages and optimal time range from July to August. The model will help the decision-makers to take effective measures on resource management to overcome the climate fluctuations and develop better agricultural policies.
Methods and Materials: This research focuses on predicting corn yields in five key corn-producing states in the U.S. Midwest (Illinois, Iowa, Minnesota, North Dakota, and South Dakota). This paper will utilize remote sensing information, including NDVI (Normalized Difference Vegetation Index), EVI (Enhanced Vegetation Index), LAI (Leaf Area Index), FPAR (Fraction of Photosynthetically Active Radiation), GPP (Gross Primary Production), and ET (Evapotranspiration); meteorological data, including temperature and precipitation; cropland data; and yield statistics during the growing season over the period 2011–2020 (May to September). XGBoost ensemble learning was used, whose hyperparameters were optimized with the Pelican Optimization Algorithm (POA) to enhance its accuracy. Filtration was performed on data using the VFI index. Nine years were used as training data, while one year was used as a test. For evaluating the performance, MAPE, MBE, MAE, RMSE, and the correlation coefficient have been used.
Findings: The evaluation results of the POA-XGBoost model demonstrated its outstanding performance in predicting corn yields. During the 2011–2020 timeframe, validation trends highlighted variations in prediction accuracy and bias. In the first period, which includes 2011–2014, the errors went down and the prediction accuracy improved: MAPE reached 6.26%, while in 2014 the correlation coefficient increased to 0.9372. During the middle period of 2015–2018, the errors and positive bias showed an upward trend, especially during 2018, where MBE rose to 0.8039 and the correlation coefficient fell to 0.8083. However, the last two years (2019–2020) revealed much improved results: MAPE comprises 6.57%, while the correlation coefficient is as high as 0.9237 in 2020.
Conclusion: The optimized POA-XGBoost model demonstrated high capability in predicting corn yields under diverse climatic conditions and can be extended to forecast other crops in the future. Advanced ensemble learning techniques combined with diverse data sources, such as satellite imagery and meteorological data, provide effective solutions for improving crop yield predictions. The study calls for the development of new hybrid models that will enable farmers and managers to better manage resources, increase productivity, and minimize risks.

کلیدواژه‌ها [English]

  • Ensemble Learning
  • Yield Prediction
  • Pelican Optimization Algorithm
  • Corn