نوع مقاله : مقاله پژوهشی
نویسندگان
گروه سیستم های اطلاعات مکانی، دانشکده مهندسی نقشه برداری، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران
چکیده
پیشینه و اهداف: پیشبینی دقیق میزان محصول کشاورزی یکی از ابزارهای اساسی برای مدیریت منابع کشاورزی، بهبود امنیت غذایی و افزایش بهرهوری تجارت بینالمللی محصولات است. با توجه به محدودیتهای روشهای سنتی در پیشبینی دقیق و سریع، تصاویر سنجش از دور ماهوارهای به دلیل توانایی پوشش مناطق وسیع و ارائه دادههای دقیق، بهطور گستردهای جایگزین شدهاند. در این میان، پیشرفتهای یادگیری ماشین و یادگیری گروهی نقش مهمی در شناسایی روابط پیچیده میان متغیرهای محیطی و بازده محصولات ایفا کردهاند. مدلهای نوین یادگیری گروهی، توانستهاند دقت پیشبینیها را بهطور قابل توجهی افزایش دهند و اطلاعات ارزشمندی برای کشاورزان و سیاستگذاران فراهم کنند. این پژوهش با هدف توسعه مدلی نوآورانه مبتنی بر ترکیب مدل XGBoost و الگوریتم بهینهسازی پلیکان (POA) بهمنظور پیشبینی دقیقتر میزان محصول ذرت در غرب میانه ایالات متحده انجام شده است. رویکرد پیشنهادی با بررسی تأثیر بازههای مختلف فنولوژی گیاه و انتخاب بازه بهینه (ژوئیه تا اوت)، امکان پیشبینی دقیق محصول را پیش از برداشت فراهم میکند. این مدل میتواند تصمیمگیریهای مؤثری در زمینه مدیریت منابع، کاهش خسارات ناشی از نوسانات اقلیمی، و ارتقای سیاستهای کشاورزی ارائه دهد.
روش و مواد: این پژوهش با هدف پیشبینی میزان محصول ذرت در پنج ایالت غرب میانه کشور آمریکا (ایلینوی، آیووا، مینهسوتا، داکوتای شمالی و داکوتای جنوبی) که از مناطق اصلی تولید ذرت هستند، انجام شده است. دادههای استفادهشده شامل اطلاعات سنجش از دور (مانند شاخص نرمال شده تفاوت پوشش گیاهی (NDVI)، شاخص پوشش گیاهی بهبود یافته (EVI)، شاخص سطح برگ (LAI)، شاخص جزء جذبشده تابش فتوسنتز فعال (FPAR)، تولید اولیه ناخالص (GPP)، و تبخیر و تعرق (ET))، دادههای آبوهوایی (نظیر دما و بارش)، دادههای زمینهای زراعی، و بازده محصول، طی بازه زمانی 2011 تا 2020 و فصل رشد (اواسط اردیبهشت تا اواسط مهر) جمعآوری شدهاند. مدلسازی با استفاده از الگوریتم یادگیری گروهی XGBoost انجام شد و تنظیم پارامترهای آن با استفاده از الگوریتم بهینهسازی پلیکان (POA) برای بهبود دقت صورت گرفت. دادهها ابتدا با شاخص VFI فیلتر شده و از 9 سال بهعنوان داده آموزشی و یک سال بهعنوان داده آزمون استفاده شد. عملکرد مدل با شاخصهایی نظیر MAPE، MBE، MAE، RMSE و ضریب همبستگی ارزیابی شد.
یافتهها: نتایج ارزیابی مدل POA-XGBoost نشان داد که این روش عملکردی برجسته در پیشبینی میزان محصول ذرت دارد. در بازه زمانی 2011 تا 2020، روند اعتبارسنجی پیشبینی میزان محصول ذرت نشاندهنده تغییرات در دقت پیشبینیها و بایاس بود. در سالهای ابتدایی (2011 تا 2014)، مقادیر خطاها کاهش و دقت پیشبینیها بهبود یافت؛ بهطوریکه در سال 2014 مقدار MAPE به 26/6% و ضریب همبستگی به 9372/0 رسید. در سالهای میانی (2015 تا 2018)، افزایش خطاها و بایاس مثبت به همراه کاهش دقت پیشبینیها مشاهده شد، بهویژه در سال 2018 که مقدار MBE به 8039/0 و ضریب همبستگی به 8083/0 کاهش یافت. در سالهای پایانی (2019 و 2020)، بهبود قابلتوجهی در دقت پیشبینیها مشاهده شد؛ بهطوریکه در سال 2020 مقدار MAPE به 57/6% و ضریب همبستگی به 9237/0 رسید.
نتیجهگیری: مدل بهینه POA-XGBoost توانایی بالایی در پیشبینی بازده محصول ذرت در شرایط مختلف آبوهوایی نشان داده است و میتواند در آینده برای پیشبینی سایر محصولات کشاورزی نیز گسترش یابد. استفاده از تکنیکهای پیشرفته یادگیری گروهی و دادههای متنوع مانند تصاویر ماهوارهای و دادههای هواشناسی، راهحلهای مؤثری برای بهبود پیشبینی بازده محصولات ارائه میدهد. این پژوهش بر ضرورت توسعه مدلهای ترکیبی جدید تأکید دارد که میتوانند به کشاورزان و مدیران در مدیریت منابع، افزایش بهرهوری، و کاهش ریسک کمک کنند.
کلیدواژهها
موضوعات
عنوان مقاله [English]
Predicting Corn Yield Using Ensemble Learning with Satellite and Meteorological Data
نویسندگان [English]
- A. Sabzali Yameqani
- A. A. Alesheikh
Department of Geospatial Information Systems, Faculty of Geodesy and Geomatics Engineering, K. N. Toosi University of Technology, Tehran, Iran
چکیده [English]
Background and Objectives: Precise agricultural yield prediction is among the most important tools for managing agricultural resources, improving food security, and enhancing the productivity of international trade in agricultural products. The satellite remote sensing images has become widely adopted because traditional methods cannot provide the needed accurate and timely predictions, and it covers large areas while providing accurate data. The advances in machine learning and ensemble learning have identified the complex interaction of environmental variables with crop yield. In modern times, ensemble learning models have achieved much higher prediction accuracy and provided useful insights to farmers and policy makers.
This study aims to develop an innovative model that combines the XGBoost algorithm with the Pelican Optimization Algorithm (POA) to predict corn yields more accurately in the U.S. Midwest. The approach will provide an opportunity for the pre-harvest yield prediction by considering the plant phenological stages and optimal time range from July to August. The model will help the decision-makers to take effective measures on resource management to overcome the climate fluctuations and develop better agricultural policies.
Methods and Materials: This research focuses on predicting corn yields in five key corn-producing states in the U.S. Midwest (Illinois, Iowa, Minnesota, North Dakota, and South Dakota). This paper will utilize remote sensing information, including NDVI (Normalized Difference Vegetation Index), EVI (Enhanced Vegetation Index), LAI (Leaf Area Index), FPAR (Fraction of Photosynthetically Active Radiation), GPP (Gross Primary Production), and ET (Evapotranspiration); meteorological data, including temperature and precipitation; cropland data; and yield statistics during the growing season over the period 2011–2020 (May to September). XGBoost ensemble learning was used, whose hyperparameters were optimized with the Pelican Optimization Algorithm (POA) to enhance its accuracy. Filtration was performed on data using the VFI index. Nine years were used as training data, while one year was used as a test. For evaluating the performance, MAPE, MBE, MAE, RMSE, and the correlation coefficient have been used.
Findings: The evaluation results of the POA-XGBoost model demonstrated its outstanding performance in predicting corn yields. During the 2011–2020 timeframe, validation trends highlighted variations in prediction accuracy and bias. In the first period, which includes 2011–2014, the errors went down and the prediction accuracy improved: MAPE reached 6.26%, while in 2014 the correlation coefficient increased to 0.9372. During the middle period of 2015–2018, the errors and positive bias showed an upward trend, especially during 2018, where MBE rose to 0.8039 and the correlation coefficient fell to 0.8083. However, the last two years (2019–2020) revealed much improved results: MAPE comprises 6.57%, while the correlation coefficient is as high as 0.9237 in 2020.
Conclusion: The optimized POA-XGBoost model demonstrated high capability in predicting corn yields under diverse climatic conditions and can be extended to forecast other crops in the future. Advanced ensemble learning techniques combined with diverse data sources, such as satellite imagery and meteorological data, provide effective solutions for improving crop yield predictions. The study calls for the development of new hybrid models that will enable farmers and managers to better manage resources, increase productivity, and minimize risks.
کلیدواژهها [English]
- Ensemble Learning
- Yield Prediction
- Pelican Optimization Algorithm
- Corn