نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه مهندسی علوم خاک، دانشگاه زنجان، زنجان، ایران

2 گروه مهندسی نقشه‌برداری، دانشکده مهندسی عمران، دانشگاه تربیت دبیر شهید رجائی، تهران، ایران

3 گروه مرتع و آبخیزداری، دانشکده منابع طبیعی، دانشگاه کردستان، کردستان، ایران

چکیده

پیشینه و اهداف: هر کشوری به خاک به‌عنوان یک منبع طبیعی حیاتی، متکی است که به‌طور قابل توجهی در حفظ محیط زیست و تولید مواد غذایی کمک می‌کند. تهیه نقشه توزیع عناصر غذایی خاک به‌عنوان یک ابزار ارزشمند برای تصمیم‌گیری مدیران عمل می‌کند. با توجه به ماهیت زمان‌بر و پرهزینه آنالیز آزمایشگاهی برای این متغیرها در مقیاس بزرگ، تلاش‌هایی برای کاوش نیتروژن خاک از طریق سنجش از دور انجام شده است. پژوهش حاضر، به کاربرد روش‌های سنجش از دور همراه با مدل‌های رگرسیون و تصادفی جنگل برای پیش‌بینی نیتروژن کل خاک در استان گیلان می‌پردازد. این مطالعه، با هدف پاسخ به دو سوال اصلی انجام شد: (1) آیا می‌توان از داده‌های SAR برای تعیین مقدار نیتروژن کل خاک استفاده کرد؟ (ب) الگوریتم‌های ماشین بردار پشتیبانی (SVM)، درخت رگرسیون تقویت‌شده (BRT) و جنگل تصادفی (RF) در پیش‌بینی محتوای نیتروژن خاک چگونه عمل می‌کنند؟
روش‌ها‌: این مطالعه بر ارزیابی قابلیت‌های داده‌ای ماهواره‌های Landsat-9 و Sentinel-1 به‌صورت جداگانه و ترکیبی، با استفاده از الگوریتم‌های پیشرفته مانند SVM، RF و BRT متمرکز شد.. نمونه‌برداری هدفمند به‌صورت استراتژیک انجام شد تا شرایط متنوع منطقه مورد مطالعه را بر اساس پوشش زمین/ کاربری زمین، پارامترهای اقلیمی و توپوگرافیکی نشان دهد. متغیرهای مختلف، از جمله پارامترهای آب‌وهوایی، اجزای توپوگرافی، و شاخص‌های زیرگروه سنجش از دور، در ارتباط با داده‌های SAR و تصاویر نوری مورد بررسی قرار گرفتند. الگوریتم‌های یادگیری ماشین غیرخطی، به‌ویژه SVM، RF و BRT برای پیش‌بینی وضعیت نیتروژن کل خاک با مدل‌سازی روابط پیچیده بین خواص خاک و متغیرهای محیطی مورد استفاده قرار گرفتند. نرم افزار R، با استفاده از بسته CARET برای ورودی پارامتر، برای پیاده‌سازی الگوریتم استفاده شد.
یافته‌ها: نتایج، حاکی از موارد زیر بود: عملکرد الگوریتم‌های RF و BRT از SVM پیشی گرفت و در پایش مقادیر نیتروژن کل خاک مؤثر بود، تصاویر SAR چند زمانی دقت بالاتری را در نظارت بر محتوای نیتروژن کل خاک در مقایسه با داده‌های سنجش از دور نوری نشان دادند و پیش‌بینی‌های واقعی‌تر را در خاک‌های شالیزاری تسهیل کردند، ادغام متغیرهای محیطی منجر به افزایش دقت الگوریتم‌ها شد. متغیرهای سنجش از دور، نقش مهمی را در این پژوهش ایفا کردند و به ترتیب، تأثیر 61 و 51 درصدی در الگوریتم‌های RF و BRT گزارش شد. مقایسه الگوریتم‌های SVM و RF نشان داد که RF پس از اجرای الگوریتم BRT در رتبه دوم قرار دارد و دقت برآورد نیتروژن کل خاک با الگوریتم SVM به‌دست نیامد. با این حال، الگوریتم‌های BRT و RF قادر به نظارت بر تغییرات نیتروژن کل خاک بودند و BRT با ثبت دقیق 58٪ تغییرات به‌دلیل مقدار R2 بالاتر (58/0) و مقادیر RMSE (25/0 میلی­گرم بر کیلوگرم) و  MAE (19/0 میلی­گرم بر کیلوگرم) کمتر، عملکرد بهتری داشت.
نتیجه‌گیری: در انتها، موارد کلیدی زیر به­عنوان نتیجه­گیری کلی از این پژوهش استخراج شد: 1) الگوریتم‌های RF و BRT در نظارت بر سطوح نیتروژن کل خاک به‌طور مؤثر بهتر از SVM عمل کردند، 2) تصاویر SAR چند زمانی دقت بالایی در ردیابی نیتروژن کل خاک در مقایسه با سنجش از دور نوری ارائه می‌دهند و پیش‌بینی دقیق را در خاک‌های شالیزاری تسهیل می‌کنند، 3) ترکیب متغیرهای محیطی باعث افزایش دقت الگوریتمی شد و 4) متغیرهای سنجش از دور به ترتیب 61 و 51 درصد به الگوریتم های RF و BRT کمک کردند.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Prediction of Total Soil Nitrogen Variations Using Three Machine Learning Approaches and Remote Sensing Data

نویسندگان [English]

  • Sh. Felegari 1
  • K. Moravej 1
  • A. Sharifi 2
  • A. Golchin 1
  • P. Karami 3

1 Department of Soil Science, Faculty of Agriculture, University of Zanjan, Zanjan, Iran

2 Department of Geomatics and Surveying Engineering, Faculty of Civil Engineering, Shahid Rajaee Teacher Training University, Tehran, Iran

3 Department of Range and Watershed Management, Faculty of Natural Resources, University of Kurdistan, Kurdistan, Iran

چکیده [English]

Background and Objectives: Every country relies on soil as a vital natural resource that significantly contributes to environmental conservation and food production. Preparation of soil nutrient distribution map serves as a valuable tool for managers to make decisions. Due to the time-consuming and expensive nature of laboratory analysis for these variables on a large scale, efforts have been made to explore soil nitrogen through remote sensing. The current research deals with the application of remote sensing methods along with regression and random forest models to predict total soil nitrogen in Gilan province. This study aimed to answer two main questions: (1) Can SAR data be used to quantify total soil nitrogen (TSN) (2) How do SVM, BRT and RF algorithms perform in predicting soil nitrogen content?
Methods: This study focused on evaluating the data capabilities of Landsat-9 and Sentinel-1 satellites individually and in combination, using advanced algorithms such as Support Vector Machine (SVM), Boosted Regression Tree (BRT), and Random Forest (RF). The purpose of this evaluation was strategic, aiming to showcase the diverse conditions of the study area based on land cover/land use, climatic, and topographical parameters. Various variables, including climate parameters, topographic components, and remote sensing subscale indices, were investigated in conjunction with SAR data and optical images. Nonlinear machine learning algorithms, specifically SVM, RF, and BRT, were employed to predict total soil nitrogen status by modeling complex relationships between soil properties and environmental variables. R software, utilizing the CARET package for parameter input, was employed to implement the algorithm.
Findings: The results indicated the following: RF and BRT algorithms outperformed SVM and were effective in monitoring total soil nitrogen values. Multi-temporal SAR images showed higher accuracy in monitoring total soil nitrogen content compared to optical remote sensing data, facilitating more realistic predictions in paddy soils. The integration of environmental variables led to an increase in the accuracy of algorithms, where remote sensing variables played a crucial role, contributing to 61% and 51% effects in RF and BRT algorithms, respectively. The comparison of SVM and RF algorithms revealed that RF ranked second after the BRT algorithm, and the accuracy of total soil nitrogen estimation was not achieved with the SVM algorithm. However, both BRT and RF algorithms were able to monitor changes in total soil nitrogen. BRT performed better, accurately recording 58% of changes, as evidenced by a higher R2 value (0.58) and lower RMSE (0.25 mg/kg) and MAE (0.19 mg/kg) values.
Conclusion: In conclusion, the following key points were extracted from this research: 1) RF and BRT algorithms outperformed SVM in effectively monitoring total soil nitrogen levels; 2) multi-temporal SAR images demonstrated higher accuracy in tracking total soil nitrogen compared to optical remote sensing, enabling precise predictions in paddy soils; 3) the incorporation of environmental variables enhanced algorithmic accuracy; and 4) remote sensing variables contributed 61% and 51% to RF and BRT algorithms, respectively.

کلیدواژه‌ها [English]

  • Boosted Regression Trees Landsat-9
  • Random Forest
  • Sentinel-1
  • Support Vector Machine
  • Total Soil Nitrogen

COPYRIGHTS 
© 2024 The Author(s).  This is an open-access article distributed under the terms and conditions of the Creative Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) (https://creativecommons.org/licenses/by-nc/4.0/

[18] Kjeldahl J. A new method for the determination of nitrogen in organic matter. Zeitschrift Für Analytische Chemie 1883.
[19] Vapnik VN. The nature of statistical learning theory. Statistics for Engineering and Information Science. Springer-Verlag, New York 2000.