نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشکده مهندسی برق و کامپیوتر، دانشگاه علم و فناوری مازندران، بهشهر، ایران

2 دانشکده مهندسی عمران، دانشگاه صنعتی نوشیروانی بابل، بابل، ایران

چکیده

پیشینه و اهداف: با پیشرفت تکنولوژی و پیدایش ماهواره‌های چندمنظوره، اطلاعات لحظه‌ای زیادی از سطح زمین مخابره می‌شود. ماهواره ها به سنجنده هایی مجهز هستند که می توانند با ارسال سیگنالهایی در فرکانسهای مختلف به سطح زمین به اطلاعات مهمی دست یابند. داده‌های دریافتی از این ماهواره‌ها در کاربردهای مختلف علمی و نظامی از جمله: هوانوردی، مطالعات جغرافیایی، هواشناسی، کشاورزی و دیگر حوزه‌های تحقیقاتی قابل استفاده است. حوزه‌ی کشاورزی و پایش سطوح کشت نیز یکی از حوزه‌هایی است که با توجه به مزیت‌های روش‌های سنجش‌ازدور در مقایسه با روش‌های سنتی، به‌عنوان یکی از ابزارهای اصلی در جمع‌آوری اطلاعات محیطی برای کاربردهای پایش نواحی، مورد توجه پژوهشگران قرار گرفته است. یکی از این موضوعات، پایش منطقه‌ای برای بررسی محصولات کشاورزی در مساحت سطح زیرکشت است که استفاده از ابزارهای سنجش‌ازدور و تصاویر ماهواره‌ای به جهت پوشش منطقه‌ای وسیع بسیار کارا است. جهت بررسی خودکار این تصاویر، طبقه‌بندی و بخش‌بندی نواحی سطح زیرکشت، امروزه از روش‌های یادگیری ماشین استفاده می‌شود. در میان این روش‌ها، یادگیری عمیق در مقایسه با دیگر روش‌های یادگیری مانند روش‌های دستی و یا روش‌های نیمه‌خودکار، عملکرد بهتر و سرعت بالاتری دارد.
روش‌ها‌: در این مقاله مدل‌های یادگیری عمیق که برای بخش‌بندی نواحی مناسب هستند مورد استفاده قرار گرفته است. عموما این مدلها بازای هر ورودی، خروجی معادل آن را با همان ابعاد تولید می کنند. لذا  جهت کار بر روی تصاویر ماهواره‌ای، در این پژوهش مدل U-Net بهبود یافته‌ای ارائه شده است. مدل پیشنهادی با استفاده از ViT در گلوگاه مدل برای طبقه‌بندی و بخش‌بندی چهار نوع محصول کشاورزی شامل برنج، گندم، کلزا و ذرت توسعه داده شده است. استفاده از ViT در مقایسه با لایه‌های کانولوشن از لحاظ ایده و پیاده‌سازی الگوریتمی کاراتر است و حجم محاسباتی کمتری دارد. این مدل مشکلات و نقاط ضعف مدل پایه U-Net را که برای مجموعه داده‌های پیچیده، متنوع در شکل، اندازه و بافت به وجود می‌آید، برطرف می‌نماید.
یافته‌ها: در نتایج آزمایشات انجام شده روش پیشنهادی توانسته است با رسیدن به دقت 83.84 و صحت 70.69، بهتر از دیگر روش‌ها دسته‌بندی درستی از 5 محصول مورد نظر را ارائه دهد. همچنین خروجی‌های کیفی نیز نشان‌دهنده‌ی بخش‌بندی بهتر تصاویر ورودی با اعمال روش پیشنهادی می‌باشد. در کنار معیار دقت، دیگر معیارها مانند افت کانونی، بازیابی و MIoU نیز مورد بررسی قرار گرفت که در اکثر موارد روش پیشنهادی به مقدار قابل قبولی رسیده است. لازم به ذکر است که با توجه به اینکه منطقه ی مورد نظر در ایران در نظر گرفته شد، جمع آوری و برچسب گذاری داده ها نیز در این پژوهش انجام شده است که می‌تواند بعنوان مجموعه داده ی مناسبی برای آموزش دیگر مدلها استفاده شود.
نتیجه‌گیری: این تحقیق یک مدل سرتاسری برای یادگیری ویژگیهای مرتبط با بخش بندی تصاویر ماهواره‌ای ارائه داده است. نتایج این تحقیق نشان می‌دهد که روش ارائه شده می‌تواند برای بخش بندی تصاویر ماهواره ای دریافتی از سنتینل-2 برای محصولات مورد نظر مورد استفاده قرار گیرد. لذا نتایج حاصل می تواند در مدیریت مصرف آب، تنظیم ساختار کاشت، تخمین تلفات و ارزیابی عملکردهای زراعی نقش مهمی را ایفا نماید. با بهره‌گیری از این روش‌ها، می‌توان به بهبود کارایی و دقت در مدیریت کشاورزی دست یافت و از منابع  این حوزه بهینه‌تراستفاده کرد.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Large Scale Crop Type Mapping Using Multi Temporal Sentinel-2 Imagery and a New Attention U-Net-Vit

نویسندگان [English]

  • M. HeidariGholanlo 1
  • R. Javanmard Alitappeh 1
  • E. Ghnabari Parmehr 2

1 Dept. of Electrical and Computer Engineering, University of Science and Technology of Mazandaran, Behshahr, Iran

2 Dept. of Geomatics Engineering, Babol Noshirvani University of Technology, Babol, Iran

چکیده [English]

Background and Objectives: With the advancement of technology and the emergence of multifunctional satellites, a significant amount of real time information is now transmitted from the Earth's surface. These satellites are equipped with sensors that obtain critical information by sending signals at various frequencies to the Earth's surface. The data received from these satellites are utilized in various scientific and military applications, including aviation, geographical studies, meteorology, agriculture, and other research fields. The agricultural sector and crop monitoring have especially benefited from remote sensing methods compared to traditional methods, becoming a primary tool for collecting environmental information for area monitoring applications, attracting researchers' attention. One such application is regional monitoring to examine agricultural products over cultivated areas. The use of remote sensing tools and satellite images is highly efficient due to their wide regional coverage. To automatically analyze these images, classify, and segment cultivated areas, machine learning methods are currently employed. Among these methods, deep learning offers superior performance and higher speed compared to other learning methods, such as manual or semi-automatic methods.
Methods: This paper utilizes deep learning models suitable for segmenting agricultural areas. Generally, these models produce an output of equivalent dimensions for each input. Therefore, for working with satellite images, an improved U-Net model is proposed in this study. The proposed model is developed using Vision Transformers (ViT) in the model's bottleneck for classifying and segmenting four types of agricultural products: rice, wheat, canola, and corn. Compared to convolutional layers, ViT is more efficient in terms of conceptual and algorithmic implementation and requires less computational power. This model addresses the problems and weaknesses of the base U-Net model that arise with complex datasets, diverse in shape, size, and texture, enabling more accurate and reliable segmentation results. Additionally, the proposed improvements enhance the model's robustness and adaptability to various agricultural scenarios.
Findings: In the numerous experiments conducted, the proposed method achieved an accuracy of 83.84 and Precision of 70.69%, providing a better classification of the five target products compared to other methods. The qualitative outputs also indicate better segmentation of the input images when applying the proposed method. Alongside the accuracy metric, other metrics such as focal loss, recall, precision, and MIoU were examined, with the proposed method reaching acceptable levels in most cases. Notably, as the target area was in Iran, data collection and labeling were also carried out in this research, providing a suitable dataset for training other models
Conclusion: This research presents an end-to-end model for learning features related to the segmentation of satellite images. The results indicate that the proposed method can be effectively used for segmenting satellite images received from Sentinel-2 for the target products, such as various crops. Therefore, the results obtained can play a crucial role in water consumption management, planting structure adjustment, loss estimation, and agricultural performance evaluation, providing significant insights for stakeholders. By utilizing these methods, it is possible to achieve improved efficiency and accuracy in agricultural management and optimize resource use in this area, contributing to sustainable agricultural practices and better decision-making processes.

کلیدواژه‌ها [English]

  • Remote sensing
  • Deep learning
  • Satellite image processing
  • Agricultural products detection

COPYRIGHTS 
© 2024 The Author(s).  This is an open-access article distributed under the terms and conditions of the Creative Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) (https://creativecommons.org/licenses/by-nc/4.0/

doi: 10.31545/intagr/152122
[9] J. Bramich, C. J. Bolch, and A. Fischer, "Improved red-edge chlorophyll-a detection for Sentinel 2," Ecological Indicators, vol. 120, p. 106876, 2021.
https://spj.science.org/doi/full/10.34133/2021/8379391
https://doi.org/10.3390/rs15112727
https://doi.org/10.1109/cvprw56347.2022.00359
https://doi.org/10.1016/j.compag.2022.107297
https://doi.org/10.3390/s23157008
https://doi.org/10.7717/peerjcs.1946/fig-10
https://doi.org/10.1109/cvpr52688.2022.00134
https://doi.org/10.1080/10106049.2021.1943009
https://doi.org/10.1109/JSTARS.2023.3329987
https://doi.org/10.1007/978-3-030-00889-5_1
https://doi.org/10.3390/rs15061517
https://doi.org/10.7717/peerj-cs.1767/fig-2
https://doi.org/10.1007/978-3-031-25066-8_9
https://doi.org/10.1007/s11227-023-05533-4
https://doi.org/10.20944/preprints202411.2377.v1
https://doi.org/10.3390/rs15010196
https://doi.org/10.5753/wvc.2020.13491