نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشکده مهندسی برق و کامپیوتر، دانشگاه علم و فناوری مازندران، بهشهر، ایران
2 دانشکده مهندسی عمران، دانشگاه صنعتی نوشیروانی بابل، بابل، ایران
چکیده
پیشینه و اهداف: با پیشرفت تکنولوژی و پیدایش ماهوارههای چندمنظوره، اطلاعات لحظهای زیادی از سطح زمین مخابره میشود. ماهواره ها به سنجنده هایی مجهز هستند که می توانند با ارسال سیگنالهایی در فرکانسهای مختلف به سطح زمین به اطلاعات مهمی دست یابند. دادههای دریافتی از این ماهوارهها در کاربردهای مختلف علمی و نظامی از جمله: هوانوردی، مطالعات جغرافیایی، هواشناسی، کشاورزی و دیگر حوزههای تحقیقاتی قابل استفاده است. حوزهی کشاورزی و پایش سطوح کشت نیز یکی از حوزههایی است که با توجه به مزیتهای روشهای سنجشازدور در مقایسه با روشهای سنتی، بهعنوان یکی از ابزارهای اصلی در جمعآوری اطلاعات محیطی برای کاربردهای پایش نواحی، مورد توجه پژوهشگران قرار گرفته است. یکی از این موضوعات، پایش منطقهای برای بررسی محصولات کشاورزی در مساحت سطح زیرکشت است که استفاده از ابزارهای سنجشازدور و تصاویر ماهوارهای به جهت پوشش منطقهای وسیع بسیار کارا است. جهت بررسی خودکار این تصاویر، طبقهبندی و بخشبندی نواحی سطح زیرکشت، امروزه از روشهای یادگیری ماشین استفاده میشود. در میان این روشها، یادگیری عمیق در مقایسه با دیگر روشهای یادگیری مانند روشهای دستی و یا روشهای نیمهخودکار، عملکرد بهتر و سرعت بالاتری دارد.
روشها: در این مقاله مدلهای یادگیری عمیق که برای بخشبندی نواحی مناسب هستند مورد استفاده قرار گرفته است. عموما این مدلها بازای هر ورودی، خروجی معادل آن را با همان ابعاد تولید می کنند. لذا جهت کار بر روی تصاویر ماهوارهای، در این پژوهش مدل U-Net بهبود یافتهای ارائه شده است. مدل پیشنهادی با استفاده از ViT در گلوگاه مدل برای طبقهبندی و بخشبندی چهار نوع محصول کشاورزی شامل برنج، گندم، کلزا و ذرت توسعه داده شده است. استفاده از ViT در مقایسه با لایههای کانولوشن از لحاظ ایده و پیادهسازی الگوریتمی کاراتر است و حجم محاسباتی کمتری دارد. این مدل مشکلات و نقاط ضعف مدل پایه U-Net را که برای مجموعه دادههای پیچیده، متنوع در شکل، اندازه و بافت به وجود میآید، برطرف مینماید.
یافتهها: در نتایج آزمایشات انجام شده روش پیشنهادی توانسته است با رسیدن به دقت 83.84 و صحت 70.69، بهتر از دیگر روشها دستهبندی درستی از 5 محصول مورد نظر را ارائه دهد. همچنین خروجیهای کیفی نیز نشاندهندهی بخشبندی بهتر تصاویر ورودی با اعمال روش پیشنهادی میباشد. در کنار معیار دقت، دیگر معیارها مانند افت کانونی، بازیابی و MIoU نیز مورد بررسی قرار گرفت که در اکثر موارد روش پیشنهادی به مقدار قابل قبولی رسیده است. لازم به ذکر است که با توجه به اینکه منطقه ی مورد نظر در ایران در نظر گرفته شد، جمع آوری و برچسب گذاری داده ها نیز در این پژوهش انجام شده است که میتواند بعنوان مجموعه داده ی مناسبی برای آموزش دیگر مدلها استفاده شود.
نتیجهگیری: این تحقیق یک مدل سرتاسری برای یادگیری ویژگیهای مرتبط با بخش بندی تصاویر ماهوارهای ارائه داده است. نتایج این تحقیق نشان میدهد که روش ارائه شده میتواند برای بخش بندی تصاویر ماهواره ای دریافتی از سنتینل-2 برای محصولات مورد نظر مورد استفاده قرار گیرد. لذا نتایج حاصل می تواند در مدیریت مصرف آب، تنظیم ساختار کاشت، تخمین تلفات و ارزیابی عملکردهای زراعی نقش مهمی را ایفا نماید. با بهرهگیری از این روشها، میتوان به بهبود کارایی و دقت در مدیریت کشاورزی دست یافت و از منابع این حوزه بهینهتراستفاده کرد.
کلیدواژهها
موضوعات
عنوان مقاله [English]
Large Scale Crop Type Mapping Using Multi Temporal Sentinel-2 Imagery and a New Attention U-Net-Vit
نویسندگان [English]
- M. HeidariGholanlo 1
- R. Javanmard Alitappeh 1
- E. Ghnabari Parmehr 2
1 Dept. of Electrical and Computer Engineering, University of Science and Technology of Mazandaran, Behshahr, Iran
2 Dept. of Geomatics Engineering, Babol Noshirvani University of Technology, Babol, Iran
چکیده [English]
Background and Objectives: With the advancement of technology and the emergence of multifunctional satellites, a significant amount of real time information is now transmitted from the Earth's surface. These satellites are equipped with sensors that obtain critical information by sending signals at various frequencies to the Earth's surface. The data received from these satellites are utilized in various scientific and military applications, including aviation, geographical studies, meteorology, agriculture, and other research fields. The agricultural sector and crop monitoring have especially benefited from remote sensing methods compared to traditional methods, becoming a primary tool for collecting environmental information for area monitoring applications, attracting researchers' attention. One such application is regional monitoring to examine agricultural products over cultivated areas. The use of remote sensing tools and satellite images is highly efficient due to their wide regional coverage. To automatically analyze these images, classify, and segment cultivated areas, machine learning methods are currently employed. Among these methods, deep learning offers superior performance and higher speed compared to other learning methods, such as manual or semi-automatic methods.
Methods: This paper utilizes deep learning models suitable for segmenting agricultural areas. Generally, these models produce an output of equivalent dimensions for each input. Therefore, for working with satellite images, an improved U-Net model is proposed in this study. The proposed model is developed using Vision Transformers (ViT) in the model's bottleneck for classifying and segmenting four types of agricultural products: rice, wheat, canola, and corn. Compared to convolutional layers, ViT is more efficient in terms of conceptual and algorithmic implementation and requires less computational power. This model addresses the problems and weaknesses of the base U-Net model that arise with complex datasets, diverse in shape, size, and texture, enabling more accurate and reliable segmentation results. Additionally, the proposed improvements enhance the model's robustness and adaptability to various agricultural scenarios.
Findings: In the numerous experiments conducted, the proposed method achieved an accuracy of 83.84 and Precision of 70.69%, providing a better classification of the five target products compared to other methods. The qualitative outputs also indicate better segmentation of the input images when applying the proposed method. Alongside the accuracy metric, other metrics such as focal loss, recall, precision, and MIoU were examined, with the proposed method reaching acceptable levels in most cases. Notably, as the target area was in Iran, data collection and labeling were also carried out in this research, providing a suitable dataset for training other models
Conclusion: This research presents an end-to-end model for learning features related to the segmentation of satellite images. The results indicate that the proposed method can be effectively used for segmenting satellite images received from Sentinel-2 for the target products, such as various crops. Therefore, the results obtained can play a crucial role in water consumption management, planting structure adjustment, loss estimation, and agricultural performance evaluation, providing significant insights for stakeholders. By utilizing these methods, it is possible to achieve improved efficiency and accuracy in agricultural management and optimize resource use in this area, contributing to sustainable agricultural practices and better decision-making processes.
کلیدواژهها [English]
- Remote sensing
- Deep learning
- Satellite image processing
- Agricultural products detection
COPYRIGHTS
© 2024 The Author(s). This is an open-access article distributed under the terms and conditions of the Creative Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) (https://creativecommons.org/licenses/by-nc/4.0/)