نوع مقاله : مقاله پژوهشی
نویسندگان
گروه مهندسی نقشه برداری، دانشکده عمران، دانشگاه تربیت دبیر شهید رجائی، تهران، ایران
چکیده
پیشینه و اهداف: جادهها به عنوان عناصر حیاتی و اساسی در توسعه و پیشرفت شهرها شناخته میشوند، زیرا نقش بسیار مهمی در ارتباطات و حمل و نقل دارند و نمایانگر میزان توسعه و رشد شهری میباشند. به منظور افزایش دقت و کارایی در تشخیص و طبقهبندی جادهها، محققان به طراحی و استفاده از روشهای خودکار مبتنی بر پردازش تصویر و یادگیری عمیق پرداختهاند. این رویکردها، به دلیل قابلیتهای برترشان در تشخیص الگوها و ویژگیهای پیچیده تصاویر، به طور موثری جایگزین روشهای سنتی شدهاند و بهبود چشمگیری در دقت و سرعت تشخیص جادهها ایجاد کردهاند.
روشها: در این تحقیق از یک مدل بهبودیافته رمزگذار-رمزگشای UNet3+ برای تشخیص جاده از تصاویر سنجش از دور استفاده شده است. در این مدل پیشنهادی از ماژول های تجمیع هرمی، توجه مکانی و توجه کانال برای بهبود نتایج تشخیصی استفاده شده است. ماژول توجه مکانی در معماری شبکه پیشنهادی برای بهبود تمرکز شبکه بر روی مکانهای مهم در نقشههای ویژگی استفاده میشود. ماژول توجه کانال نیز به شبکه اجازه می دهد تا روی اطلاعات مهم تمرکز بیشتری داشته باشد و در کارهایی مانند تشخیص ویژگی و طبقه بندی بهتر عمل کند. ماژول تجمیع هرمی برای دریافت اطلاعات چند مقیاسی طراحی شده است. این ماژول به شبکه کمک میکند تا مقیاسهای مکانی مختلف را با اعمال میانگینگیری در سطوح مختلف و سپس تغییر اندازه ویژگیهای متوسط به اندازه نقشه ویژگی اصلی، درک کند.
یافتهها: ارزیابی قابلیت اجرایی شبکه پیشنهادی در تشخیص جاده های فرعی در مناطقی که تراکم مسکونی کمتری دارند و دارای پوشش خاکی و گیاهی هستند، نشان دهنده برتری این شبکه نسبت به نسخه اصلی UNet3+ است. شبکه بهبود یافته پیشنهادی در این مقاله توانست جاده ها را با دقت بیشتری تشخیص دهد. این امر نشان دهنده قدرت شبکه در تشخیص جاده ها در شرایطی است که تداخلات محیطی کمتری وجود دارد. نتایج کمی بهدستآمده از این شبکه نمایانگر این واقعیت است که استفاده از ماژولهای توجه مکانی و کانال و ماژول تجمیع هرمی توانسته است معیارهای دقت، بازخوانی، امتیاز F1 و IOU را به ترتیب 6، 15.6، 8.3 و 17.4 نسبت به نسخه اصلی شبکه UNet3+ افزایش دهد.
نتیجهگیری: چالشهای مطرح در تشخیص خودکار جاده ها از تصاویر سنجش از دور اعم از تاثیر سایه و انسداد جاده با ساختمانها و پوشش گیاهی و شباهت جاده با پسزمینه میتواند منجر به کاهش دقت تشخیص جاده ها از تصاویر سنجش از دور گردد. استفاده از قابلیت های معماری رمزگذار-رمزگشای بهبودیافته UNet3+ در این تحقیق توانست بخشی از این چالش ها را کاهش داده و دقت نتایج تشخیص جاده های فرعی در مناطق دارای زمینه خاکی و پوشش گیاهی را افزایش دهد.
کلیدواژهها
موضوعات
عنوان مقاله [English]
Detection of Secondary Roads in Soil and Vegetation areas Based on Deep Learning Model
نویسندگان [English]
- A. Gholamian
- F. Tabib Mahmoudi
Department of Surveying and Geomatics Engineering, Faculty of Civi Engineering, Shahid Rajaee Teacher Training University, Tehran, Iran
چکیده [English]
Background and Objectives: Roads are known as vital and essential elements in the development of cities, because they play a very important role in communication and transportation and represent the extent of urban development and growth. In order to increase accuracy and efficiency in road detection and classification, researchers have designed and used automatic methods based on deep learning algorithms. These approaches, due to their superior capabilities in recognizing patterns and complex features of images, have effectively replaced traditional methods and have significantly improved the accuracy and speed of road detection.
Methods: In this paper, an improved UNet3+ encoder-decoder model has been used for road detection from remote sensing images. In this proposed model, pyramid pooling and spatial and channel attention modules are used to improve road detection results. The spatial attention module is used in the proposed network architecture to improve the network's focus on important locations in feature maps. The channel attention module also allows the network to more focus on important information and perform better at tasks such as feature detection and classification. The pyramid pooling module is designed to receive multi-scale information. This module helps the network to understand different spatial scales by applying averaging at different levels and then resizing the averaged features to the size of the original feature map.
Findings: The evaluation of the capabilities of the proposed network in detecting secondary roads in areas with less residential density and with soil and vegetation cover shows the superiority of this network over the original version of UNet3+. The improved network proposed in this paper was able to detect roads more accurately. This shows the power of the network in detecting roads in conditions where there is less environmental interference. Quantitative results obtained from this network show the fact that the use of spatial and channel attention modules and pyramid pooling module has been able to increase the accuracy, recall, F1 score and IOU measures by 6, 15.6, 8.3 and 17.4, respectively, compared to the original version of the UNet3+ network.
Conclusion: The challenges raised in the automatic roads detection from remote sensing images, including the effect of shadows and obstruction of the road with buildings and vegetation cover, and the similarity of the secondary roads with the soil background can lead to a decrease in the accuracy of recognizing roads from remote sensing images. The use of improved UNet3+ encoder-decoder architecture capabilities in this research was able to reduce some of these challenges and increase the accuracy of the detection results of secondary roads in areas with soil and vegetation.
کلیدواژهها [English]
- Road detection
- Deep Learning
- Semantic Segmentation
- Remote Sensing
COPYRIGHTS
© 2024 The Author(s). This is an open-access article distributed under the terms and conditions of the Creative Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) (https://creativecommons.org/licenses/by-nc/4.0/)