نوع مقاله : مقاله پژوهشی
نویسندگان
1 گروه سیستمهای اطلاعات مکانی، دانشکده مهندسی نقشه برداری، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران
2 گروه جغرافیای فیزیکی و مرکز تحقیقات اقلیمی بولین، دانشگاه استکهلم، استکهلم، سوئد
چکیده
پیشینه و اهداف: استانهای شمالی ایران (گلستان، مازندران و گیلان) در امتداد دریای خزر قرار گرفتهاند و ترکیب آبوهوای مرطوب، توپوگرافی شیبدار البرز، برداشت بیرویه آب زیرزمینی برای کشاورزی و تغییر سریع کاربری اراضی موجب میشود این منطقه بهطور همزمان در معرض سیل، زمینلغزش و فرونشست زمین قرار گیرد. با وجود این همزمانی، بیشتر مطالعات پیشین هر یک از مخاطرات را بهصورت مجزا بررسی کردهاند و بینش محدودی درباره مکانهای همپوشانی فضایی این تهدیدها و چگونگی مدیریت مشترک آنها در مقیاس منطقهای ارائه کردهاند. مدلهای حساسیت موجود اغلب بر الگوریتمهای یادگیری ماشین منفرد و بدون تنظیم سیستماتیک فراپارامترها متکی هستند و خروجیهای آنها بهعنوان جعبهسیاه در نظر گرفته میشود، که این موضوع کاربرد آنها را در تصمیمگیری مبتنی بر شواهد محدود کرده و اعتماد ذینفعان را تضعیف میکند. هدف این پژوهش، توسعه یک چارچوب بهینهسازیشده و تفسیرپذیر برای تهیه نقشههای حساسیت توأمان هر سه مخاطره در این منطقه و پشتیبانی از برنامهریزی یکپارچه ریسک و سیاستگذاری آگاهانه کاربری اراضی است.
روشها: یک مدل ترکیبی شامل رگرسیون بردار پشتیبان به همراه الگوریتم بهینهسازی گرگ خاکستری با جهش دومرحلهای (SVR-TMGWO) بهصورت جداگانه برای هر مخاطره ساخته شد. اطلاعات رخدادهای سیل و زمینلغزش طی یک دوره بیستساله (۲۰۰۰ تا ۲۰۲۰) از سازمان زمینشناسی و اکتشافات معدنی ایران و سازمان منابع طبیعی و آبخیزداری کشور گردآوری شد، و موقعیت نقاط فرونشست از تحلیلهای تداخلسنجی راداری Sentinel-1 استخراج گردید. نقاط عدم رخداد بهصورت رندوم در خارج از بافر ۲۰۰۰ متری اطراف رخدادهای ثبتشده و با نسبت ۱:۱ تولید شدند تا توازن دستهای حفظ شود، و سپس دادهها در درون خوشههای K-means (که مقدار بهینه K از طریق تحلیلهای Gap و Silhouette تعیین شد) به نسبت ۷۰٪ آموزش و ۳۰٪ آزمون تقسیم گردیدند تا توزیع دادهها در فضای ویژگی بین دو زیرمجموعه متوازن باقی بماند. هجده عامل مؤثر شامل متغیرهای توپوگرافی، هیدرولوژیکی، محیطی، انسانساخت و ویژگیهای فیزیکی خاک برای هر پیکسل آمادهسازی شد. الگوریتم TMGWO سه فراپارامتر مدل SVR ( یعنی C، ε و γ) را بهصورت همزمان برای هر مخاطره تنظیم کرد و پیکربندیهای متمایزی متناسب با فیزیک هر فرآیند بهدست داد. دقت مدل با استفاده از شاخصهای AUC-ROC، RMSE، R² و R² تعدیلشده روی دادههای آزمون مستقل ارزیابی شد. بهمنظور غلبه بر محدودیت جعبهسیاه بودن یادگیری ماشین، مقادیر شپلی (SHAP) در دو سطح جهانی و محلی محاسبه شد تا سهم هر عامل مؤثر در پیشبینی، هم در سطح منطقهای و هم در موقعیتهای منفرد، آشکار گردد. در پایان، سه نقشه حساسیت تکمخاطرهای در قالب یک نقشه چندمخاطرهای هشتطبقهای تلفیق شدند که پهنههای با همپوشانی یگانه، دوگانه و سهگانه را مشخص میکند.
یافتهها: الگوریتم TMGWO بهطور پیوسته مقدار AUC-ROC را در مرحله آزمون نسبت به مدل پایه SVR بهبود بخشید و به ۸۴۰۴/۰ برای سیل، ۹۳۲۹/۰ برای زمینلغزش و ۹۶۴۲/۰ برای فرونشست رسید، و در عین حال فاصله میان مرحله آموزش و آزمون را کاهش داد که نشاندهنده کنترل بیشبرازش در مقایسه با مدل پایه بهینهنشده است. تحلیل SHAP ارتفاع را بهعنوان عامل غالب در هر سه مخاطره شناسایی کرد، اما عوامل ثانویه متفاوتی برای هر فرآیند آشکار ساخت. نقشه چندمخاطرهای نشان داد که پهنههای با همپوشانی سهگانه از نظر فضایی محدود و در نواحی انتقالی میان کوهستان و دشت متمرکز هستند.
نتیجهگیری: چارچوب پیشنهادی SVR-TMGWO در ترکیب با تفسیرپذیری مبتنی بر SHAP، نقشههای حساسیت فضایی صریح و از نظر فیزیکی معنادار را برای سه مخاطره همزمان در شمال ایران تولید کرد. نقشه چندمخاطرهای هشتطبقهای حاصل، مناطق اولویتدار را برای برنامهریزی یکپارچه کاربری اراضی، حفاظت از زیرساختها و اولویتبندی هشدار اولیه مشخص میکند، در حالی که خروجیهای SHAP استدلال مدل را برای ذینفعان غیرمتخصص شفاف میسازد. در پژوهشهای آتی، گنجاندن پویاییهای زمانی از طریق تحلیلهای چندزمانه InSAR و سناریوهای اقلیمی، مقایسه با گزینههای یادگیری عمیق مانند شبکههای عصبی پیچشی، و گسترش چارچوب به ارزیابی کامل ریسک از طریق در نظر گرفتن مؤلفههای در معرضقرارگرفتگی و آسیبپذیری توصیه میشود.
کلیدواژهها
- حساسیت چندمخاطرهای
- رگرسیون بردار پشتیبان
- الگوریتم گرگ خاکستری یادگیری ماشین
- توضیحپذیر استانهای شمالی ایران
موضوعات
عنوان مقاله [English]
Development of Optimized Explainable Machine Learning Models for Preparing Multi-Hazard Susceptibility Maps of Flood, Landslide, and Land Subsidence (Case Study: Caspian Sea Coast)
نویسندگان [English]
- Ali Asghar Alesheikh 1
- Kymia Kheirkhah 1
- Fatemeh Rezaie 1
- Ali Jafari 1
- Mahdi Panahi 2
1 Department of Geospatial Information Systems , Faculty of Surveying Engineering, K. N.Toosi University of Technology, Tehran, Iran
2 Department of Physical Geography and Bolin Centre for Climate Research, Stockholm University, Stockholm, Sweden
چکیده [English]
Barckground and Objectives: Iran's northern provinces (Golestan, Mazandaran, and Gilan) lie along the Caspian Sea and combine humid climate, steep Alborz topography, intensive groundwater extraction for agriculture, and rapid land-use change, making them simultaneously exposed to floods, landslides, and land subsidence. Despite this co-occurrence, most prior studies have addressed each hazard in isolation, providing limited insight into where these threats overlap spatially and how they should be jointly managed at the regional scale. Existing susceptibility models often rely on single machine learning algorithms without systematic hyperparameter tuning and treat their predictions as opaque outputs, limiting their value for evidence-based decision-making and undermining stakeholder trust. This research aims to develop an optimized and interpretable framework that produces joint susceptibility maps for all three hazards across this region, supporting integrated risk planning and informed land-use policy.
Methods: A hybrid model combining Support Vector Regression with the Two-phase Mutation Grey Wolf Optimizer (SVR-TMGWO) was built separately for each hazard. Twenty years of recorded flood and landslide events (2000–2020) were compiled from the Geological Survey of Iran and the national watershed-management authority, while subsidence locations were derived from Sentinel-1 InSAR analyses. Non-event points were generated randomly outside a 2000-metre buffer around recorded events at a 1:1 ratio to preserve class balance, and the dataset was partitioned into 70% training and 30% testing within K-means clusters (with the optimal K determined via Gap and Silhouette analyses) so that the feature-space distribution was balanced across both subsets. Eighteen conditioning factors spanning topographic, hydrological, environmental, anthropogenic, and soil-physical variables were prepared for each pixel. The TMGWO algorithm simultaneously tuned the three SVR hyperparameters (C, ε, γ) for each hazard, producing distinct configurations that reflect the differing physics of each process. Model accuracy was evaluated using AUC-ROC, RMSE, R², and adjusted R² on independent test data. To overcome the black-box limitation of machine learning, Shapley Additive Explanations (SHAP) were computed at both global and local scales, exposing the contribution of each conditioning factor to the prediction at the regional level and at individual locations. Finally, the three single-hazard maps were combined into an eight-class multi-hazard map identifying areas of single, dual, and triple hazard overlap.
Findings: TMGWO consistently improved test-phase AUC-ROC over the base SVR model, reaching 0.8404 for flood, 0.9329 for landslide, and 0.9642 for subsidence, while narrowing the training-test gap and indicating reduced overfitting compared with the unoptimized baseline. SHAP identified elevation as the leading driver across all three hazards but revealed contrasting secondary controls per process. The multi-hazard map showed that triple-overlap zones were spatially restricted and concentrated along the mountain-plain transition.
Conclusion: The proposed SVR-TMGWO framework, combined with SHAP interpretability, produced spatially explicit and physically meaningful susceptibility maps for three coexisting hazards in northern Iran. The resulting eight-class multi-hazard product highlights priority areas for integrated land-use planning, infrastructure protection, and early-warning prioritisation, while the SHAP outputs make the model's reasoning transparent to non-expert stakeholders. Future research should incorporate temporal dynamics through multi-temporal InSAR and climate projections, compare deep learning alternatives such as convolutional neural networks, and extend the framework to full risk assessment by including exposure and vulnerability components.
کلیدواژهها [English]
- Multi-hazard susceptibility
- Support Vector Regression
- Grey Wolf Optimizer Explainable Machine Learning
- Northern Provinces of Iran
COPYRIGHTS
© 2026 The Author(s). This is an open-access article distributed under the terms and conditions of the Creative Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)