نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه سیستم‌های اطلاعات مکانی، دانشکده مهندسی نقشه برداری، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران

2 گروه جغرافیای فیزیکی و مرکز تحقیقات اقلیمی بولین، دانشگاه استکهلم، استکهلم، سوئد

چکیده

پیشینه و اهداف: استان‌های شمالی ایران (گلستان، مازندران و گیلان) در امتداد دریای خزر قرار گرفته‌اند و ترکیب آب‌وهوای مرطوب، توپوگرافی شیب‌دار البرز، برداشت بی‌رویه آب زیرزمینی برای کشاورزی و تغییر سریع کاربری اراضی موجب می‌شود این منطقه به‌طور هم‌زمان در معرض سیل، زمین‌لغزش و فرونشست زمین قرار گیرد. با وجود این هم‌زمانی، بیشتر مطالعات پیشین هر یک از مخاطرات را به‌صورت مجزا بررسی کرده‌اند و بینش محدودی درباره مکان‌های همپوشانی فضایی این تهدیدها و چگونگی مدیریت مشترک آن‌ها در مقیاس منطقه‌ای ارائه کرده‌اند. مدل‌های حساسیت موجود اغلب بر الگوریتم‌های یادگیری ماشین منفرد و بدون تنظیم سیستماتیک فراپارامترها متکی هستند و خروجی‌های آن‌ها به‌عنوان جعبه‌سیاه در نظر گرفته می‌شود، که این موضوع کاربرد آن‌ها را در تصمیم‌گیری مبتنی بر شواهد محدود کرده و اعتماد ذی‌نفعان را تضعیف می‌کند. هدف این پژوهش، توسعه یک چارچوب بهینه‌سازی‌شده و تفسیرپذیر برای تهیه نقشه‌های حساسیت توأمان هر سه مخاطره در این منطقه و پشتیبانی از برنامه‌ریزی یکپارچه ریسک و سیاست‌گذاری آگاهانه کاربری اراضی است.
روش‌ها‌: یک مدل ترکیبی شامل رگرسیون بردار پشتیبان به همراه الگوریتم بهینه‌سازی گرگ خاکستری با جهش دومرحله‌ای (SVR-TMGWO) به‌صورت جداگانه برای هر مخاطره ساخته شد. اطلاعات رخدادهای سیل و زمین‌لغزش طی یک دوره بیست‌ساله (۲۰۰۰ تا ۲۰۲۰) از سازمان زمین‌شناسی و اکتشافات معدنی ایران و سازمان منابع طبیعی و آبخیزداری کشور گردآوری شد، و موقعیت نقاط فرونشست از تحلیل‌های تداخل‌سنجی راداری Sentinel-1 استخراج گردید. نقاط عدم رخداد به‌صورت رندوم در خارج از بافر ۲۰۰۰ متری اطراف رخدادهای ثبت‌شده و با نسبت ۱:۱ تولید شدند تا توازن دسته‌ای حفظ شود، و سپس داده‌ها در درون خوشه‌های K-means (که مقدار بهینه K از طریق تحلیل‌های Gap و Silhouette تعیین شد) به نسبت ۷۰٪ آموزش و ۳۰٪ آزمون تقسیم گردیدند تا توزیع داده‌ها در فضای ویژگی بین دو زیرمجموعه متوازن باقی بماند. هجده عامل مؤثر شامل متغیرهای توپوگرافی، هیدرولوژیکی، محیطی، انسان‌ساخت و ویژگی‌های فیزیکی خاک برای هر پیکسل آماده‌سازی شد. الگوریتم TMGWO سه فراپارامتر مدل SVR ( یعنی C، ε و γ) را به‌صورت هم‌زمان برای هر مخاطره تنظیم کرد و پیکربندی‌های متمایزی متناسب با فیزیک هر فرآیند به‌دست داد. دقت مدل با استفاده از شاخص‌های AUC-ROC، RMSE، R² و R² تعدیل‌شده روی داده‌های آزمون مستقل ارزیابی شد. به‌منظور غلبه بر محدودیت جعبه‌سیاه بودن یادگیری ماشین، مقادیر شپلی (SHAP) در دو سطح جهانی و محلی محاسبه شد تا سهم هر عامل مؤثر در پیش‌بینی، هم در سطح منطقه‌ای و هم در موقعیت‌های منفرد، آشکار گردد. در پایان، سه نقشه حساسیت تک‌مخاطره‌ای در قالب یک نقشه چندمخاطره‌ای هشت‌طبقه‌ای تلفیق شدند که پهنه‌های با همپوشانی یگانه، دوگانه و سه‌گانه را مشخص می‌کند.
یافته‌ها: الگوریتم TMGWO به‌طور پیوسته مقدار AUC-ROC را در مرحله آزمون نسبت به مدل پایه SVR  بهبود بخشید و به ۸۴۰۴/۰ برای سیل، ۹۳۲۹/۰ برای زمین‌لغزش و ۹۶۴۲/۰ برای فرونشست رسید، و در عین حال فاصله میان مرحله آموزش و آزمون را کاهش داد که نشان‌دهنده کنترل بیش‌برازش در مقایسه با مدل پایه بهینه‌نشده است. تحلیل SHAP ارتفاع را به‌عنوان عامل غالب در هر سه مخاطره شناسایی کرد، اما عوامل ثانویه متفاوتی برای هر فرآیند آشکار ساخت. نقشه چندمخاطره‌ای نشان داد که پهنه‌های با همپوشانی سه‌گانه از نظر فضایی محدود و در نواحی انتقالی میان کوهستان و دشت متمرکز هستند.
نتیجه‌گیری: چارچوب پیشنهادی SVR-TMGWO در ترکیب با تفسیرپذیری مبتنی بر SHAP، نقشه‌های حساسیت فضایی صریح و از نظر فیزیکی معنادار را برای سه مخاطره هم‌زمان در شمال ایران تولید کرد. نقشه چندمخاطره‌ای هشت‌طبقه‌ای حاصل، مناطق اولویت‌دار را برای برنامه‌ریزی یکپارچه کاربری اراضی، حفاظت از زیرساخت‌ها و اولویت‌بندی هشدار اولیه مشخص می‌کند، در حالی که خروجی‌های SHAP استدلال مدل را برای ذی‌نفعان غیرمتخصص شفاف می‌سازد. در پژوهش‌های آتی، گنجاندن پویایی‌های زمانی از طریق تحلیل‌های چندزمانه InSAR و سناریوهای اقلیمی، مقایسه با گزینه‌های یادگیری عمیق مانند شبکه‌های عصبی پیچشی، و گسترش چارچوب به ارزیابی کامل ریسک از طریق در نظر گرفتن مؤلفه‌های در معرض‌قرارگرفتگی و آسیب‌پذیری توصیه می‌شود.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Development of Optimized Explainable Machine Learning Models for Preparing Multi-Hazard Susceptibility Maps of Flood, Landslide, and Land Subsidence (Case Study: Caspian Sea Coast)

نویسندگان [English]

  • Ali Asghar Alesheikh 1
  • Kymia Kheirkhah 1
  • Fatemeh Rezaie 1
  • Ali Jafari 1
  • Mahdi Panahi 2

1 Department of Geospatial Information Systems , Faculty of Surveying Engineering, K. N.Toosi University of Technology, Tehran, Iran

2 Department of Physical Geography and Bolin Centre for Climate Research, Stockholm University, Stockholm, Sweden

چکیده [English]

Barckground and Objectives: Iran's northern provinces (Golestan, Mazandaran, and Gilan) lie along the Caspian Sea and combine humid climate, steep Alborz topography, intensive groundwater extraction for agriculture, and rapid land-use change, making them simultaneously exposed to floods, landslides, and land subsidence. Despite this co-occurrence, most prior studies have addressed each hazard in isolation, providing limited insight into where these threats overlap spatially and how they should be jointly managed at the regional scale. Existing susceptibility models often rely on single machine learning algorithms without systematic hyperparameter tuning and treat their predictions as opaque outputs, limiting their value for evidence-based decision-making and undermining stakeholder trust. This research aims to develop an optimized and interpretable framework that produces joint susceptibility maps for all three hazards across this region, supporting integrated risk planning and informed land-use policy.
Methods: A hybrid model combining Support Vector Regression with the Two-phase Mutation Grey Wolf Optimizer (SVR-TMGWO) was built separately for each hazard. Twenty years of recorded flood and landslide events (2000–2020) were compiled from the Geological Survey of Iran and the national watershed-management authority, while subsidence locations were derived from Sentinel-1 InSAR analyses. Non-event points were generated randomly outside a 2000-metre buffer around recorded events at a 1:1 ratio to preserve class balance, and the dataset was partitioned into 70% training and 30% testing within K-means clusters (with the optimal K determined via Gap and Silhouette analyses) so that the feature-space distribution was balanced across both subsets. Eighteen conditioning factors spanning topographic, hydrological, environmental, anthropogenic, and soil-physical variables were prepared for each pixel. The TMGWO algorithm simultaneously tuned the three SVR hyperparameters (C, ε, γ) for each hazard, producing distinct configurations that reflect the differing physics of each process. Model accuracy was evaluated using AUC-ROC, RMSE, R², and adjusted R² on independent test data. To overcome the black-box limitation of machine learning, Shapley Additive Explanations (SHAP) were computed at both global and local scales, exposing the contribution of each conditioning factor to the prediction at the regional level and at individual locations. Finally, the three single-hazard maps were combined into an eight-class multi-hazard map identifying areas of single, dual, and triple hazard overlap.
Findings: TMGWO consistently improved test-phase AUC-ROC over the base SVR model, reaching 0.8404 for flood, 0.9329 for landslide, and 0.9642 for subsidence, while narrowing the training-test gap and indicating reduced overfitting compared with the unoptimized baseline.  SHAP identified elevation as the leading driver across all three hazards but revealed contrasting secondary controls per process. The multi-hazard map showed that triple-overlap zones were spatially restricted and concentrated along the mountain-plain transition.
Conclusion: The proposed SVR-TMGWO framework, combined with SHAP interpretability, produced spatially explicit and physically meaningful susceptibility maps for three coexisting hazards in northern Iran. The resulting eight-class multi-hazard product highlights priority areas for integrated land-use planning, infrastructure protection, and early-warning prioritisation, while the SHAP outputs make the model's reasoning transparent to non-expert stakeholders. Future research should incorporate temporal dynamics through multi-temporal InSAR and climate projections, compare deep learning alternatives such as convolutional neural networks, and extend the framework to full risk assessment by including exposure and vulnerability components.

کلیدواژه‌ها [English]

  • Multi-hazard susceptibility
  • Support Vector Regression
  • Grey Wolf Optimizer Explainable Machine Learning
  • Northern Provinces of Iran

COPYRIGHTS

© 2026 The Author(s). This is an open-access article distributed under the terms and conditions of the Creative Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)

(https://creativecommons.org/licenses/by-nc/4.0/)

https://doi.org/10.1038/s41598-020-60191-3
https://doi.org/10.1038/s41598-020-69233-2
https://doi.org/10.22067/geo.v8i4.83263
https://doi.org/10.3390/info15110689
https://doi.org/10.1038/s41598-025-15381-2
https://doi.org/10.3390/rs13244966
https://doi.org/10.3390/su13105369
https://doi.org/10.1016/j.gsf.2022.101425
https://doi.org/10.1016/j.iswcr.2020.07.006
https://doi.org/10.3390/rs12030475
https://doi.org/10.1007/s12040-013-0282-2
https://doi.org/10.22069/ijerr.2023.18630.1326
https://doi.org/10.5194/isprs-archives-XLIII-B3-2021-155-2021
https://doi.org/10.1126/sciadv.adk3039
https://doi.org/10.1007/s11069-012-0217-2
https://doi.org/10.1007/s10708-020-10162-y
https://doi.org/10.22067/jsw.2023.84146.1328
https://doi.org/10.1016/j.scitotenv.2019.03.496
https://doi.org/10.1007/s00521-019-04109-9
https://doi.org/10.1016/S0925-2312(02)00601-X
https://doi.org/10.1016/j.catena.2019.104426
https://doi.org/10.1080/19475705.2019.1607782
https://doi.org/10.1016/j.advengsoft.2013.12.007
https://doi.org/10.1016/j.eswa.2019.112824
https://doi.org/10.1016/j.earscirev.2020.103225
https://doi.org/10.1007/s00366-018-0644-0
https://doi.org/10.3390/w12030683
https://doi.org/10.7717/peerj-cs.623
https://dl.acm.org/doi/10.5555/3295222.3295230
https://doi.org/10.1007/s10822-020-00314-0
https://doi.org/10.1007/s11069-019-03785-z