留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

熵指数融入支持向量机的滑坡灾害易发性评价方法—以陕西省为例

徐胜华 刘纪平 王想红 张玉 林荣福 张蒙 刘猛猛 姜涛

徐胜华, 刘纪平, 王想红, 张玉, 林荣福, 张蒙, 刘猛猛, 姜涛. 熵指数融入支持向量机的滑坡灾害易发性评价方法—以陕西省为例[J]. 武汉大学学报 ● 信息科学版, 2020, 45(8): 1214-1222. doi: 10.13203/j.whugis20200109
引用本文: 徐胜华, 刘纪平, 王想红, 张玉, 林荣福, 张蒙, 刘猛猛, 姜涛. 熵指数融入支持向量机的滑坡灾害易发性评价方法—以陕西省为例[J]. 武汉大学学报 ● 信息科学版, 2020, 45(8): 1214-1222. doi: 10.13203/j.whugis20200109
XU Shenghua, LIU Jiping, WANG Xianghong, ZHANG Yu, LIN Rongfu, ZHANG Meng, LIU Mengmeng, JIANG Tao. Landslide Susceptibility Assessment Method Incorporating Index of Entropy Based on Support Vector Machine: A Case Study of Shaanxi Province[J]. Geomatics and Information Science of Wuhan University, 2020, 45(8): 1214-1222. doi: 10.13203/j.whugis20200109
Citation: XU Shenghua, LIU Jiping, WANG Xianghong, ZHANG Yu, LIN Rongfu, ZHANG Meng, LIU Mengmeng, JIANG Tao. Landslide Susceptibility Assessment Method Incorporating Index of Entropy Based on Support Vector Machine: A Case Study of Shaanxi Province[J]. Geomatics and Information Science of Wuhan University, 2020, 45(8): 1214-1222. doi: 10.13203/j.whugis20200109

熵指数融入支持向量机的滑坡灾害易发性评价方法—以陕西省为例

doi: 10.13203/j.whugis20200109
基金项目: 

国家重点研发计划 2016YFC0803101

国家重点研发计划 2016YFC0803108

国家自然科学基金 71903183

中国测绘科学研究院科研业务费 7771701

详细信息
    作者简介:

    徐胜华,博士,研究员,主要研究方向为时空数据地学分析、应急地理信息服务。xushh@casm.ac.cn

    通讯作者: 张玉,博士。zhangyu@casm.ac.cn
  • 中图分类号: P208

Landslide Susceptibility Assessment Method Incorporating Index of Entropy Based on Support Vector Machine: A Case Study of Shaanxi Province

Funds: 

The National Key Research and Development Program of China 2016YFC0803101

The National Key Research and Development Program of China 2016YFC0803108

the National Natural Science Foundation of China 71903183

Basic Research Fund of Chinese Academy of Surveying and Mapping 7771701

More Information
    Author Bio:

    XU Shenghua, PhD, professor, specializes in geospatial data analysis, and emergency geographic information services.xushh@casm.ac.cn

    Corresponding author: ZHANG Yu, PhD. zhangyu@casm.ac.cn
  • 摘要: 滑坡灾害易发性评价可为滑坡灾害风险管理、国土空间规划及滑坡监测提供科学依据。针对现有滑坡灾害易发性评价模型无法消除易发性评价指标因子在量纲、性质等方面的差异,尚未考虑易发性评价指标因子与滑坡灾害相关性,以及精度较高的经典机器学习模型训练效率较低、参数选取困难等问题,引入熵指数(index of entropy,IOE)和粒子群优化(particle swarm optimization,PSO)算法,提出IOE融入支持向量机(support vector machine, SVM)的滑坡灾害易发性评价方法。首先,基于滑坡灾害易发性评价指标因子,利用IOE模型计算SVM的调节因子;然后,采用PSO算法迭代求解SVM最优解,根据SVM二分类得到的隶属度来区分滑坡灾害易发性;最后,以陕西省作为实验区,从滑坡灾害易发性分区图、分区统计及评价模型精度3个方面将所提方法与SVM方法进行了对比,实验结果表明所提方法的准确性、可靠性优于SVM方法。
  • 图  1  本文算法流程图

    Figure  1.  Flowchart of the Proposed Method

    图  2  易发性评价结果图

    Figure  2.  Results of Landslide Susceptibility Assessment

    图  3  ROC曲线

    Figure  3.  ROC Curve

    表  1  灾害易发性评价不确定性方法的分类及评述

    Table  1.   Classification and Uncertainty Methods of Hazard Susceptibility Assessment

    类别 方法 评述
    基于知识驱动的分析方法 经验模型 模糊逻辑法[3] 方法简单,隶属度函数及模糊算子的选取具有较强的主观性
    层次分析法[3-5] 对象分析直观,因子权重的获取存在主观性,适用于解决目标结构复杂且存在不确定性的评价情况
    专家打分法[6] 依赖于专家丰富的经验知识,主观性较强
    基于数据驱动的分析方法 统计分析模型 证据权法[7] 要求各证据满足条件独立性
    信息量法[8] 对数据样本要求少,可解决多源数据差异性,计算量大
    确定性系数法[9-10] 可消除部分误差,但难以确定各个因子与灾害点的关系
    机器学习模型 逻辑回归[8, 11] 对样本数据要求较高,适用于数据资料详尽的地区
    决策树[12] 适用于单个模型,易产生过拟合现象
    人工神经网络[13-15] 能够处理非线性数据关系,硬件条件高,计算时间长
    随机森林法[15-16] 可处理高维度、大数据量数据,具有较高的泛化能力,但在噪音较大的分类问题上易过拟合
    支持向量机[17-19] 数据需求量少,精度高,易受因子影响
    下载: 导出CSV

    表  2  滑坡灾害点占比分区统计/%

    Table  2.   Statistics of Percent of Landslide Hazard Areas/%

    易发性 SVM 本文方法
    极低易发区 4.69 2.62
    低易发区 10.65 6.57
    中易发区 12.50 13.16
    高易发区 17.31 19.01
    极高易发区 54.85 58.64
    下载: 导出CSV

    表  3  滑坡灾害点分布密度分区统计/km-2

    Table  3.   Statistics of Distribution Density of Landslide Hazard Areas/km-2

    易发性 SVM 本文方法
    极低易发区 0.004 5 0.003 0
    低易发区 0.022 9 0.010 8
    中易发区 0.060 1 0.055 2
    高易发区 0.119 7 0.132 2
    极高易发区 0.328 1 0.357 4
    下载: 导出CSV
  • [1] 于宪煜.基于多源数据和多尺度分析的滑坡易发性评价方法研究[D]. 武汉:中国地质大学, 2016

    Yu Xianyu. Study on the Landslide Susceptibility Evaluation Method Based on Multi-source Data and Multi-scale Analysis[D]. Wuhan: China University of Geosciences,2016
    [2] 黄发明. 基于3S和人工智能的滑坡位移预测与易发性评价[D]. 武汉:中国地质大学, 2017

    Huang Faming. Landslide Displacement Prediction and Susceptibility Assessment Based on 3S and Artificial Intelligence[D]. Wuhan: China University of Geosciences, 2017
    [3] Pourghasemi H R, Pradhan B, Gokceoglu C. Application of Fuzzy Logic and Analytical Hierarchy Process (AHP) to Landslide Susceptibility Mapping at Haraz Watershed, Iran[J]. Natural Hazards, 2012, 63(2): 965-996 doi:  10.1007/s11069-012-0217-2
    [4] 胡致远,罗文强,晏鄂川,等.基于改进层次分析法的英山县地质灾害易发性评价[J].安全与环境工程, 2018, 25(4): 28-32 doi:  10.13578/j.cnki.issn.1671-1556.2018.04.006

    Hu Zhiyuan, Luo Wenqiang, Yan E’chuan, et al. IAHP-Based Evaluation of Susceptibility of Geological Hazards in Yingshan County[J]. Safety and Environmental Engineering, 2018, 25(4): 28-32 doi:  10.13578/j.cnki.issn.1671-1556.2018.04.006
    [5] 曹璞源,胡胜,邱海军,等.基于模糊层次分析的西安市地质灾害危险性评价[J].干旱区资源与环境, 2017,31(8):136-142 doi:  10.13448/j.cnki.jalre.2017.259

    Cao Puyuan, Hu Sheng, Qiu Haijun, et al. Evaluation of Geological Hazards and Its Validation in Xi’an City Based on FAHP[J]. Journal of Arid Land Resources and Environment, 2017, 31(8):136-142 doi:  10.13448/j.cnki.jalre.2017.259
    [6] 刘阳. 延长县滑坡地质灾害风险评估和管理研究[D].西安:长安大学,2009

    Liu Yang. Extension of the County Landslide Disaster Risk Assessment and Management Research[D]. Xi’an: Chang’an University, 2009
    [7] 孙琳,任娜娜, 李云安, 等. 基于证据权法的公路路基岩溶塌陷危险性评价[J]. 中国地质灾害与防治学报, 2019, 30(3):94-100 http://www.cnki.com.cn/Article/CJFDTotal-ZGDH201903018.htm

    Sun Lin, Ren Nana, Li Yun’an, et al. Risk Assessment on Karst Collapse of the Highway Subgrade Based on Weights of Evidence Method[J]. The Chinese Journal of Geological Hazard and Control, 2019, 30(3):94-100 http://www.cnki.com.cn/Article/CJFDTotal-ZGDH201903018.htm
    [8] 张俊, 殷坤龙, 王佳佳, 等. 三峡库区万州区滑坡灾害易发性评价研究[J].岩石力学与工程学报, 2016, 35(2):284-296 doi:  10.13722/j.cnki.jrme.2015.0318

    Zhang Jun, Yin Kunlong, Wang Jiajia, et al.Evaluation of Landslide Susceptibility for Wanzhou District of Three Gorges Reservoir[J]. Chinese Journal of Rock Mechanics and Engineering, 2016, 35(2):284-296 doi:  10.13722/j.cnki.jrme.2015.0318
    [9] 李远远, 梅红波, 任晓杰,等. 基于确定性系数和支持向量机的地质灾害易发性评价[J].地球信息科学学报,2018,20(12):1 699-1 709 http://www.cnki.com.cn/Article/CJFDTotal-DQXX201812003.htm

    Li Yuanyuan, Mei Hongbo, Ren Xiaojie, et al. Geological Disaster Susceptibility Evaluation Based on Certainty Factor and Support Vector Machine[J]. Journal of Geo-Information Science, 2018, 20(12): 1 699-1 709 http://www.cnki.com.cn/Article/CJFDTotal-DQXX201812003.htm
    [10] 杨光, 徐佩华, 曹琛, 等.基于确定性系数组合模型的区域滑坡敏感性评价[J].工程地质学报, 2019, 27(5):1 153-1 163

    Yang Guang, Xu Peihua, Cao Chen, et al. Assessment of Regional Landslide Susceptibility Based on Combined Model of Certainty Factor Method[J]. Journal of Engineering Geology, 2019, 27(5): 1 153-1 163
    [11] Althuwaynee O F, Pradhan B, Park H J,et al. A Novel Ensemble Decision Tree-Based Chi-squared Automatic Interaction Detection (CHAID) and Multivariate Logistic Regression Models in Landslide Susceptibility Mapping[J]. Landslides, 2014, 11(6): 1 063-1 078 doi:  10.1007/s10346-014-0466-0
    [12] Hong H Y, Pradhan B, Xu C, et al. Spatial Prediction of Landslide Hazard at the Yihuang Area (China) Using Two-Class Kernel Logistic Regression, Alternating Decision Tree and Support Vector Machines[J]. Catena, 2015, 133: 266-281 doi:  10.1016/j.catena.2015.05.019
    [13] 张晓敏. 基于GIS的陕西省滑坡灾害危险性评价及分区研究[D].西安:长安大学,2019

    Zhang Xiaomin. Hazard Assessment and Zoning Research of Landslide in Shaanxi Province Based on GIS[D]. Xi’an: Chang’an University, 2019
    [14] Pradhan B,Youssef A M,Varathrajoo R.Approaches for Delineating Landslide Hazard Areas Using Different Training Sites in an Advanced Artificial Neural Network Model[J]. Geo-spatial Information Science, 2010, 13(2):93-102 doi:  10.1007/s11806-010-0236-7
    [15] 孙德亮. 基于机器学习的滑坡易发性区划与降雨诱发滑坡预报预警研究[D].上海:华东师范大学,2019

    Sun Deliang. Mapping Landslide Susceptibility Based on Machine Learning and Forecast Warning of Landslide Induced by Rainfall[D]. Shanghai: East China Normal University, 2019
    [16] 刘坚, 李树林, 陈涛. 基于优化随机森林模型的滑坡易发性评价[J].武汉大学学报·信息科学版,2018,43(7):1 085-1 091 doi:  10.13203/j.whugis20160515

    Liu Jian, Li Shulin, Chen Tao. Landslide Susceptibility Assessment Based on Optimized Random Forest Model[J].Geomatics and Information Science of Wuhan University, 2018, 43(7):1 085-1 091 doi:  10.13203/j.whugis20160515
    [17] 武雪玲,任福,牛瑞卿,等.斜坡单元支持下的滑坡易发性评价支持向量机模型[J].武汉大学学报·信息科学版, 2013, 38(12):1 499-1 503 http://ch.whu.edu.cn/article/id/2839

    Wu Xueling, Ren Fu, Niu Ruiqing, et al. Landslide Spatial Prediction Based on Slope Units and Support Vector Machines[J]. Geomatics and Information Science of Wuhan University, 2013, 38(12):1 499-1 503 http://ch.whu.edu.cn/article/id/2839
    [18] Ballabio C, Sterlacchini S. Support Vector Machines for Landslide Susceptibility Mapping: The Staffora River Basin Case Study, Italy[J]. Mathematical Geosciences, 2012,44(1):47-70 doi:  10.1007/s11004-011-9379-9
    [19] Tehrany M S, Pradhan B, Mansor S, et al. Flood Susceptibility Assessment Using GIS-Based Support Vector Machine Model with Different Kernel Types[J]. Catena, 2015,125:91-101 doi:  10.1016/j.catena.2014.10.017
    [20] 宁奎斌,李永红,何倩,等.2000—2016年陕西省地质灾害时空分布规律及变化趋势[J].中国地质灾害与防治学报,2018,29(1):93-101 doi:  10.16031/j.cnki.issn.1003-8035.2018.01.15

    Ning Kuibin, Li Yonghong, He Qian, et al. The Spatial and Temporal Distribution and Trend of Geological Disaster in Shaanxi Province from 2000 to 2016[J].The Chinese Journal of Geological Hazard and Control, 2018, 29(1):93-101 doi:  10.16031/j.cnki.issn.1003-8035.2018.01.15
    [21] 单博. 基于3S技术的奔子栏水源地库区库岸地质灾害易发性评价及灾害风险性区划研究[D].长春:吉林大学, 2014

    Shan Bo. Reservoir Bank Geological Disaster Susceptibility Assessment and Study on Zoning of Disaster Risk in Benzilan Water-source Reservoir Area Based on 3S Technology[D]. Changchun: Jilin University, 2014
    [22] Hong H, Chen W, Xu C, et al. Rainfall-Induced Landslide Susceptibility Assessment at the Chongren Area (China) Using Frequency Ratio, Certainty Factor, and Index of Entropy[J]. Geocarto International, 2017, 32(2): 139-154 doi:  10.1080/10106049.2015.1130086
    [23] Shadman R M, Aryal J, Shahabi H, et al. Fuzzy Shannon Entropy: A Hybrid GIS-Based Landslide Susceptibility Mapping Method[J]. Entropy, 2016, 18(10): 343-363 doi:  10.3390/e18100343
    [24] Cortes C, Vapnik V. Support-Vector Networks[J]. Machine Learning, 1995, 20(3): 273-297 doi:  10.3390/e18100343
    [25] Wu D. Gear Box Fault Diagnosis Method Based on Support Vector Machine[J].Journal of Vibration, Measurement and Diagnosis, 2008, 28: 339-342
    [26] Azriel R,Wechser H. Pattern Recognition: Historical Perspective and Future Directions[J]. International Journal of Imaging Systems and Technology, 2000, 11: 101-116 doi:  10.1002/1098-1098(2000)11:2<101::AID-IMA1>3.0.CO;2-J
    [27] Chen Y, Ma H W. Research on Fault Diagnosis of Shearer Rocker Arm Gear Box Based on PSO-SVM[J]. Coal Mine Machinery, 2015, 36: 303-306
  • [1] 何朝阳, 许强, 巨能攀, 解明礼.  滑坡实时监测预警模型调度算法优化研究 . 武汉大学学报 ● 信息科学版, 2021, 46(7): 970-982. doi: 10.13203/j.whugis20200314
    [2] 段佩祥, 钱海忠, 何海威, 谢丽敏, 罗登瀚.  基于支持向量机的线化简方法 . 武汉大学学报 ● 信息科学版, 2020, 45(5): 744-752, 783. doi: 10.13203/j.whugis20180434
    [3] 张福浩, 朱月月, 赵习枝, 张杨, 石丽红, 刘晓东.  地理因子支持下的滑坡隐患点空间分布特征及识别研究 . 武汉大学学报 ● 信息科学版, 2020, 45(8): 1233-1244. doi: 10.13203/j.whugis20200126
    [4] 秦宏楠, 马海涛, 于正兴.  地基SAR技术支持下的滑坡预警预报分析方法 . 武汉大学学报 ● 信息科学版, 2020, 45(11): 1697-1706. doi: 10.13203/j.whugis20200268
    [5] 陈涛, 钟子颖, 牛瑞卿, 刘桐, 陈胜云.  利用深度信念网络进行滑坡易发性评价 . 武汉大学学报 ● 信息科学版, 2020, 45(11): 1809-1817. doi: 10.13203/j.whugis20190144
    [6] 高飞, 王美珍, 刘学军, 王自然.  一种监控摄像机网络-路网覆盖优化调度方法 . 武汉大学学报 ● 信息科学版, 2020, 45(3): 362-373. doi: 10.13203/j.whugis20180247
    [7] 武雪玲, 杨经宇, 牛瑞卿.  一种结合SMOTE和卷积神经网络的滑坡易发性评价方法 . 武汉大学学报 ● 信息科学版, 2020, 45(8): 1223-1232. doi: 10.13203/j.whugis20200127
    [8] 刘渊博, 牛瑞卿, 于宪煜, 张凯翔.  旋转森林模型在滑坡易发性评价中的应用研究 . 武汉大学学报 ● 信息科学版, 2018, 43(6): 959-964. doi: 10.13203/j.whugis20160132
    [9] 刘坚, 李树林, 陈涛.  基于优化随机森林模型的滑坡易发性评价 . 武汉大学学报 ● 信息科学版, 2018, 43(7): 1085-1091. doi: 10.13203/j.whugis20160515
    [10] 段功豪, 牛瑞卿, 彭令, 付杰.  诱发因素影响下的滑坡参数优化预测模型研究 . 武汉大学学报 ● 信息科学版, 2017, 42(4): 531-536. doi: 10.13203/j.whugis20140913
    [11] 段功豪, 牛瑞卿, 赵艳南, 张凯翔, 咬登魁.  基于动态指数平滑模型的降雨诱发型滑坡预测 . 武汉大学学报 ● 信息科学版, 2016, 41(7): 958-962. doi: 10.13203/j.whugis20140276
    [12] 武雪玲, 沈少青, 牛瑞卿.  GIS支持下应用PSO-SVM模型预测滑坡易发性 . 武汉大学学报 ● 信息科学版, 2016, 41(5): 665-671. doi: 10.13203/j.whugis20130566
    [13] 武雪玲, 任福, 牛瑞卿.  多源数据支持下的三峡库区滑坡灾害空间智能预测 . 武汉大学学报 ● 信息科学版, 2013, 38(8): 963-968.
    [14] 武雪玲, 任福, 牛瑞卿, 彭令.  斜坡单元支持下的滑坡易发性评价支持向量机模型 . 武汉大学学报 ● 信息科学版, 2013, 38(12): 1499-1503.
    [15] 彭令, 牛瑞卿, 赵艳南, 邓清禄.  基于核主成分分析和粒子群优化支持向量机的滑坡位移预测 . 武汉大学学报 ● 信息科学版, 2013, 38(2): 148-152,161.
    [16] 范千, 花向红.  基于相空间重构与支持向量机预测滑坡位移的一种新方法 . 武汉大学学报 ● 信息科学版, 2009, 34(2): 248-251.
    [17] 陈刚, 鄂栋臣.  基于纹理分析和支持向量机的极地冰雪覆盖区的云层检测 . 武汉大学学报 ● 信息科学版, 2006, 31(5): 403-406.
    [18] 徐芳, 梅文胜, 燕琴.  支持向量机中遗传模糊C-均值的样本预选取方法 . 武汉大学学报 ● 信息科学版, 2005, 30(10): 921-924.
    [19] 梅建新, 段汕, 秦前清.  基于支持向量机的特定目标检测方法 . 武汉大学学报 ● 信息科学版, 2004, 29(10): 912-915,932.
    [20] 徐芳, 燕琴.  基于支持向量机的航空影像纹理分类研究 . 武汉大学学报 ● 信息科学版, 2003, 28(5): 517-520.
  • 加载中
图(3) / 表(3)
计量
  • 文章访问数:  782
  • HTML全文浏览量:  149
  • PDF下载量:  95
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-03-26
  • 刊出日期:  2020-08-05

熵指数融入支持向量机的滑坡灾害易发性评价方法—以陕西省为例

doi: 10.13203/j.whugis20200109
    基金项目:

    国家重点研发计划 2016YFC0803101

    国家重点研发计划 2016YFC0803108

    国家自然科学基金 71903183

    中国测绘科学研究院科研业务费 7771701

    作者简介:

    徐胜华,博士,研究员,主要研究方向为时空数据地学分析、应急地理信息服务。xushh@casm.ac.cn

    通讯作者: 张玉,博士。zhangyu@casm.ac.cn
  • 中图分类号: P208

摘要: 滑坡灾害易发性评价可为滑坡灾害风险管理、国土空间规划及滑坡监测提供科学依据。针对现有滑坡灾害易发性评价模型无法消除易发性评价指标因子在量纲、性质等方面的差异,尚未考虑易发性评价指标因子与滑坡灾害相关性,以及精度较高的经典机器学习模型训练效率较低、参数选取困难等问题,引入熵指数(index of entropy,IOE)和粒子群优化(particle swarm optimization,PSO)算法,提出IOE融入支持向量机(support vector machine, SVM)的滑坡灾害易发性评价方法。首先,基于滑坡灾害易发性评价指标因子,利用IOE模型计算SVM的调节因子;然后,采用PSO算法迭代求解SVM最优解,根据SVM二分类得到的隶属度来区分滑坡灾害易发性;最后,以陕西省作为实验区,从滑坡灾害易发性分区图、分区统计及评价模型精度3个方面将所提方法与SVM方法进行了对比,实验结果表明所提方法的准确性、可靠性优于SVM方法。

English Abstract

徐胜华, 刘纪平, 王想红, 张玉, 林荣福, 张蒙, 刘猛猛, 姜涛. 熵指数融入支持向量机的滑坡灾害易发性评价方法—以陕西省为例[J]. 武汉大学学报 ● 信息科学版, 2020, 45(8): 1214-1222. doi: 10.13203/j.whugis20200109
引用本文: 徐胜华, 刘纪平, 王想红, 张玉, 林荣福, 张蒙, 刘猛猛, 姜涛. 熵指数融入支持向量机的滑坡灾害易发性评价方法—以陕西省为例[J]. 武汉大学学报 ● 信息科学版, 2020, 45(8): 1214-1222. doi: 10.13203/j.whugis20200109
XU Shenghua, LIU Jiping, WANG Xianghong, ZHANG Yu, LIN Rongfu, ZHANG Meng, LIU Mengmeng, JIANG Tao. Landslide Susceptibility Assessment Method Incorporating Index of Entropy Based on Support Vector Machine: A Case Study of Shaanxi Province[J]. Geomatics and Information Science of Wuhan University, 2020, 45(8): 1214-1222. doi: 10.13203/j.whugis20200109
Citation: XU Shenghua, LIU Jiping, WANG Xianghong, ZHANG Yu, LIN Rongfu, ZHANG Meng, LIU Mengmeng, JIANG Tao. Landslide Susceptibility Assessment Method Incorporating Index of Entropy Based on Support Vector Machine: A Case Study of Shaanxi Province[J]. Geomatics and Information Science of Wuhan University, 2020, 45(8): 1214-1222. doi: 10.13203/j.whugis20200109
  • 近年来,滑坡灾害频发,滑坡灾害的易发性评价作为防灾减灾工作的重点和难点,引起了国内外学者的广泛关注[1]。滑坡灾害易发性评价是对滑坡灾害的时空分布和发生概率进行预测,预测和分析结果可为滑坡灾害风险管理、国土空间规划布局和滑坡监测提供重要的决策依据[2-3]。因此,为丰富滑坡灾害评价方法与模型、保护人们的生命财产安全、减少灾害损失、提高防灾减灾工作效率,开展滑坡灾害易发性评价及区划研究不仅具有一定的学术意义,还可以为政府部门制定防灾减灾措施提供科学依据,具有重要的应用价值。

    中国是一个地质灾害多发的国家,其中滑坡地质灾害因其发生频率高、影响范围广和持续时间长而成为诸多地质灾害中的严重灾种[3]。2019年《全国地质灾害通报》显示:全国共发生地质灾害6 181起,其中滑坡4 220起,占地质灾害总数的68.27%。由此可见滑坡地质灾害的严重性。位于中国西北部的陕西省是全国滑坡地质灾害防治的重点区域。陕西省的地质构造运动活跃,地质条件较复杂,沟谷深切、地形破碎、斜坡陡峻,且受各种影响因素如工程建设、土地资源利用、矿产资源开发、强降雨等作用,滑坡灾害隐患显著增加。因此,对陕西省滑坡灾害进行监测与预测具有十分重要的实践意义。

    根据理论基础的不同,滑坡灾害易发性评价方法可以分为确定性方法和不确定性方法[1-2]这两类。确定性方法是利用以滑坡诱发机制、边坡稳定性计算为基础的传统定量物理力学模型,对一定范围内滑坡发生的概率进行预测的方法[2]。确定性方法能够充分地考虑边坡失稳破坏的力学原理,一般适用于大比例尺、小范围的滑坡灾害评价。不确定性方法是通过统计分析滑坡发生处的历史灾情信息,将影响灾害发生的因子进行权重叠加,从而实现对研究区内的滑坡发生概率进行预测的方法[1-2]。不确定方法由于考虑了各指标因子的权重信息,评价精度较高,其主要分类、方法与评述见表 1

    表 1  灾害易发性评价不确定性方法的分类及评述

    Table 1.  Classification and Uncertainty Methods of Hazard Susceptibility Assessment

    类别 方法 评述
    基于知识驱动的分析方法 经验模型 模糊逻辑法[3] 方法简单,隶属度函数及模糊算子的选取具有较强的主观性
    层次分析法[3-5] 对象分析直观,因子权重的获取存在主观性,适用于解决目标结构复杂且存在不确定性的评价情况
    专家打分法[6] 依赖于专家丰富的经验知识,主观性较强
    基于数据驱动的分析方法 统计分析模型 证据权法[7] 要求各证据满足条件独立性
    信息量法[8] 对数据样本要求少,可解决多源数据差异性,计算量大
    确定性系数法[9-10] 可消除部分误差,但难以确定各个因子与灾害点的关系
    机器学习模型 逻辑回归[8, 11] 对样本数据要求较高,适用于数据资料详尽的地区
    决策树[12] 适用于单个模型,易产生过拟合现象
    人工神经网络[13-15] 能够处理非线性数据关系,硬件条件高,计算时间长
    随机森林法[15-16] 可处理高维度、大数据量数据,具有较高的泛化能力,但在噪音较大的分类问题上易过拟合
    支持向量机[17-19] 数据需求量少,精度高,易受因子影响

    现有方法各有利弊,相比经验模型与统计分析模型,基于数据驱动的机器学习方法应用于省级大区域滑坡灾害易发性评价精度较高,能较好地处理环境因子和滑坡编录之间的非线性相关性,避免了数据及模型参数获取的困难,且具有可靠性。经典的支持向量机(support vector machine, SVM)模型存在训练效率较低、参数选取困难等缺点。因此,本文引入熵指数(index of entropy,IOE)和粒子群优化(particle swarm optimization,PSO)算法,提出了IOE融入SVM的滑坡灾害易发性评价方法,以提高滑坡灾害易发性评价的精度。

    • 陕西省在中国西北部,东经105°29′~111°15′、北纬31°42′~39°35′之间,地域上南北狭长、东西窄,总面积约20.56 万km2。区内地势南北高、中部低,北部为陕北高原,地表以第四系风成黄土、风成沙为主;中部为关中平原,地势低平,以冲积、洪积物及黄土为主,海拔320~800 m;南部由陇山、秦岭、大巴山组成陕南秦巴山地,地形起伏大,河流深切,冲积物组成的河流阶地零星分布于山间盆地与大河两侧,海拔多在1 000~3 000 m之间。

      陕西省地跨长江、黄河两大流域。秦岭以南的长江水系,河网密度大,受构造控制多呈网格状或平行状,流域面积约为7.22 万km2,占全省面积的35.2%;秦岭以北的黄河水系,河网密度较小,流域面积约为13.34 万km2,占全省面积的64.8%。区内年平均降水量340~1 240 mm,降水分布很不均匀,从北到南逐渐递增。每年的7月—9月是研究区降水最为集中的时期,尤其是陕北地区,该时段的降水量占年降水量的50%~65%,且多以暴雨形式出现;巴山地区的年降水量达900~1 600 mm,且集中在夏、秋两季,是全省降水量最多的地区;陕北长城沿线年降水量仅300~450 mm,是全省降水量最少的地区[20]

      随着人类频繁的工程活动,道路、水利工程的不断开挖,形成了高陡边坡的地形趋势,破坏了斜坡稳定性,并在地层岩性、地质构造、水文气象等自然环境作用下,滑坡、崩塌、泥石流、地面塌陷、地裂缝、地面沉降等地质灾害广泛发育。

    • 陕西省滑坡灾害点数据来源于中国科学院资源环境科学数据中心的“地质灾害点空间分布数据”(http://www.resdc.cn/data.aspx?DATAID=290),数据格式为excel和矢量shape文件格式,数据内容包括崩塌、塌陷、泥石流、地面沉降、地裂缝、滑坡、斜坡等7大类地质灾害点,其中陕西省滑坡灾害点10 193个。陕西省地质岩性数据来源于中国科学院资源环境科学数据中心的“中国地质岩性空间分布数据”(http://www.resdc.cn/data.aspx?DATAID=307),陕西省共有4 940个地质岩性单元。陕西省年降水量数据来源于中国科学院资源环境科学数据中心的“中国1980年以来逐年年降水量空间插值数据集”(http://www.resdc.cn/data.aspx?DATAID=229),年降水量单位为0.1 mm。数字高程模型(digital elevation model, DEM)数据、居民点数据来自于全国第一次地理国情普查成果数据。道路数据、水系数据是由开放街道地图(OpenStreetMap)提供的公开数据集。

      为便于统计与分析,根据研究区大小,将整个研究区按照30 m×30 m的格网单元进行划分,共划分为343 389 885个模型单元。

    • 结合研究区滑坡发育的地质环境特点,根据滑坡灾害各指标因素下的滑坡比例、分级比例和信息量值,对各指标因子进行状态分级和相关性分析[21-23],本文最终确定人类影响因子(距道路距离、距水系距离、距居民点距离)、气象特征因子(累计降雨量)、地形特征因子(高程、坡度、坡向)和地层岩性特征因子(岩组滑坡灾害点密度)共4类8个指标因子构建研究区滑坡灾害易发性评价指标体系。其中,对于地层岩性因子,考虑到研究区内地质构造较为复杂,结合陕西省地质岩性空间分布情况及滑坡灾害点分布情况,用各个地质岩组的灾害点密度进行量化。

    • 为了对滑坡灾害易发性模型进行训练与建模,需要建立滑坡灾害易发性评价训练样本数据集。每一条样本数据由滑坡属性(滑坡灾害单元或者非滑坡灾害单元)与滑坡评价因子(8个滑坡灾害易发性评价因子属性值)两部分组成,滑坡灾害易发性评价因子是评价模型的模型参量,滑坡属性则是评价模型的预测目标。陕西省10 193个滑坡灾害点对应10 193个单元,出于样本均衡性方面的考虑,在建立评价模型训练样本数据集时,从剩下的343 379 692个单元中随机选择与地质灾害点数目一致的单元数目作为非地质灾害单元,将这两部分数据作为样本数据。为了保证非滑坡灾害单位分布均匀并减少误差,选择的非滑坡单元要求与已知滑坡单元保持1 000 m以上距离,并且所有的非滑坡单元之间距离不小于1 000 m。

    • SVM以训练误差作为优化问题的约束条件,最小化置信区间为优化目标。SVM是一种基于结构化风险最小化原理的机器学习方法,具有比其他传统方法更好的推广能力[24]。由于SVM求解过程最终转化为二次规划求解,其解是唯一的最优解。SVM在解决非线性高维模式识别问题上具有许多独特的优势[25-26]

      假设滑坡训练数据D有一组样本Xi,其中i=1, 2...n, Xi为包含8个滑坡敏感性因子的输入向量,${y_i} \in \left\{ { - 1, 1} \right\}$为其对应的两个输出值,即滑坡和非滑坡,n为训练样本的数量。SVM训练过程的目标是找到一个最优的超平面,将训练数据分成两个输出类。表示为:

      $$ {\bm{wx}} + b = 0 $$ (1)

      式中,w表示法向量;x为超平面上的点;b为常数。当wx最优时,表示找到了最优超平面,使得正、负样本间的距离最大。通过求解下面的优化问题,可以确定最优超平面为:

      $$ \mathop {{\rm{minimize}}}\limits_{W, b, \xi } :\frac{1}{2}{{\bm{W}}^{\rm{T}}}{\bm{W}} + C\sum\limits_{i = 1}^h {{\xi _i}} $$ (2)

      受约束于

      $$ {y_i}({w^T}x + b) \ge 1 - {\xi _i} $$ (3)

      式中,W是确定超平面方向的权重向量,确定分割平面方向;b表示位移量,是一个常数项;h是支持向量点的个数;${\xi _i}$是松弛变量;C>0为惩罚参数,c值大小与惩罚程度成正相关。

      使用拉格朗日乘子αi,在约束下$\sum\limits_i {{\alpha _i}{y_i} = 0} $且$0 \le {\alpha _i} \le C$,优化问题即转换为:

      $$ \max :\mathop \sum \limits_i {a_i} - \frac{1}{2}\mathop \sum \limits_i \mathop \sum \limits_j {a_i}{\alpha _j}{y_i}{y_j}K\left( {{x_i},{y_j}} \right) $$ (4)

      上述问题可用二次规划算法求解。其中,j=1, 2···n且$i \ne j$;$0 < {\alpha _i} < C$的样本称为无界支持向量;αi=C的样本称为有界支持向量;αi<0的样本称为支持向量;K(xi, yi)为核函数,意味着存在一个从输入空间到特征空间的映射$\phi (x)$,对任意输入空间中的(xi, yi),有:

      $$ K({x_i}, {y_j}) = \phi {({x_i})^{\rm{T}}}\phi ({y_j}) $$ (5)

      于是,数据分类的SVM模型的决策函数,即隶属度为:

      $$ f(x) = {\rm{sign}}\left( {\mathop \sum \limits_{i = 1}^n {y_i}{\alpha _i}K\left( {{x_i}, {y_j}} \right) + b} \right) $$ (6)

      由于SVM模型的特征空间受所使用的核函数的影响,因此核函数的选择对SVM训练的成功和分类精度起着至关重要的作用。根据核函数的不同,常用的SVM主要有线性核函数(linear kernel, LN)-SVM、多项式核函数(polynomial kernel, PL)-SVM、径向基函数(radial basis function, RBF)-SVM和sigmoid核函数(sigmoid kernel, SIG)-SVM。顾及到在先验知识不足的情况下,径向基函数可以将样本映射到一个更高维的空间,当类标签和特征之间的关系是非线性时的样例时,可以有较好的处理效果[27],因此本文选择径向基函数作为核函数。

    • 熵表示系统的不确定性程度。滑坡能量熵反映了影响滑坡发生的各种因素的程度[22-23]。可以利用熵值来计算指标体系的目标权重。IOE允许使用下面的方程估计SVM模型式(2)中每个调节因子Wt的权重:

      $$ {p_l} = \frac{{{b_{st}}}}{{{a_t}}} $$ (7)
      $$ {p_l} = \frac{{{p_l}}}{{\mathop \sum \limits_{l = 1}^{{S_l}} {p_l}}} $$ (8)

      式中,atbst分别为研究区和滑坡区数量;pl是第l类型滑坡的百分比;$l = 1, 2 \cdots {S_l}, {S_l}$是l的类总数;Pl是概率密度。熵值Ht、${H_{t\max }}$的计算公式为:

      $$ {H_t} = \mathop \sum \limits_{l = 1}^{{S_t}} {P_l}{\rm{lo}}{{\rm{g}}_2}{P_l} $$ (9)
      $$ {H_{t\max }} = {\rm{lo}}{{\rm{g}}_2}{S_l} $$ (10)

      信息系数It定义为:

      $$ {I_l} = \frac{{{H_{l{\rm{max}}}} - {H_l}}}{{{H_{l{\rm{max}}}}}} $$ (11)
      $$ {W_l} = {I_l} \times {P_l} $$ (12)

      通过式(12)计算Wl的权值,其结果从0到1变化。该值越接近数字1,则不稳定性越大。

    • 在确定核函数的类型后,需要确定惩罚参数C和径向基函数参数γ。参数C决定了分类器的训练误差和泛化能力;参数γ影响样本在特征空间中的分布形式。参数的选择对分类器的性能非常重要,传统的网格搜索是一种寻找最优参数的方法,搜索不仅耗时且结果不一定是最好的。因此,本文采用PSO来选择参数Cγ,以提高分类性能。

      PSO是继蚁群算法和鱼群算法之后的一种群体智能优化算法,用于求解多项式复杂程度的非确定性问题(non-deterministic polynomial complete, NPC)。PSO随机生成初始解粒子,粒子通过位置、速度在解空间中不断迭代搜索,通过适应度函数计算适应值来判断搜索解的优劣。通过个体极值和种群极值来更新粒子位置。当每个粒子均完成其位置更新时,计算其适应度值。这一原则可简述如下。

      假设在一个N维搜索空间中,有一个种群$X = \left\{ {{x_1}, {x_2} \cdots {x_m}} \right\}$,由m个粒子组成。第i个粒子表示为${x_i} = \left[ {12{\rm{}} \cdots {x_{iN}}} \right]$的N维向量,表示第i个粒子在d维搜索空间中的位置,也表示该问题的一个可能解。根据目标函数,可以计算出每个粒子的位置Xi的适应度值。如果第i个粒子的速度是${V_i} = \left[ {{V_{i1}}{V_{i2}} \cdots {V_{iD}}} \right]$,单独的极值为${q_i} = ({q_{i1}}, {q_{i2}}{\rm{}} \cdots {\rm{}}{q_{iN}})$,种群极值为${q_g} = ({q_{g1}}, {q_{g2}}{\rm{}} \cdots {\rm{}}{q_{gN}})$,然后根据以下方程更新粒子的速度和位置:

      $$ V_{id}^{k + 1} = V_{id}^k + {c_1}{r_1}\left( {q_{id}^k - X_{id}^k} \right) + {c_2}{r_2}\left( {q_{gd}^k - X_{id}^k} \right) $$ (13)
      $$ X_{id}^{k + 1} = X_{id}^k + V_{id}^{k + 1} $$ (14)

      式中,$d = 1, 2 \cdots N;i = 1, 2 \cdots m;k$为迭代次数;c1c2是学习因子,它们是非负常数,使粒子向自身或其他更好的粒子学习,以达到接近自身或整个群体的更好位置的目的;r1r2是分布在[0, 1]的随机数。为了防止粒子的盲目搜索,一般建议位置不超过种群最远点,速度不超过最大值。

    • IOE可以计算滑坡灾害易发性评价指标因子与滑坡相关性,能够消除易发性评价指标因子在量纲、性质等方面的差异;PSO算法作为启发式算法中的一种,具有函数简单、收敛迅速等特点,算法实现简单、精度高,防止陷入局部最优。因此,在综合考虑这两种方法优势的基础上,本文将这两种方法结合在一起,构建IOE融入SVM的灾害易发性评价模型,解决了SVM模型中存在的参数赋值问题,提高了SVM模型作为滑坡灾害易发性评价模型的预测精度,并且最终达到提高滑坡灾害易发性评价结果准确性、可靠性的目的,算法流程如图 1所示。

      图  1  本文算法流程图

      Figure 1.  Flowchart of the Proposed Method

      算法过程如下:

      1)滑坡灾害易发性评价指标构建。选取4类8个指标因子构建研究区滑坡灾害易发性评价指标体系。

      2)样本数据集构建。随机选择与滑坡灾害点相同数目的单元作为非地质灾害单元,合并两者为样本数据集,并作为模型训练数据集和验证数据集。

      3)融合IOE的PSO-SVM模型。将训练数据代入IOE模型求解初始W,再利用训练样本数据训练SVM模型。在PSO求解参数时,将初始W作为初始搜索点,迭代求解最优参数Cγ,得到滑坡灾害易发性评价模型。基于陕西省数据集,利用易发性评价模型进行分类并得到隶属度。

      4)滑坡灾害分区图。利用自然间断法将隶属度划分为5类灾害易发性等级。

      5)精度评价。采用SVM方法与本文方法进行滑坡灾害易发性结果对比,计算两种方法受试者工作特征(receiver operating characteristic, ROC)曲线和曲线下面积(area under curve,AUC)值,以此来分析方法的优劣。

    • 为了验证本文方法的正确性和可靠性,利用陕西省滑坡灾害点数据进行了易发性评价分析,并从易发性分区图、分区统计及评价模型精度3个方面将本文方法与SVM方法进行了对比分析。

    • 图 2所示,从整体上看,两种方法所得到的滑坡灾害易发性分区具有较高的相似性,陕西省南部是滑坡灾害的极高发区域,这主要是由于该地区内分布着秦岭山脉,地区内沟壑纵横,海拔较高,坡度较陡,这为滑坡灾害的发生提供了良好的孕灾条件。陕西省中部滑坡灾害的易发性较低,这主要是由于陕西中部为平原地区,地势较为缓和,滑坡灾害的发生相对较少。陕西省北部亦有滑坡灾害中高发区分布,这主要是由于黄土高原的存在增加了滑坡的可能性。同时,可以看出区内滑坡灾害主要发生于陕南的低山和中山地区,尤其是陕南秦巴山区为区内滑坡灾害的高易发区和重点防范区。

      图  2  易发性评价结果图

      Figure 2.  Results of Landslide Susceptibility Assessment

      相较于SVM方法,在陕西省中部易发性较低的平原地区,本文方法将部分极低易发区划分为低易发区,关中平原虽然灾害点分布较少,但仍时有滑坡灾害发生,在部分有灾害点分布的区域,将灾害易发性提升一个等级,对灾害易发性分区更具有合理性。

    • 将SVM方法与本文方法所得到的滑坡灾害易发性分区图与滑坡灾害点进行叠加,统计了各类方法在各易发区的滑坡灾害点占比(见表 2)以及各易发区的滑坡灾害点分布密度(见表 3)。从表 2中可以看出,随着灾害易发性的提高,两种方法中各分区滑坡灾害点占比亦逐渐增加,在极高发区达到最大,与滑坡灾害点的实际分布规律较为吻合,易发性评价方法较为可靠。特别是在极高发区域,本文方法中滑坡灾害点占比达到了58.64%,高于SVM方法。从表 3中可以看出,在滑坡灾害点分布密度方面,本文方法得到的滑坡灾害易发性分区的灾害点分布密度在高发区以及极高发区的值均高于SVM方法,在低易发区的灾害点分布密度值亦低于SVM方法。这表明本文方法所划分的易发区与实际灾害点分布更为吻合,划分效果更好。

      表 2  滑坡灾害点占比分区统计/%

      Table 2.  Statistics of Percent of Landslide Hazard Areas/%

      易发性 SVM 本文方法
      极低易发区 4.69 2.62
      低易发区 10.65 6.57
      中易发区 12.50 13.16
      高易发区 17.31 19.01
      极高易发区 54.85 58.64

      表 3  滑坡灾害点分布密度分区统计/km-2

      Table 3.  Statistics of Distribution Density of Landslide Hazard Areas/km-2

      易发性 SVM 本文方法
      极低易发区 0.004 5 0.003 0
      低易发区 0.022 9 0.010 8
      中易发区 0.060 1 0.055 2
      高易发区 0.119 7 0.132 2
      极高易发区 0.328 1 0.357 4
    • 由于ROC曲线简单、直观,可准确地反映所用分析方法特异性和敏感性的关系,具有很好的实验准确性,因而被广泛地应用于地质灾害敏感性评价。在ROC曲线中,灵敏度与特异度是相互影响的,将灵敏度与特异度所组成的点对映射到坐标中,可以从左到右连成一条特定模型ROC曲线。并且在ROC曲线中,离左上角越近的点的预测准确性越高。ROC AUC可以反映和比较模型的评价预测精度。AUC取值范围为[0.5, 1]。当AUC=0.5时,模型预测效果没有价值;当0.5<AUC≤0.7时,有较低的准确性;当 0.7<AUC≤0.9时,准确性较高;当AUC>0.9时,准确性很高;当AUC=1时,模型预测的效果特别好。

      两种方法的ROC曲线如图 3所示,都有较好的预测准确率,曲线上离左上角最近的点与参考线的距离都很远,即这两种模型在ROC曲线评价方面都有较好的表现。而从细节上来看,本文方法中,离左上角最近的点要比SVM方法ROC曲线中的点距离参考线更远,这在一定程度上说明了本文方法要优于SVM方法。

      图  3  ROC曲线

      Figure 3.  ROC Curve

      为了对这一点进行定量分析,利用AUC对模型进行优劣评价。经ROC曲线检验得到本文方法的AUC值为0.89,SVM方法为0.82。这表明本文方法的准确性高于SVM方法,预测效果更好。

      综上可得,本文方法具有较高的预测精度,由于SVM方法无法消除易发性评价指标因子在量纲、性质等方面的差异,直接使用原始易发性评价指标因子数据,会突出数值较高的滑坡灾害评价因子在易发性评价模型中的作用。本文方法利用IOE消除量纲、误差等方面的影响,保证了滑坡灾害易发性评价因子在滑坡灾害易发性分析中的客观性,提高了滑坡灾害易发性评价模型的准确性、可靠性。

    • 滑坡灾害分布广泛,发生频率高,致灾结果严重,发生发展迅速,深入研究滑坡灾害的发生规律、分析滑坡灾害易发性,对实现减灾防灾具有十分重要的意义。本文以陕西省为研究区域,在分析陕西省历史滑坡灾害数据特征的基础上,利用提取出的研究区的地形特征(高程、坡度、坡向)、人类影响(距道路距离、距水系距离、距居民点距离)、气象特征(累计降雨量)和地层岩性特征(岩组滑坡灾害点密度)等影响因素作为研究区滑坡灾害重要因子,并构建IOE融入SVM的灾害易发性评价模型,对研究区滑坡灾害易发性进行评价。实验结果表明,本文方法具有较高的准确性、可靠性,对减少滑坡灾害带来的损失,提高滑坡灾害防治工作的效率具有重要理论意义与实际价值。

参考文献 (27)

目录

    /

    返回文章
    返回