留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种结合SMOTE和卷积神经网络的滑坡易发性评价方法

武雪玲 杨经宇 牛瑞卿

武雪玲, 杨经宇, 牛瑞卿. 一种结合SMOTE和卷积神经网络的滑坡易发性评价方法[J]. 武汉大学学报 ● 信息科学版, 2020, 45(8): 1223-1232. doi: 10.13203/j.whugis20200127
引用本文: 武雪玲, 杨经宇, 牛瑞卿. 一种结合SMOTE和卷积神经网络的滑坡易发性评价方法[J]. 武汉大学学报 ● 信息科学版, 2020, 45(8): 1223-1232. doi: 10.13203/j.whugis20200127
WU Xueling, YANG Jingyu, NIU Ruiqing. A Landslide Susceptibility Assessment Method Using SMOTE and Convolutional Neural Network[J]. Geomatics and Information Science of Wuhan University, 2020, 45(8): 1223-1232. doi: 10.13203/j.whugis20200127
Citation: WU Xueling, YANG Jingyu, NIU Ruiqing. A Landslide Susceptibility Assessment Method Using SMOTE and Convolutional Neural Network[J]. Geomatics and Information Science of Wuhan University, 2020, 45(8): 1223-1232. doi: 10.13203/j.whugis20200127

一种结合SMOTE和卷积神经网络的滑坡易发性评价方法

doi: 10.13203/j.whugis20200127
基金项目: 

自然资源部城市国土资源监测与仿真重点实验室开放基金 KF-2019-04-045

国家自然科学基金 41871355

中央高校基本科研业务费专项资金 CUGQY1936

详细信息
    作者简介:

    武雪玲,博士,副教授,主要从事滑坡灾害预测及地学空间分析方面的研究。wuxl@cug.edu.cn

    通讯作者: 牛瑞卿,博士,教授。rqniu@163.com
  • 中图分类号: P208

A Landslide Susceptibility Assessment Method Using SMOTE and Convolutional Neural Network

Funds: 

The Open Fund of Key Laboratory of Urban Land Resources Monitoring and Simulation, MNR KF-2019-04-045

the National Natural Science Foundation of China 41871355

the State Key Laboratory of Resources and Environmental Information System CUGQY1936

More Information
    Author Bio:

    WU Xueling, PhD, associate professor, specializes in landslide hazard predication and geoscientific spatial analysis. E-mail:wuxl@cug.edu.cn

    Corresponding author: NIU Ruiqing, PhD, professor. E-mail: rqniu@163.com
  • 摘要: 大规模的人类工程活动诱发和加剧了滑坡灾害的致灾情况,严重威胁工程安全和环境安全。滑坡易发性评价是滑坡监测预警的关键技术。针对传统滑坡监测手段数据源有限、缺乏挖掘滑坡灾害空间分布特征及其诱发因素的有效方法等问题,以位于三峡库区的中国重庆市万州区为研究区,基于地形、地质和遥感影像等多源数据,首先提取了22个滑坡易发性评价因子,并对这些因子进行多重共线性检验;然后采用合成少数类过采样技术(synthetic minority oversampling technique, SMOTE)解决滑坡和非滑坡样本比例不平衡问题,建立输入训练集;最后构建卷积神经网络(convolutional neural networks,CNN)模型,定量预测滑坡易发性,生成滑坡易发性分区图。采用受试者工作特征曲线分析评价结果,测试数据集模型精度达89.50%,说明该模型是一种高性能的滑坡易发性评价方法。
  • 图  1  LeNet模型结构图

    Figure  1.  Diagram of LeNet Model

    图  2  研究区概况图

    Figure  2.  Overview of the Study Area

    图  3  ROC曲线和曲线下面积

    Figure  3.  ROC Curves and Area Under Curve

    图  4  滑坡易发性分区图

    Figure  4.  Landslide Susceptibility Zoning Map

    表  1  滑坡灾害因子多重共线检验

    Table  1.   Multicollinearity Test of Landslide Hazard Factors

    滑坡因子 容差 VIF 滑坡因子 容差 VIF
    高程 0.47 2.15 流宽 0.96 1.04
    坡向 0.96 1.05 流路长度 0.64 1.56
    坡度 0.20 5.06 河谷深度 0.41 2.45
    坡长 0.79 1.26 流域坡度 0.24 4.15
    坡高 0.54 1.85 降雨 0.65 1.55
    中坡位置 0.78 1.28 地层 0.58 1.72
    地形汇聚指数 0.41 2.45 土地利用类型 0.97 1.04
    地表粗糙指数 0.26 3.79 距居民地距离 0.89 1.12
    地形表面凸率 0.62 1.61 距构造线距离 0.87 1.15
    地形位置指数 0.57 1.76 距主要水域距离 0.63 1.59
    地形湿度指数 0.31 3.20 距道路距离 0.87 1.14
    下载: 导出CSV

    表  2  地形地貌及基础地质因子

    Table  2.   Landform and Basic Geological Factors

    因子 分级 H0 H/% S0 S/% FR 因子 分级 H0 H/% S0 S/% FR
    坡度 < 10° 20 473 27.04 1 481065 25.88 1.05 高程 < 200m 12 285 16.23   210171   3.67 4.42
    10°~20° 29 226 38.60 2 061873 36.02 1.07 200~400m 25 900 34.21   985645 17.22 1.99
    20°~30° 18 247 24.10 1 482759 25.91 0.93 400~600m 22 881 30.22 1 833772 32.04 0.94
    30°~40°   6 377   8.42    578725 10.11 0.83 600~800m   9 029 11.93 1 417042 24.76 0.48
    > 40°   1 385   1.83    119294   2.08 0.88 800~1000 m   3 101   4.10   725099 12.67 0.32
    坡向 平地     414   0.55     53 002   0.93 0.59 1000~1 200 m   1 503   1.99   383666   6.70 0.30
      9 119 12.04    784181 13.70 0.88 > 1200 m   1 009   1.33   168321   2.94 0.45
    东北   9 817 12.97    620656 10.84 1.20 坡长 0~50 m 40 692 53.75 3 225506 56.35 0.95
      9 593 12.67    638721 11.16 1.14 50~100m 10 849 14.33   858320 15.00 0.96
    东南   8 078 10.67    732617 12.80 0.83 100~150m   6 810   9.00   503452   8.80 1.02
      7 724 10.20    717408 12.53 0.81 150~200m   4 475   5.91   322552   5.64 1.05
    西南   8 810 11.64    622643 10.88 1.07 > 200m 12 882 17.02   813886 14.22 1.20
    西 10 359 13.68    674014 11.78 1.16 中坡位置 < 0.2 13 807 18.24 1 052569 18.39 0.99
    西北 11 794 15.58    880474 15.38 1.01 0.2~0.4 14 390 19.01 1 086324 18.98 1.00
    坡高 < 40m 36 978 48.84 3 202454 55.95 0.87 0.4~0.6 14 384 19.00 1 137727 19.88 0.96
    40~80m 17 790 23.50 1 290701 22.55 1.04 0.6~0.8 15 705 20.74 1 285981 22.47 0.92
    80~120m   9 899 13.08    603197 10.54 1.24 0.8~1 17 422 23.01 1 161115 20.29 1.13
    120~160m   5 359   7.08    304902   5.33 1.33 地形汇聚指数 < -60       43   0.06   12 289   0.21 0.26
    160~200m   2 972   3.93    162110   2.83 1.39 -60~-40   3 721   4.91   323111   5.65 0.87
    > 200m   2 710   3.58    160352   2.80 1.28 -40~-20 12 608 16.65 1 030642 18.01 0.92
    地形表面凸率  30     165   0.22    41 306   0.72 0.30 -20~0 20 044 26.48 1 514797 26.47 1.00
    30~40   2 600   3.43    141710   2.48 1.39 0~20 22 799 30.11 1 534944 26.82 1.12
    40~50 39 820 52.60 3 094012 54.06 0.97 20~40 11 443 15.11   944613 16.50 0.92
    50~60 32 330 42.70 2 421210 42.30 1.01 40~60   4 591   6.06   334954   5.85 1.04
    > 60     793   1.05     25 478   0.45 2.35 > 60     459   0.61   28 366   0.50 1.22
    地表粗糙指数 0~5 38 354 50.66 2 698756 47.15 1.07 地形位置指数 < -10   1 906   2.52   222943   3.90 0.65
    5~10 29 118 38.46 2 296963 40.13 0.96 -10~-5   7 889 10.42   714465 12.48 0.83
    10~15   6 935   9.16    617722 10.79 0.85 -5~0 28 924 38.20 2 002342 34.98 1.09
    15~20   1 061   1.40     92 250   1.61 0.87 0~5 26 440 34.92 1 829996 31.97 1.09
    20~25     199   0.26     13 693   0.24 1.10 5~10   8 212 10.85   700867 12.24 0.89
    > 25         41   0.05      4 332 0.08 0.72 > 10   2 337   3.09   253103   4.42 0.70
    地层 T2b     5 781   7.64   843901 14.74 0.52 距构造线距离 < 500m     5 657   7.47   562237   9.82 0.76
    T3xj   3 147   4.16   426710   7.46 0.56 500~1500 m 11 306 14.93 1 061409 18.54 0.81
    J2s 61 587 81.35 3 060670 53.47 1.52 1500~2 500 m   9 836 12.99   988994 17.28 0.75
    J2b     335   0.44     62 245   1.09 0.41 2500~3 500 m 11 076 14.63   752560 13.15 1.11
    J2x      91   0.12     20 363   0.36 0.34 3500~4 500 m 10 196 13.47   650104 11.36 1.19
    J1z 4 767   6.30 1 102284 19.26 0.33 > 4500 m 27 637 36.50 1 708412 29.85 1.22
    注:T2b为三叠系中统巴东组,T3xj为三叠系上统须家河组,J2s为侏罗系中统上沙溪庙组,J2b为侏罗系中统,J2x为侏罗系中统新田沟组,J1z为侏罗系下统珍珠冲组
    下载: 导出CSV

    表  3  水文及各类诱发因子

    Table  3.   Hydrology and Various Landslide Inducing Factors

    因子 分级 H0 H% S0 S% FR 因子 分级 H0 H% S0 S% FR
    地形湿度指数 < 3 6 522 8.61 716853 12.52 0.69 距主要水域距离 < 500m 17 283 22.83 694411 12.13 1.88
    3~4 37 078 48.98 2 811938 49.13 1 500~1500 m 25 373 33.51 1 021585 17.85 1.88
    4~5 22 600 29.85 1 606362 28.07 1.06 1500~2 500 m 12 019 15.88 913542 15.96 0.99
    5~6 7 016 9.27 444668 7.77 1.19 2500~3 500 m 7 176 9.48 805309 14.07 0.67
    > 6 2 492 3.29 143895 2.51 1.31 3500~4 500 m 4 113 5.43 690641 12.07 0.45
    流宽 < 26 5 516 7.29 472167 8.25 0.88 > 4500 m 9 744 12.87 1 598228 27.92 0.46
    26~28m 7 187 9.49 518584 9.06 1.05 土地利用类型 耕地 45 846 60.56 3 281304 57.33 1.06
    28~30m 8 799 11.62 656061 11.46 1.01 林区 14 484 19.13 1 887393 32.97 0.58
    30~32m 10 815 14.29 832404 14.54 0.98 草地 3 798 5.02 338394 5.91 0.85
    32~34m 15 172 20.04 1 156929 20.21 0.99 水域 6 219 8.21 121526 2.12 3.87
    > 34m 28 219 37.27 2 087571 36.47 1.02 苔原 212 0.28 27 903 0.49 0.57
    流路长度 < 250m 14 785 19.53 1 498499 26.18 0.75 人工建筑 5 149 6.80 67 196 1.17 5.79
    250~500m 18 739 24.75 1 647270 28.78 0.86 距居民地距离 < 500m 22 326 29.49 1 529346 26.72 1.10
    500~750m 15 119 19.97 1 085580 18.97 1.05 500~1000 m 12 908 17.05 999738 17.47 0.98
    750~1000 m 9 900 13.08 663686 11.60 1.13 1000~1 500 m 8 846 11.68 834419 14.58 0.80
    1000~1 250 m 6 720 8.88 385678 6.74 1.32 1500~2 000 m 10 186 13.45 655968 11.46 1.17
    1250~1 500 m 4 540 6.00 216861 3.79 1.58 2000~2 500 m 6 634 8.76 506076 8.84 0.99
    > 1500 m 5 905 7.80 226142 3.95 1.97 > 2500 m 14 808 19.56 1 198169 20.93 0.93
    河谷深度 0~40 m 31 051 41.01 2 910570 50.85 0.81 距道路距离 < 500m 17 974 23.74 1 507269 26.33 0.90
    40~80m 21 502 28.40 1 425418 24.90 1.14 500~1500 m 30 511 40.30 1 966574 34.36 1.17
    80~120m 12 508 16.52 706605 12.35 1.34 1500~2 500 m 19 225 25.39 1 199634 20.96 1.21
    120~160m 6 228 8.23 352845 6.16 1.33 2500~3 500 m 6 031 7.97 636071 11.11 0.72
    160~200m 2 676 3.53 171574 3.00 1.18 > 3500 m 1 967 2.60 414168 7.24 0.36
    > 200m 1 743 2.30 156704 2.74 0.84 流域坡度 0~0.15 9 017 11.91 814738 14.23 0.84
    降雨 1 100mm/a 11 236 14.84 355040 6.20 2.39 0.15~0.3 31 550 41.67 2 012948 35.17 1.18
    1 150mm/a 57 426 75.85 4 343147 75.88 1 0.3~0.45 26 131 34.52 2 023976 35.36 0.98
    1 200mm/a 3 381 4.47 531480 9.29 0.48 0.45~0.6 8 226 10.87 791897 13.84 0.79
    1 300mm/a 3 665 4.84 494049 8.63 0.56 > 0.6 784 1.04 80 157 1.40 0.74
    下载: 导出CSV

    表  4  参数设置表

    Table  4.   Parameter Setting

    LeNet各参数项 参数值
    卷积核大小 5×5
    最大池化 2×2
    激活函数 线性整流函数
    优化器 自适应矩估计
    批量数据大小 1 000
    学习率 0.01
    下载: 导出CSV

    表  5  滑坡易发性分区统计表

    Table  5.   Statistics of Landslide Susceptibility Zoning

    分区 滑坡栅格数量 占比/% 非滑坡栅格数量 占比/% 合计 占比/%
    极低易发区 3 062 4.04 3 448 375 61.05 3 451 437 60.30
    较低易发区 5 238 6.92 823 150 14.57 828 388 14.47
    中等易发区 8 122 10.73 544748 9.64 552870 9.66
    较高易发区 14 189 18.74 443790 7.86 457979 8.00
    极高易发区 45 097 59.57 387945 6.87 433042 7.57
    下载: 导出CSV
  • [1] 李媛, 孟晖, 董颖, 等.中国地质灾害类型及其特征:基于全国县市地质灾害调查成果分析[J].中国地质灾害与防治学报, 2004(2): 32-37 http://www.cqvip.com/Main/Detail.aspx?id=9915473

    Li Yuan, Meng Hui, Dong Ying, et al. Main Types and Characteristics of Geo-hazard in China:Based on the Results of Geo-hazard Survey in 290 Counties[J]. The Chinese Journal of Geological Hazard and Control, 2004(2): 32-37 http://www.cqvip.com/Main/Detail.aspx?id=9915473
    [2] 薛凯喜, 胡艳香, 邹玉亮, 等.近十年中国地质灾害时空发育规律分析[J].中国地质灾害与防治学报, 2016, 27(3): 90-97 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zgdzzhyfzxb201603014

    Xue Kaixi, Hu Yanxiang, Zou Yuliang, et al. Temporal-Spatial Distribution Discipline of Geological Disaster in China in Recent Ten Years[J]. The Chinese Journal of Geological Hazard and Control, 2016, 27(3): 90-97 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zgdzzhyfzxb201603014
    [3] 殷跃平.中国地质灾害减灾战略初步研究[J].中国地质灾害与防治学报, 2004(2): 4-11 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zgdzzhyfzxb200402001

    Yin Yueping.Initial Study on the Hazard-Relief Strategy of Geological Hazard in China [J]. The Chinese Journal of Geological Hazard and Control, 2004(2): 4-11 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zgdzzhyfzxb200402001
    [4] 侯俊东, 肖人彬.地质灾害防治项目治理的社会网络结构优化及策略[J].管理评论, 2015, 27(2): 13-25 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=90877168504849534850484851

    Hou Jundong, Xiao Renbin. Strategies and Social Network Structure Optimization of the Prevention and Control Project Governance for the Geo-disaster [J]. Management Review, 2015, 27(2): 13-25 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=90877168504849534850484851
    [5] 葛大庆, 戴可人, 郭兆成, 等.重大地质灾害隐患早期识别中综合遥感应用的思考与建议[J].武汉大学学报·信息科学版, 2019, 44(7): 949-956 doi:  10.13203/j.whugis20190094

    Ge Daqing, Dai Keren, Guo Zhaocheng, et al. Early Identification of Serious Goelogical Hazards with Integrated Remote Sensing Technologies: Thoughts and Recommendations [J]. Geomatics Information Science of Wuhan University, 2019, 44(7): 949-956 doi:  10.13203/j.whugis20190094
    [6] 程温鸣, 彭令, 牛瑞卿.基于粗糙集理论的滑坡易发性评价:以三峡库区秭归县境内为例[J].中南大学学报(自然科学版), 2013, 44(3): 1 083-1 090 http://d.wanfangdata.com.cn/Periodical/zngydxxb201303033

    Cheng Wenming, Peng Ling, Niu Ruiqing.Landslide Susceptibility Assessment Based on Rough Sets: Taking Zigui County Territory in Three Gorges Reservoir for Example [J]. Journal of Central South University (Science and Technology), 2013, 44(3): 1 083-1 090 http://d.wanfangdata.com.cn/Periodical/zngydxxb201303033
    [7] Mandal B, Mandal S. Landslide Susceptibility Mapping Using Modified Information Value Model in the Lish River Basin of Darjiling Himalaya [J]. Spatial Information Research, 2017, 25(2): 205-218 doi:  10.1007/s41324-017-0096-4
    [8] 彭珂, 彭红霞, 梁峰, 等.基于信息量模型的赣州市地质灾害易发性分区[J].安全与环境工程, 2018, 25(5): 22-28 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=dzktaq201805004

    Peng Ke, Peng Hongxia, Liang Feng, et al. Susceptibility Zoning of Geo-hazards in Ganzhou City Based on the Information Model[J]. Safety and Environmental Engineering, 2018, 25(5): 22-28 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=dzktaq201805004
    [9] 方教勇, 杨根云.基于GIS与逻辑回归的清平滑坡易发性评价[J].人民珠江, 2018, 39(4): 66-70 doi:  10.3969/j.issn.1001-9235.2018.04.015

    Fang Jiaoyong, Yang Genyun. Landslide Susceptibility Assessment Based on GIS and Logistic Regression Model [J]. Pearl River, 2018, 39(4): 66-70 doi:  10.3969/j.issn.1001-9235.2018.04.015
    [10] 赵良军, 陈冬花, 李虎, 等.基于二元逻辑回归模型的新疆果子沟滑坡风险区划[J].山地学报, 2017, 35(2): 203-211 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=sdxb201702010

    Zhao Liangjun, Chen Donghua, Li Hu, et al. A Method to Assess Landslide Susceptibility by Using Logistic Regression Model for Guozigou Region, Xinjiang[J]. Journal of Mountain Science, 2017, 35(2): 203-211 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=sdxb201702010
    [11] Chen Wei, Pourghasemi H R, Naghibi S A. A Comparative Study of Landslide Susceptibility Maps Produced Using Support Vector Machine with Different Kernel Functions and Entropy Data Mining Models in China[J]. Bulletin of Engineering Geology and the Environment, 2018, 77(2): 647-664 doi:  10.1007/s10064-017-1010-y
    [12] Pham B T, Jaafari A, Prakash I, et al. A Novel Hybrid Intelligent Model of Support Vector Machines and the Multiboost Ensemble for Landslide Susceptibility Modeling [J]. Bulletin of Engineering Geology and the Environment, 2019, 78(4): 2 865-2 886 doi:  10.1007/s10064-018-1281-y
    [13] 武雪玲, 任福, 牛瑞卿, 等.斜坡单元支持下的滑坡易发性评价支持向量机模型[J].武汉大学学报·信息科学版, 2013, 38(12): 1 499-1 503 http://ch.whu.edu.cn/article/id/2839

    Wu Xueling, Ren Fu, Niu Ruiqing, et al. Landslide Spatial Prediction Based on Slope Units and Support Vector Machines[J].Geomatics and Information Science of Wuhan University, 2013, 38(12): 1 499-1 503 http://ch.whu.edu.cn/article/id/2839
    [14] Pham B T, Khosravi K, Prakash I. Application and Comparison of Decision Tree-Based Machine Learning Methods in Landside Susceptibility Assessment at Pauri Garhwal Area, Uttarakhand, India[J]. Environmental Processes, 2017, 4(3): 711-730 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=c3d9a142ebbc3132c1d2d1f8721e4e56
    [15] 刘渊博, 牛瑞卿, 于宪煜, 等.旋转森林模型在滑坡易发性评价中的应用研究[J].武汉大学学报·信息科学版, 2018, 43(6): 959-964 doi:  10.13203/j.whugis20160132

    Liu Yuanbo, Niu Ruiqing, Yu Xianyu, et al. Application of the Rotation Forest Model in Landslide Susceptibility Assessment[J]. Geomatics and Information Science of Wuhan University, 2018, 43(6): 959-964 doi:  10.13203/j.whugis20160132
    [16] Dou Jie, Yunus A P, Bui D T, et al. Assessment of Advanced Random Forest and Decision Tree Algorithms for Modeling Rainfall-Induced Landslide Susceptibility in the Izu-Oshima Volcanic Island, Japan[J]. Science of the Total Environment, 2019, 662: 332-346 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=fda94785fb8db997536b7576175e36b6
    [17] de Oliveira G G, Ruiz L F C, Guasselli L A, et al. Random Forest and Artificial Neural Networks in Landslide Susceptibility Modeling: A Case Study of the Fao River Basin, Southern Brazil[J]. Natural Hazards, 2019, 99(2): 1 049-1 073 doi:  10.1007/s11069-019-03795-x
    [18] Xiong Junnan, Sun Ming, Zhang Hao, et al. Application of the Levenburg-Marquardt Back Propagation Neural Network Approach for Landslide Risk Assessments[J]. Natural Hazards and Earth System Sciences, 2019, 19(3): 629-653 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=b4a22e1fbaea0325c03933c4d92b2ef4
    [19] Can A, Dagdelenler G, Ercanoglu M, et al. Landslide Susceptibility Mapping at Ovack-Karabuk (Turkey) Using Different Artificial Neural Network Models: Comparison of Training Algorithms[J]. Bulletin of Engineering Geology and the Environment, 2019, 78(1): 89-102 doi:  10.1007/s10064-017-1034-3
    [20] Zhu Chonghao, Zhang Jianjing, Liu Yang, et al. Comparison of GA-BP and PSO-BP Neural Network Models with Initial BP Model for Rainfall-Induced Landslides Risk Assessment in Regional Scale: A Case Study in Sichuan, China[J]. Natural Hazards, 2020, 100(1): 173-204 doi:  10.1007/s11069-019-03806-x
    [21] 王佳佳, 殷坤龙, 肖莉丽.基于GIS和信息量的滑坡灾害易发性评价:以三峡库区万州区为例[J].岩石力学与工程学报, 2014, 33(4): 797-808 http://www.cqvip.com/QK/96026X/20144/49334671.html

    Wang Jiajia, Yin Kunlong, Xiao Lili. Landslide Susceptibility Assessment Based on GIS and Weighted Information Value: A Case Study of Wanzhou District, Three Gorges Reservoir [J]. Chinese Journal of Rock Mechanics and Engineering, 2014, 33(4): 797-808 http://www.cqvip.com/QK/96026X/20144/49334671.html
    [22] 张俊, 殷坤龙, 王佳佳, 等.三峡库区万州区滑坡灾害易发性评价研究[J].岩石力学与工程学报, 2016, 35(2): 284-296 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=yslxygcxb201602009

    Zhang Jun, Yin Kunlong, Wang Jiajia, et al.Evaluation of Landslide Susceptibility for Wanzhou District of Three Gorges Reservoir [J]. Chinese Journal of Rock Mechanics and Engineering, 2016, 35(2): 284-296 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=yslxygcxb201602009
    [23] 黄发明, 殷坤龙, 蒋水华, 等.基于聚类分析和支持向量机的滑坡易发性评价[J].岩石力学与工程学报, 2018, 37(1): 156-167 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=yslxygcxb201801016

    Huang Faming, Yin Kunlng, Jiang Shuihua, et al. Landslide Susceptibility Assessment Based on Clustering Analysis and Support Vector Machine[J]. Chinese Journal of Rock Mechanics and Engineering, 2018, 7(1):156-167 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=yslxygcxb201801016
    [24] 郭子正, 殷坤龙, 黄发明, 等.基于滑坡分类和加权频率比模型的滑坡易发性评价[J].岩石力学与工程学报, 2019, 38(2): 287-300 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=yslxygcxb201902008

    Guo Zizheng, Yin Kunlong, Huang Faming, et al. Evaluation of Landslide Susceptibility Based on Landslide Classification and Weighted Frequency Ratio Model[J]. Chinese Journal of Rock Mechanics and Engineering, 2019, 38(2): 287-300 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=yslxygcxb201902008
    [25] Gu Jiuxiang, Wang Zhenhua, Kuen J, et al. Recent Advances in Convolutional Neural Networks [J]. Pattern Recognition, 2018, 77: 354-377 doi:  10.1016/j.patcog.2017.10.013
    [26] 吴正文.卷积神经网络在图像分类中的应用研究[D].成都: 电子科技大学, 2015

    Wu Zhengwen. Application Research of Convolution Neural Network in Image Classification[D]. Chengdu: University of Electronic Science and Technology of China, 2015
    [27] 陈耀丹, 王连明.基于卷积神经网络的人脸识别方法[J].东北师大学报(自然科学版), 2016, 48(2): 70-76 http://xuebao.neu.edu.cn/natural/CN/volumn/home.shtml

    Chen Yaodan, Wang Lianming. Convolutional Neural Network for Face Recognition [J]. Journal of Northeast Normal University (Natural Science Edition), 2016, 48(2): 70-76 http://xuebao.neu.edu.cn/natural/CN/volumn/home.shtml
    [28] 付炜, 杨洋.基于卷积神经网络和随机森林的音频分类方法[J].计算机应用, 2018, 38(S2): 58-62 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=jsjyy2018z2013

    Fu Wei, Yang Yang. Audio Classification Method Based on Convolutional Neural Network and Random Forest[J]. Journal of Computer Applications, 2018, 38(S2): 58-62 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=jsjyy2018z2013
    [29] 饶江浩.基于CNN一体化的目标识别、定位、检测[D].成都: 中国科学院光电技术研究所, 2018

    Rao Jianghao. The Integration of Recognition, Positioning and Detection Based on CNN[D].Chengdu: Institute of Optics and Electronics, Chinese Academy of Science, 2018
    [30] Wang Yi, Fang Zhice, Hong Haoyuan. Comparison of Convolutional Neural Networks for Landslide Susceptibility Mapping in Yanshan County, China[J]. Science of the Total Environment, 2019, 666: 975-993 doi:  10.1016/j.scitotenv.2019.02.263
    [31] 李彦冬, 郝宗波, 雷航.卷积神经网络研究综述[J].计算机应用, 2016, 36(9): 2 508-2 515 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=jsjyy201609028

    Li Yandong, Hao Zongbo, Lei Hang. Survey of Convolutional Neural Network [J]. Journal of Computer Applications, 2016, 36(9): 2 508-2 515 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=jsjyy201609028
    [32] 万士宁.基于卷积神经网络的人脸识别研究与实现[D].成都: 电子科技大学, 2016

    Wan Shining. Research and Implementation of Face Recognition Based on Convolution Neural Network [D]. Chengdu: University of Electronic Science and Technology of China, 2016
    [33] 汪海波, 陈雁翔, 李艳秋.基于主成分分析和SoftMax回归模型的人脸识别方法[J].合肥工业大学学报(自然科学版), 2015, 38(6): 759-763 doi:  10.3969/j.issn.1003-5060.2015.06.008

    Wang Haibo, Chen Yanxiang, Li Yanqiu. Face Recognition Method Based on Principal Component Analysis and SoftMax Regression Model[J]. Journal of Hefei University of Technology, 2016, 38(6): 759-763 doi:  10.3969/j.issn.1003-5060.2015.06.008
    [34] Lemaitre G, Nogueira F, Aridas C.Imbalanced- learn : A Python Toolbox to Tackle the Curse of Imbalanced Datasets in Machine Learning[J]. Journal of Machine Learning Research, 2017, 18: 1-5 doi:  10.5555/3122009.3122026
    [35] 梁杰, 陈嘉豪, 张雪芹, 等.基于独热编码和卷积神经网络的异常检测[J].清华大学学报(自然科学版), 2019, 59(7): 523-529 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=qhdxxb201907004

    Liang Jie, Chen Jiahao, Zhnag Xueqin, et al. One-hot Encoding and Convolutional Neural Network Based Anomaly Detection[J]. Journal of Tsinghua University(Science and Technology), 2019, 59(7): 523-529 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=qhdxxb201907004
  • [1] 王晨辉, 郭伟, 孟庆佳, 刘炎炎, 毕逢东.  基于虚拟参考站的GNSS滑坡变形监测方法及性能分析 . 武汉大学学报 ● 信息科学版, 2022, 47(6): 990-996. doi: 10.13203/j.whugis20220102
    [2] 何朝阳, 许强, 巨能攀, 解明礼.  滑坡实时监测预警模型调度算法优化研究 . 武汉大学学报 ● 信息科学版, 2021, 46(7): 970-982. doi: 10.13203/j.whugis20200314
    [3] 秦宏楠, 马海涛, 于正兴.  地基SAR技术支持下的滑坡预警预报分析方法 . 武汉大学学报 ● 信息科学版, 2020, 45(11): 1697-1706. doi: 10.13203/j.whugis20200268
    [4] 陈涛, 钟子颖, 牛瑞卿, 刘桐, 陈胜云.  利用深度信念网络进行滑坡易发性评价 . 武汉大学学报 ● 信息科学版, 2020, 45(11): 1809-1817. doi: 10.13203/j.whugis20190144
    [5] 徐胜华, 刘纪平, 王想红, 张玉, 林荣福, 张蒙, 刘猛猛, 姜涛.  熵指数融入支持向量机的滑坡灾害易发性评价方法—以陕西省为例 . 武汉大学学报 ● 信息科学版, 2020, 45(8): 1214-1222. doi: 10.13203/j.whugis20200109
    [6] 冯非凡, 武雪玲, 牛瑞卿, 许石罗.  一种V/S和LSTM结合的滑坡变形分析方法 . 武汉大学学报 ● 信息科学版, 2019, 44(5): 784-790. doi: 10.13203/j.whugis20170218
    [7] 张路, 廖明生, 董杰, 许强, 龚健雅.  基于时间序列InSAR分析的西部山区滑坡灾害隐患早期识别——以四川丹巴为例 . 武汉大学学报 ● 信息科学版, 2018, 43(12): 2039-2049. doi: 10.13203/j.whugis20180181
    [8] 丁超, 冯光财, 周玉杉, 王会强, 杜亚男, 陈晨月.  尼泊尔地震触发滑坡识别和雪崩形变分析 . 武汉大学学报 ● 信息科学版, 2018, 43(6): 847-853, 950. doi: 10.13203/j.whugis20160031
    [9] 刘渊博, 牛瑞卿, 于宪煜, 张凯翔.  旋转森林模型在滑坡易发性评价中的应用研究 . 武汉大学学报 ● 信息科学版, 2018, 43(6): 959-964. doi: 10.13203/j.whugis20160132
    [10] 刘坚, 李树林, 陈涛.  基于优化随机森林模型的滑坡易发性评价 . 武汉大学学报 ● 信息科学版, 2018, 43(7): 1085-1091. doi: 10.13203/j.whugis20160515
    [11] 段功豪, 牛瑞卿, 彭令, 付杰.  诱发因素影响下的滑坡参数优化预测模型研究 . 武汉大学学报 ● 信息科学版, 2017, 42(4): 531-536. doi: 10.13203/j.whugis20140913
    [12] 段功豪, 牛瑞卿, 赵艳南, 张凯翔, 咬登魁.  基于动态指数平滑模型的降雨诱发型滑坡预测 . 武汉大学学报 ● 信息科学版, 2016, 41(7): 958-962. doi: 10.13203/j.whugis20140276
    [13] 武雪玲, 沈少青, 牛瑞卿.  GIS支持下应用PSO-SVM模型预测滑坡易发性 . 武汉大学学报 ● 信息科学版, 2016, 41(5): 665-671. doi: 10.13203/j.whugis20130566
    [14] 彭令, 牛瑞卿, 赵艳南, 邓清禄.  基于核主成分分析和粒子群优化支持向量机的滑坡位移预测 . 武汉大学学报 ● 信息科学版, 2013, 38(2): 148-152,161.
    [15] 武雪玲, 任福, 牛瑞卿.  多源数据支持下的三峡库区滑坡灾害空间智能预测 . 武汉大学学报 ● 信息科学版, 2013, 38(8): 963-968.
    [16] 王利, 张勤, 管建安, 孔令杰.  基于GPS技术的滑坡动态变形监测试验结果与分析 . 武汉大学学报 ● 信息科学版, 2011, 36(4): 422-426.
    [17] 张正禄, 汪宏晨, 邓勇, 谢年生.  滑坡变形分析与预报的新方法 . 武汉大学学报 ● 信息科学版, 2009, 34(12): 1387-1389.
    [18] 张昆, 张松林, 刘祖强, 杨红.  滑坡变形的三维可视化研究 . 武汉大学学报 ● 信息科学版, 2006, 31(9): 795-798.
    [19] 曾旭平.  GPS滑坡高程监测的数据处理问题 . 武汉大学学报 ● 信息科学版, 2004, 29(3): 201-204.
    [20] 秦宏楠, 马海涛, 于正兴, 刘玉溪.  地基雷达干涉测量动态高频次数据用于滑坡早期预警方法研究 . 武汉大学学报 ● 信息科学版, 0, 0(0): -. doi: 10.13203/j.whugis20220152
  • 加载中
图(4) / 表(5)
计量
  • 文章访问数:  740
  • HTML全文浏览量:  118
  • PDF下载量:  148
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-03-29
  • 刊出日期:  2020-08-05

一种结合SMOTE和卷积神经网络的滑坡易发性评价方法

doi: 10.13203/j.whugis20200127
    基金项目:

    自然资源部城市国土资源监测与仿真重点实验室开放基金 KF-2019-04-045

    国家自然科学基金 41871355

    中央高校基本科研业务费专项资金 CUGQY1936

    作者简介:

    武雪玲,博士,副教授,主要从事滑坡灾害预测及地学空间分析方面的研究。wuxl@cug.edu.cn

    通讯作者: 牛瑞卿,博士,教授。rqniu@163.com
  • 中图分类号: P208

摘要: 大规模的人类工程活动诱发和加剧了滑坡灾害的致灾情况,严重威胁工程安全和环境安全。滑坡易发性评价是滑坡监测预警的关键技术。针对传统滑坡监测手段数据源有限、缺乏挖掘滑坡灾害空间分布特征及其诱发因素的有效方法等问题,以位于三峡库区的中国重庆市万州区为研究区,基于地形、地质和遥感影像等多源数据,首先提取了22个滑坡易发性评价因子,并对这些因子进行多重共线性检验;然后采用合成少数类过采样技术(synthetic minority oversampling technique, SMOTE)解决滑坡和非滑坡样本比例不平衡问题,建立输入训练集;最后构建卷积神经网络(convolutional neural networks,CNN)模型,定量预测滑坡易发性,生成滑坡易发性分区图。采用受试者工作特征曲线分析评价结果,测试数据集模型精度达89.50%,说明该模型是一种高性能的滑坡易发性评价方法。

English Abstract

武雪玲, 杨经宇, 牛瑞卿. 一种结合SMOTE和卷积神经网络的滑坡易发性评价方法[J]. 武汉大学学报 ● 信息科学版, 2020, 45(8): 1223-1232. doi: 10.13203/j.whugis20200127
引用本文: 武雪玲, 杨经宇, 牛瑞卿. 一种结合SMOTE和卷积神经网络的滑坡易发性评价方法[J]. 武汉大学学报 ● 信息科学版, 2020, 45(8): 1223-1232. doi: 10.13203/j.whugis20200127
WU Xueling, YANG Jingyu, NIU Ruiqing. A Landslide Susceptibility Assessment Method Using SMOTE and Convolutional Neural Network[J]. Geomatics and Information Science of Wuhan University, 2020, 45(8): 1223-1232. doi: 10.13203/j.whugis20200127
Citation: WU Xueling, YANG Jingyu, NIU Ruiqing. A Landslide Susceptibility Assessment Method Using SMOTE and Convolutional Neural Network[J]. Geomatics and Information Science of Wuhan University, 2020, 45(8): 1223-1232. doi: 10.13203/j.whugis20200127
  • 地质灾害的发育分布及其危害程度与地质环境背景条件、气象水文、植被条件、人类工程活动及强度等有着极为密切的关系。中国山地丘陵约占国土面积的2/3,地质条件复杂,构造活动频繁,同时受近几十年来频发的极端气候以及剧烈的人类活动影响,是世界地质灾害最严重的国家之一[1-3]。滑坡作为一种主要的地质灾害,具有隐蔽性、突发性、不确定性以及破坏性强等特点[4-5]。根据历年《全国地质灾害通报》及国家自然资源部2019年发布的地质灾害趋势预测,近10 a来全国平均每年发生滑坡8 704起,约占地质灾害总量的72%,造成了大量的人员伤亡与经济损失。因此,科学、准确地进行滑坡易发性评价,是减灾防灾工作的基础[6]

    目前,常用的滑坡易发性评价模型有信息量模型[6-7]、逻辑回归模型[8-9]、支持向量机[10-12]、决策树[13-15]、神经网络等[16-19]。针对位于三峡库区的中国重庆市万州区的滑坡易发性研究,文献[20]使用信息量模型进行评价,结果表明有87%的滑坡数据位于高危或较高危险区;文献[21]根据选取的7个致灾因子分别采用信息量和逻辑回归模型进行易发性预测,对预测结果进行快速聚类处理;文献[22]使用自组织特征映射神经网络对栅格单元分类,再从中挑选可信的非滑坡单元用于支持向量机模型预测;文献[23]通过实验证明,与逻辑回归、模糊层次分析、频率比模型相比,对因子权重定量计算后的加权频率比模型评价效果更好。

    以神经认知机模型为发展起点的卷积神经网络(convolutional neural networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络。从90年代的LeNet模型开始,随着各种模型构架的提出以及硬件技术的发展,作为深度学习代表算法之一的CNN[24]在图像分类[25]、人脸识别[26]、音频检索[27]、目标定位检测[28]等方面具有广泛的应用。在滑坡易发性评价方面,文献[29]使用围绕一维、二维和三维数据构建的CNN模型与传统LeNet模型进行了比较,结果表明CNN模型在总体准确率上优于传统LeNet模型。

    本文利用合成少数类过采样技术(synthetic minority oversampling technique, SMOTE)和改进的LeNet模型进行滑坡易发性评价,基本思路为:(1)基于地形、地质、遥感影像和历史滑坡数据,提取滑坡信息(是否为滑坡)及22个滑坡易发性评价因子,形成初始数据集;(2)随机选取30%初始数据集作为测试集,对其余的70%初始数据集进行SMOTE处理,得到1:1的滑坡与非滑坡数据;(3)从比例平衡的数据集中随机抽取90%作为训练集,其余10%作为验证集;(4)通过训练集、验证集和测试集完善模型,获得滑坡易发性评价结果。

    • CNN与其他神经网络的区别主要在于卷积运算。CNN的基本结构包括卷积层、池化层、全连接层和输出层。CNN提供了一种端到端的学习模型,可以通过传统的梯度下降方法选取模型参数,经过训练的CNN能够学习图像特征,完成对图像特征的提取和分类[30]

      1)卷积层是CNN模型中的关键部分,卷积是对输入数据的每个位置进行线性变换映射成新值的过程,该过程可以提取输入数据的特征。卷积核对输入的数据进行卷积计算,得到输入图层的特征图。卷积核具有局部性和权值共享的属性。局部性是指只关注局部特征,局部程度取决于卷积核的大小。权值共享是指用一个相同的卷积核去卷积整幅图像,相当于对图像做一个全图滤波。在实际应用中,卷积核的权值不需要提前设计,其参数通过反向传播算法最佳化得到,只需要进行初始化处理。

      假设输入的是一幅M×N的二维图像,卷积层计算公式为:

      $$ \begin{array}{*{20}{l}} {{y_{mn}} = f\left( {\mathop \sum \limits_{j = 0}^{j - 1} \mathop \sum \limits_{i = 0}^{i - 1} {x_{m + i, n + j}}{w_{ij}} + b} \right), (0 \le m \le M, }\\ {0 \le n \le N)} \end{array} $$ (1)

      式中,y为卷积层输出特征图;f是激活函数;wj×i的卷积核;b是偏置。如果因为卷积核移动的步长,卷积核无法计算边缘数值,可以在矩阵外围补零。特征图矩阵都是方阵, 设输入矩阵大小为x,卷积核大小为k,步幅为s,补零层数为p,则卷积后产生的特征图大小的计算公式为:[(x+2p-k)/s]+1。

      2)池化又叫下采样,其具体操作与卷积层的操作基本相同。池化层通常放在卷积层后面使用,主要的池化方式有最大池化和平均池化。池化层旨在通过降低特征面的分辨率获得具有空间不变性的特征,池化层能够在保持特征图数目一致的情况下起到二次提取特征的作用,在保留主要特征的同时减少参数,防止过拟合,提高模型泛化能力[31-32]

      3)全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。全连接层中的每个神经元与前一层的所有神经元完全连接。卷积核大小为上层特征大小,卷积后的结果为一个节点,对应全连接层的一个点。特征图在全连接层中会失去空间拓扑结构,被展开为向量并通过激励函数传递至下一层。

      4)SoftMax[33]可以完成多分类任务。例如SoftMax可将N个(-∞,+∞)实数映射为N个(0, 1)的实数或概率,同时保证它们之和为1。假设Va是包含b个元素数组V中的第a个元素,则元素Va的SoftMax值为:

      $$ {S_a} = \frac{{{{\rm{e}}^{{V_a}}}}}{{\sum\limits_{k = 1}^b {{{\rm{e}}^{{v_k}}}} }},k = 1,2 \ldots b $$ (2)

      式中,e是自然常数;Sa即SoftMax函数,表示当前元素的指数与所有元素指数和的比值。

      LeNet模型结构如图 1所示。

      图  1  LeNet模型结构图

      Figure 1.  Diagram of LeNet Model

    • 样本的不均衡会影响模型精度,通常使用过采样、欠采样等方法使得样本比例均衡。SMOTE是基于随机过采样算法的一种改进方案,其基本思想是对少数类别样本进行分析和模拟,并将模拟的新样本添加到数据集中,进而改善原始数据类别比例失衡的问题,从而降低了模型过拟合的可能性且避免了信息的丢失。SMOTE算法的模拟过程采样了K最近邻(K-nearest neighbor,KNN)分类算法,模拟生成新样本的步骤为:(1)对于少数类中每一个样本Xi,计算其到少数类样本集中所有样本的距离,得到K个近邻;(2)根据样本之间的比例确定采样倍率ƞ,对每个少数类样本Xi从其K个近邻中随机选取ƞ个样本;(3)对这ƞ个样本进行随机线性插值,构造新样本数据,将新合成的样本与原样本组合成比例均衡的样本。

    • 重庆市万州区位于三峡库区腹心,地处经度107°55′22″E~108°53′25″E、纬度30°24′25″N~31°14′58″N之间,面积约3 457 km2。万州是长江十大港口之一,并且随着三峡移民的迁入,发展为重庆第二大辖区,现常驻人口超过160万人。长江自西南向东北穿过,过境流程约80.4 km,区境内支流众多,水资源丰富。受亚热带季风影响,该地雨量充沛,年均降雨约1 243 mm。地形以山地丘陵为主,东南部地势较高,长江两岸地势较低。境内的铁峰山、方斗山等属世界三大褶皱山系之一的川东平行岭谷,呈现出背斜成山、向斜成谷、山谷相间、彼此平行的褶皱地貌。研究区概况如图 2所示。

      图  2  研究区概况图

      Figure 2.  Overview of the Study Area

      本文采用的主要数据源包括:(1)25 m分辨率的数字高程模型,用于提取地形地貌、水文条件等相关信息;(2)万州区1:50 000地质图,用于提取断层和工程岩组等信息;(3)从全国地理信息资源目录服务系统中下载的N48_30和N49_40两幅30 m地表覆盖数据,用于提取土地利用信息;(4)1:100 000地质灾害分布图,用于滑坡数据的空间定位。

    • 本文采用25 m×25 m分辨率的栅格作为评价单元,研究区共计5 723 716个栅格单元。选取全区700多个滑坡点作为滑坡基础样本数据,以滑坡点为缓冲对象,滑坡面积半径为缓冲半径,生成滑坡面,全区共计75 708个滑坡栅格单元。

      滑坡形成主要受基础地形地质条件和诱发因素影响。本文在前人的研究基础上[21-23]结合现有资料选取22个评价因子:高程、坡向、坡度、坡长、坡高、中坡位置、地形汇聚指数、地表粗糙指数、地形表面凸率、地形位置指数、地形湿度指数、流宽、流路长度、河谷深度、流域坡度、降雨、地层、土地利用类型、距居民地距离、距构造线距离、距主要水域距离和距道路距离,进而采用方差扩大因子(variance influence factor,VIF)指标对评价因子进行多重共线检验。通常情况下,当VIF < 10时,数据间多重共线性较低;当10≤VIF < 100时,存在较强多重共线性;当VIF≥100时,存在严重多重共线性。共线检验结果如表 1所示,由表 1可知各因子的共线检验合格。

      表 1  滑坡灾害因子多重共线检验

      Table 1.  Multicollinearity Test of Landslide Hazard Factors

      滑坡因子 容差 VIF 滑坡因子 容差 VIF
      高程 0.47 2.15 流宽 0.96 1.04
      坡向 0.96 1.05 流路长度 0.64 1.56
      坡度 0.20 5.06 河谷深度 0.41 2.45
      坡长 0.79 1.26 流域坡度 0.24 4.15
      坡高 0.54 1.85 降雨 0.65 1.55
      中坡位置 0.78 1.28 地层 0.58 1.72
      地形汇聚指数 0.41 2.45 土地利用类型 0.97 1.04
      地表粗糙指数 0.26 3.79 距居民地距离 0.89 1.12
      地形表面凸率 0.62 1.61 距构造线距离 0.87 1.15
      地形位置指数 0.57 1.76 距主要水域距离 0.63 1.59
      地形湿度指数 0.31 3.20 距道路距离 0.87 1.14

      各因子分级中滑坡栅格数量H0及占比H,各分级因子的栅格数量S0及占比SH0S0的频率比(frequency ratio,FR)如表 2-3所示。

      表 2  地形地貌及基础地质因子

      Table 2.  Landform and Basic Geological Factors

      因子 分级 H0 H/% S0 S/% FR 因子 分级 H0 H/% S0 S/% FR
      坡度 < 10° 20 473 27.04 1 481065 25.88 1.05 高程 < 200m 12 285 16.23   210171   3.67 4.42
      10°~20° 29 226 38.60 2 061873 36.02 1.07 200~400m 25 900 34.21   985645 17.22 1.99
      20°~30° 18 247 24.10 1 482759 25.91 0.93 400~600m 22 881 30.22 1 833772 32.04 0.94
      30°~40°   6 377   8.42    578725 10.11 0.83 600~800m   9 029 11.93 1 417042 24.76 0.48
      > 40°   1 385   1.83    119294   2.08 0.88 800~1000 m   3 101   4.10   725099 12.67 0.32
      坡向 平地     414   0.55     53 002   0.93 0.59 1000~1 200 m   1 503   1.99   383666   6.70 0.30
        9 119 12.04    784181 13.70 0.88 > 1200 m   1 009   1.33   168321   2.94 0.45
      东北   9 817 12.97    620656 10.84 1.20 坡长 0~50 m 40 692 53.75 3 225506 56.35 0.95
        9 593 12.67    638721 11.16 1.14 50~100m 10 849 14.33   858320 15.00 0.96
      东南   8 078 10.67    732617 12.80 0.83 100~150m   6 810   9.00   503452   8.80 1.02
        7 724 10.20    717408 12.53 0.81 150~200m   4 475   5.91   322552   5.64 1.05
      西南   8 810 11.64    622643 10.88 1.07 > 200m 12 882 17.02   813886 14.22 1.20
      西 10 359 13.68    674014 11.78 1.16 中坡位置 < 0.2 13 807 18.24 1 052569 18.39 0.99
      西北 11 794 15.58    880474 15.38 1.01 0.2~0.4 14 390 19.01 1 086324 18.98 1.00
      坡高 < 40m 36 978 48.84 3 202454 55.95 0.87 0.4~0.6 14 384 19.00 1 137727 19.88 0.96
      40~80m 17 790 23.50 1 290701 22.55 1.04 0.6~0.8 15 705 20.74 1 285981 22.47 0.92
      80~120m   9 899 13.08    603197 10.54 1.24 0.8~1 17 422 23.01 1 161115 20.29 1.13
      120~160m   5 359   7.08    304902   5.33 1.33 地形汇聚指数 < -60       43   0.06   12 289   0.21 0.26
      160~200m   2 972   3.93    162110   2.83 1.39 -60~-40   3 721   4.91   323111   5.65 0.87
      > 200m   2 710   3.58    160352   2.80 1.28 -40~-20 12 608 16.65 1 030642 18.01 0.92
      地形表面凸率  30     165   0.22    41 306   0.72 0.30 -20~0 20 044 26.48 1 514797 26.47 1.00
      30~40   2 600   3.43    141710   2.48 1.39 0~20 22 799 30.11 1 534944 26.82 1.12
      40~50 39 820 52.60 3 094012 54.06 0.97 20~40 11 443 15.11   944613 16.50 0.92
      50~60 32 330 42.70 2 421210 42.30 1.01 40~60   4 591   6.06   334954   5.85 1.04
      > 60     793   1.05     25 478   0.45 2.35 > 60     459   0.61   28 366   0.50 1.22
      地表粗糙指数 0~5 38 354 50.66 2 698756 47.15 1.07 地形位置指数 < -10   1 906   2.52   222943   3.90 0.65
      5~10 29 118 38.46 2 296963 40.13 0.96 -10~-5   7 889 10.42   714465 12.48 0.83
      10~15   6 935   9.16    617722 10.79 0.85 -5~0 28 924 38.20 2 002342 34.98 1.09
      15~20   1 061   1.40     92 250   1.61 0.87 0~5 26 440 34.92 1 829996 31.97 1.09
      20~25     199   0.26     13 693   0.24 1.10 5~10   8 212 10.85   700867 12.24 0.89
      > 25         41   0.05      4 332 0.08 0.72 > 10   2 337   3.09   253103   4.42 0.70
      地层 T2b     5 781   7.64   843901 14.74 0.52 距构造线距离 < 500m     5 657   7.47   562237   9.82 0.76
      T3xj   3 147   4.16   426710   7.46 0.56 500~1500 m 11 306 14.93 1 061409 18.54 0.81
      J2s 61 587 81.35 3 060670 53.47 1.52 1500~2 500 m   9 836 12.99   988994 17.28 0.75
      J2b     335   0.44     62 245   1.09 0.41 2500~3 500 m 11 076 14.63   752560 13.15 1.11
      J2x      91   0.12     20 363   0.36 0.34 3500~4 500 m 10 196 13.47   650104 11.36 1.19
      J1z 4 767   6.30 1 102284 19.26 0.33 > 4500 m 27 637 36.50 1 708412 29.85 1.22
      注:T2b为三叠系中统巴东组,T3xj为三叠系上统须家河组,J2s为侏罗系中统上沙溪庙组,J2b为侏罗系中统,J2x为侏罗系中统新田沟组,J1z为侏罗系下统珍珠冲组

      表 3  水文及各类诱发因子

      Table 3.  Hydrology and Various Landslide Inducing Factors

      因子 分级 H0 H% S0 S% FR 因子 分级 H0 H% S0 S% FR
      地形湿度指数 < 3 6 522 8.61 716853 12.52 0.69 距主要水域距离 < 500m 17 283 22.83 694411 12.13 1.88
      3~4 37 078 48.98 2 811938 49.13 1 500~1500 m 25 373 33.51 1 021585 17.85 1.88
      4~5 22 600 29.85 1 606362 28.07 1.06 1500~2 500 m 12 019 15.88 913542 15.96 0.99
      5~6 7 016 9.27 444668 7.77 1.19 2500~3 500 m 7 176 9.48 805309 14.07 0.67
      > 6 2 492 3.29 143895 2.51 1.31 3500~4 500 m 4 113 5.43 690641 12.07 0.45
      流宽 < 26 5 516 7.29 472167 8.25 0.88 > 4500 m 9 744 12.87 1 598228 27.92 0.46
      26~28m 7 187 9.49 518584 9.06 1.05 土地利用类型 耕地 45 846 60.56 3 281304 57.33 1.06
      28~30m 8 799 11.62 656061 11.46 1.01 林区 14 484 19.13 1 887393 32.97 0.58
      30~32m 10 815 14.29 832404 14.54 0.98 草地 3 798 5.02 338394 5.91 0.85
      32~34m 15 172 20.04 1 156929 20.21 0.99 水域 6 219 8.21 121526 2.12 3.87
      > 34m 28 219 37.27 2 087571 36.47 1.02 苔原 212 0.28 27 903 0.49 0.57
      流路长度 < 250m 14 785 19.53 1 498499 26.18 0.75 人工建筑 5 149 6.80 67 196 1.17 5.79
      250~500m 18 739 24.75 1 647270 28.78 0.86 距居民地距离 < 500m 22 326 29.49 1 529346 26.72 1.10
      500~750m 15 119 19.97 1 085580 18.97 1.05 500~1000 m 12 908 17.05 999738 17.47 0.98
      750~1000 m 9 900 13.08 663686 11.60 1.13 1000~1 500 m 8 846 11.68 834419 14.58 0.80
      1000~1 250 m 6 720 8.88 385678 6.74 1.32 1500~2 000 m 10 186 13.45 655968 11.46 1.17
      1250~1 500 m 4 540 6.00 216861 3.79 1.58 2000~2 500 m 6 634 8.76 506076 8.84 0.99
      > 1500 m 5 905 7.80 226142 3.95 1.97 > 2500 m 14 808 19.56 1 198169 20.93 0.93
      河谷深度 0~40 m 31 051 41.01 2 910570 50.85 0.81 距道路距离 < 500m 17 974 23.74 1 507269 26.33 0.90
      40~80m 21 502 28.40 1 425418 24.90 1.14 500~1500 m 30 511 40.30 1 966574 34.36 1.17
      80~120m 12 508 16.52 706605 12.35 1.34 1500~2 500 m 19 225 25.39 1 199634 20.96 1.21
      120~160m 6 228 8.23 352845 6.16 1.33 2500~3 500 m 6 031 7.97 636071 11.11 0.72
      160~200m 2 676 3.53 171574 3.00 1.18 > 3500 m 1 967 2.60 414168 7.24 0.36
      > 200m 1 743 2.30 156704 2.74 0.84 流域坡度 0~0.15 9 017 11.91 814738 14.23 0.84
      降雨 1 100mm/a 11 236 14.84 355040 6.20 2.39 0.15~0.3 31 550 41.67 2 012948 35.17 1.18
      1 150mm/a 57 426 75.85 4 343147 75.88 1 0.3~0.45 26 131 34.52 2 023976 35.36 0.98
      1 200mm/a 3 381 4.47 531480 9.29 0.48 0.45~0.6 8 226 10.87 791897 13.84 0.79
      1 300mm/a 3 665 4.84 494049 8.63 0.56 > 0.6 784 1.04 80 157 1.40 0.74

      高程和土地利用类型是两个最明显的影响因素,分布在200~400 m和400~600 m高程的滑坡栅格占总数的60%以上,但从FR值来看,200 m以下高程对滑坡的影响最明显,其FR值为4.42。土地利用类型中,60.56%的滑坡位于耕地,但人工建筑类型与滑坡的相关性最强,其FR值为5.79。

    • 采用22个评价因子作为条件属性,与对应的滑坡属性组成初始数据集。将数据集分为两类:随机选取70%滑坡和非滑坡数据构建数据集A,包含4 005 546份数据;其余的30%数据作为测试集,共计1 718 170份数据。

      使用imlbearn[34]库中上采样方法中的SMOTE接口对数据集A进行过采样处理,构建数据集B,使得数据集B中滑坡与非滑坡数据比例为1:1,达到平衡样本比例的目的。在数据集B中随机抽取10%作为验证集,共计790 464份,其余作为训练集,训练集样本数量达到7 114 177份。使用独热编码[35]以及补零等方法将测试集、验证集和训练集中每行数据转变为22×22的二维矩阵数据导入模型。训练集用于训练模型参数;测试集用于估计模型对样本的泛化误差,检验模型是否过拟合;验证集用于选择调整模型的超参数。

      LeNet模型各项参数设置如表 4所示。

      表 4  参数设置表

      Table 4.  Parameter Setting

      LeNet各参数项 参数值
      卷积核大小 5×5
      最大池化 2×2
      激活函数 线性整流函数
      优化器 自适应矩估计
      批量数据大小 1 000
      学习率 0.01

      将训练集导入模型进行训练,用训练好的模型分别对验证集和测试集进行运算。模型对于验证集的准确率为87.50%,测试集数据预测值的受试者工作特征曲线(receiver operator characteristic curve, ROC)如图 3所示,曲线下面积(area under curve,AUC)为0.895,即测试集数据的预测准确率为89.5%。经过SMOTE过采样后的验证集数据精度与未经过样本比例处理的测试集数据精度相差不大,表明该模型有着较好的泛化能力,可以排除模型过拟合的情况。

      图  3  ROC曲线和曲线下面积

      Figure 3.  ROC Curves and Area Under Curve

      将全部数据导入模型得到研究区的滑坡发生概率,根据自然断点法将0~1的滑坡发生概率分为5个等级:极低易发区(0~0.09)、较低易发区(0.09~0.28)、中等易发区(0.28~0.50)、较高易发区(0.50~0.74)和极高易发区(0.74~1),如图 4所示。

      图  4  滑坡易发性分区图

      Figure 4.  Landslide Susceptibility Zoning Map

      总的来说,极高易发区主要集中在长江沿岸,特别是万州区长江段中北部一侧的人工建筑区域和南段的低海拔地区、北部行政边界处的铁峰山一侧以及西部和东南部靠近行政边界的主要山脉河流附近,极高易发区分布与实际滑坡的位置相符。

      各易发性分区统计结果如表 5所示,78.31%的滑坡数据被分入极高和较高易发区,75.62%的非滑坡栅格被划入极低和较低易发区。滑坡点数据被分入极高至极低易发区的数量及占比逐渐减小,非滑坡数据则刚好相反,这符合滑坡易发性评价原则。极高至极低易发区面积同样是逐渐减少的,极低易发区占比甚至超过61%,如果在实际滑坡灾害防范工作中,可以直接将大多数区域排除出风险区域,这对各项工作的开展具有一定的积极意义。实验结果表明,经过训练的LeNet模型有着较强的预测能力,通过学习训练具有比较准确的分辨能力。如果以0.5作为全体预测值的阈值,将模型的预测结果划分为0和1,通过与真实值进行对比,模型的整体精度为84.59%。

      表 5  滑坡易发性分区统计表

      Table 5.  Statistics of Landslide Susceptibility Zoning

      分区 滑坡栅格数量 占比/% 非滑坡栅格数量 占比/% 合计 占比/%
      极低易发区 3 062 4.04 3 448 375 61.05 3 451 437 60.30
      较低易发区 5 238 6.92 823 150 14.57 828 388 14.47
      中等易发区 8 122 10.73 544748 9.64 552870 9.66
      较高易发区 14 189 18.74 443790 7.86 457979 8.00
      极高易发区 45 097 59.57 387945 6.87 433042 7.57
    • 结合SMOTE和LeNet模型的滑坡易发性评价方法表现出了较好的适应性:对滑坡和非滑坡有较高的分辨效率,总体精度较高(84.59%),占研究区总面积15.57%的极高和较高易发区中78.31%的滑坡数据被预测为极高和较高易发区,占研究区总面积75.62%的极低和较低易发区中74.77%的非滑坡数据被预测为极低和较低易发区,结果表明易发性分区图与研究区实际情况比较一致,能够为滑坡监测预警研究工作提供参考。此外,CNN具有一些传统技术所没有的优点,比如自学习能力,能够学习大量输入数据与输出数据之间的映射关系,而不需要任何输入与输出数据之间的精确数学表达式,具有极强的适应性,善于挖掘数据局部特征,提取全局训练特征和分类。但是CNN模型的物理含义不明确,且处理大量数据时耗时较长,依赖图形处理器加速。因此,为了能将CNN广泛应用于区域滑坡预警,需要从超参优化组合、模型结构调整、适用性分析等方面开展进一步研究,以提高模型的精度和鲁棒性。

参考文献 (35)

目录

    /

    返回文章
    返回