留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

使用深度学习方法实现黄土滑坡自动识别

巨袁臻 许强 金时超 李为乐 董秀军 郭庆华

巨袁臻, 许强, 金时超, 李为乐, 董秀军, 郭庆华. 使用深度学习方法实现黄土滑坡自动识别[J]. 武汉大学学报 ● 信息科学版, 2020, 45(11): 1747-1755. doi: 10.13203/j.whugis20200132
引用本文: 巨袁臻, 许强, 金时超, 李为乐, 董秀军, 郭庆华. 使用深度学习方法实现黄土滑坡自动识别[J]. 武汉大学学报 ● 信息科学版, 2020, 45(11): 1747-1755. doi: 10.13203/j.whugis20200132
JU Yuanzhen, XU Qiang, JIN Shichao, LI Weile, DONG Xiujun, GUO Qinghua. Automatic Object Detection of Loess Landslide Based on Deep Learning[J]. Geomatics and Information Science of Wuhan University, 2020, 45(11): 1747-1755. doi: 10.13203/j.whugis20200132
Citation: JU Yuanzhen, XU Qiang, JIN Shichao, LI Weile, DONG Xiujun, GUO Qinghua. Automatic Object Detection of Loess Landslide Based on Deep Learning[J]. Geomatics and Information Science of Wuhan University, 2020, 45(11): 1747-1755. doi: 10.13203/j.whugis20200132

使用深度学习方法实现黄土滑坡自动识别

doi: 10.13203/j.whugis20200132
基金项目: 

国家自然科学基金创新研究群体科学基金 41521002

四川省科技厅重点研发计划 2019YFS0074

四川省科技计划 2018SZ0339

详细信息
    作者简介:

    巨袁臻,博士生,主要从事滑坡灾害自动识别研究。415384857@qq.com

    通讯作者: 许强,博士,教授。xq@cdut.edu.cn
  • 中图分类号: P237; P208

Automatic Object Detection of Loess Landslide Based on Deep Learning

Funds: 

The Science Fund for Creative Research Groups of the National Natural Science Foundation of China 41521002

the Key Research and Development Program of the Department of Science and Technology of Sichuan Province 2019YFS0074

Sichuan Science and Technology Program 2018SZ0339

More Information
    Author Bio:

    JU Yuanzhen, PhD candidate, specializes in geological disaster automatic detection. E-mail: 415384857@qq.com

    Corresponding author: XU Qiang, PhD, professor. E-mail: xq@cdut.edu.cn
  • 摘要: 区域性滑坡识别是滑坡灾害风险管理的基础,传统的识别工作主要依靠人力完成。在已有的滑坡自动识别研究中,方法上以机器学习为主,数据源上对谷歌地球影像应用较少,识别对象上多以与环境差异较大的新滑坡为主。结合深度学习方法和谷歌地球影像数据对中国典型黄土地区历史滑坡进行自动识别。首先,基于开源谷歌地球影像建立了历史黄土滑坡样本数据库,包含黄土滑坡2 498处;然后,利用掩膜区域卷积神经网络(mask region-based convolutional networks,Mask R-CNN)目标检测模块进行黄土滑坡自动识别。识别的准确率为0.56,召回率为0.72,F1值为0.63。结果表明,Mask R-CNN是一种稳健性较好的方法,可以用于以谷歌地球影像为数据源的黄土滑坡自动识别,为快速准确地进行区域滑坡灾害调查提供了可能。
  • 图  1  研究区位置和滑坡样本分布

    Figure  1.  Location of Study Area and Distribution of Landslide Samples

    图  2  黄土滑坡样本

    Figure  2.  Samples of Loess Landslide

    图  3  Mask R-CNN滑坡检测流程图

    Figure  3.  Flowchart of Mask R-CNN Landslide Detection

    图  4  滑坡检测中IoU使用示例

    Figure  4.  Example of IoU in Landslide Detection

    图  5  训练损失与验证精度

    Figure  5.  Train Loss and Validation Accuracy

    图  6  滑坡识别结果

    Figure  6.  Results of Landslide Detection

    图  7  正确识别结果

    Figure  7.  Results of Correct Detection

    图  8  错误识别结果

    Figure  8.  Results of Wrong Detection

    图  9  未识别结果

    Figure  9.  Results of Omission Detection

    表  1  滑坡数据集划分及统计信息

    Table  1.   Datasets of Landslide Samples and Statistical Information

    类型 训练集/个 验证集/个 测试集/个 最大面积/(103 m2) 最小面积/(103 m2) 平均面积/(103 m2) 外接矩形最大边长/m 外接矩形最小边长/m
    新滑坡 396 16 92 717.28 1.29 29.24 1 000 47
    未改造老滑坡 1 129 50 282 618.99 2.87 41.53 1 100 68
    已改造老滑坡 361 20 152 829.38 4.72 102.69 1 300 85
    所有滑坡 1 886 86 526 829.38 1.29 52.12 1 300 47
    下载: 导出CSV

    表  2  测试集精度

    Table  2.   Accuracy of Test Dataset

    类型 数量 预测数量 正确预测 召回率 准确率 F1
    新滑坡 92 58 0.6
    未改造老滑坡 282 205 0.71
    已改造老滑坡 152 114 0.73
    所有滑坡 526 668 377 0.72 0.56 0.63
    下载: 导出CSV
  • [1] Guzzetti F, Reichenbach P, Ardizzone F, et al. Estimating the Quality of Landslide Susceptibility Models[J]. Geomorphology, 2006, 81(1/2): 166-184 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=48fad4b960c1a74fc8296f625162f657
    [2] 许强, 汤明高, 徐开祥, 等.滑坡时空演化规律及预警预报研究[J].岩石力学与工程学报, 2008, 27(6): 1 104-1 112 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=yslxygcxb200806003

    Xu Qiang, Tang Minggao, Xu Kaixiang, et al. Research on Space-Time Evolution Laws and Early Warning-Prediction of Landslides[J]. Chinese Journal of Rock Mechanics and Engineering, 2008, 27(6): 1 104-1 112 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=yslxygcxb200806003
    [3] 张路, 廖明生, 董杰, 等.基于时间序列InSAR分析的西部山区滑坡灾害隐患早期识别:以四川丹巴为例[J].武汉大学学报·信息科学版, 2018, 43(12): 2 039-2 049 doi:  10.13203/j.whugis20180181

    Zhang Lu, Liao Mingsheng, Dong Jie, et al.Early Detection of Landslide Hazards in Mountainous Areas of West China Using Time Series SAR Interferometry:A Case Study of Danba, Sichuan[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2 039-2 049 doi:  10.13203/j.whugis20180181
    [4] Peng Dalei, Xu Qiang, Liu Fangzhou, et al. Distribution and Failure Modes of the Landslides in Heitai Terrace, China[J]. Engineering Geology, 2018, 236: 97-110 doi:  10.1016/j.enggeo.2017.09.016
    [5] Sato H P, Hasegawa H, Fujiwara S, et al. Interpretation of Landslide Distribution Triggered by the 2005 Northern Pakistan Earthquake Using SPOT‑5 Imagery[J]. Landslides, 2007, 4(2): 113-122 doi:  10.1007/s10346-006-0069-5
    [6] Huang R Q, Li W L. Analysis of the Geo-hazards Triggered by the 12 May 2008 Wenchuan Earthquake, China[J]. Bulletin of Engineering Geology and the Environment, 2009, 68(3): 363-371 doi:  10.1007/s10064-009-0207-0
    [7] Sun Wenyi, Tian Yuansheng, Mu Xingmin, et al. Loess Landslide Inventory Map Based on GF-1 Satellite Imagery[J]. Remote Sensing, 2017, 9(4): 1-17 http://adsabs.harvard.edu/abs/2017RemS....9..314S
    [8] Martha T R, Kerle N, Jetten V, et al.Characterising Spectral, Spatial and Morphometric Properties of Landslides for Semi-automatic Detection Using Object-Oriented Methods[J].Geomorphology, 2010, 116(1/2): 24-36 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=73285a8aa7dde01ac9b3686b44396934
    [9] Leshchinsky B A, Olsen M J, Tanyu B F. Contour Connection Method for Automated Identification and Classification of Landslide Deposits[J]. Computers and Geosciences, 2015, 74: 27-38 doi:  10.1016/j.cageo.2014.10.007
    [10] Li Zhongbin, Shi Wenzhong, Lu Ping, et al. Landslide Mapping from Aerial Photographs Using Change Detection-Based Markov Random Field[J]. Remote Sensing of Environment, 2016, 187: 76-90 doi:  10.1016/j.rse.2016.10.008
    [11] Lu Ping, Qin Yuanyuan, Li Zhongbin, et al. Remote Sensing of Environment Landslide Mapping from Multi-sensor Data Through Improved Change Detection-Based Markov Random Field[J]. Remote Sensing of Environment, 2019, 231: 1-17 http://www.sciencedirect.com/science/article/pii/S0034425719302548
    [12] Stumpf A, Kerle N.Object-Oriented Mapping of Landslides Using Random Forests[J].Remote Sensing of Environment, 2011, 115(10): 2 564-2 577 doi:  10.1016/j.rse.2011.05.013
    [13] van Eeckhaut M D, Kerle N, Poesen J, et al. Object-Oriented Identification of Forested Landslides with Derivatives of Single Pulse LiDAR Data[J]. Geomorphology, 2012, 11(173-174): 30-42 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=e356e263b1ed7ca6f2e4c5f958c8eb84
    [14] Chen Weitao, Li Xianju, Wang Yanxin, et al.Forested Landslide Detection Using LiDAR Data and the Random Forest Algorithm: A Case Study of the Three Gorges, China[J]. Remote Sensing of Environment, 2014, 152: 291-301 doi:  10.1016/j.rse.2014.07.004
    [15] Gorsevski P V, Brown M K, Panter K, et al. Landslide Detection and Susceptibility Mapping Using LiDAR and an Artificial Neural Network Approach: A Case Study in the Cuyahoga Valley National Park, Ohio[J]. Landslides, 2016, 13(3): 467-484 doi:  10.1007/s10346-015-0587-0
    [16] Mezaal M R, Pradhan B. An Improved Algorithm for Identifying Shallow and Deep-Seated Landslides in Dense Tropical Forest from Airborne Laser Scanning Data[J]. Catena, 2018, 167: 147-159 doi:  10.1016/j.catena.2018.04.038
    [17] Hu Qiao, Zhou Yi, Wang Shixing, et al.Improving the Accuracy of Landslide Detection in "Offsite" Area by Machine Learning Model Portability Comparison:A Case Study of Jiuzhaigou[J].Remote Sensing, 2019, 11(21):2 530-2 550 doi:  10.3390/rs11212530
    [18] Ghorbanzadeh O, Blaschke T, Gholamnia K, et al. Evaluation of Different Machine Learning Methods and Deep-Learning Convolutional Neural Networks for Landslide Detection[J].Remote Sensing, 2019, 11(2): 196-216 doi:  10.3390/rs11020196
    [19] Ghorbanzadeh O, Meena S R, Blaschke T, et al. UAV-Based Slope Failure Detection Using Deep-learning Convolutional Neural Networks[J]. Remote Sensing, 2019, 11(17): 2 046-2 069 doi:  10.3390/rs11172046
    [20] Ji Shunping, Yu Dawen, Shen Chaoyong, et al. Landslide Detection from an Open Satellite Imagery and Digital Elevation Model Dataset Using Attention Boosted Convolutional Neural Networks[J]. Landslides, 2020, 17(6): 1 337-1 352 doi:  10.1007/s10346-020-01353-2
    [21] Prakash N, Manconi A, Loew S. Mapping Landslides on EO Data: Performance of Deep Learning Models vs. Traditional Machine Learning Models[J]. Remote Sensing, 2020, 12(3): 346-368 doi:  10.3390/rs12030346
    [22] Sameen M I, Pradhan B. Landslide Detection Using Residual Networks and the Fusion of Spectral and Topographic Information[J]. IEEE Access, 2019, 7: 114 363-114 373 doi:  10.1109/ACCESS.2019.2935761
    [23] Yu Bo, Chen Fang, Xu Chong. Landslide Detection Based on Contour-Based Deep Learning Framework in Case of National Scale of Nepal in 2015[J]. Computers and Geosciences, 2020, 135: 104 388-104 395 doi:  10.1016/j.cageo.2019.104388
    [24] Guo Qinghua, Jin Shichao, Li Min, et al. Application of Deep Learning in Ecological Resource Research: Theories, Methods, and Challenges[J]. Science China Earth Sciences, 2020, DOI:  10.1007/s11430-019-9584-9
    [25] He K, Gkioxari G, Dollár P, et al. Mask R-CNN[C]. 2017 IEEE International Conference on Computer Vision, Venice, Italy, 2017
    [26] Wu Xiongwei, Sahoo D, Hoi S C H. Recent Advances in Deep Learning for Object Detection[J]. Neurocomputing, 2020, 396: 39-64 doi:  10.1016/j.neucom.2020.01.085
    [27] He Kaiming, Zhang Xiangyu, Ren Shaoqing, et al. Deep Residual Learning for Image Recognition[C]. The IEEE Conference on Computer Vision and Pattern Recognition, Nevada, American, 2016
    [28] Lin T, Dollár P, Girshick R, et al. Feature Pyramid Networks for Object Detection[C]. The IEEE Conference on Computer Vision and Pattern Recognition, Honolulu, American, 2017
    [29] Ren Shaoqing, He Kaiming, Girshick Ross, et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017, 39: 1 137-1 149 http://europepmc.org/abstract/MED/27295650
    [30] 许强, 董秀军, 李为乐.基于空-天-地一体化的重大地质灾害隐患早期识别与监测预警[J].武汉大学学报·信息学版, 2019, 44(7):957-966 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=whchkjdxxb201907003

    Xu Qiang, Dong Xiujun, Li Weile.Integrated Space-Air-Ground Early Detection, Monitoring and Warning System for Potential Catastrophic Geohazards[J]. Geomatics and Information Science of Wuhan University, 2019, 44(7): 957-966 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=whchkjdxxb201907003
  • [1] 邵振峰, 孙悦鸣, 席江波, 李岩.  智能优化学习的高空间分辨率遥感影像语义分割 . 武汉大学学报 ● 信息科学版, 2022, 47(2): 234-241. doi: 10.13203/j.whugis20200640
    [2] 李鹏程, 白文浩.  基于Transformer结构的遥感影像敏感目标自动隐藏方法 . 武汉大学学报 ● 信息科学版, 2022, 47(8): 1287-1297. doi: 10.13203/j.whugis20220219
    [3] 李彦胜, 张永军.  耦合知识图谱和深度学习的新一代遥感影像解译范式 . 武汉大学学报 ● 信息科学版, 2022, 47(8): 1176-1190. doi: 10.13203/j.whugis20210652
    [4] 赵之若, 王少宇, 王心宇, 钟燕飞.  一种改进的火星车多光谱影像深度新颖目标探测方法 . 武汉大学学报 ● 信息科学版, 2022, 47(8): 1328-1335. doi: 10.13203/j.whugis20220119
    [5] 王艳东, 邵鑫, 刘波, 邓跃进, 魏广泽, 豆明宣.  一种利用Mask R-CNN的遥感影像与矢量数据配准方法 . 武汉大学学报 ● 信息科学版, 2022, 47(4): 623-631. doi: 10.13203/j.whugis20200137
    [6] 陈行, 罗斌.  利用动态上采样滤波深度网络进行多角度遥感影像超分辨率重建 . 武汉大学学报 ● 信息科学版, 2021, 46(11): 1716-1726. doi: 10.13203/j.whugis20200651
    [7] 季顺平, 罗冲, 刘瑾.  基于深度学习的立体影像密集匹配方法综述 . 武汉大学学报 ● 信息科学版, 2021, 46(2): 193-202. doi: 10.13203/j.whugis20200620
    [8] 张瑞倩, 邵振峰, Aleksei Portnov, 汪家明.  多尺度空洞卷积的无人机影像目标检测方法 . 武汉大学学报 ● 信息科学版, 2020, 45(6): 895-903. doi: 10.13203/j.whugis20200253
    [9] 眭海刚, 黄立洪, 刘超贤.  利用具有注意力的Mask R-CNN检测震害建筑物立面损毁 . 武汉大学学报 ● 信息科学版, 2020, 45(11): 1660-1668. doi: 10.13203/j.whugis20200158
    [10] 潘银, 邵振峰, 程涛, 贺蔚.  利用深度学习模型进行城市内涝影响分析 . 武汉大学学报 ● 信息科学版, 2019, 44(1): 132-138. doi: 10.13203/j.whugis20170217
    [11] 史绪国, 张路, 许强, 赵宽耀, 董杰, 蒋厚军, 廖明生.  黄土台塬滑坡变形的时序InSAR监测分析 . 武汉大学学报 ● 信息科学版, 2019, 44(7): 1027-1034. doi: 10.13203/j.whugis20190056
    [12] 赵超英, 刘晓杰, 张勤, 彭建兵, 许强.  甘肃黑方台黄土滑坡InSAR识别、监测与失稳模式研究 . 武汉大学学报 ● 信息科学版, 2019, 44(7): 996-1007. doi: 10.13203/j.whugis20190072
    [13] 樊恒, 徐俊, 邓勇, 向金海.  基于深度学习的人体行为识别 . 武汉大学学报 ● 信息科学版, 2016, 41(4): 492-497. doi: 10.13203/j.whugis20140110
    [14] 何 楚, 张 宇, 廖紫纤, 徐 新.  基于压缩感知的sar图像cfar目标检测算法 . 武汉大学学报 ● 信息科学版, 2014, 39(7): 878-882.
    [15] 李德仁, 胡晓光, 朱欣焰.  基于视觉反差的显著图生成与目标检测 . 武汉大学学报 ● 信息科学版, 2012, 37(4): 379-383.
    [16] 邵振峰, 李德仁, 朱先强.  利用改进的遗传算法对红外影像自适应目标进行检测 . 武汉大学学报 ● 信息科学版, 2011, 36(5): 535-539.
    [17] 胡学敏, 郑宏, 司小书.  利用双指数函数导数模型进行高分辨率卫星影像目标检测 . 武汉大学学报 ● 信息科学版, 2010, 35(11): 1265-1270.
    [18] 汪长城, 廖明生.  一种多孔径SAR图像目标检测方法 . 武汉大学学报 ● 信息科学版, 2009, 34(1): 32-35.
    [19] 肖力炀, 李伟, 袁博, 崔逸群, 高荣, 王文庆.  一种改进型Mask R-CNN模型的路面裂缝识别方法 . 武汉大学学报 ● 信息科学版, 0, 0(0): -. doi: 10.13203/j.whugis20210279
    [20] 姜万冬, 席江波, 李振洪, 丁明涛, 杨立功, 谢大帅.  模拟困难样本的Mask R-CNN滑坡分割识别 . 武汉大学学报 ● 信息科学版, 0, 0(0): 0-0. doi: 10.13203/j.whugis20200692
  • 加载中
图(9) / 表(2)
计量
  • 文章访问数:  1806
  • HTML全文浏览量:  420
  • PDF下载量:  445
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-03-30
  • 刊出日期:  2020-11-19

使用深度学习方法实现黄土滑坡自动识别

doi: 10.13203/j.whugis20200132
    基金项目:

    国家自然科学基金创新研究群体科学基金 41521002

    四川省科技厅重点研发计划 2019YFS0074

    四川省科技计划 2018SZ0339

    作者简介:

    巨袁臻,博士生,主要从事滑坡灾害自动识别研究。415384857@qq.com

    通讯作者: 许强,博士,教授。xq@cdut.edu.cn
  • 中图分类号: P237; P208

摘要: 区域性滑坡识别是滑坡灾害风险管理的基础,传统的识别工作主要依靠人力完成。在已有的滑坡自动识别研究中,方法上以机器学习为主,数据源上对谷歌地球影像应用较少,识别对象上多以与环境差异较大的新滑坡为主。结合深度学习方法和谷歌地球影像数据对中国典型黄土地区历史滑坡进行自动识别。首先,基于开源谷歌地球影像建立了历史黄土滑坡样本数据库,包含黄土滑坡2 498处;然后,利用掩膜区域卷积神经网络(mask region-based convolutional networks,Mask R-CNN)目标检测模块进行黄土滑坡自动识别。识别的准确率为0.56,召回率为0.72,F1值为0.63。结果表明,Mask R-CNN是一种稳健性较好的方法,可以用于以谷歌地球影像为数据源的黄土滑坡自动识别,为快速准确地进行区域滑坡灾害调查提供了可能。

English Abstract

巨袁臻, 许强, 金时超, 李为乐, 董秀军, 郭庆华. 使用深度学习方法实现黄土滑坡自动识别[J]. 武汉大学学报 ● 信息科学版, 2020, 45(11): 1747-1755. doi: 10.13203/j.whugis20200132
引用本文: 巨袁臻, 许强, 金时超, 李为乐, 董秀军, 郭庆华. 使用深度学习方法实现黄土滑坡自动识别[J]. 武汉大学学报 ● 信息科学版, 2020, 45(11): 1747-1755. doi: 10.13203/j.whugis20200132
JU Yuanzhen, XU Qiang, JIN Shichao, LI Weile, DONG Xiujun, GUO Qinghua. Automatic Object Detection of Loess Landslide Based on Deep Learning[J]. Geomatics and Information Science of Wuhan University, 2020, 45(11): 1747-1755. doi: 10.13203/j.whugis20200132
Citation: JU Yuanzhen, XU Qiang, JIN Shichao, LI Weile, DONG Xiujun, GUO Qinghua. Automatic Object Detection of Loess Landslide Based on Deep Learning[J]. Geomatics and Information Science of Wuhan University, 2020, 45(11): 1747-1755. doi: 10.13203/j.whugis20200132
  • 中国幅员辽阔,地形多变,地质灾害频发,严重威胁人民生命财产安全,其中尤以滑坡灾害居多。在滑坡灾害研究中,滑坡识别或滑坡制图又是其他研究工作的基础。从滑坡的发展阶段来说,滑坡识别分为对历史滑坡的识别和对滑坡的早期识别两类。历史滑坡的识别结果可以反映滑坡分布情况,是滑坡易发性等风险评价研究的基础[1]。滑坡的早期识别也有两类:(1)识别未成灾的不稳定斜坡[2];(2)识别历史滑坡的整体或局部复活,如丹巴五里牌滑坡[3]和甘肃黑方台滑坡群[4]等。同时,随着对地观测技术的迅猛发展,遥感技术在大面积地质灾害调查中的应用也越来越普遍。因此,在大量的遥感数据中快速、全面和准确地识别出历史滑坡对防灾减灾具有重要意义。

    现有的历史滑坡识别方法主要有5类:(1)目视解译方法。该方法主要通过专业人员的知识和经验对历史滑坡进行人工判断[5-6]。目视解译结果一般准确度较高,但非常依赖专业人员的经验,且十分费时费力。(2)特征阈值方法。这种方法多使用基于像素的方法或基于对象的多尺度分割方法,对滑坡区域的光谱、纹理、地貌或地形等特征进行统计,设置一种或者多种阈值进行滑坡识别[7-9]。由于其判断标准为特定区域特定特征的统计值,因此适用范围较小。(3)变化检测方法。这种方法需要有同一位置的两期或多期遥感数据,找出因滑坡引起的变化区域,数据源可以是二维光学影像,也可以是三维地形数据[10-11]。变化检测对新生滑坡的应用效果较好,需要具有时间序列的遥感数据。(4)机器学习方法。这种方法在数据准备部分与特征阈值方法和变化检测类似,需要提取所使用数据的各类相关特征,但最后识别不是使用单一的阈值进行区分,而是使用机器学习的各种分类器进行滑坡识别,其自动化程度相较于前面的方法更高。常用的有贝叶斯、逻辑回归、支持向量机、随机森林和人工神经网络等算法[12-17]。机器学习方法的特征选择和超参数调试工作量较大。(5)深度学习方法。相较于机器学习,深度学习在处理滑坡特征时不用人工构建和选择特征图层,同时深度学习所接纳的样本量更大,适合于更大场景的滑坡识别,在滑坡识别中以卷积神经网络为主[18-23]。作为一种以数据为驱动的方法,随着地质灾害观测数据爆发式增长,深度学习成为滑坡识别方法研究中的热点。

    在已有使用深度学习的滑坡识别研究中,研究对象多聚焦于在光谱和纹理特征上与环境区别度较大的滑坡[20],如地震滑坡[18, 23]和降雨滑坡[22]等新生滑坡,而对发生时间较久远、滑坡边界不明显、侵蚀和改造强烈的黄土历史滑坡研究较少。从滑坡识别研究中所使用的数据源上来看,光学影像数据主要有卫星影像[18, 20-21]、航空影像[22]和无人机影像[19],地形数据主要以机载激光雷达数据[21]为主。尽管如陆地卫星(Landsat)和哨兵2号(Sentinel-2)影像以及美国航天飞机雷达地形测绘任务数据可免费获取,但其空间分辨率较低,而高空间分率的数据获取具有一定门槛。对黄土滑坡而言,其平均面积较小,使用低空间分辨率影像进行识别会造成许多遗漏。谷歌地球影像则可以较好地兼顾黄土滑坡识别中高空间分辨率和易获取的需求。同时,深度学习作为一种以数据驱动的方法,具有一定数量的训练样本数据库是使用该方法的前提,而在前人研究中缺少用于黄土历史滑坡识别的训练样本数据库。

    针对以上研究空白,本文结合开源数据和深度学习方法对黄土历史滑坡识别进行研究。考虑到黄土滑坡的平均面积较小,识别对数据空间分辨率有一定的要求,选择谷歌地球开源影像作为研究数据源;深度学习方法则选择掩膜区域卷积神经网络(mask region-based convolutional networks,Mask R-CNN)的目标检测模块。选择甘肃省兰州市和临夏回族自治州作为研究区,在谷歌地球1 m空间分辨率影像上进行黄土滑坡解译,构建黄土历史滑坡识别数据库,在该数据库的基础上,探索使用Mask R-CNN深度学习方法进行滑坡目标检测的可行性。

    • 本文研究区位于甘肃省兰州市与临夏回族自治州(见图 1),地处黄土高原,年平均降雨量少,蒸发量大,气候干燥,植被较少,可通过光学影像对滑坡进行解译。研究区的滑坡类型以黄土滑坡为主。

      图  1  研究区位置和滑坡样本分布

      Figure 1.  Location of Study Area and Distribution of Landslide Samples

      滑坡解译使用的数据为谷歌地球影像,空间分辨率为1 m,面积约为225×260 km2。由于谷歌地球影像由多种传感器数据拼接而成,因此大范围影像的光谱和时间不具有一致性,本文中使用的影像时间为2015—2018年。选择ArcMap作为滑坡人工解译软件,在该区域共解译出历史滑坡2 498处,根据这些滑坡在影像中所表现出的光谱和纹理特点,推测其发生时间,可大致分为新滑坡、未改造老滑坡和已改造老滑坡3类(图 2),具体如下:

      图  2  黄土滑坡样本

      Figure 2.  Samples of Loess Landslide

      1) 新滑坡。这类滑坡形成的时间较短,光谱明亮,滑坡体完全解体(图 2(a))。本文共解译有504处新滑坡,滑坡面积最大值为717.28×103 m2,最小值为1.29×103 m2,平均值为29.24×103 m2。滑坡边界外接矩形最大边长为1 000 m,最小边长为47 m。

      2) 未改造老滑坡。这类滑坡的光谱与环境几乎一致,滑坡后壁可见,但滑坡侧边界较模糊,滑坡体或堆积区没有明显农田改造(图 2(b))。本文共解译有1 461处未改造老滑坡,滑坡面积最大值为618.99×103 m2,最小值为2.87×103 m2,平均值为41.53×103 m2。滑坡边界外接矩形最大边长为1 100 m,最小边长为68 m。

      3) 已改造老滑坡。这类滑坡的光谱与环境几乎一致,滑坡内部被改造成农田或村庄(图 2(c))。本文共解译533处已改造老滑坡,滑坡面积最大值为829.38×103 m2,最小值为4.72×103 m2,平均值为102.69×103 m2。滑坡边界外接矩形最大边长为1 300 m,最小边长为85 m。

      在深度学习中,需将样本数据划分为训练数据集、验证数据集和测试数据集。训练数据用于学习目标特征,验证数据用于选择表现最好的模型,测试数据用于对模型性能进行评价。本文中,为全面评价方法性能,根据滑坡类型分布和影像数据光谱特征相对均匀地划分数据集(见图 1(b)),其中训练样本1 886处,验证样本86处,测试样本526处(见表 1)。从滑坡的统计信息来看,滑坡最大边长为1 300 m,为充分训练滑坡和非滑坡区域,将滑坡区域的图片裁剪为2 000×2 000像素大小。

      表 1  滑坡数据集划分及统计信息

      Table 1.  Datasets of Landslide Samples and Statistical Information

      类型 训练集/个 验证集/个 测试集/个 最大面积/(103 m2) 最小面积/(103 m2) 平均面积/(103 m2) 外接矩形最大边长/m 外接矩形最小边长/m
      新滑坡 396 16 92 717.28 1.29 29.24 1 000 47
      未改造老滑坡 1 129 50 282 618.99 2.87 41.53 1 100 68
      已改造老滑坡 361 20 152 829.38 4.72 102.69 1 300 85
      所有滑坡 1 886 86 526 829.38 1.29 52.12 1 300 47
    • 自动识别任务即目标检测任务,它由目标分类和目标定位组成。深度学习目标检测类算法首先会提取出大量的初始框,然后根据图像特征进行训练筛选后获得潜在目标框;目标框经过目标分类获得其类别标签,具体是通过输出层中的分类层将高度抽象的特征转为类别概率来实现;同时,目标框需要通过目标定位获得其准确边界位置,具体是通过输出层中的边界回归层对目标框顶点坐标进行精确回归来实现[24]。本文中,滑坡的自动识别是通过深度学习算法完成滑坡的分类和定位,滑坡分类是指区分滑坡和非滑坡,滑坡定位是获得滑坡边界的外接矩形。这一过程的自动实现主要得益于深度学习网络参数的自动更新,实现特征的自动提取。参数自动更新则是通过梯度下降算法找到降低损失函数的权重更新方向来实现的,基于最优的参数组合提取正确的特征即可完成自动识别任务。

      本文选用深度学习方法中的Mask R-CNN目标检测模块[25]来执行滑坡检测任务,检测流程图如图 3所示。从方法类别角度来讲,Mask R-CNN的目标检测是一个两阶段算法[26]:(1)在对图像进行特征金字塔提取后,在训练区域提取网络并生成感兴趣区域(region of interest,RoI);(2)对感兴趣区域进行类别预测和边界回归。

      图  3  Mask R-CNN滑坡检测流程图

      Figure 3.  Flowchart of Mask R-CNN Landslide Detection

      在Mask R-CNN结构中主要包含5个部分:(1)残差网络,它是特征提取的主干网络,并可以解决模型性能不随卷积层数增加而提高的问题[27];(2)特征金字塔网络,用于构建图像的多尺度特征,可丰富特征地图,兼顾空间分辨率和特征[28];(3)区域提取网络[29],用于提取图像中的感兴趣区域,将其作为模型第二阶段训练或测试的输入区域;(4)RoI分类器,用于预测RoI的类别;(5)RoI边界框回归,用于精修边界框的位置坐标。更多关于Mask R-CNN的细节和讨论见文献[25]。

      本文使用的Mask R-CNN代码来源于Github(https://github.com/matterport/Mask_RCNN),它是基于Keras和Tensorflow框架搭建的。本文只是使用Mask R-CNN模型的检测模块完成滑坡的定位任务。

      模型训练和测试使用的设备参数为Intel Xeon e5-2640 CPU,256 GB RAM,NVIDIA Tesla P100-PCIE-12 GB GPU。模型选用ResNet-101(101层)为主干网络,最小批数量为2张图片,训练批次为100,每个批次迭代1 000次,学习率为0.005,学习动量为0.9,权重正则化系数为0.005,训练时将所有样本重采样为1 024×1 024像素。此外,除不使用Mask R-CNN的实例分割模块外,其他参数保持默认。为弥补训练数据量小的缺陷,减少训练时间,模型训练的初始参数采用COCO预训练模型以进行迁移学习。同时,为了防止过拟合现象,在训练的同时使用验证集数据对模型精度进行验证,取验证集精度最高时的模型作为最优模型,并将其用于测试集数据。另外,为进一步增大样本量,在训练时采用了旋转的数据增强策略。在滑坡解译时,尽管已将其大致分为3类,但是考虑到各类别数量和面积的不均衡,将本次滑坡目标检测设定为二分类任务,即只区分影像中的滑坡和非滑坡,结果为滑坡边界的外接框。

    • 对目标检测任务进行精度评价时应先确定某个预测结果是否正确,需要设定置信度阈值和IoU(intersection of union)阈值。置信度是每个预测结果属于该类别的概率值,即模型对该结果可靠程度的评估,设定置信度阈值用于在所有结果中确定最终的预测结果(大于该阈值为最终结果)。IoU表示的是最终结果与真值的重叠度,计算公式为:

      $$ {I_U} = \frac{I}{U} $$ (1)

      式中,IU表示IoU值;I为预测框和滑坡边界框的交集面积值;U为预测框和滑坡边界框的并集面积值。IoU阈值用于评定某个预测结果是否正确(大于该阈值为正确预测)。以图 4(a)为例,预测框1、2、3为最终预测结果,假设IoU阈值为0.5,其中预测框1与预测框2为错误预测框,预测框3为正确预测框。本文中的置信度阈值为0.8,IoU阈值为0.5。

      图  4  滑坡检测中IoU使用示例

      Figure 4.  Example of IoU in Landslide Detection

      在本文的滑坡识别研究中,有部分结果如图 4(b)所示,使用IoU的划分标准,则预测类1为错误识别,预测类2为正确识别。但从滑坡滑动方式来看,这是由于有些滑坡具有多级多次滑动的特点。图 4(b)中预测类1识别出的是这类滑坡的次级滑动范围,尽管其预测范围不准确,但这也是该类滑坡较突出的特点。因此,这类结果采取人工校核的方式,将其归为正确识别。对本文的目标检测结果使用准确率、召回率和F1值作为精度评价指标[25]。准确率是指正确预测结果数量与所有预测结果数量的比值;召回率是指正确预测结果数量与所有真值的比值;F1值是同时考虑准确率和召回率的综合指标,计算公式为:

      $$ {F_1} = \frac{{2PR}}{{P + R}} $$ (2)

      式中,P为准确率;R为召回率。

      本文最终获得的是二分类结果,即只判断是否是滑坡,不会判断是哪一类滑坡,因此对整体结果可以计算准确率、召回率和F1值,对不同类别的滑坡则只能计算其召回率。

    • 在Mask R-CNN模型训练的100个批次中,训练完第87个批次后,验证集的F1值达到最大值0.58,尽管后续损失仍有下降,但对应的验证集精度有所下降,因此选择第87个批次的模型参数作为最优模型用于结果测试(见图 5)。

      图  5  训练损失与验证精度

      Figure 5.  Train Loss and Validation Accuracy

      表 2是测试集精度,测试集共有526个滑坡,使用上述最优模型测试的结果中,大于置信度阈值的预测框有668个,根据IoU阈值进行划分,正确预测个数为377个,错误预测个数为291个,整体准确率为0.56,召回率为0.72,F1值为0. 63。在不同类型滑坡上,未改造老滑坡和已改造老滑坡的召回率要高于新滑坡的召回率。

      表 2  测试集精度

      Table 2.  Accuracy of Test Dataset

      类型 数量 预测数量 正确预测 召回率 准确率 F1
      新滑坡 92 58 0.6
      未改造老滑坡 282 205 0.71
      已改造老滑坡 152 114 0.73
      所有滑坡 526 668 377 0.72 0.56 0.63

      图 6为部分区域的滑坡识别结果,为便于展示预测效果,使用滑坡多边形边界表示真值。从影像上来看,由于谷歌地球影像由不同传感器、不同时间的影像拼接而成,其光谱特征不均一;从识别结果来看,Mask R-CNN模型在这些光谱不同的区域都能实现滑坡识别。

      图  6  滑坡识别结果

      Figure 6.  Results of Landslide Detection

    • 图 7为部分正确识别结果。从图 7中可以看出,本文训练的Mask R-CNN目标检测模块具有识别不同光谱、不同类型历史滑坡的能力,说明在谷歌影像上采用深度学习方法进行滑坡识别具有一定的效果。图 8为部分错误识别结果,对错误识别结果进行对比发现,主要有两类错误类型。错误预测1多发生在影像中阴影部位,位于山脊或坡顶,这些地方坡度较大,在太阳照射下,形成与滑坡后壁类似的阴影,以致被错误划分;错误预测2主要发生在地表纹理复杂如梯田变化、自然侵蚀或山脊交汇处,这些地方不同的地表纹理可能组成与滑坡后缘类似的圈椅状或弧状边界形态,导致错误识别。

      图  7  正确识别结果

      Figure 7.  Results of Correct Detection

      图  8  错误识别结果

      Figure 8.  Results of Wrong Detection

      在未检测出的滑坡中,新滑坡召回率相对较低(见表 2),这是由于滑坡样本主要以与环境光谱一致的老滑坡为主,即滑坡训练新老滑坡样本数量不均衡,同时这类滑坡的尺寸也较小,难以充分识别。而在未检测出的老滑坡中,滑动距离较小,滑坡体未出现明显解体,滑坡内部与环境的光谱和纹理特征基本一致(见图 9),边界更加模糊,识别难度更大。

      图  9  未识别结果

      Figure 9.  Results of Omission Detection

    • 使用深度学习方法对检测黄土老滑坡具有一定的效果。在不同场景中都具有识别历史滑坡的能力,但在样本、数据源和方法上仍有不足,具有一定改进空间。

      1) 丰富滑坡数据集。从上述结果可以看出,新滑坡的识别效果稍差,滑距短和边界模糊的滑坡漏分较多。下一步可结合迁移学习和人工核准方法增加这些类别的样本数量,并平衡各类滑坡数量,以期得到一个对所有滑坡类别均有较好识别效果的模型。

      2) 融合多源数据。虽然谷歌地球影像便于获取,整体空间分辨率也较高,但仅有红绿蓝波段,同时时间分辨率难以控制,部分地区空间分辨率较低,可将其与其他开源数据如Sentinel-2影像数据进行融合,增加数据光谱多样性,提升识别的准确率。除光学影像外,随着国内地质灾害调查领域中三维探测手段如激光雷达技术的丰富与普及[30],可进一步增加精细的地形数据,加强对滑坡的关键特征如滑坡主断壁的检测。

      3) 滑坡识别多分类任务。本文使用深度学习方法对历史黄土滑坡进行识别为二分类任务,即区分滑坡与非滑坡。下一步可对本文中按光谱特征和改造程度的分类进行多分类识别,即区分新滑坡、未改造老滑坡和改造老滑坡。同时,不同区域滑坡形成条件与滑坡运动类型是不同的,与之对应的影像形态特征也是不同的,可从运动类型如蠕滑、远程滑动等角度对滑坡进行多分类研究。

    • 本文构建了用于深度学习的黄土历史滑坡样本集,样本中主要以滑动时间较长的老滑坡为主;以开源谷歌地球影像作为数据源,使用Mask R-CNN深度学习方法对大范围黄土老滑坡进行识别。识别结果准确率为0.56,召回率为0.72,F1值为0.63,表明基于深度学习方法使用谷歌地球影像可以对研究区大部分黄土历史滑坡进行自动识别。但由于滑坡形态的多变性以及自然环境纹理的复杂性,现有工作中错误识别也较多,需要对滑坡进行更精细的分类识别。另外,老滑坡中对堆积区改造较为严重,可重点进行滑源区的识别研究。对历史滑坡的识别不仅是区域滑坡风险管理的基础,由于部分滑坡具有群发和复活特点,结合其他监测技术还可实现滑坡的早期识别,特别是在地质灾害研究进入大数据时代后,使用深度学习方法进行滑坡识别可大大提升效率,对滑坡防灾减灾具有重要意义。

参考文献 (30)

目录

    /

    返回文章
    返回