文章信息
- 冯非凡, 武雪玲, 牛瑞卿, 许石罗
- FENG Feifan, WU Xueling, NIU Ruiqing, XU Shiluo
- 一种V/S和LSTM结合的滑坡变形分析方法
- A Landslide Deformation Analysis Method Using V/S and LSTM
- 武汉大学学报·信息科学版, 2019, 44(5): 784-790
- Geomatics and Information Science of Wuhan University, 2019, 44(5): 784-790
- http://dx.doi.org/10.13203/j.whugis20170218
-
文章历史
收稿日期: 2018-10-24
2. 中国地质大学(武汉)地球物理与空间信息学院, 湖北 武汉, 430074;
3. 河南省地质矿产勘查开发局第四地质勘查院, 河南 郑州, 450001
2. Institute of Geophysics and Geomatics, China University of Geosciences, Wuhan 430074, China;
3. The Fourth Geological Exploration Institute of Henan Geology and Mineral Bureau, Zhengzhou, 450001, China
滑坡的时空演化是一个复杂的非线性过程,传统的预测预报理论模型大多存在参数物理意义不明确、滑坡变形趋势预测不足和监测数据缺失等局限性。因此,探索一种高效、准确的滑坡变形分析方法成为滑坡灾害监测、预警和评估的关键。分形理论作为探索自然界复杂现象的有效手段,成为解决地质环境问题的有效非线性方法之一。重标方差(rescaled variance statistic, V/S)分析是由传统重标极差分析法发展而来的新的非参数分析法,对非线性时间序列的长记忆性研究有很好的稳健性和适用性[1],在水文、股票等数据的动态分析中已得到广泛应用[2-4],在滑坡非线性变形趋势分析领域具有潜在研究价值。长短记忆(long short-term memory, LSTM)递归神经网络作为深度机器学习神经网络,具有时序观念的同时,解决了神经网络固有的易陷入局部最小值、梯度缺失问题,在手写文字、自然语言处理和图片内容等领域已取得显著研究成果[5-8],但在滑坡时间序列预测领域中实践较少,具有良好的应用前景。本文以三峡库区典型滑坡为研究对象,结合地质环境定性分析与V/S分析法定量化研究,选取适当的影响因子并运用LSTM神经网络构建滑坡位移预测模型,探讨了一种V/S分析和LSTM神经网络结合的滑坡变形趋势分析方法,为三峡库区滑坡变形综合评价提供决策支撑。
1 V/S分析和LSTM神经网络V/S分析是文献[9]提出的利用序列方差替换序列累计离差的新的极差分形时间序列分析方法。对于已知时间序列{ξ(t)}(t=1,2,3…),τ时刻的V/S分析统计量定义为:
$\begin{array}{l} {(V/S)_\tau } = \frac{1}{{\tau S{{(\tau )}^2}}}\left[ {\sum\limits_{n = 1}^r {{{\left( {\sum\limits_{t = 1}^n {\left( {\xi (t) - {{\bar \xi }_\tau }} \right)} } \right)}^2}} - } \right.\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\frac{1}{\tau }{\left( {\sum\limits_{n = 1}^\tau {\sum\limits_{t = 1}^n {\left( {\xi (t) - {{\bar \xi }_z}} \right)} } } \right)^2}] \end{array} $ | (1) |
式中,$S(\tau) = \sqrt {\frac{1}{\tau }\sum\limits_{ = 1}^\tau {{{\left({\xi (t) - {{\bar \xi }_\tau }} \right)}^2}} } $;${\bar \xi _\tau } = \frac{1}{\tau }\sum\limits_{t = 1}^\tau \xi (t)$;${\bar \xi _\tau }$表示τ时刻时间序列的均值;${(V/S)_\tau } \propto K{\tau ^{2H}}$,K、H为常数,H即为Hurst指数。Hurst指数的估计为lg(V/S)-lg(τ)双对数坐标中最小二乘法估计拟合趋势线斜率的1/2。
Hurst及其他学者研究证明,Hurst指数取值范围为[0, 1],且区间内不同取值表示不同的时间序列特性[10]。若H=1/2,则时间序列观测值之间相互独立,事物状态呈随机性;若H > 1/2,则时间序列状态存在持续性,即长记忆性特征,持续性与H值增大呈正比;若0≤H < 1/2,则时间序列状态存在反持续性,事物所处状态向其相反方向改变,反持续性与H值减小成反比。分形维数D是衡量时序运动变化程度与轨迹平滑程度的指标,与Hurst指数的关系为:D=2-H[11]。D值越大,运动变化程度越激烈,运动轨迹平滑程度越差。
LSTM神经网络相比传统递归神经网络,其核心构建了包含一个记忆单元和多种门结构的记忆块,使内部神经元-多激活神经元保持恒定误差[12]。本文采用引入遗忘门结构的改进LSTM神经网络模型,该模型通过构建输入门、遗忘门、输出门共3种门结构,分别实现数据的输入、筛选和输出,以sigmoid和tanh为激活函数,采用数乘和相加的线性运算数据传播方式,实现对信息的控制和存储,使得梯度在反向传播过程中得以有效保存,从而让网络具有“记忆”特性,避免梯度消失问题的同时,达到保留长记忆信息的效果[13-14]。
因此,将V/S分析和LSTM神经网络结合并用于滑坡变形趋势分析,在有效判别非线性时间序列特性的同时,能够挖掘、学习长记忆信息并避免梯度消失,为提高滑坡变形趋势预测的高效性与准确性提供了新思路和方法。
2 滑坡变形特征分析白水河滑坡位于三峡库区秭归县,距三峡大坝坝址56 km,地处长江南岸。滑坡地形地貌南高北低,滑坡形态呈不规则“圈椅”状。地层以侏罗系香溪组与第四系地层为主,岩性多碎屑岩类,为单斜顺层土质滑坡(见图 1)。该滑坡历史上曾因强烈变形而多次预警,监测形式包括GPS位移与地下水位监测、降雨与深部位移钻孔测斜监测,以及宏观地质巡查,其平面监测布置如图 2所示。
滑坡各监测点累积位移与时间变化关系见图 3。预警区内ZG93、ZG118和XD-01、XD-02、XD-03、XD-04监测点位移整体保持上升趋势,变化幅度有所差异。滑坡体东部及其前缘XD-01、XD-03监测点累积位移变化幅度明显高于中部及其西部ZG93和ZG118监测点,说明预警区内滑坡体北东部变形程度比中部、西部强烈。从整体上看,滑坡监测点位移均表现为阶跃型特征,且均以每年5月至9月突变增加的上升趋势保持增长。相比之下,非预警区内ZG91、ZG92、ZG94、ZG119和ZG120监测点多年观测值很小,变形不明显。
由图 3可知,2006—2012年,滑坡位移变化与库水位变化、降雨呈明显相关性。预警区内各累积位移曲线在库水位下调期间呈阶跃式增长。受库水位波动影响,滑坡前缘与东部突变最为明显。滑坡所在区域雨季为每年的5月至9月,同时期内滑坡地表变形受库水位和连续强降雨综合作用,位移变形显著。因此,库水位下降与连续强降雨为诱发滑坡变形的共同外界因素,库水位下调诱发滑坡变形,强降雨加速滑坡变形。
3 滑坡变形定量分析 3.1 滑坡变形趋势分析为便于对同时间段滑坡各监测点稳定性现状及整体未来变形趋势进行分析,考虑已有数据情况,分别选取白水河滑坡2006年1月至2012年4月期间,预警区内ZG93、ZG118、XD-01监测点以及非预警区内ZG91、ZG92、ZG94、ZG119、ZG120监测点的累积位移数据,采用V/S分析探索滑坡变形趋势,Hurst指数及分维数结果见表 1。
分形参数 | 监测点 | |||||||
ZG91 | ZG92 | ZG93 | ZG94 | ZG118 | ZG119 | ZG120 | XD-01 | |
Hurst指数 | 0.853 | 0.761 | 0.937 | 0.446 | 0.934 | 0.697 | 0.642 | 0.950 |
截距 | -1.632 | -1.487 | -1.602 | -0.821 | -1.594 | -1.289 | -1.284 | -1.636 |
拟合度R | 0.952 | 0.971 | 0.988 | 0.908 | 0.990 | 0.906 | 0.974 | 0.987 |
分维数D | 1.147 | 1.239 | 1.063 | 1.554 | 1.066 | 1.303 | 1.358 | 1.050 |
由表 1可见,除ZG94监测点外,其余各监测点的累积位移时序Hurst指数均处于(0.5, 1],具有随机性与趋势增强双重特性,累积位移具有长记忆性。西部监测点ZG94的累积位移趋势性减弱,坡体相对稳定。纵看各剖面线其他监测点,Hurst指数从前缘至后缘逐渐下降,累积位移变形趋势由前缘到后缘逐渐减小,后缘较前缘稳定。滑坡体东部XD-01监测点的累积位移Hurst指数明显高于相近高程的西部ZG94、中部ZG118和ZG93监测点,累积位移变形趋势明显。
图 2中滑坡体东部L3裂缝和L2裂缝宏观变形监测资料显示,2006年间,L3裂缝扩展张开迹象明显,裂缝宽5 mm(图 4(a));2007年间,L2裂缝长达180 m,宽50~600 mm,下沉40~500 mm(图 4(b)),滑坡体东部变形活跃。
综合表明,滑坡体的变形趋势空间分布差异明显,整体变形趋势为东部大于西部,前缘大于后缘。故滑坡体北东部变形最为活跃,西部和后缘相对稳定,滑坡体运动具有牵引式特点。
3.2 滑坡变形位移预测 3.2.1 滑坡位移响应分析滑坡变形受滑坡体内在结构特征与外界因素共同作用,位移曲线呈现出非线性特征。其时间序列可用加法模型表示为[15]:
$Y\left( t \right) = \alpha \left( t \right) + \beta \left( t \right) $ | (2) |
式中,Y(t)是滑坡位移时间序列;α(t)是趋势项函数;;β(t)是周期项函数。
移动平均法通过移动窗口大小的确定,可有效消弱或消除原始序列中周期性和季节性的不规则变动,从而平滑波动趋势[16]。
本文以滑坡中部监测点ZG93为预测对象,取2012年4月之前的数据为训练样本,之后的数据为预测验证样本。以时间序列加法模型为基础,取移动平均法平均窗口大小为12,对滑坡位移趋势项与周期项进行有效划分,并在不同模型支持下定量预测滑坡位移。
3.2.2 滑坡位移特征点周期项影响因子选取基于前文库水、降雨与滑坡变形间的相关性,除了已有累积位移数据(v6),另外选取两类外界因素为滑坡周期项位移(y)的影响因子。
1)库水位。库水位升降对滑坡体地下水渗流场与应力场作用明显,使得滑坡体的稳定状态发生改变,引发滑坡体变形与破坏[17]。故选取月平均库水位(v1)、累积库水波动率(v2)和月库水累积降率(v3)作为库水位对滑坡周期项的影响因子。
2)降雨。雨水渗入不仅引起滑坡体抗剪强度下降、下滑力增大的水-土力学反应,也会造成滑坡岩土体内摩擦角及粘聚力的减小[18]。由于降雨入渗具有滞后性,故选取两月累积降雨量(v4)和观测前一日降雨量(v5)为降雨对滑坡周期项的影响因子。
为保证各影响因子间的相对独立性,对因子间相关程度作Pearson积矩相关系数定量统计分析,结果见表 2,其绝对值最大为0.652,评价因子选取相对合理。
影响因子 | v1 | v2 | v3 | v4 | v5 | v6 | y |
v1 | 1 | ||||||
v2 | -0.027 | 1 | |||||
v3 | 0.070 | 0.381 | 1 | ||||
v4 | -0.427 | 0.338 | -0.264 | 1 | |||
v5 | -0.124 | -0.156 | -0.221 | 0.226 | 1 | ||
v6 | 0.652 | 0.014 | -0.357 | 0.063 | 0.061 | 1 | |
y | -0.489 | 0.168 | 0.316 | 0.170 | -0.223 | -0.425 | 1 |
注:相关系数是一个对称阵,右上角空白表示相关系数以对角线上下对称 |
采用差分自回归移动平均(autoregressive integrated moving average, ARIMA)模型实现趋势项位移预测[19-20]。利用R语言选择最优模型结构为ARIMA(0, 2, 1),通过白噪声检验,结构有效,预测结果的均方根误差为3.98 mm。
基于开源机器学习库Tensor-flow和Keras,采用LSTM神经网络实现滑坡周期项位移预测。选取滑坡中部监测点ZG93周期项及其影响因子为实验数据。LSTM网络的输入、输出维度由数据决定,实验中滑坡周期项6个影响因子为输入变量,周期项位移为输出变量,因此LSTM网络输入维为6,输出维为1。为防止影响因子数据类型、取值范围和量纲的不一致对网络训练速度的影响,采用极差标准化对原始序列进行归一化处理,得到区间[0, 1]。目前关于最优网络结构并没有确定性原则,通过多次实验最终确定本文网络的隐层节点数为45,包括3个LSTM层。采用构建的LSTM神经网络模型实现滑坡周期项位移预测。模型预测结果与实际值见图 5,均方根误差为8.36 mm。
将滑坡趋势项与周期项两项预测位移值相加,即为累积位移预测值。为验证LSTM神经网络的适用性,本文分别利用经典反向传播(back propagation,BP)神经网络、ELMAN递归神经网络开展滑坡位移周期项预测,实现滑坡累积位移总预测,并与利用ARIMA模型实现单一时间序列预测作比较分析。神经网络模型的输入维均为6,输出维均为1,训练函数均为trainlm;BP神经网络隐含层节点数为12;ELMAN递归神经网络隐含层节点数为3;ARIMA预测模型结构为ARIMA(0, 2, 1)。各模型预测结果见表 3和图 6。
时间 | 实际值/mm | 本文模型 | BP模型 | ELMAN模型 | ARIMA模型 | |||||||
预测值/mm | 相对误差/% | 预测值/mm | 相对误差/% | 预测值/mm | 相对误差/% | 预测值/mm | 相对误差/% | |||||
2012-05 | 2 251.70 | 2 265.53 | 0.61 | 2 265.43 | 0.61 | 2 256.32 | 0.21 | 2 272.64 | 0.93 | |||
2012-06 | 2 280.00 | 2 274.59 | -0.24 | 2 285.39 | 0.24 | 2 278.64 | -0.06 | 2 293.96 | 0.61 | |||
2012-07 | 2 343.60 | 2 329.31 | -0.61 | 2 444.13 | 4.29 | 2 395.60 | 2.22 | 2 318.18 | -1.08 | |||
2012-08 | 2 357.10 | 2 363.12 | 0.26 | 2 388.18 | 1.32 | 2 326.73 | -1.29 | 2 342.80 | -0.61 | |||
2012-09 | 2 368.80 | 2 375.42 | 0.28 | 2 391.80 | 0.97 | 2 346.58 | -0.94 | 2 367.14 | -0.07 | |||
2012-10 | 2 371.50 | 2 369.36 | -0.09 | 2 389.45 | 0.76 | 2 372.96 | 0.06 | 2 391.19 | 0.83 | |||
2012-11 | 2 361.10 | 2 369.38 | 0.35 | 2 374.40 | 0.56 | 2 359.52 | -0.07 | 2 415.13 | 2.29 | |||
2012-12 | 2 371.00 | 2 378.94 | 0.33 | 2 381.82 | 0.46 | 2 350.76 | -0.85 | 2 439.04 | 2.87 | |||
均方根误差/mm | 8.95 | 39.43 | 23.87 | 34.32 |
由表 3得到,本文模型预测结果的相对误差均小于0.7%,均方根误差为8.95 mm,均优于BP神经网络的39.43 mm与ELMAN递归神经网络的23.87 mm,预测精确。
从图 6可以看出,当位移数据发生明显波动,BP神经网络与ELMAN递归神经网络模型预测效果较差,随机性较强。LSTM神经网络模型预测结果相对稳定,与实际累积位移变化趋势仍能保持一致,预测能力和预测效果明显优于其他模型。滑坡变形规律受多种外界因素的影响,ARIMA模型预测结果呈单一线性上升趋势,并未体现滑坡在受外界影响因素下的波动变化情况,对具有周期性和随机性的非线性滑坡的位移预测不具有适用性。
因此,引入外界影响因子的LSTM神经网络模型较其他预测模型,预测结果更优,且在描述滑坡变形趋势与规律上更加稳定,更适用于滑坡位移预测研究。
4 结语本文利用V/S分析法,从分形理论角度出发,在白水河滑坡非线性演化特征曲线变化趋势定性判断的基础上,将LSTM神经网络模型引入滑坡位移时间序列预测领域,实现了白水河滑坡位移定量预测。
结果表明,滑坡体整体变形趋势由西南部向北东部逐渐变大,西部和后缘相对稳定,属牵引式滑坡。LSTM神经网络支持下的滑坡累积位移预测值的均方根误差为8.95 mm,对滑坡位移预测具有很好的适用性与表征能力。
致谢: 感谢三峡库区地质灾害防治工作指挥部提供滑坡数据。[1] |
Cajueiro D O, Tabak B M. The Rescaled Variance Statistic and the Determination of the Hurst Exponent[J]. Mathematics and Computers in Simulation, 2005, 70(3): 172-179. |
[2] |
Sun Dongyong, Chang Jianxia, Huang Qiang, et al. Application of the Combination of V/S and Mann-Kendall Method in Flood Disaster Analysis[J]. Journal of Northwest A and F University (Natural Science Edition), 2012, 40(4): 230-234. (孙东永, 畅建霞, 黄强, 等. V/S和Mann-Kendall相结合的方法在洪涝灾情分析中的应用[J]. 西北农林科技大学学报(自然科学版), 2012, 40(4): 230-234. ) |
[3] |
Gu Rongbao, Chen Jixia. Long Memory Testing for Shanghai and Shenzhen Stock Markets Based on the V/S Analysis[J]. Journal of Anhui University (Natural Sciences), 2008, 32(3): 18-21. (顾荣宝, 陈霁霞. 基于分形V/S技术的沪深股市长记忆性研究[J]. 安徽大学学报(自然科学版), 2008, 32(3): 18-21. DOI:10.3969/j.issn.1000-2162.2008.03.006 ) |
[4] |
Qiao Meiying, Chen Xin, Lan Jianyi. Study on Fractal Characteristics of Gas Emission Rate Based on V/S Analysis[J]. China Coal, 2014(10): 104-110. (乔美英, 陈鑫, 兰建义. 基于V/S分析的瓦斯涌出量分形特性研究[J]. 中国煤炭, 2014(10): 104-110. DOI:10.3969/j.issn.1006-530X.2014.10.024 ) |
[5] |
Liwicki M, Graves A, Bunke H, et al.A Novel Approach to On-line Handwriting Recognition Based on Bidirectional Long Short-Term Memory Networks[C].The 9th International Conference on Document Analysis and Recognition, Curitiba, Brazil, 2007
|
[6] |
Vinyals O, Kaiser L, Koo T, et al.Grammar as a Foreign Language[C].Advances in Neural Information Processing Systems, Montreal, Canada, 2015
|
[7] |
Liang Jun, Chai Yumei, Yuan Huibin, et al. Polarity Shifting and LSTM Based Recursive Networks for Sentiment Analysis[J]. Journal of Chinese Information Processing, 2015, 29(5): 152-159. (梁军, 柴玉梅, 原慧斌, 等. 基于极性转移和LSTM递归网络的情感分析[J]. 中文信息学报, 2015, 29(5): 152-159. DOI:10.3969/j.issn.1003-0077.2015.05.020 ) |
[8] |
Yang Xunzheng, Ke Yuyang, Liang Xiao, et al. A Study on the Prediction of Generator Set Pollutant Emissions Based on LSTM[J]. Electrical Automation, 2016, 38(5): 22-25. (杨训政, 柯余洋, 梁肖, 等. 基于LSTM的发电机组污染物排放预测研究[J]. 电气自动化, 2016, 38(5): 22-25. DOI:10.3969/j.issn.1000-3886.2016.05.007 ) |
[9] |
Giraitis L, Kokoszka P, Leipus R, et al. Rescaled Variance and Related Tests for Long Memory in Volatility and Levels[J]. Journal of Econometrics, 2003, 126(2): 265-294. |
[10] |
Peters E E.Fractal Market Analysis: Appling Chaos Theory to Investment and Economics[M].Beijing: Economic Science Press, 2002 (Peters E E.分形市场分析: 将混沌理论应用到投资与经济理论上[M].北京: 经济科学出版社, 2002)
|
[11] |
Peters E E.Chaos and Order in the Capital Markets[M].Beijing: Economic Science Press, 1999 (Peters E E.资本市场的混沌与秩序[M].北京: 经济科学出版社, 1999)
|
[12] |
Hochreiter S, Schmidhuber J. Long Short-Term Memory[J]. Neural Computation, 1997, 9(8): 1735-1780. DOI:10.1162/neco.1997.9.8.1735 |
[13] |
Gers F A, Schmidhuber J, Cummins F. Learning to Forget:Continual Prediction with LSTM[J]. Neural Computation, 2000, 12(10): 2451-2471. DOI:10.1162/089976600300015015 |
[14] |
Hu Xinchen.Research on Semantic Relation Classification Based on LSTM[D].Harbin: Harbin Institute of Technology, 2015 (胡新辰.基于LSTM的语义关系分类研究[D].哈尔滨: 哈尔滨工业大学, 2015)
|
[15] |
Wang Jianfeng. Quantitative Prediction of Landslide Using S-curve[J]. The Chinese Journal of Geological Hazard and Control, 2003, 14(2): 1-8. (王建锋. 滑坡发生时间预报分析[J]. 中国地质灾害与防治学报, 2003, 14(2): 1-8. DOI:10.3969/j.issn.1003-8035.2003.02.001 ) |
[16] |
Zhang Jun. Landslide Deformation Monitoring Analysis and Prediction Based on Nonliner Theory and Method[M]. Beijing: China Water and Power Press, 2010. (张军. 滑坡监测分析预报的非线性理论和方法[M]. 北京: 中国水利水电出版社, 2010. )
|
[17] |
Li Xiao, Zhang Nianxue, Liao Qiulin, et al. Analysis on Hydrodynamic Field Influenced by Combination of Rainfall and Reservoir Level Fluctuation[J]. Chinese Journal of Rock Mechanics and Engineering, 2004, 23(21): 3714-3720. (李晓, 张年学, 廖秋林, 等. 库水位涨落与降雨联合作用下滑坡地下水动力场分析[J]. 岩石力学与工程学报, 2004, 23(21): 3714-3720. DOI:10.3321/j.issn:1000-6915.2004.21.026 ) |
[18] |
Liu Xiaowei, Liu Gao, Chen Wenwu, et al. Analysis of Rainfall Influence on Slope Deformation and Failure[J]. Chinese Journal of Rock Mechanics and Engineering, 2003, 22(S2): 2715-2718. (刘小伟, 刘高, 谌文武, 等. 降雨对边坡变形破坏影响的综合分析[J]. 岩石力学与工程学报, 2003, 22(S2): 2715-2718. ) |
[19] |
Zhang G P. Time Series Forecasting Using a Hybrid ARIMA and Neural Network Model[J]. Neurocomputing, 2003, 50(1): 159-175. |
[20] |
Cryer J D, Chan K S.Time Series Analysis with Applications in R[M].Beijing: China Machine Press, 2011 (Cryer J D, Chan K S.时间序列分析及应用: R语言[M].北京: 机械工业出版社, 2011)
|