留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

利用深度自编码算法的地震脉冲信号检测方法

周聪 曾祥芝 袁静 李兴泉 王庆良 陈文胜

周聪, 曾祥芝, 袁静, 李兴泉, 王庆良, 陈文胜. 利用深度自编码算法的地震脉冲信号检测方法[J]. 武汉大学学报 ( 信息科学版), 2020, 45(7): 980-987, 995. doi: 10.13203/j.whugis20180348
引用本文: 周聪, 曾祥芝, 袁静, 李兴泉, 王庆良, 陈文胜. 利用深度自编码算法的地震脉冲信号检测方法[J]. 武汉大学学报 ( 信息科学版), 2020, 45(7): 980-987, 995. doi: 10.13203/j.whugis20180348
ZHOU Cong, ZENG Xiangzhi, YUAN Jing, LI Xingquan, WANG Qingliang, CHEN Wensheng. Earthquake Pulselike Records Detection Based on Deep Autoencoder[J]. Geomatics and Information Science of Wuhan University, 2020, 45(7): 980-987, 995. doi: 10.13203/j.whugis20180348
Citation: ZHOU Cong, ZENG Xiangzhi, YUAN Jing, LI Xingquan, WANG Qingliang, CHEN Wensheng. Earthquake Pulselike Records Detection Based on Deep Autoencoder[J]. Geomatics and Information Science of Wuhan University, 2020, 45(7): 980-987, 995. doi: 10.13203/j.whugis20180348

利用深度自编码算法的地震脉冲信号检测方法

doi: 10.13203/j.whugis20180348
基金项目: 

中国地震局地震科技星火项目 XH17060Y

四川省地震局地震科技专项 LY1502

详细信息
    作者简介:

    周聪,博士生,主要从事震源物理过程与地震前兆、地震数据处理方法等研究。zhoucong323@126.com

    通讯作者: 曾祥芝,助理研究员。zengxiangzhi@cags.ac.cn
  • 中图分类号: P315

Earthquake Pulselike Records Detection Based on Deep Autoencoder

Funds: 

The Spark Programs of Earthquake Sciences Granted by the China Earthquake Administration XH17060Y

Seismological Science and Technology Special of Earthquake Administration of Sichuan Province LY1502

More Information
    Author Bio:

    ZHOU Cong, PhD candidate, specializes in the research of earthquake physical processes and precursors, earthquake data processing and detection. E‐mail: zhoucong323@126.com

    Corresponding author: ZENG Xiangzhi, assistant researcher. E‐mail: zengxiangzhi@cags.ac.cn
  • 摘要: 四川省汶川地震发生前,一些测震和形变台站记录到了低频脉冲信号。为了进一步分析和判别这类脉冲信号的真实性,提出了基于深度自编码算法的地震脉冲信号检测方法。以汶川地震为例,首先收集四川省49个台站震前9天的波形数据作为样本集,采用连续小波变换获得波形数据的时频谱,然后利用深度自编码神经网络对其进行训练,并应用于地震脉冲异常信号的自动识别。测试结果表明,所构建的深度自编码网络模型具备良好的稳定性,对新数据的识别准确度在93%以上。最后初步统计了汶川地震前1个月四川省出现的疑似脉冲异常的空间分布,从断层慢滑移运动的角度给出了一种可能解释。
  • 图  1  不同地震台站记录的疑似脉冲异常信号

    Figure  1.  Pulselike Abnormal Signals In Several Seismic Stations

    图  2  自动编码器原理图

    Figure  2.  Schematic of Autoencoder

    图  3  小波变换频谱图(上图为时间域原始波形,下图为小波变换时频谱)

    Figure  3.  Schematic of Continuous Wavelet Transform(Upper is Time Domain, Lower is Time‐Spectrum Domain)

    图  4  切割后的小波变换频谱图

    Figure  4.  Schematic of Continuous Wavelet Transform After Cutting

    图  5  两层自编码网络框架示意图

    Figure  5.  Schematic of Two Layers Autoencoder Network

    图  6  2008年5月11日地震数据的训练结果(对角线数据分别表示“No”、“Yes”和整体的识别数及识别率)

    Figure  6.  Training Results on May 11, 2008(the Diagonal Parts Indicate Recognition Number and Rate of"No", "Yes"and Overall Data, Respectively)

    图  7  利用不同天数的数据获得的神经网络模型识别结果

    Figure  7.  Relognition Results of Neural Network Model Using Different Days Data

    图  8  异常信号频次统计

    Figure  8.  Statistics of Pulselike Signals

    图  9  脉冲异常空间分布

    Figure  9.  Spatial Distribution of Pulselike Signals

    表  1  四川地震数据样本标定

    Table  1.   Training Data Labeling on Sichuan Earthquake Data

    时间 文件个数 Yes No Unclear
    2008-05-01 7 302 301 5 083 1 918
    2008-05-02 6 078 179 4 806 1 093
    2008-05-03 8 700 483 6 042 2 175
    2008-05-04 9 477 792 7 650 1 035
    2008-05-05 5 925 926 4 362 637
    2008-05-06 8 334 730 6 224 1 380
    2008-05-07 9 975 1 180 7 061 1 734
    2008-05-08 13 545 2 033 9 937 1 575
    2008-05-09 8 208 788 5 971 1 449
    2008-05-10 5 979 548 4 646 785
    2008-05-11 7 872 309 5 354 2 209
    典型脉冲库 7 692 2 010 4 621 1 061
    共计 99 087 10 279 71 757 17 051
    注:典型脉冲库指2008年4月15日—28日,不包含4月19日、23日、25日
    下载: 导出CSV

    表  2  训练结果/%

    Table  2.   Training Results/%

    模型 2008‐05‐08 2008‐05‐09 2008‐05‐10
    Deep3 87.6 91.6 92.8
    Deep4 91.2 92.7 93.6
    下载: 导出CSV

    表  3  深度自编码神经网络识别率统计/%

    Table  3.   Recognition Rate Statistics of Autoencoder Network/%

    时间 “Yes”识别率
    (两层/三层)
    “No”识别率
    (两层/三层)
    总识别率
    (两层/三层)
    2008-05-01 4.6/3.6 93.0/92.6 97.5/96.2
    2008-05-02 2.8/2.2 94.3/93.3 97.1/95.6
    2008-05-03 5.4/3.9 91.1/90.7 96.5/94.6
    2008-05-04 7.2/6.0 89.1/88.7 96.4/94.7
    2008-05-05 14.4/11.4 80.9/80.8 95.3/92.2
    2008-05-06 7.4/5.6 88.0/87.6 95.3/93.2
    2008-05-07 10.4/7.3 84.4/84.1 94.9/91.3
    2008-05-08 13.7/11.2 81.9/81.9 95.6/93.1
    2008-05-09 9.1/7.0 87.3/87.4 96.4/94.4
    2008-04-25 10.8/10.0 82.3/82.3 93.1/93.0
    2008-05-10 6.9/6.4 86.5/87.6 93.4/93.9
    2008-05-11 3.7/3.5 90.9/92.6 94.5/96.1
    下载: 导出CSV
  • [1] Ma T F, Wu Z L. Precursor-Like Anomalies Prior to the 2008 Wenchuan Earthquake:A Critical-butConstructive Review[J]. International Journal of Geophysics, [DOI: 1155/2012/583097]
    [2] 邱泽华, 张宝红, 池顺良, 等.汶川地震前姑咱台观测的异常应变变化[J].中国科学(地球科学), 2010, 40(8):1 031-1 039 http://d.old.wanfangdata.com.cn/Conference/7230353

    Qiu Zehua, Zhang Baohong, Chi Shunliang, et al.Abnormal Strain Changes Observed at Guza Before the Wenchuan Earthquake[J]. Science China Earth Sciences, 2010, 40(8):1 031-1 039 http://d.old.wanfangdata.com.cn/Conference/7230353
    [3] Zhou C, Wang Q L, Zhu L Y, et al. One Cause of Pulse-Like Anomalies Observed at Guza Before the Wenchuan Earthquake[J]. Acta Geophysica, 2018, 66(5):833-842 doi:  10.1007/s11600-018-0174-6
    [4] 尹亮, 杨立明.宽频带数字资料低频波在大地震前的短临前兆信息研究[J].西北地震学报, 2010, 32(1):82-87 http://www.cnki.com.cn/Article/CJFDTotal-ZBDZ201001016.htm

    Yin Liang, Yang Liming. Research on Low-frequency Wave of the Broadband Digital Data and the Information of Short-imminent Precursor Before Strong Earthquakes[J]. Northwestern Seismological Journal, 2010, 32(1):82-87 http://www.cnki.com.cn/Article/CJFDTotal-ZBDZ201001016.htm
    [5] 路珍, 周聪, 郭泉, 等.汶川地震前地震连续波形资料中的异常信号[J].大地测量与地球动力学, 2018, 38(4):344-350 http://d.old.wanfangdata.com.cn/Periodical/dkxbydz201804003

    Lu Zhen, Zhou Cong, Guo Quan, et al. The Abnormal Signals in Continuous Waveform Data Before Wenchuan Earthquake[J]. Journal of Geodesy and Geodynamics, 2018, 38(4):344-350 http://d.old.wanfangdata.com.cn/Periodical/dkxbydz201804003
    [6] Nasuno S, Kudrolli A, Gollub J P. Friction in Granular Layers:Hysteresis and Precursors[J]. Physical Review Letters, 1997, 79(5):949-952 doi:  10.1103/PhysRevLett.79.949
    [7] Sharon E, Cohen G, Fineberg J. Propagating Solitary Waves Along a Rapidly Moving Crack Front[J]. Nature, 2001, 410:68-71 doi:  10.1038/35065051
    [8] Page M T, Dunham E M, Carlson J M. Distinguishing Barriers and Asperities in Near-Source Ground Motion[J]. Journal of Geophysical Research, 2005, 110:B11302 http://www.its.caltech.edu/~pagem/BarriersAndAsperities.pdf
    [9] Baker J W. Quantitative Classification of Near-Fault Ground Motions Using Wavelet Analysis[J]. Bulletin of the Seismological Society of America, 2007, 97(5):1 486-1 501 doi:  10.1785/0120060255
    [10] Lecun Y, Bengio Y, Hinton G. Deep Learning[J].Nature, 2015, 521:436-444 doi:  10.1038/nature14539
    [11] 樊恒, 徐俊, 邓勇, 等.基于深度学习的人体行为识别[J].武汉大学学报·信息科学版, 2016, 41(4):492-497 doi:  10.13203/j.whugis20140110

    Fan Heng, Xu Jun, Deng Yong, et al. Behavior Recognition of Human Based on Deep Learning[J].Geomatics and Information Science of Wuhan University, 2016, 41(4):492-497 doi:  10.13203/j.whugis20140110
    [12] 张兵.遥感大数据时代与智能信息提取[J].武汉大学学报·信息科学版, 2018, 43(12):1 861-1 871 doi:  10.13203/j.whugis20180172

    Zhang Bing. Remotely Sensed Big Data Era and Intelligent Information Extraction[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12):1 861-1 871 doi:  10.13203/j.whugis20180172
    [13] Vallejos V, McKinnon S D. Logistic Regression and Neural Network Classification of Seismic Records[J]. International Journal of Rock Mechanic and Mining Sciences, 2013, 62:86-95 doi:  10.1016/j.ijrmms.2013.04.005
    [14] Perol T, Gharbi M, Denolle M. Convolutional Neural Network for Earthquake Detection and Location[J]. Science Advances, 2018, 4(2):e1700578 https://advances.sciencemag.org/content/4/2/e1700578.full
    [15] Rouet-Leduc B, Hulbert C, Lubbers N, et al. Machine Learning Predicts Laboratory Earthquakes[J]. GeophysicalResearchLetters, 2017, 44 (18):9 276-9 282 doi:  10.1002/2017GL074677
    [16] 吕亮.基于深度学习的说话人识别方法的研究[D].南京: 东南大学, 2016 http://cdmd.cnki.com.cn/Article/CDMD-10286-1016325522.htm

    Lü Liang. Research on Speaker Recognition Based on Deep Learning[D]. Nanjing: Southeast University, 2016 http://cdmd.cnki.com.cn/Article/CDMD-10286-1016325522.htm
    [17] 尚敬文, 王朝坤, 辛欣, 等.基于深度稀疏自动编码器的社区发现算法[J].软件学报, 2017, 28(3):648-662 http://d.old.wanfangdata.com.cn/Periodical/rjxb201703012

    Shang Jingwen, Wang Chaokun, Xin Xin, et al.Community Detection Algorithm Based on Deep Sparse Autoencoder [J]. Journal of Software, 2017, 28(3):648-662 http://d.old.wanfangdata.com.cn/Periodical/rjxb201703012
    [18] Bengio Y, Lamblin P, Popovici D, et al. Greedy Layer-Wise Training of Deep Networks[J]. Advances in Neural Information Processing Systems, 2007, 19:153-160 http://www.iro.umontreal.ca/%7Elisa/pointeurs/BengioNips2006.pdf
    [19] 余成波, 田桐, 熊递恩, 等.中心损失与Softmax损失联合监督下的人脸识别[J].重庆大学学报, 2018, 41(5):92-100 http://d.old.wanfangdata.com.cn/Periodical/cqdxxb201805012

    Yu Chengbo, Tian Tong, Xiong Di'en, et al. Joint Supervision of Center Loss and Softmax Loss for Face Recognition[J]. Journal of Chongqing University, 2018, 41(5):92-100 http://d.old.wanfangdata.com.cn/Periodical/cqdxxb201805012
    [20] 丁昊青.基于机器学习算法的脉冲型地震动识别[D].哈尔滨: 哈尔滨工业大学, 2017

    Ding Haoqing. Identification of Pulselike Ground Motion Based on Machine Learning Algorithm[D].Harbin: Harbin Institute of Technology, 2017
    [21] 郑秀芬, 欧阳飚, 张东宁, 等."国家数字测震台网数据备份中心"技术系统建设及对汶川大地震研究的数据支撑[J].地球物理学报, 2009, 52(5):1 412-1 417 http://www.cnki.com.cn/Article/CJFDTotal-DQWX200905032.htm

    Zheng Xiufen, Ouyang Biao, Zhang Dongning, et al. Technical System Construction of Data Backup Center for China Seismograph Network and the Data Support to Researches on the Wenchuan Earthquake[J]. Chinese Journal Geophysics, 2009, 52(5):1 412-1 417 http://www.cnki.com.cn/Article/CJFDTotal-DQWX200905032.htm
    [22] 金朝娣, 赖昌信, 刘玉强, 等.小波域相关算法在随钻地震信号处理中的应用[J].煤炭学报, 2012, 37(4):621-626 http://d.old.wanfangdata.com.cn/Periodical/mtxb201204017

    Jin Zhaodi, Nai Changxin, Liu Yuqiang, et al. SWD Signal Processing Based on Wavelet Domain Correlation Algorithm [J]. Journal of China Coal Society, 2012, 37(4):621-626 http://d.old.wanfangdata.com.cn/Periodical/mtxb201204017
    [23] Liu Y, Rice J R. Aseismic Slip Transients Emerge Spontaneously in Three-dimensional Rate and State Modeling of Subduction Earthquake Sequences[J]. Journal of Geophysical Research, 2005, 110:B08307 doi:  10.1029/2004JB003424
    [24] Romanet P, Bhat H S, Jolivet R, et al. Fast and Slow Slip Events Emerge Due to Fault Geometrical Complexity [J]. Geophysical Research Letters, 2018, 45:4 809-4 819 doi:  10.1029/2018GL077579
    [25] Zhou C, Zeng X Z, Wang Q L, et al. Rotational Motions of the Ms 7. 0 Jiuzhaigou Earthquake with Ground Tilt Data[J]. Science China:Earth Sciences, 2019, 62(5):832-842 doi:  10.1007/s11430-018-9320-3
  • [1] 牛安福, 赵静, 苑争一, 吉平.  汶川地震孕育过程中变形场变化特征研究 . 武汉大学学报 ( 信息科学版), 2022, 47(6): 839-848. doi: 10.13203/j.whugis20220117
    [2] 龙玉洁, 李为乐, 黄润秋, 许强, 余斌, 刘刚.  汶川地震震后10 a绵远河流域滑坡遥感自动提取与演化趋势分析 . 武汉大学学报 ( 信息科学版), 2020, 45(11): 1792-1800. doi: 10.13203/j.whugis20200180
    [3] 马一方, 姜卫平, 席瑞杰.  利用全球电离层地图分析芦山地震电离层异常变化 . 武汉大学学报 ( 信息科学版), 2015, 40(9): 1274-1278. doi: 10.13203/j .whu g is20130683
    [4] 陈鹏, 陈家君.  2012-04-11苏门答腊地震同震电离层异常研究 . 武汉大学学报 ( 信息科学版), 2015, 40(7): 882-886. doi: 10.13203/j.whugis20130616
    [5] 李冲, 李建成, 黄瑞金, 谭理.  青藏高原东部地壳物质流变模型及汶川地震机理探讨 . 武汉大学学报 ( 信息科学版), 2015, 40(6): 810-815. doi: 10.13203/j.whugis20130655
    [6] 蔡华, 李子申, 王敏, 孙汉荣.  汶川Mw7.9与日本Mw9.0地震同震电离层扰动研究 . 武汉大学学报 ( 信息科学版), 2013, 38(6): 716-719.
    [7] 丁开华, 许才军, 温扬茂.  汶川地震震后形变的GPS反演 . 武汉大学学报 ( 信息科学版), 2013, 38(2): 131-135.
    [8] 王林松, 陈超, 梁青, 王秋革.  东日本大地震重力信号同震响应 . 武汉大学学报 ( 信息科学版), 2012, 37(11): 1348-1351.
    [9] 王伟, 宁津生, 罗志才, 汪海洪.  利用小波变换分离俯冲带重力异常 . 武汉大学学报 ( 信息科学版), 2012, 37(2): 187-190.
    [10] 张希, 李瑞莎, 贾鹏, 王庆良.  汶川大震前扰动异常的震源区定位探索 . 武汉大学学报 ( 信息科学版), 2012, 37(3): 310-313.
    [11] 陈国雄, 孙劲松, 刘天佑.  GRACE卫星时变重力场的小波多尺度分解——以2008年汶川Ms8.0大地震为例 . 武汉大学学报 ( 信息科学版), 2012, 37(6): 679-682.
    [12] 许才军, 江国焰, 王浩, 温扬茂.  基于GIS的InSAR结果分析方法及在汶川Mw7.9级地震同震解释中的应用 . 武汉大学学报 ( 信息科学版), 2011, 36(4): 379-383.
    [13] 杨博雄, 柳林, 秦前清.  基于形态小波的地震数据压缩方法研究 . 武汉大学学报 ( 信息科学版), 2011, 36(7): 785-788.
    [14] 熊永良, 黄丁发, 徐韶光, 廖华.  长距离动态GPS数据处理方法与汶川地震引起的动态地壳形变特征分析 . 武汉大学学报 ( 信息科学版), 2010, 35(3): 265-269.
    [15] 许才军, 林敦灵, 温扬茂.  利用InSAR数据的汶川地震形变场提取及分析 . 武汉大学学报 ( 信息科学版), 2010, 35(10): 1138-1142.
    [16] 张燕, 吴云.  2008年汶川地震前的形变异常及机理解释 . 武汉大学学报 ( 信息科学版), 2010, 35(1): 25-29.
    [17] 顾国华, 王武星, 孟国杰, 徐岳仁.  GPS测得的汶川大地震前后的地壳运动 . 武汉大学学报 ( 信息科学版), 2009, 34(11): 1336-1339.
    [18] 张希, 崔笃信, 张四新, 王双绪.  地形变观测揭示的汶川Ms8.0级地震同震响应与影响 . 武汉大学学报 ( 信息科学版), 2009, 34(10): 1204-1209.
    [19] 孟泱, 王泽民, 鄂栋臣.  基于GPS数据的地震前电离层TEC异常研究 . 武汉大学学报 ( 信息科学版), 2008, 33(1): 81-84.
    [20] 黄兵杰, 柳林涛, 高光星, 周剑.  基于小波变换的GPS精密单点定位中的周跳探测 . 武汉大学学报 ( 信息科学版), 2006, 31(6): 512-515.
  • 加载中
图(9) / 表(3)
计量
  • 文章访问数:  959
  • HTML全文浏览量:  251
  • PDF下载量:  36
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-02-22
  • 刊出日期:  2020-07-30

利用深度自编码算法的地震脉冲信号检测方法

doi: 10.13203/j.whugis20180348
    基金项目:

    中国地震局地震科技星火项目 XH17060Y

    四川省地震局地震科技专项 LY1502

    作者简介:

    周聪,博士生,主要从事震源物理过程与地震前兆、地震数据处理方法等研究。zhoucong323@126.com

    通讯作者: 曾祥芝,助理研究员。zengxiangzhi@cags.ac.cn
  • 中图分类号: P315

摘要: 四川省汶川地震发生前,一些测震和形变台站记录到了低频脉冲信号。为了进一步分析和判别这类脉冲信号的真实性,提出了基于深度自编码算法的地震脉冲信号检测方法。以汶川地震为例,首先收集四川省49个台站震前9天的波形数据作为样本集,采用连续小波变换获得波形数据的时频谱,然后利用深度自编码神经网络对其进行训练,并应用于地震脉冲异常信号的自动识别。测试结果表明,所构建的深度自编码网络模型具备良好的稳定性,对新数据的识别准确度在93%以上。最后初步统计了汶川地震前1个月四川省出现的疑似脉冲异常的空间分布,从断层慢滑移运动的角度给出了一种可能解释。

English Abstract

周聪, 曾祥芝, 袁静, 李兴泉, 王庆良, 陈文胜. 利用深度自编码算法的地震脉冲信号检测方法[J]. 武汉大学学报 ( 信息科学版), 2020, 45(7): 980-987, 995. doi: 10.13203/j.whugis20180348
引用本文: 周聪, 曾祥芝, 袁静, 李兴泉, 王庆良, 陈文胜. 利用深度自编码算法的地震脉冲信号检测方法[J]. 武汉大学学报 ( 信息科学版), 2020, 45(7): 980-987, 995. doi: 10.13203/j.whugis20180348
ZHOU Cong, ZENG Xiangzhi, YUAN Jing, LI Xingquan, WANG Qingliang, CHEN Wensheng. Earthquake Pulselike Records Detection Based on Deep Autoencoder[J]. Geomatics and Information Science of Wuhan University, 2020, 45(7): 980-987, 995. doi: 10.13203/j.whugis20180348
Citation: ZHOU Cong, ZENG Xiangzhi, YUAN Jing, LI Xingquan, WANG Qingliang, CHEN Wensheng. Earthquake Pulselike Records Detection Based on Deep Autoencoder[J]. Geomatics and Information Science of Wuhan University, 2020, 45(7): 980-987, 995. doi: 10.13203/j.whugis20180348
  • 四川省汶川地震发生后,大量的文献报道了地震前的一些异常现象。据Ma等[1]统计,大约有300篇与震前异常观测有关。异常种类繁多,有地震活动性异常、形变异常、重力异常等。但除了少数几篇文章,很少有讨论观测异常与大地震在统计学或者物理学意义上的相关性。邱泽华等[2]发现从汶川地震前一年多开始,位于龙门山断裂带西南端的姑咱台钻孔应变仪记录到“毛刺”形态的异常应变变化,他们分析认为这种异常是构造运动的表现。随后,基于非稳态滑动模型以及非线性波传播理论,Zhou等[3]从构造物理的角度解释了该“毛刺”异常产生的一种可能成因。尹亮等[4]在研究台风对地脉动的影响时,发现汶川地震前成都地震台地震波记录有独特的脉冲现象,频率低至0.003 Hz左右。但经过分析认为,该脉冲现象并非台风引起,其产生机理依旧不明。除此之外,在其他测震台站也发现了这种类似的脉冲现象(如图 1所示,四川黑水(HSH)地震台(5月10号)和仲家沟(ZJG)地震台(4月28号))。路珍等[5]认为脉冲类的突跳异常可能是具有前兆意义的震前异常信号。

    图  1  不同地震台站记录的疑似脉冲异常信号

    Figure 1.  Pulselike Abnormal Signals In Several Seismic Stations

    岩石物理和摩擦数值实验证实,在断层相对运动的过程中可能会出现脉冲型非线性信号[3, 6-7]。在地震同震过程中,断层破裂附近的凹凸体可能激发另一种速度脉冲现象[8-9],且实际波形和形变资料中也发现了类似的低频信号[4-5]。但从个别台站的波形资料上很难分清是环境或仪器干扰,还是有物理意义的构造信息。为了进一步判断实际资料中低频脉冲信号的形成机制,需要在多震例、长时间、大范围内自动搜索该类型信号,统计出该低频脉冲的空间分布和时间演化规律并做进一步分析。由于测震数据量庞大,依靠人工识别难以实现,因此需要寻求高效、智能的搜索算法,从海量数据中快速检测出类似的低频信号,以获得该类异常的时空分布特征。深度神经网络技术(简称深度学习)是近十几年发展起来的一种机器学习方法。该技术解决了多层神经网络反向传播(back propagation,BP)算法中的发散问题,使得多层神经网络得以实现,其在语音识别、视觉识别、目标检测等领域取得了可观的成效[10-12]。目前,深度学习技术也被逐渐应用于地学领域,如地震事件自动分类[13]、地震事件检测与定位[14]、地震预测[15]等。本文尝试将其应用于地震前兆的疑似脉冲异常检测中,它能快速、智能地识别海量数据中的脉冲信号,以便从空间分布和时间演化上进一步分析该异常的形成原因。同时也能提高地震工作中前兆异常识别的工作效率。

    • 深度学习起源于人工神经网络,通常将含有两层及以上隐含层的神经网络称为深度神经网络,简称深度学习[16]。它的主要思想是通过建立具有多个层次的神经网络,实现对输入数据的深层次表达,从而实现更好的分类与特征提取。

      目前,主流的深度学习方法有[17]自动编码器(autoencoder,AE)、限制玻尔兹曼机(restricted Boltzmann machines,RBN)、深度置信网络(deep belief network,DBN)、卷积神经网络(convolutional neural network,CNN)等。其中,AE、RBN、DBN是无监督的深度学习方法,CNN是有监督的深度学习方法。一个典型的深度神经网络的训练通常分为预训练和微调[18]。预训练采用无监督的方式逐层训练每一层网络。在所有网络参数确定后,再用有监督的BP算法进行训练至收敛,称为微调。CNN等有监督的深度学习方法主要用于分类问题,AE等无监督的深度学习方法在学习特征方面存在诸多优势。与CNN训练过程会丢失大量信息的特点不同,AE致力于在特征提取时尽可能减少信息丢失[17]。本文尝试利用AE的这一特点,将其用于地震脉冲信号的识别中。

    • 自动编码器的目的是使得每一层的输出可以进行重构而还原成其输入。这样可以最大程度地避免在降维过程中有效信息的丢失,并且一定程度上可以进行信息还原,在保证特征信息的前提下大大降低了信息的存储量。自动编码器是一个对信息的编解码过程,单层自动编码器实际上先对数据编码(如图 2中将输入的2 500维数据压缩成100维),然后通过解码数据最大程度恢复信息(将编码后的100维数据解码还原为2 500维)。

      图  2  自动编码器原理图

      Figure 2.  Schematic of Autoencoder

      假设原始信息有n个样本(x1x2xn),对应的输出是(z1z2zn),输入层到中间层的连接矩阵是w,偏置是b,中间层到输出层的连接矩阵是w',偏置是b'。那么误差函数是:

      $$ J(\mathit{\boldsymbol{w}}, \mathit{\boldsymbol{b}}, {\mathit{\boldsymbol{w}}^\prime }, {\mathit{\boldsymbol{b}}^\prime }) = \frac{1}{n}\sum\limits_{i = 1}^n L ({x_i}, {z_i}) $$ (1)

      w'通常取w的转置矩阵wT。取激活函数为sigmoid函数,用S (·)表示。假设中间层的输出为y,可以得到:

      $$ {\mathit{\boldsymbol{y}} = S(\mathit{\boldsymbol{wx}} + \mathit{\boldsymbol{b}})} $$ (2)
      $$ {z = S({\mathit{\boldsymbol{w}}^{\rm{T}}}\mathit{\boldsymbol{y}} + {\mathit{\boldsymbol{b}}^\prime })} $$ (3)

      那么误差函数式(1)可以重新表示为:

      $$ {J = \frac{1}{n}\sum\limits_{i = 1}^n L ({x_i}, S({\mathit{\boldsymbol{w}}^{\rm{T}}} \cdot S(\mathit{\boldsymbol{wx}} + \mathit{\boldsymbol{b}}) + {\mathit{\boldsymbol{b}}^\prime }))} $$ (4)

      自编码机的目的是实现输出zx,因此距离函数L可以选择一般的方差损失函数:

      $$ L({x_i}, {z_i}) = \frac{1}{2}|{x_i} - {z_i}{|^2} $$ (5)

      得到误差函数L后,就可以使用反演算法(如梯度下降算法)进行参数更新:

      $$ {\mathit{\boldsymbol{w}} = \mathit{\boldsymbol{w}} - \eta \cdot \frac{{\partial L(x, z)}}{{\partial \mathit{\boldsymbol{w}}}}} $$ (6)
      $$ {\mathit{\boldsymbol{b}} = \mathit{\boldsymbol{b}} - \eta \cdot \frac{{\partial L(x, z)}}{{\partial \mathit{\boldsymbol{b}}}}} $$ (7)

      至此完成了最简单的单层自动编码器模型的构建。如果需要多层,就用单层的输出作为下一层的输入,重复以上步骤。

    • 通常神经网络的输入结果可以为任意数值。但人们常常希望输出结果以概率的形式出现。而Softmax函数或称为归一化指数函数,是逻辑函数的一种推广。它能将一个含任意实数的K维向量z“压缩”到另一个K维实向量σ (z),使得每一个元素的范围都在(0,1)之间,并且所有元素和为1。该函数的形式通常按下面式子给出[19]

      $$ {\sigma ({z_i}) = {e^{{z_j}}}/\sum\nolimits_{k = 1}^K {{e^{{z_k}}}} , j = 1, 2 \cdots K} $$ (8)

      所以可以将多个自动编码器与Softmax分类器结合,构建一个包含多隐藏层与一个最终Softmax分类器的深度自编码网络。

    • 数据特征会直接影响所使用的预测模型和实现的预测结果。准备和选择的特征越好,实验的结果越好。丁昊青直接将速度曲线保存为图像作为深度神经网络模型的输入来识别脉冲型地震,但其识别准确率只有85%左右[20]。地震波数据与语音数据类似,都是一维的连续波动。语音事件识别中一个关键的环节就是选用恰当的音频特征来表征响应的声音,一般同时分析信号的时频域信息特征,如频谱图和耳蜗图。而地震波数据能用频谱图来同时表征时域和频域两部分信息。本文采用连续小波变换来获得地震数据的二维时频特征。

    • 中国地震局地球物理研究所国家测震台网数据备份中心为本研究提供了地震连续波形数据[21]。本文收集了四川测震台网2007-06-2008-05的连续波形数据(共49个台站),采样率为1 Hz。选择震前9天的连续波形数据作为样本子集。

    • 对于任意f (t)∈ L2 (R)(L2 (R)表示平方可积的实数空间,即能量有限的空间信号),定义其连续小波变换为:

      $$ \begin{array}{l} {\mathit{\boldsymbol{W}}_f}(a, b) = < f, {\psi _{a, b}} > = \\ {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} |a{|^{ - 1/2}}\int_{ - \infty }^{ + \infty } {f(t)} \bar \psi (\frac{{t - b}}{a}){\rm{d}}t \end{array} $$ (9)

      式中,f为需要变换的信号;ψ表示ψ的复共轭;ψab为母小波ψ生成的依赖于参数(ab)的连续小波族;ab分别为伸缩因子和平移因子。复Morlet小波采用时频窗面积最小的高斯窗函数,时频域局部化性能和对称性较好[22]。经过测试,选用中心频率为1 Hz、带宽为2 Hz的复Morlet小波作为母小波。根据对所需识别脉冲的初步统计,脉冲宽度在500 s之内,大多数处于250 s以内,因此尺度范围可选择在50~1 000,其对应的频率范围为0.001~0.02 Hz。

      图 3为连续小波变换示意图。可以看到时间域脉冲信号在时频域中都对应了比较高的能量团,其频率大致处于0.015~0.02 Hz范围内。因此,对时间域连续波形数据中脉冲信号的识别,经过小波变换转化成对时频域中高能量团汇聚的识别。

      图  3  小波变换频谱图(上图为时间域原始波形,下图为小波变换时频谱)

      Figure 3.  Schematic of Continuous Wavelet Transform(Upper is Time Domain, Lower is Time‐Spectrum Domain)

      由于目标脉冲信号周期大多数处于250 s以内,因此需要将其切割成时间长度为几分钟(略大于目标脉冲)的二维时频数据进行训练和识别。同时,为了减少连续小波变换过程中产生的边界效应,在处理数据时可将原始的、时长为1 h的原始地震数据拼接成一天的数据,然后进行连续小波变换,最后再切割成目标数据文件。根据实验,选取将数据切割成2 min,而且根据尺度的变化对大尺度数据进行间隔采样,最终切割成的训练数据如图 4所示。

      图  4  切割后的小波变换频谱图

      Figure 4.  Schematic of Continuous Wavelet Transform After Cutting

    • 利用§1的深度自编码神经网络算法对§2预处理后的地震数据进行样本标定、训练和识别。依次构建二层和三层深度自编码网络模型进行计算。

    • 首先是第一轮的图片识别。从2008年5月1日—11日,共识别图片12 912张,从中挑选出供第二轮计算机自动识别的数据图片为1 021张。对这1 021张图片所对应的数据进行分割并手动标定,结果如表 1所示。再从2018年4月15日— 30日中挑选典型的脉冲数据作为典型脉冲库。因此总的标定数据为99 087个,其中标定“Yes”的有10 279个,标定“No”的有71 757个,“Unclear”的有17 051个。训练过程中只输入标定“Yes”和“No”的数据。

      表 1  四川地震数据样本标定

      Table 1.  Training Data Labeling on Sichuan Earthquake Data

      时间 文件个数 Yes No Unclear
      2008-05-01 7 302 301 5 083 1 918
      2008-05-02 6 078 179 4 806 1 093
      2008-05-03 8 700 483 6 042 2 175
      2008-05-04 9 477 792 7 650 1 035
      2008-05-05 5 925 926 4 362 637
      2008-05-06 8 334 730 6 224 1 380
      2008-05-07 9 975 1 180 7 061 1 734
      2008-05-08 13 545 2 033 9 937 1 575
      2008-05-09 8 208 788 5 971 1 449
      2008-05-10 5 979 548 4 646 785
      2008-05-11 7 872 309 5 354 2 209
      典型脉冲库 7 692 2 010 4 621 1 061
      共计 99 087 10 279 71 757 17 051
      注:典型脉冲库指2008年4月15日—28日,不包含4月19日、23日、25日
    • 本节以2008年5月11日的数据为例进行训练,两层深度自编码神经网络框架(简称两层模型)如图 5所示。

      图  5  两层自编码网络框架示意图

      Figure 5.  Schematic of Two Layers Autoencoder Network

      图 5显示本网络结构主要分为两部分:自编码网络部分和分类器。首先采用自编码网络进行无监督训练,旨在得到维度较低的鲁棒特征,本文输入数据可看做1 050维(即1 050×NN代表样本或文件个数),经过两层无监督自动编码器(其中每层自编码都包含图 2所示的编码和解码过程),得到一个50维的稀疏数据。然后采用Softmax分类器进行监督训练,输出一维结果。一维结果是0~1之间的值,代表概率。训练出的模型记为Deep1。

      首先利用2008年5月11日的数据进行自检。图 6所示的混淆矩阵表明自检识别率为100%。接着,将2008年5月8日—10日的数据依次输入该模型进行他检,结果如图 7(a)~7(c)所示,识别率分别为87.7%、91.0%和91.8%。其次利用2008年5月4日—7日共4 d的数据进行训练,得到的模型记为Deep2。再将2008年5月8日—10日的数据依次输入模型进行他检,结果如图 7(d)~7(f)所示,识别率分别为91.2%、92.8%和91.7%。对比前后两次训练结果,可以看到训练4天的数据比训练一天数据获得的模型识别结果要好,特别是对“Yes”的识别上有很大的提高。因此训练样本的数量对识别结果有较大的影响。

      图  6  2008年5月11日地震数据的训练结果(对角线数据分别表示“No”、“Yes”和整体的识别数及识别率)

      Figure 6.  Training Results on May 11, 2008(the Diagonal Parts Indicate Recognition Number and Rate of"No", "Yes"and Overall Data, Respectively)

      图  7  利用不同天数的数据获得的神经网络模型识别结果

      Figure 7.  Relognition Results of Neural Network Model Using Different Days Data

    • 参考§3.2的实验方法,构建三层深度自编码神经网络框架(简称三层模型)。同样分别以2008年5月11日和2008年5月4日—7日的数据进行自检,训练出的模型分别记为Deep3和Deep4。Deep3的自检率为98.6%,虽然没有达到100%,但同样是比较好的结果。

      两个模型的他检结果如表 2所示。与图 7的结果对比,可以看出两层和三层模型的识别率处于同一个水平。即使对于2008年5月10日数据,三层模型的识别率高出近2%,但在脉冲的识别上(“Yes”的识别率),两层模型还要略高一点。

      表 2  训练结果/%

      Table 2.  Training Results/%

      模型 2008‐05‐08 2008‐05‐09 2008‐05‐10
      Deep3 87.6 91.6 92.8
      Deep4 91.2 92.7 93.6
    • 选择四川省测震台站(共49个)2008年5月1日—9日的连续波形数据作为样本子集进行手动标定。由于训练样本的数量和质量(即数据源)对识别结果有较大的影响,为了尽量扩大样本的时间跨度,从2008年4月15日—28日中挑选了典型的脉冲数据作为补充库(注:不包含4月19日、23日、25日的数据)。为了验算新数据的识别效果,将4月25日、5月10日和5月11日数据作为他检测试。测试结果如表 3所示,可以看到两层模型的识别结果中,2008年5月1日—9日自检部分的识别率(平均大于96%)明显大于他检部分(平均大于93%)。而三层模型的识别结果自检部分和他检部分识别率相当。虽然后者的他检识别结果略高于前者,但在脉冲信号的识别上(“Yes”的识别率),前者的识别效果稍好。

      表 3  深度自编码神经网络识别率统计/%

      Table 3.  Recognition Rate Statistics of Autoencoder Network/%

      时间 “Yes”识别率
      (两层/三层)
      “No”识别率
      (两层/三层)
      总识别率
      (两层/三层)
      2008-05-01 4.6/3.6 93.0/92.6 97.5/96.2
      2008-05-02 2.8/2.2 94.3/93.3 97.1/95.6
      2008-05-03 5.4/3.9 91.1/90.7 96.5/94.6
      2008-05-04 7.2/6.0 89.1/88.7 96.4/94.7
      2008-05-05 14.4/11.4 80.9/80.8 95.3/92.2
      2008-05-06 7.4/5.6 88.0/87.6 95.3/93.2
      2008-05-07 10.4/7.3 84.4/84.1 94.9/91.3
      2008-05-08 13.7/11.2 81.9/81.9 95.6/93.1
      2008-05-09 9.1/7.0 87.3/87.4 96.4/94.4
      2008-04-25 10.8/10.0 82.3/82.3 93.1/93.0
      2008-05-10 6.9/6.4 86.5/87.6 93.4/93.9
      2008-05-11 3.7/3.5 90.9/92.6 94.5/96.1
    • 利用§3.2的两层深度自编码网络模型,对四川省49个测震台站震前约1个月的连续波形数据进行自动识别,得到异常的频次统计图(见图 8)。本文构建的深度自编码模型对脉冲信号较为敏感,识别结果也会根据训练样本的数量和质量有所不同,这里仅定性分析不同台站相对大背景出现脉冲频次略高的台站。从图 8可明显看出,仲家沟(ZJG)、宣汉(XHA)、壤塘(RTA)、剑门关(JMG)、金鸡寺(JJS)、黑水(HSH)、姑咱(GZA)和巴塘(BTA)在震前约1个月内出现脉冲异常频次较高。将这8个台站投影到空间分布图上,如图 9所示。除了BTA,其他7个台站大致沿着龙门山断裂带以及近垂直于该断裂带分布。

      图  8  异常信号频次统计

      Figure 8.  Statistics of Pulselike Signals

      图  9  脉冲异常空间分布

      Figure 9.  Spatial Distribution of Pulselike Signals

      地震前兆可以理解为断层主破裂之前的一系列构造运动所激发的信号。地球物理学家根据断层的滑动和破裂速度,给予其地震学上的意义[23-24]:无震滑动(Vslip∈(1×10-9 ~1× 10-7 m/s),略大于板块运动1× 10-9 m/s,约为32 mm/a);慢滑移(Vslip∈(1 μm/s~1 mm/s),Vrupture < 0.001 cs);常规地震(Vslip >1 mm/s,Vrupture > 0.001 cs,其中cs为横波速度)。慢滑移与地震事件均能辐射出地震波,最大的区别在于震源的运动频率。Zhou等[3]从构造物理的角度解释了姑咱台钻孔应变的“毛刺”异常可能是一种慢粘滑运动产生的信号。而且在研究九寨沟地震旋转运动场中,发现辐射出的旋转运动场主要分布在近垂直于断层走向的区域[25]。因此,根据前人的研究成果和本文获得的统计规律,初步推测汶川地震前,龙门山断裂带慢滑移运动过程中,由于震源的慢滑移运动及其辐射出的低频能量,使得沿断层走向区域和近垂直于断层走向区域能记录到类似低频脉冲地震信号。

    • 本文通过构建深度自编码神经网络模型算法来自动识别地震连续波形数据中的脉冲异常,虽然获得了初步的定性结果,但由于训练数据时间关系以及技术上的难题,尚存在一些需要解决的问题:

      1)构建的深度自编码神经网络算法对脉冲信号较为敏感,导致数据源的质量对识别结果有较大影响,应对原始数据做进一步预处理后再作训练和识别。

      2)所用的训练数据时间较短,应增加训练数据时长,同时统计出更长时间段内异常的频次分布。

      3)需进一步分析不同分量上出现的脉冲频次及其空间分布特征,而且要对识别出的台站进行异常落实。这对于进一步分析地震异常信号、探索地震成核过程中激发出的脉冲信号都有重要作用。

    • 本文尝试将深度自编码算法用于地震脉冲信号的自动检测。首先利用连续波形数据中疑似脉冲异常的二维小波谱特征,通过训练获得了两层和三层深度自编码模型。然后将其应用于四川省汶川地震脉冲异常的自动检测中,测试结果表明,本文构建的深度自编码网络模型具备良好的稳定性,两种模型对新数据的识别准确度均高于93%。最后初步统计了汶川地震前1个月内四川省测震台网疑似脉冲异常的频次分布规律,并从断层慢滑移运动的角度给出了一种可能的解释。

参考文献 (25)

目录

    /

    返回文章
    返回