留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

利用卷积神经网络识别交通指数时间序列模式

卢剑 张学东 张健钦 郭小刚 张悦颖

卢剑, 张学东, 张健钦, 郭小刚, 张悦颖. 利用卷积神经网络识别交通指数时间序列模式[J]. 武汉大学学报 ● 信息科学版, 2020, 45(12): 1981-1988. doi: 10.13203/j.whugis20200035
引用本文: 卢剑, 张学东, 张健钦, 郭小刚, 张悦颖. 利用卷积神经网络识别交通指数时间序列模式[J]. 武汉大学学报 ● 信息科学版, 2020, 45(12): 1981-1988. doi: 10.13203/j.whugis20200035
LU Jian, ZHANG Xuedong, ZHANG Jianqin, GUO Xiaogang, ZHANG Yueying. Identification of Traffic Index Time Series Pattern by Using Convolution Neural Network[J]. Geomatics and Information Science of Wuhan University, 2020, 45(12): 1981-1988. doi: 10.13203/j.whugis20200035
Citation: LU Jian, ZHANG Xuedong, ZHANG Jianqin, GUO Xiaogang, ZHANG Yueying. Identification of Traffic Index Time Series Pattern by Using Convolution Neural Network[J]. Geomatics and Information Science of Wuhan University, 2020, 45(12): 1981-1988. doi: 10.13203/j.whugis20200035

利用卷积神经网络识别交通指数时间序列模式

doi: 10.13203/j.whugis20200035
基金项目: 

国家自然科学基金面上项目 41771413

国家自然科学基金青年基金 41701473

战略性国际科技创新合作重点专项 2018YFE0206100

北京市自然科学基金 8202013

研究生创新基金 PG2020085

详细信息

Identification of Traffic Index Time Series Pattern by Using Convolution Neural Network

Funds: 

General Program of the National Natural Science Foundation of China 41771413

the Youth Program of the National Natural Science Foundation of China 41701473

Key Projects of Strategic International Scientific and Technological Innovation Cooperation 2018YFE0206100

Project of Beijing Natural Science Foundation 8202013

Graduate Innovation Project Fund PG2020085

More Information
    Author Bio:

    LU Jian, postgraduate, specializes in intelligent transportation and geographic information visualization. E-mail:610723374@qq.com

    Corresponding author: ZHANG Xuedong, PhD, associate professor. E-mail:zhangxuedong@bucea.edu.cn
  • 摘要: 城市交通时间序列模式识别主要基于距离计算和特征提取两种方法,但前者结果受到时间序列非线性特征的影响,后者难以提取多时间段Shapelet子序列。为准确识别城市交通指数数据模式,提出了基于卷积神经网络对交通时间序列数据进行模式识别的方法。首先将时间序列数据预处理成N维矩阵,确定神经网络模型的输入数据; 然后通过反复训练特征网络提取输入层的特征信息,确定交通指数的模式类型; 最后利用Softmax分类器进行模式分类,实现交通指数类别划分。实验以2016—2018年北京市全市交通指数时间序列模式识别为例,对比发现,该方法能更准确地将交通指数时间序列数据划分为符合真实情况的5类模式。该方法对时间序列数据模式识别更准确,适合呈现时间阶段性变化的数据间相关性研究和模式发现。
  • 图  1  神经网络结构示意图

    Figure  1.  Schematic Diagram of Neural Network Structure

    图  2  卷积神经网络

    Figure  2.  Convolutional Neural Network

    图  3  卷积层运算示意图

    Figure  3.  Operation Diagram of Convolution Layer

    图  4  训练集模式分类

    Figure  4.  Training Set Pattern Classification

    图  5  卷积神经网络识别结果

    Figure  5.  Recognition Results of Convolutional Neural Network

    图  6  k-means聚类结果

    Figure  6.  Results of k-means Clustering

    图  7  层次聚类结果

    Figure  7.  Results of Hierarchical Clustering

    表  1  北京市交通指数分时示意表

    Table  1.   Traffic Index of Beijing in Different Time

    日期 05:00 05:15 05:30 22:30 22:45 23:00
    2016-11-01 1.0 1.2 1.0 1.6 1.5 1.3
    2016-11-02 0.8 1.0 1.0 1.8 1.8 1.5
    2018-11-28 1.1 1.1 1.1 1.7 1.6 1.5
    2018-11-29 1.4 1.3 1.1 1.6 1.6 1.5
    下载: 导出CSV

    表  2  交通指数特征

    Table  2.   Characteristics of Traffic Indexes

    模式类别 早高峰 平峰 晚高峰 第二峰
    出现时刻 起点时刻 峰值 持续时长
    周一模式 7.5~7.9 1.3~2.0 5.6~7.9
    周中模式 6.3~7.6 1.9~2.4 7.4~8.2 早高峰后 09:30~09:45 4.3~7.2 15~45 min
    周五模式 6.1~7.7 2.0~3.0 8.2~8.5 早高峰后,晚高峰后 09:30~09:45, 20:15~20:30 3.6~5.2 45 min ~1 h 45 min
    周六模式 4.2~6.8 2.7~6.6 7.1~8.2 早高峰前,晚高峰前 08:30~08:45, 14:45~15:00 3.5~6.6 15 min~1 h 15 min
    周日模式 2.6~3.9 2.3~5.5 6.3~7.6 早高峰前,晚高峰前 08:45~09:00,14:30~15:00 1.6~3.6 1 h 15 min~3 h
    下载: 导出CSV

    表  3  基于CNN的时间序列模式识别结果

    Table  3.   Recognition Results of Time Series Pattern Based on CNN

    类别 CNN k-means聚类 层次聚类 真实情况
    周一模式 19日、22日、26日、27日 19日、20日、22日、26日、27日、29日 19日、20日、21日、22日、26日、27日、28日、29日 19日、26日
    周中模式 20日、21日、28日、29日 21日、28日 20日、21日、22日、27日、28日、29日
    周五模式 16日、23日 16日、23日 16日、23日 16日、23日
    周六模式 17日、24日 17日、24日 17日、24日 17日、24日
    周日模式 18日、25日 18日、25日 18日、25日 18日、25日
    下载: 导出CSV
  • [1] 桑应宾.基于K近邻的分类算法研究[D].重庆: 重庆大学, 2009

    Sang Yingbi. Research on Classification Algorithm Based on K-Nearest Neighbor[D]. Chongqing : Chongqing University, 2009
    [2] 闫汶和, 李桂玲.基于Shapelet的时间序列分类研究[J].计算机科学, 2019, 46(1):29-35

    Yan Wenhe, Li Guiling. Research on Time Series Classification Based on Shapelet[J].Computer Science, 2019, 46(1):29-35
    [3] 王子一.基于特征提取的时间序列分类方法的研究[D].南京: 南京大学, 2019

    Wang Ziyi. Research on Time Series Classification Based on Feature Extraction[D]. Nanjing : Nanjing University, 2019
    [4] 沈旭东.基于深度学习的时间序列算法综述[J].信息技术与信息化, 2019(1):71-76

    Shen Xudong. A Survey of Time Series Algorithms Based on Deep Learning[J].Information Technology and Informatization, 2019(1):71-76
    [5] 郭茂祖, 王鹏跃, 赵玲玲.基于深度学习的出行模式识别方法[J].哈尔滨工业大学学报, 2019, 51(11):1-7

    Guo Maozu, Wang Pengyue, Zhao Lingling. Research on Recognition Method of Transportation Modes Based on Deep Learning[J]. Journal of Harbin Institute of Technology, 2019, 51(11): 1-7
    [6] 李旭冬, 叶茂, 李涛.基于卷积神经网络的目标检测研究综述[J].计算机应用研究, 2017, 34(10):2 881-2 886, 2 891

    Li Xudong, Ye Mao, Li Tao. Review of Object Detection Based on Convolutional Neural Networks[J].Application Research of Computers, 2017, 34(10):2 881-2 886, 2 891
    [7] 范会敏, 王浩.模式识别方法概述[J].电子设计工程, 2012, 20(19):48-51 http://www.cnki.com.cn/Article/CJFDTotal-GWDZ201219016.htm

    Fan Huimin, Wang Hao. An Overview of the Pattern Recognition Methods[J].Electronic Design Engineering, 2012, 20(19):48-51 http://www.cnki.com.cn/Article/CJFDTotal-GWDZ201219016.htm
    [8] Macqueen J. Some Methods for Classification and Analysis of Multi Variate Observations[C]. Berkeley Symposium on Mathematical Statistics & Probability, Los Angeles, USA, 1965
    [9] Saroj K. Review: Study on Simple K Mean and Modified K Mean Clustering Technique[J]. International Journal of Computer Science Engineering and Technology, 2016, 6(7):279-281
    [10] 胡晓依, 荆云建, 宋志坤, 等.基于CNN-SVM的深度卷积神经网络轴承故障识别研究[J].振动与冲击, 2019, 38(18):173-178

    Hu Xiaoyi, Jing Yunjian, Song Zhikun, et al.Bearing Fault Identification by Using Deep Convolution Neural Networks Based on CNN-SVM[J]. Journal of Vibration and Shock, 2019, 38(18): 173-178
    [11] 周飞燕, 金林鹏, 董军.卷积神经网络研究综述[J].计算机学报, 2017(6): 1 229-1 251 http://www.cnki.com.cn/article/cjfdtotal-jsjx201706001.htm

    Zhou Feiyan, Jin Linpeng, Dong Jun. Review of Convolutional Neural Network[J]. Chinese Journal of Computers, 2017(6):1 229-1 251 http://www.cnki.com.cn/article/cjfdtotal-jsjx201706001.htm
    [12] 蒋昂波, 王维维. ReLU激活函数优化研究[J].传感器与微系统, 2018, 37(2):50-52 http://d.old.wanfangdata.com.cn/Periodical/cgqjs201802014

    Jiang Angbo, Wang Weiwei. Research on Optimization of ReLU Activation Function[J].Transducer and Microsystem Technologies, 2018, 37(2):50-52 http://d.old.wanfangdata.com.cn/Periodical/cgqjs201802014
    [13] 刘梦雅, 毛剑琳.一种改进池化模型对卷积神经网络性能影响的研究[J].电子测量技术, 2019, 42(5):34-38

    Liu Mengya, Mao Jianlin. Research on Influence of an Improved Pooling Model on the Performance of Convolutional Neural Network[J].Electronic Measurement Technology, 2019, 42(5):34-38
    [14] 刘万军, 梁雪剑, 曲海成.不同池化模型的卷积神经网络学习性能研究[J].中国图象图形学报, 2016, 21(9):1 178-1 190

    Liu Wanjun, Liang Xuejian, Qu Haicheng. Learning Performance of Convolutional Neural Networks with Different Pooling Models[J]. Journal of Image and Graphics, 2016, 21(9):1 178-1 190
    [15] 冉鹏, 王灵, 李昕, 等.改进Softmax分类器的深度卷积神经网络及其在人脸识别中的应用[J].上海大学学报(自然科学版), 2018, 24(3):352-366

    Ran Peng, Wang Ling, Li Xin, et al. Improved Softmax Classifier for Deep Convolution Neural Networks and Its Application in Face Recognition[J]. Journal of Shanghai University(Natural Science), 2018, 24(3):352-366
    [16] Simone T, Amir H, Simone S. A Non-parametric Softmax for Improving Neural Attention in Time-series Forecasting[J]. Neurocomputing, 2020(381):177-185 http://www.sciencedirect.com/science/article/pii/s0925231219315267
  • [1] 郭从洲, 李可, 李贺, 童晓冲, 王习文.  遥感图像质量等级分类的深度卷积神经网络方法 . 武汉大学学报 ● 信息科学版, 2022, 47(8): 1279-1286. doi: 10.13203/j.whugis20200292
    [2] 周访滨, 邹联华, 刘学军, 孟凡一.  栅格DEM微地形分类的卷积神经网络法 . 武汉大学学报 ● 信息科学版, 2021, 46(8): 1186-1193. doi: 10.13203/j.whugis20190311
    [3] 黄若冰, 贾永红.  利用卷积神经网络和小面元进行人脸图像替换 . 武汉大学学报 ● 信息科学版, 2021, 46(3): 335-340. doi: 10.13203/j.whugis20180500
    [4] 王映雪, 李少梅, 任丽秋, 张鑫禄, 张崇涛, 张付兵.  面向特征的网络空间点群要素自动综合方法 . 武汉大学学报 ● 信息科学版, 2021, 46(3): 427-433. doi: 10.13203/j.whugis20200002
    [5] 任加新, 刘万增, 李志林, 李然, 翟曦.  利用卷积神经网络进行“问题地图”智能检测 . 武汉大学学报 ● 信息科学版, 2021, 46(4): 570-577. doi: 10.13203/j.whugis20190259
    [6] 黄博华, 李锡瑞, 肖常富, 何若枫, 韩崇砚, 郭志亮.  BDS卫星钟差数据异常值类型识别的卷积神经网络方法 . 武汉大学学报 ● 信息科学版, 2021, 46(6): 947-956. doi: 10.13203/j.whugis20190422
    [7] 任福, 侯宛玥.  面向机器阅读的地图名称注记类别识别方法 . 武汉大学学报 ● 信息科学版, 2020, 45(2): 273-280. doi: 10.13203/j.whugis20180503
    [8] 王米琪, 艾廷华, 晏雄锋, 肖屹.  图卷积网络模型识别道路正交网格模式 . 武汉大学学报 ● 信息科学版, 2020, 45(12): 1960-1969. doi: 10.13203/j.whugis20200022
    [9] 门计林, 刘越岩, 张斌, 周繁.  多结构卷积神经网络特征级联的高分影像土地利用分类 . 武汉大学学报 ● 信息科学版, 2019, 44(12): 1841-1848. doi: 10.13203/j.whugis20180137
    [10] 彭向阳, 刘洋, 王柯, 张泊宇, 钱金菊, 陈驰, 杨必胜.  利用卷积神经网络进行绝缘子自动定位 . 武汉大学学报 ● 信息科学版, 2019, 44(4): 563-569. doi: 10.13203/j.whugis20170175
    [11] 徐江河, 张飞舟, 张立福, 邓楚博, 孙雪剑.  一种综合利用图像和光谱信息的物体真假模式识别方法 . 武汉大学学报 ● 信息科学版, 2019, 44(8): 1174-1181. doi: 10.13203/j.whugis20190139
    [12] 范仲鸣, 李精忠, 张小波.  矢量多边形模式识别的小波方法 . 武汉大学学报 ● 信息科学版, 2017, 42(10): 1400-1405, 1416. doi: 10.13203/j.whugis20150688
    [13] 田晶, 张泊宇, 杨雯雨.  对自组织映射聚类实现道路网网格模式识别 . 武汉大学学报 ● 信息科学版, 2013, 38(11): 1330-1334.
    [14] 田晶, 艾廷华, 雷华清.  运用自组织映射识别街道网中的网格模式 . 武汉大学学报 ● 信息科学版, 2012, 37(3): 362-365.
    [15] 王树良, 邹珊珊, 操保华, 谢媛.  利用数据场的表情脸识别方法 . 武汉大学学报 ● 信息科学版, 2010, 35(6): 738-742.
    [16] 喻永平, 陈晓勇, 刘经南, 都洁.  状态扩展元胞自动机模型在时空数据挖掘中的应用 . 武汉大学学报 ● 信息科学版, 2008, 33(6): 592-595.
    [17] 王树根.  基于认知心理学的模式识别模型框架 . 武汉大学学报 ● 信息科学版, 2002, 27(5): 543-547.
    [18] 杨挺, 刘友光, 黄幼才.  模式识别在手腕骨自动识别中的应用研究 . 武汉大学学报 ● 信息科学版, 1998, 23(1): 43-46.
    [19] 刘少创, 林宗坚.  基于神经网络的地图数字注记识别 . 武汉大学学报 ● 信息科学版, 1994, 19(3): 194-198.
    [20] 舒宁.  遥感数据自动分类中应用辅助数据的原理 . 武汉大学学报 ● 信息科学版, 1988, 13(4): 91-98.
  • 加载中
图(7) / 表(3)
计量
  • 文章访问数:  1048
  • HTML全文浏览量:  291
  • PDF下载量:  96
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-08-27
  • 刊出日期:  2020-12-05

利用卷积神经网络识别交通指数时间序列模式

doi: 10.13203/j.whugis20200035
    基金项目:

    国家自然科学基金面上项目 41771413

    国家自然科学基金青年基金 41701473

    战略性国际科技创新合作重点专项 2018YFE0206100

    北京市自然科学基金 8202013

    研究生创新基金 PG2020085

    作者简介:

    卢剑,硕士生,研究方向为智能交通与地理信息可视化。610723374@qq.com

    通讯作者: 张学东,博士,副教授。zhangxuedong@bucea.edu.cn
  • 中图分类号: U491

摘要: 城市交通时间序列模式识别主要基于距离计算和特征提取两种方法,但前者结果受到时间序列非线性特征的影响,后者难以提取多时间段Shapelet子序列。为准确识别城市交通指数数据模式,提出了基于卷积神经网络对交通时间序列数据进行模式识别的方法。首先将时间序列数据预处理成N维矩阵,确定神经网络模型的输入数据; 然后通过反复训练特征网络提取输入层的特征信息,确定交通指数的模式类型; 最后利用Softmax分类器进行模式分类,实现交通指数类别划分。实验以2016—2018年北京市全市交通指数时间序列模式识别为例,对比发现,该方法能更准确地将交通指数时间序列数据划分为符合真实情况的5类模式。该方法对时间序列数据模式识别更准确,适合呈现时间阶段性变化的数据间相关性研究和模式发现。

English Abstract

卢剑, 张学东, 张健钦, 郭小刚, 张悦颖. 利用卷积神经网络识别交通指数时间序列模式[J]. 武汉大学学报 ● 信息科学版, 2020, 45(12): 1981-1988. doi: 10.13203/j.whugis20200035
引用本文: 卢剑, 张学东, 张健钦, 郭小刚, 张悦颖. 利用卷积神经网络识别交通指数时间序列模式[J]. 武汉大学学报 ● 信息科学版, 2020, 45(12): 1981-1988. doi: 10.13203/j.whugis20200035
LU Jian, ZHANG Xuedong, ZHANG Jianqin, GUO Xiaogang, ZHANG Yueying. Identification of Traffic Index Time Series Pattern by Using Convolution Neural Network[J]. Geomatics and Information Science of Wuhan University, 2020, 45(12): 1981-1988. doi: 10.13203/j.whugis20200035
Citation: LU Jian, ZHANG Xuedong, ZHANG Jianqin, GUO Xiaogang, ZHANG Yueying. Identification of Traffic Index Time Series Pattern by Using Convolution Neural Network[J]. Geomatics and Information Science of Wuhan University, 2020, 45(12): 1981-1988. doi: 10.13203/j.whugis20200035
  • 随着城市化的快速发展,城市交通拥堵问题日益突出。科研人员从社会学、统计学、互联网和地理信息等多领域开展了大量的研究,以期准确地发现居民在交通出行中存在的规律和特征,为交管部门提供参考与指导。交通指数是研究城市交通运行状态的重要指标,反映了城市拥堵状况的量化结果,在时间维度上具有一定的规律。因此,通过时间序列模式识别,从历史交通指数中得到居民出行的潜在特征,区分其所属类别,可为交通运行状态研究及预测提供基础数据,对城市交通拥堵疏解具有重要的价值。

    时间序列模式识别研究已成为数据挖掘领域的研究重点。目前时间序列模式识别机器学习方法主要包括基于距离的时间序列模式识别和基于特征的时间序列模式识别[1-3]。基于距离的时间序列模式识别一般使用欧氏距离衡量时间序列数据之间的相似性,如K近邻算法[1]。而基于特征的模式识别是针对时间序列数据差异性特征研究时间序列的差异性子段,通过对比时间序列差异性最显著的子段来区分序列所属类别。如Shapelet算法[2-3]寻找时间序列中最具有代表性的连续子序列。基于距离和特征进行时间序列模式识别只有在一定条件下才可以获得较好的识别效果[4-6]。由于不确定性因素的影响,时间序列数据本身存在一定的变形和扭曲现象; 而基于特征的模式识别对单一Shapelet子序列区分能力有限,又很难实现多时间段Shapelet子序列提取。

    针对此,本文提出一种基于特征提取的卷积神经网络(convolutional neural network,CNN)对交通指数时间序列进行模式识别的方法,研究结果可为相关管理部门制定交通规划提供参考。

    • 模式识别[7]是计算机按照一定的算法自动识别客体的类别,通过对象表征的数量、大小或者逻辑关系,将具有一定相似性的对象看作一个整体,从而挖掘和提取其规律。模式识别方法分为监督学习和非监督学习,区分依据一般是对分类结果是否已知的判断。非监督分类常见的算法是聚类分析,聚类分析的高效性和简单性使得其在模式识别中应用广泛。聚类分析一般分为3个步骤:特征提取、对象特征相似性计算和根据相似性进行分组。Macqueen[8]首次提出了k-means算法,该算法的核心思想是将欧氏距离作为衡量对象相似度的指标,欧氏距离与相似度大小成反比。k-means是要寻找最佳的kti,使得损失函数最小[9]。但k-means在部分聚类问题上很难体现出优势。将数据{xi}聚类为k类,聚类后每个类别为ti,聚类中心为μi,则k-means的损失函数表示为:

      $$L = \mathop \sum \limits_{j = 1}^k \mathop \sum \limits_{i = 1}^n {\left( {{x_i} - {\mu _j}} \right)^2}_{\left\{ {{t_i} = j} \right\}}$$ (1)

      随着实际问题复杂度的提升,传统非监督学习方法已无法满足实际问题的需求。而神经网络由大量节点(神经元)连接构成,每个节点都是一个输出函数,节点与节点之间由一个权重值连接,这就为机器学习提供了新的思路。如图 1所示,神经网络可以分为输入层和输出层。在深度学习中,支持向量机(support vector machine,SVM)算法[10]是在对象样本中找出一个超平面,将对象样本按照相似性差异分割。SVM的核心是如何找到这个超平面使对象差异最大化。但在实际中,SVM存在着一些不足,如多分类问题存在困难,其性能的优劣取决于核函数的选取等。

      图  1  神经网络结构示意图

      Figure 1.  Schematic Diagram of Neural Network Structure

      由于普通的聚类算法和SVM算法很难考虑时间序列数据的时序性,又因人工构造特征比较繁琐,本文选择CNN作为交通指数时间序列模式识别方法,该方法可降低人为特征干预的影响,挖掘出更深层次的时间序列规律和特性。CNN是一种针对于图像处理的神经网络,通过反向传播来实现。如图 2所示,CNN的主要过程包括输入层、卷积层、池化层、全连接层和输出层[11]

      图  2  卷积神经网络

      Figure 2.  Convolutional Neural Network

    • 卷积层中由卷积核对输入层进行遍历计算,在原始输入层上对局部区域进行特征提取(图 3)。

      图  3  卷积层运算示意图

      Figure 3.  Operation Diagram of Convolution Layer

      根据实际需求设计卷积核的算法和大小。输入层与卷积核进行卷积处理的表达式如下:

      $$a_j^l = f\left( {\mathop \sum \limits_{i \in {M_i}} a_i^{l - 1}K_j^l + b_j^l} \right)$$ (2)

      式中,ajl为卷积运算后的输出结果; kjl为第l层第j个卷积; bjl为偏置参数; f(x)为激活函数。卷积层还需要满足“权值共享”原则,即用一个卷积层扫描整个输入层。

      卷积层运算后的结果再经过激活函数的非线性转化来解决线性不可分问题。常见的激活函数[12]包括Sigmoid函数、Tanh函数和ReLU函数,计算公式分别如下:

      $$f\left( x \right) = \frac{1}{{1 + {{\rm{e}}^{ - x}}}}$$ (3)
      $${\rm{Tanh}}\left( x \right) = \frac{{{{\rm{e}}^x} - {{\rm{e}}^{ - x}}}}{{{{\rm{e}}^x} + {{\rm{e}}^{ - x}}}}$$ (4)
      $${\rm{ReLU}}\left( x \right) = \left\{ {\begin{array}{*{20}{c}} {x, x > 0}\\ {0, x \le 0} \end{array}} \right.$$ (5)

      Sigmoid函数会增大计算量,同时函数反向传播时会导致梯度消失和梯度爆炸的情况,造成信息丢失,无法完成深层网络训练。Tanh函数建立在Sigmoid函数之上,只是尺度和范围有所不同。ReLU函数能够更加有效地降低梯度下降和反向传播对训练的影响,避免梯度爆炸和梯度消失问题,不仅优化了计算过程,减少了计算量,而且同时减少了参数的依赖关系,缓解了网络出现过拟合的现象。因此,本文采用ReLU函数来进行卷积处理后的非线性转化。

      池化层主要对卷积层处理后的特征图进一步压缩提取,常分为均值池化和最大池化两种。均值池化是邻域内的特征点取平均值作为邻域的特征表达; 最大池化是邻域内的特征点取最大值作为邻域的特征表达。卷积过程中的误差来自于邻域大小的选择以及卷积参数的调整。均值池化能够减小邻域大小选择导致的误差,但无法减小参数调整对于均值偏移造成的误差,因此不能更多保留输入层的特征信息。基于两种池化层的运算特征可知,均值池化层善于保留背景信息,而最大池化层能够提取出该邻域的特征纹理[13-14]

      本文主要根据交通指数时间序列的变化规律来划分其模式,而特征差异最明显的值能够有效地反映交通指数变化规律,因此可忽略其背景信息特征,探寻邻域内最值来刻画交通指数的特征信息。最大池化层的运算方式刚好满足本次实验需求,因此,本文采用最大池化来进一步进行特征提取。

    • 经过卷积处理和池化处理后,特征图层进入全连接层进行分类。全连接层将特征图层进行整合,输出一个一维向量,使得局部特征在更高维度上进行全局信息整合。经过全连接层的整合后,再利用Softmax函数对整合结果进行分类,得到每种类别的分布概率,从而根据概率的大小,将概率最大的类别作为分类结果[15-16]。Softmax函数表达式如下:

      $${S_j} = \frac{{{{\rm{e}}^{{a_j}}}}}{{\sum \limits_{k = 1}^T {{\rm{e}}^{{a_k}}}}}$$ (6)

      式中,aj表示全连接层中向量的第j个值; ak表示全连接层中每一位值; T表示预先设定的分类类别数。

    • 时间序列指随机变量随着时间变化排列得到的一段序列。根据观察时间的不同,时间序列中的时间可以是年份、季度、月份或其他任何时间形式。时间序列是现实生活中十分常见的变量,例如股票交易量和客流量等。时间序列数据与时间的关系非常密切,假定一组随机变量X={X1, X2Xn},定义时间为T={t1, t2tn},那么定义Xt={X1, X2Xt|tT}为在时间T内的时间序列。

      本文采用2016年11月、2017年11月和2018年11月(不含2018年11月30日数据)3个月的北京市全市交通指数数据作为实验对象。时间频率为15 min,记录每天05:00~23:00的交通指数。交通指数为0~10中的数值,数值越大,表示交通越拥堵,交通状况越恶劣。具体数据如表 1表 2所示。可以看出,交通指数数据根据日期的不同呈现明显的差异。实验从峰值大小、谷值大小、第二峰是否存在、第二峰峰值和第二峰持续时间等因素将交通指数模式划分为周一模式、周中模式、周五模式、周六模式和周日模式。

      表 1  北京市交通指数分时示意表

      Table 1.  Traffic Index of Beijing in Different Time

      日期 05:00 05:15 05:30 22:30 22:45 23:00
      2016-11-01 1.0 1.2 1.0 1.6 1.5 1.3
      2016-11-02 0.8 1.0 1.0 1.8 1.8 1.5
      2018-11-28 1.1 1.1 1.1 1.7 1.6 1.5
      2018-11-29 1.4 1.3 1.1 1.6 1.6 1.5

      表 2  交通指数特征

      Table 2.  Characteristics of Traffic Indexes

      模式类别 早高峰 平峰 晚高峰 第二峰
      出现时刻 起点时刻 峰值 持续时长
      周一模式 7.5~7.9 1.3~2.0 5.6~7.9
      周中模式 6.3~7.6 1.9~2.4 7.4~8.2 早高峰后 09:30~09:45 4.3~7.2 15~45 min
      周五模式 6.1~7.7 2.0~3.0 8.2~8.5 早高峰后,晚高峰后 09:30~09:45, 20:15~20:30 3.6~5.2 45 min ~1 h 45 min
      周六模式 4.2~6.8 2.7~6.6 7.1~8.2 早高峰前,晚高峰前 08:30~08:45, 14:45~15:00 3.5~6.6 15 min~1 h 15 min
      周日模式 2.6~3.9 2.3~5.5 6.3~7.6 早高峰前,晚高峰前 08:45~09:00,14:30~15:00 1.6~3.6 1 h 15 min~3 h

      将2016年11月、2017年11月和2018年11月1日—15日数据作为训练集,并根据其真实情况进行标记,利用0和1表示,例如,(1,0,0,0,0)表示周一模式,(0,1,0,0,0)表示周中模式,(0,0,1,0,0)表示周五模式,(0,0,0,1,0)表示周六模式,(0,0,0,0,1)表示周日模式。每日05:00~23:00每隔15 min取值一共73个数值,将每天数据用数值“0”在时间序列数据首位补充成为10×10维矩阵,将标签标记在矩阵末尾来区分每天的模式,最终将实验数据组成CNN的输入层。

    • 经过预处理将数据分为训练集和测试集。训练集数据包括2016年11月、2017年11月和2018年11月1日—15日,共75 d; 测试集数据包括2018年11月16日-29日,共14 d。图 4展示了训练集数据5种模式分类结果。

      图  4  训练集模式分类

      Figure 4.  Training Set Pattern Classification

    • 为了避免卷积核上下左右移动之后位置信息发生偏移,卷积核通常采用奇数×奇数的构造形式。虽然偶数×偶数的卷积核在理论上也存在,但会造成图像边界信息丢失,即存在有些图像角落和边界的信息发挥作用较小的情况。因此,在实践中卷积核一般以n×n(n为奇数)形式存在。卷积核的大小根据输入层的大小决定,常见的尺寸包括3×3、5×5和7×7,卷积核边长越长,计算量越大。在本文实验中,尺寸为7×7卷积核的感受野过大,计算量也较大,但计算结果差异不明显; 尺寸为3×3和5×5的卷积核都适用于本次实验,但是5×5的卷积核感受野更大,能够提取更多特征信息,因此,本文选择尺寸为5×5的卷积核。池化层主要实现降维、去除冗余信息、对特征进行压缩、简化网络复杂度、减少计算量、减少内存消耗等处理,本文采用2×2的最大池化层,能够实现局部特征的压缩与提取。经实验发现,若采用更大尺寸的池化层会造成图层信息的丢失,降低所提取特征的鲁棒性。

    • 本实验采用的整体框架由CNN和Softmax分类器组成。CNN框架由两组卷积层、激活函数(ReLU)和最大池化层组成; Softmax分类器包括Softmax函数分类层、CNN输出结果和Softmax分类器,由全连接层连接。实验首先对于输入层的10×10维矩阵进行特征提取,第一次卷积采用5×5的卷积核,借助ReLU激活函数进行非线性转换,解决梯度消失和缓解过拟合等问题; 将经过激活函数非线性转换后的结果利用2×2的最大池化处理。经过第一次卷积池化处理后,能够提取出低层次特征,但更深层次的特征信息需要根据实际使用需求安排卷积核和池化层的数量。由于实验数据样本量较小,为避免出现过拟合现象,实验中采用两组卷积核和池化层进行特征提取,对特征进一步压缩,得到更为可靠的特征信息。第二组卷积池化处理与第一次相同,两次处理的输出结果通过全连接层实现多维数据一维化,将一维特征信息向量作为Softmax函数逻辑回归的输入层,输出每种模式出现的概率,其大小为0~1之间的数值,取概率最大值对应的模式作为该天时间序列数据模式的类别。

    • 将2018年11月16日-29日数据分为5类,见表 3中真实情况所示。本文采用基于CNN的时间序列模式识别得到的结果如图 5所示,分类结果如表 3所示。从表 3可以看出,CNN误把11月22日和27日分为周一模式,与实际情况不符。

      表 3  基于CNN的时间序列模式识别结果

      Table 3.  Recognition Results of Time Series Pattern Based on CNN

      类别 CNN k-means聚类 层次聚类 真实情况
      周一模式 19日、22日、26日、27日 19日、20日、22日、26日、27日、29日 19日、20日、21日、22日、26日、27日、28日、29日 19日、26日
      周中模式 20日、21日、28日、29日 21日、28日 20日、21日、22日、27日、28日、29日
      周五模式 16日、23日 16日、23日 16日、23日 16日、23日
      周六模式 17日、24日 17日、24日 17日、24日 17日、24日
      周日模式 18日、25日 18日、25日 18日、25日 18日、25日

      图  5  卷积神经网络识别结果

      Figure 5.  Recognition Results of Convolutional Neural Network

      为验证CNN模式识别的准确性,本文采用k-means聚类算法和层次聚类算法在Tensorflow中实现对比,来验证CNN的分类精度。与CNN相同,k-means聚类实验将聚类数k设定为5,即设定5个聚类中心。对照每个时间序列样本曲线,根据式(1)计算样本曲线与中心曲线对应时刻的距离总和,寻找距离本身最近的中心线,判断聚类前后样本点聚类情况是否相同。若聚类结果不同,则根据此次聚类结果更新中心曲线,重新计算样本数据与中心曲线的距离,根据距离判断聚类情况,反复迭代直至聚类结果与分类结果一致,完成此次聚类。

      将2018年11月16日-29日数据同样分为5类进行实验。k-means聚类结果如表 3图 6所示。根据表 3可知,k-means聚类算法能够准确区分周五模式、周六模式和周日模式,但对于周一模式和周中模式区分有误。即其将11月19日、20日、22日、26日、27日和29日归类为周一模式,而11月21日和11月28日识别为周中模式,这与实际情况相矛盾。可见,k-means聚类算法无法准确识别出周一模式和周中模式。

      图  6  k-means聚类结果

      Figure 6.  Results of k-means Clustering

      层次聚类算法一般通过计算节点间的距离相似度创建层次嵌套聚类树。其原理是通过计算节点数据彼此间的距离确定其相似性,将距离最近的两组数据或类别进行组合,并反复迭代完成这一过程。层次聚类方法能够发现类别间的层次关系,可以在不同尺度上区分数据集的聚类情况,一般适用于复杂多变的时间序列数据的分析。层次聚类分为凝聚和分裂,本实验采用凝聚型层次聚类。首先将每天交通指数时间序列数据作为一个簇,计算两两之间的最小距离,将距离最小的合并成一组新类,重新计算新类与所有类别之间的距离,重复此类计算,直到完成聚类。将2018年11月16日-29日数据进行层次聚类,同样分为5类。聚类结果如表 3图 7所示。

      图  7  层次聚类结果

      Figure 7.  Results of Hierarchical Clustering

      根据表 3可知,层次聚类算法能够挖掘工作日和非工作日的显著特征,能够准确识别周五模式、周六模式和周日模式,但对周一模式和周中模式识别不理想。层次聚类算法将11月19日、20日、21日、2日、26日、27日、28日和29日全部归类为周一模式,这与实际情况矛盾。可见,虽然层次聚类算法能够区分工作日和非工作日模式,但无法正确衡量工作日模式的相似度,识别能力有限。

      图 5~7分别是CNN、k-means算法和层次聚类算法识别结果的可视化展示,其误识别率分别为14.3%、28.6%和42.9%。3种算法都能够准确识别周六模式(蓝色曲线)和周日模式(灰色曲线),但对于特征信息相对模糊的工作日模式,3种方法的识别能力不同。k-means算法基于距离作为相似度衡量序列的类别差异,未能挖掘深层次的特征信息,导致该算法聚类与真实情况有所差异。层次聚类同样采用距离作为衡量相似度依据,由于时间序列数据的特殊性,只能够准确识别相似度差异最大的类别。CNN通过反复训练,能充分提取交通指数特征信息,根据特征信息寻找最具有代表性的子段序列,明确不同模式下的交通指数差异特征,完成模式识别任务。本文利用CNN对于交通指数时间序列模式的识别精度高于传统k-means聚类算法和层次聚类算法,验证了本文的方法对时间序列模式识别的可行性及优越性。本次实验中,CNN误将11月22日和27日分为周一模式,以后可以通过加大样本量的训练、优化网络结构和调整模型参数等方法,训练出最佳的网络模型,以提高识别精度。

    • 由于时间序列数据的特殊性,传统聚类算法很难准确地区分时间序列模式,因此,本文提出了基于CNN对时间序列数据进行模式识别的方法。实验以2016—2018年北京市全市交通指数数据作为研究对象,将交通指数时间序列数据构成10维矩阵,先利用神经网络反复训练优化得到最佳网络模型,对于输入层进行两次卷积池化处理,训练提取时间序列数据的特征信息,再利用Softmax分类器进行模式分类,最终将2018年11月16日—29日数据区分为周一模式、周中模式、周五模式、周六模式和周日模式。与基于距离计算的机器学习算法相比,本文对时间序列数据模式识别具有较好的识别能力。

      为了更全面地探究时间序列数据的模式和规律,未来需要考虑环境因素对于算法权重的影响。例如,将路网密度、交通环境、突发情况和重大事件等因素融入神经网络,得到基于特征提取的多因素影响下的交通指数模式识别算法。该研究对于交管部门进行统筹把控、制定交通规划有重要意义,能够为缓解城市交通压力服务。

参考文献 (16)

目录

    /

    返回文章
    返回