留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

利用经验约束规则和证据理论进行出租车异常轨迹检测

周洋 方志祥 李清泉 郭善昕

周洋, 方志祥, 李清泉, 郭善昕. 利用经验约束规则和证据理论进行出租车异常轨迹检测[J]. 武汉大学学报 ● 信息科学版, 2016, 41(6): 797-802. doi: 10.13203/j.whugis20140221
引用本文: 周洋, 方志祥, 李清泉, 郭善昕. 利用经验约束规则和证据理论进行出租车异常轨迹检测[J]. 武汉大学学报 ● 信息科学版, 2016, 41(6): 797-802. doi: 10.13203/j.whugis20140221
ZHOU Yang, FANG Zhixiang, LI Qingquan, GUO Shanxin. Anomalous Taxi Trajectory Detection Based on Experiential Constraint Rules and Evidence Theory[J]. Geomatics and Information Science of Wuhan University, 2016, 41(6): 797-802. doi: 10.13203/j.whugis20140221
Citation: ZHOU Yang, FANG Zhixiang, LI Qingquan, GUO Shanxin. Anomalous Taxi Trajectory Detection Based on Experiential Constraint Rules and Evidence Theory[J]. Geomatics and Information Science of Wuhan University, 2016, 41(6): 797-802. doi: 10.13203/j.whugis20140221

利用经验约束规则和证据理论进行出租车异常轨迹检测

doi: 10.13203/j.whugis20140221
基金项目: 

国家自然科学基金 Nos. 41371377,41231171

国家863计划 No. 2012AA12A403-4

深圳市科技研发资金 Nos. ZDSY20121019111146499, JSGG20121026111056204

深圳市战略性新兴产业发展专项资金 No. JCYJ20121019111128765

详细信息

Anomalous Taxi Trajectory Detection Based on Experiential Constraint Rules and Evidence Theory

Funds: 

The National Natural Science Foundation of China Nos. 41371377,41231171

National 863 Program of China No. 2012AA12A403-4

Shenzhen Scientific Research and Development Funding Program Nos. ZDSY20121019111146499, JSGG20121026111056204

Shenzhen Dedicated Fund of Strategic Emerging Industry Development Program No. JCYJ20121019111128765

More Information
    Author Bio:

    ZHOU Yang,PhD candidate, specializes in trajectory analysis and space-time pattern mining of moving objects. E-mail:cleverzhouyang@whu.edu.cn

    Corresponding author: FANG Zhixiang, PhD, professor. E-mail:zxfang@whu.edu.cn.
  • 摘要: 提出了一种根据择路经验特征,利用证据理论检测出租车异常轨迹的方法。该方法考虑最短路径与轨迹长度的比值、规避路径代价、出行发生时间3个因素,利用证据理论综合这3个证据来判别轨迹的异常程度,检测出行距离和路径选择明显不同于正常情况下的异常轨迹。实验结果表明此方法能有效识别不符合正常认知的异常轨迹,不依赖于单一起始点和终点对(origin-destination,OD)中的轨迹数目,能快速处理海量GPS数据,可用于大规模浮动车数据择路行为分析前期的数据过滤。
  • 图  1  算法流程

    Figure  1.  Flowchart of the Algorithm

    图  2  研究区域和出租车轨迹分布示例

    Figure  2.  Study Area and Samples of Taxi GPS Trajectories

    图  3  出租车经验规避路段等级(EAR)

    Figure  3.  Experience Levels of Taxi EAR

    图  4  出租车经验规避路段说明

    Figure  4.  Illustrations of Taxi EAR

    图  5  异常检测结果及D-S异常指数示例

    Figure  5.  Examples of Anomalous Detection Results and Their D-S Indices

    图  6  3种方法结果对比

    Figure  6.  Result Comparison of Three Methods

    表  1  实验数据统计

    Table  1.   Statistical Description of Traces in Different Rd

    指标Rd≤1Rd<1Rd≤1/1.25Rd≤1/1.5
    轨迹数目 587 820 362 008 23 547 7 101
    占所有轨迹百分比 100% 61.6% 4% 1.2%
    平均GT长度/m 3 795 5 052 7 013 8 208
    平均SDP长度/m 3 606 4 557 4 708 4 408
    平均Rd 0.97 0.92 0.69 0.56
    下载: 导出CSV

    表  2  初始概率分配函数BPA值

    Table  2.   Default BPA Valuse for Each Set

    RdIc
    0.1 <Rd <0.9Rd≤0.1或 Rd≥0.9 0.1 <Ic <0.9 Ic≤0.1或 Ic≥0.9
    m({A}) 1-Rd-0.05 1-Rd Ic-0.05 Ic
    m({B}) Rd-0.05 Rd 1-Ic-0.05 Ic-0.05
    m(Θ={A,B}) 0.1 0 0.1 0
    下载: 导出CSV
  • [1] Zheng Yu, Liu Yanchi, Yuan Jing, et al. Urban Computing with Taxicabs[C]. ACM International Conference on Ubiquitous Computing, Beijing, 2011
    [2] 王汉东,乐阳,李宇光,等. 城市商业服务设施吸引力的空间相关性分析[J]. 武汉大学学报·信息科学版,2011,36(9):1102-1106

    Wang Handong, Yue Yang, Li Yuguang, et al. Spatial Correlation Analysis of Attractiveness of Commercial Facilities[J]. Geomatics and Information Science of Wuhan University, 2011, 36(9):1102-1106
    [3] Liu Yu. Understanding Intra-urban Trip Patterns from Taxi Trajectory Data[J]. Journal of Geographical Systems,2012,14:463-483
    [4] Fang Zhixiang, Shaw Shilung, Tu Wei, et al. Spatio Temporal Analysis of Critical Transportation Links Based on Time Geographic Concepts:A Case Study of Critical Bridges in Wuhan, China[J]. Journal of Transport Geography, 2012, 23:44-59
    [5] Oliva J B. Anomaly Detection and Modeling of Trajectories[D]. Pittsburgh:Carnegie Mellon University, 2012
    [6] Lee J G, Han Jiawei, Li Xiaolei. Trajectory Outlier Detection:A Partition-and-Detect Framework[C]. IEEE International Conference on Data Engineering, Cancun, Mexico, 2008
    [7] Zhang Daqing, Li Nan, Zhou Zhihua, et al. iBAT:Detecting Anomalous Taxi Trajectories from GPS Traces[C]. ACM International Conference on Ubiquitous Computing, Beijing, 2011
    [8] Liu Siyuan, Krishnan R. Fraud Detection from Taxi's Driving Behaviors[J]. IEEE Transactions on Vehicular Technology, 2014, 63(1):646-672
    [9] Ge Yong, Xiong Hui, Liu Chuanren, et al. A Taxi Driving Fraud Detection System[C]. IEEE International Conference on Data Mining, British Columbia, Canada, 2011
    [10] Shafer G.Mathematical Theory of Evidence[M]. Princeton:Princeton University Press, 1976
    [11] 唐炉亮, 常晓猛, 李清泉. 出租车经验知识建模与路径规划算法[J]. 测绘学报,2010, 39(4):404-409

    Tang Luliang, Chang Xiaomeng, Li Qingquan. The Knowledge Modeling and Route Planning Based on Taxi Experience[J]. Acta Geodaetica et Cartographic Sinica, 2010, 39(4):404-409
    [12] Li Qingquan, Zeng Zhe, Zhang Tong, et al. Path-Finding Through Flexible Hierarchical Road Networks:An Experiential Approach Using Taxi Trajectory Data[J]. International Journal of Applied Earth Observation and Geoinformation, 2011, 13(1):110-119
    [13] Yager R R. On the Dempster-Shafer Framework and New Combination Rules[J]. Information System, 1989, 41(2):93-137
  • [1] 郭宁, 熊伟, 欧阳雪, 杨岸然, 吴烨, 陈荦, 景宁.  时空轨迹多层级相似子段匹配方法 . 武汉大学学报 ● 信息科学版, 2022, 47(9): 1390-1397. doi: 10.13203/j.whugis20200170
    [2] 殷吉崇, 武芳, 李安平, 杜佳威, 刘呈熠.  顾及速度与航向信息的轨迹匹配方法 . 武汉大学学报 ● 信息科学版, 2021, 46(11): 1774-1781. doi: 10.13203/j.whugis20210058
    [3] 季航宇, 蔡忠亮, 姜莉莉, 李桂娥, 李伯钊.  出租车出行的空间不平等及其与人口结构的关联 . 武汉大学学报 ● 信息科学版, 2021, 46(5): 766-776. doi: 10.13203/j.whugis20190327
    [4] 张寅, 蔡旭阳, 闫钧华, 苏恺, 张琨.  联合时空信息和轨迹关联的空中多目标检测 . 武汉大学学报 ● 信息科学版, 2020, 45(10): 1533-1540. doi: 10.13203/j.whugis20190359
    [5] 贾涛, 李琦, 马楚, 李雨芊.  武汉市出租车轨迹二氧化碳排放的时空模式分析 . 武汉大学学报 ● 信息科学版, 2019, 44(8): 1115-1123. doi: 10.13203/j.whugis20170334
    [6] 姚尧, 张亚涛, 关庆锋, 麦可, 张金宝.  使用时序出租车轨迹识别多层次城市功能结构 . 武汉大学学报 ● 信息科学版, 2019, 44(6): 875-884. doi: 10.13203/j.whugis20170111
    [7] 熊汉江, 郭胜, 郑先伟, 周妍.  室内行人移动行为识别及轨迹追踪 . 武汉大学学报 ● 信息科学版, 2018, 43(11): 1696-1703. doi: 10.13203/j.whugis20170066
    [8] 唐炉亮, 邹倩倩, 张霞, 任畅, 李清泉.  融合线上线下轨迹的景观热度评价 . 武汉大学学报 ● 信息科学版, 2018, 43(11): 1704-1711. doi: 10.13203/j.whugis20170043
    [9] 龚希, 陈占龙, 谢忠.  出租车轨迹数据的地域间移动模式分析 . 武汉大学学报 ● 信息科学版, 2018, 43(10): 1595-1602. doi: 10.13203/j.whugis20170035
    [10] 解愉嘉, 刘学军.  顾及轨迹地理方向的监控视频浓缩方法 . 武汉大学学报 ● 信息科学版, 2017, 42(1): 70-76. doi: 10.13203/j.whugis20160080
    [11] 唐炉亮, 靳晨, 杨雪, 阚子涵, 任畅.  基于GPS时空轨迹的路网拓扑自动变化检测 . 武汉大学学报 ● 信息科学版, 2017, 42(10): 1381-1386. doi: 10.13203/j.whugis20150662
    [12] 刘汇慧, 阚子涵, 孙飞, 段倩, 唐炉亮, 吴华意.  采用轨迹大数据探测短时非营运行为 . 武汉大学学报 ● 信息科学版, 2016, 41(9): 1192-1198. doi: 10.13203/j.whugis20150569
    [13] 何金平, 马传彬, 施玉群.  高拱坝多效应量改进型D-S证据理论融合模型 . 武汉大学学报 ● 信息科学版, 2012, 37(12): 1397-1400.
    [14] 袁伟, 熊永良, 黄丁发.  附有运动轨迹约束条件的整周模糊度快速分解算法 . 武汉大学学报 ● 信息科学版, 2009, 34(11): 1316-1319.
    [15] 张浩, 蔡晋辉, 周泽魁.  DS证据理论在SAR图像边缘检测中的应用 . 武汉大学学报 ● 信息科学版, 2008, 33(1): 105-108.
    [16] 唐敏, 张祖勋, 张剑.  基于广义点理论的多基线影像钣金件3D重建与尺寸检测 . 武汉大学学报 ● 信息科学版, 2007, 32(12): 1095-1098.
    [17] 熊平, 朱天清, 黄天戍.  模糊关联规则挖掘算法及其在异常检测中的应用 . 武汉大学学报 ● 信息科学版, 2005, 30(9): 841-845.
    [18] 关欣, 何友, 衣晓.  基于D-S推理的灰关联雷达辐射源识别方法研究 . 武汉大学学报 ● 信息科学版, 2005, 30(3): 274-277.
    [19] 柴艳菊, 欧吉坤, 韩保民.  异常形变检测方法探讨 . 武汉大学学报 ● 信息科学版, 2002, 27(4): 372-376.
    [20] 任来平, 赵俊生, 翟国君, 黄谟涛.  机载激光测深海面扫描轨迹计算与分析 . 武汉大学学报 ● 信息科学版, 2002, 27(2): 138-142.
  • 加载中
图(6) / 表(2)
计量
  • 文章访问数:  1342
  • HTML全文浏览量:  56
  • PDF下载量:  595
  • 被引次数: 0
出版历程
  • 收稿日期:  2014-10-15
  • 刊出日期:  2016-06-05

利用经验约束规则和证据理论进行出租车异常轨迹检测

doi: 10.13203/j.whugis20140221
    基金项目:

    国家自然科学基金 Nos. 41371377,41231171

    国家863计划 No. 2012AA12A403-4

    深圳市科技研发资金 Nos. ZDSY20121019111146499, JSGG20121026111056204

    深圳市战略性新兴产业发展专项资金 No. JCYJ20121019111128765

    作者简介:

    周洋,博士生,主要研究方向为移动对象轨迹分析和时空模式挖掘。cleverzhouyang@whu.edu.cn

    通讯作者: 方志祥,博士,教授。zxfang@whu.edu.cn.
  • 中图分类号: P208

摘要: 提出了一种根据择路经验特征,利用证据理论检测出租车异常轨迹的方法。该方法考虑最短路径与轨迹长度的比值、规避路径代价、出行发生时间3个因素,利用证据理论综合这3个证据来判别轨迹的异常程度,检测出行距离和路径选择明显不同于正常情况下的异常轨迹。实验结果表明此方法能有效识别不符合正常认知的异常轨迹,不依赖于单一起始点和终点对(origin-destination,OD)中的轨迹数目,能快速处理海量GPS数据,可用于大规模浮动车数据择路行为分析前期的数据过滤。

English Abstract

周洋, 方志祥, 李清泉, 郭善昕. 利用经验约束规则和证据理论进行出租车异常轨迹检测[J]. 武汉大学学报 ● 信息科学版, 2016, 41(6): 797-802. doi: 10.13203/j.whugis20140221
引用本文: 周洋, 方志祥, 李清泉, 郭善昕. 利用经验约束规则和证据理论进行出租车异常轨迹检测[J]. 武汉大学学报 ● 信息科学版, 2016, 41(6): 797-802. doi: 10.13203/j.whugis20140221
ZHOU Yang, FANG Zhixiang, LI Qingquan, GUO Shanxin. Anomalous Taxi Trajectory Detection Based on Experiential Constraint Rules and Evidence Theory[J]. Geomatics and Information Science of Wuhan University, 2016, 41(6): 797-802. doi: 10.13203/j.whugis20140221
Citation: ZHOU Yang, FANG Zhixiang, LI Qingquan, GUO Shanxin. Anomalous Taxi Trajectory Detection Based on Experiential Constraint Rules and Evidence Theory[J]. Geomatics and Information Science of Wuhan University, 2016, 41(6): 797-802. doi: 10.13203/j.whugis20140221
  • 出租车轨迹广泛应用于城市动态监测[1]、商圈吸引力分析[2]、城市内人群出行模式分析[3-4]等方面。基于数据传输效率、存储空间等方面的考虑,大规模浮动车系统普遍采样率较低(40~120 s),使得发生在采样间隔中的乘客换乘无法记录,于是两段旅程有可能会被记录为一段轨迹。另外,有些出租车司机为赚取更多车费故意带乘客绕行较远路径等欺诈行为的发生,也会导致产生行驶距离和路径选择不合常理的路径。这些行为产生的异常轨迹淹没于真实数据集中,对后续的正常情况下司机择路行为分析、起始点和终点(origin-destination,OD)对之间的旅程开销分析等造成一定的干扰,而检测出租车异常轨迹有助于数据分析前期的数据过滤。另一方面,大多数出租车宰客纠纷还停留在投诉后人工判别的基础上,自动检测开销明显超出正常范畴的异常轨迹能为提高出租车服务的规范性提供一定的技术支持。

    常见异常轨迹的探测方法如支持向量机(support vector machine,SVM)、马尔柯夫时序分析等机器学习方法[5]需要较大样本数目用于学习训练,在出行量较少的OD区域的效果并不显著,且城市中出租车轨迹的OD对分布广泛且多样,用SVM等机器学习方法检测异常轨迹,需要对每一OD对都建立样本数据,花费开销较大。另一类基于密度和子轨迹特征等的轨迹分类法[6]难以应付采样稀疏和以路网为基础的GPS轨迹,且出租车轨迹分布并不均匀,难以确定密度阈值。文献[7]提出了一种基于iBAT的方法,构建伪轨迹序列探索同一或相似OD对的所有轨迹中“少”且“异于大多数”的异常轨迹。文献[8]提出了一种基于速度的出租车欺诈行为探测方法。文献[9]通过距离和密度特征利用证据理论检验异常轨迹。另外,也有方法将空间划分为格网[6, 9],GPS轨迹为伪格网序列,方法中所计算的行驶距离并不是出租车在实际路网中的行驶距离,并没有考虑到出租车行驶的城市背景,如路网、时间等因素。本文认为出租车的轨迹符合一定的时空约束和行为习惯,异常轨迹的行驶长度、择路行为会偏离正常认知,因此提出一种不依赖于样本数目,侧重于出行时空约束和经验规律的异常轨迹探测方法。

    Dempster-Shafer (D-S)证据理论[10]是一种不确定性推理和处理方法,不需要先验概率和条件概率就可以进行证据推理,同时可以依靠证据的积累不断缩小假设集,可以将“不确定”区分开来。利用D-S合成法则可以综合考虑多证据进行决策推理,处理不确定性问题和异常检测。本文从出租车出行的时空经验约束入手,以旅程距离、规避路径代价、出行发生时间等约束条件为判别证据,利用证据理论检验出行距离和路径选择明显不同于正常情况下的异常轨迹。该方法并不依赖于单一OD对中的轨迹数目,能快速处理海量GPS数据。

    • D-S证据理论中的识别框架Θ包含了所有可能的判别假设,各假设相互独立且互斥,有2Θ个子集。本文中用于异常轨迹检测有两种判别,分别为A={异常}、B={正常},则识别框架Θ={A,B},有{A}、{B}、{A,B}、共4种子集。

      ,存在基本概率分配(basic probability assignment,BPA)函数m(X),表示证据对命题X的信任程度,且m(X)满足m()=0且。BPA可通过检测数据或者人的经验给出。根据BPA,可计算证据对某假设X的信任函数Bel(X)和似然函数Pl(X)[10]

      (1)

      (2)

      式中,Bel(X)为包含在X中的所有子集的BPA之和,表示证据对X为真的信任程度;Pl(X)表示证据不怀疑X的程度;Bel(X)和Pl(X)分别表示证据对假设X为真信任程度的下限和上限,每个命题都有形式为 [Bel(X),Pl(X)]的判别结果,[Bel(X),Pl(X)]称为信度区间。

      本文选取距离约束、经验规避路段约束和时间约束3个指标作为证据判别轨迹的异常程度。

    • 乘客对距离、费用等因素的考虑,使得正常出租车的行驶路径满足一定的距离约束。引入参数Rd衡量实际行驶距离(GPS trajectory,GT)LGT与最短路径(shortest distance path,SDP)LSDP间的比率:

      (3)

      Rd的范围为(0,1],Rd越大,表明实际行驶路径与最短路径的长度差别越小;Rd越趋近于0,表明相比于最短距离,实际路径绕行的越远。一般而言,由于宰客和信息缺失所造成的异常轨迹都会有较大的绕路,即Rd的值较小。

    • 由于出租车司机对城市路网十分熟悉,且对城市交通状态具有充分全面的了解,所以其对路径规划有自己的经验和习惯。许多出租车由于拥堵、转向、驾驶习惯等原因,会牺牲一定的行驶距离来保证驾驶的顺畅和舒适度,有意识地规避最短路径中的某些路段而选择另外的替代路径。近年来,许多研究基于出租车寻路经验知识构建经验层级路网,进而进行导航路径的规划[11-12],均以出租车频繁通过的路段作为出租车司机的经验知识,结合速度、时间、联通度等指标进行路径优化导航。与前述研究有所区别的是,本文将最短路径中出租车司机经常拒绝的路段称为经验规避路段(experiential avoid road,EAR),EAR是属于最短路径但出租车并没有实际采纳的路段。EAR的寻找方式与经验路段的构建方式类似,本文以浮动车规避最短路径的频繁程度将所有EAR划分为N个等级。等级越高,说明规避该路段的轨迹越多。等级最低的路段说明规避属于偶发性现象。将出租车为了规避EAR而产生的绕行代价记为Ic,计算公式为:

      (4)

      式中,LGTd为实际轨迹中区别于最短路径部分的路段总长度;LSDPd(EARi)表示被规避最短路径中EAR路段的长度;wi为权重,由对应EAR所属的等级N决定。当LGTd=0时,说明实际路径与最短路径一致,没有花费代价,Ic=0;当LGTd≠0时,Ic越大,表明轨迹为了规避EAR绕行的代价越大。与正常绕行相比,异常轨迹的规避路段并不含有EAR或者存在EAR但绕行的代价十分离谱。

    • 一般而言,出租车在白天交通条件复杂的情况下产生绕行的概率较大,而在夜晚由于道路交通通达,不会产生拥堵,所以夜间发生的较大绕行通常为异常轨迹。本文为简便处理,将时间划分为白天模式(07:00~21:00)和夜间模式(22:00~06:00)。在白天模式中交通状况复杂,发生一定程度的绕路比较正常。在夜间模式中,交通畅通,绕行行为属于异常轨迹的可能性较大。时间约束判别能力较弱,更适合用作辅助性判别。

    • 本文以距离约束Rd和经验规避路段约束Ic作为主要证据逐一检验每一轨迹为异常的确定程度,时间约束为辅助判别,检验流程如图 1所示。多证据可通过Dempster合成规则进行正交运算得到综合的BPA函数,反映证据的联合作用。为避免证据冲突时产生的Zadeh悖论,本文采用Yager提出的合成规则[13]。Bel(A)表示认为轨迹属于异常的程度,Bel(A)越大 ,表示轨迹异常指数越高;Pl(A)表示不怀疑轨迹为异常的程度,Pl(A)越小,表明轨迹正常的指数越大,异常指数越低。一般来说,Bel(A)>50%的轨迹可判别为异常,Pl(A)<50%的路径可判别为正常,对于其他不确定情况,再结合时间进行辅助判别。例如,若Bel(A)处于40% ~ 50%之间,且发生时间为夜间,仍可判定为异常。

      图  1  算法流程

      Figure 1.  Flowchart of the Algorithm

    • 选取武汉市二环内区域作为实验区域(见图 2),采用武汉市超过10 000辆出租车的浮动车数据,数据采集时间为2012-09-07~2012-09-16(其中09-12~09-13数据丢失)共8 d的数据,采样间隔为60 s左右,经过地图匹配和轨迹恢复选择载客状态且起始点均处于实验区域的轨迹共587 820条。部分轨迹分布见图 2

      图  2  研究区域和出租车轨迹分布示例

      Figure 2.  Study Area and Samples of Taxi GPS Trajectories

    • 证据的选择直接影响最终的判别结果,所以有必要考察每个证据指标的特征。计算每条轨迹对应的最短路径和Rd,并统计基本信息如表 1

      表 1  实验数据统计

      Table 1.  Statistical Description of Traces in Different Rd

      指标Rd≤1Rd<1Rd≤1/1.25Rd≤1/1.5
      轨迹数目 587 820 362 008 23 547 7 101
      占所有轨迹百分比 100% 61.6% 4% 1.2%
      平均GT长度/m 3 795 5 052 7 013 8 208
      平均SDP长度/m 3 606 4 557 4 708 4 408
      平均Rd 0.97 0.92 0.69 0.56

      表 1可以看出,实际路径长度超过最短路径长度1.5倍的轨迹(即Rd ≤ 1/1.5)在数据中所占的比例并不算高(1.2%),但其平均最短路径长度和实际轨迹长度都高于整体数据,说明绕路较易发生在距离较远的出行中。

      图 3为EAR层级图,以道路R1为例具体说明司机绕行EAR的原因。图 3(b)R1位于主干道中山大道,由于该处地处商业最繁华地段,交通流量大,所以许多司机绕行R2(沿江大道)和其他低等级道路,如图 4(a)图 4(b)R1R2在24 h内每10 min的平均速度对比,可以看见R2南北走向的两条路段的平均速度明显高于R1。另外,长江隧道也是绕行发生较大的地方,主要原因在于长江隧道一旦发生拥堵,司机将没有其他应变措施以选择其他替代路径。

      图  3  出租车经验规避路段等级(EAR)

      Figure 3.  Experience Levels of Taxi EAR

      图  4  出租车经验规避路段说明

      Figure 4.  Illustrations of Taxi EAR

    • 本文以指标Rd、Ic为主要判断证据,在计算绕行代价Ic时,采用w表示EAR等级从高到低的权重[11]。初始BPA设定如表 2,设置m(Θ={A,B})=0.1有助于避免证据冲突所带来的判定错误。

      表 2  初始概率分配函数BPA值

      Table 2.  Default BPA Valuse for Each Set

      RdIc
      0.1 <Rd <0.9Rd≤0.1或 Rd≥0.9 0.1 <Ic <0.9 Ic≤0.1或 Ic≥0.9
      m({A}) 1-Rd-0.05 1-Rd Ic-0.05 Ic
      m({B}) Rd-0.05 Rd 1-Ic-0.05 Ic-0.05
      m(Θ={A,B}) 0.1 0 0.1 0

      图 5所示为本文方法检测的异常轨迹。由于Bel(A)表示怀疑轨迹属于异常的程度,Pl(A)表示不怀疑轨迹为异常的程度,从[Bel,Pl]值看,Bel(A)>50%的轨迹可判别为异常,Pl(A)<50%的路径可判别为正常。图 5(a)轨迹虽然异常度只有40.2%,但其发生时间为23:00,所以该绕行不合理程度较大,归类为异常。图 5(b)图 5(c)中轨迹Bel值较大,为78.4%和96.2%,属于较明显异常,一般情况下,司机不会主动选择这些路径,其产生原因可能为中间的乘客换乘没有记录使两段旅程合并为一段旅程或者恶意宰客。

      图  5  异常检测结果及D-S异常指数示例

      Figure 5.  Examples of Anomalous Detection Results and Their D-S Indices

      将本文实验结果与文献[5]中的SVM方法以及人工判读结果相比较(见图 6)。本文方法选取通过某一OD对的所有轨迹(共有391条轨迹,其中9条与最短路径相同),将所提基于D-S的方法检测的异常指数区间以Bel(A)值升序排列、Pl(A) 值降序排列,序列号越大异常度越大,如图 6(b)。SVM方法仅考虑了将轨迹的线型形态作为特征向量,其结果较大程度地依赖于样本训练的好坏,所以与样本中的异常轨迹形态差别较大的异常轨迹无法得到识别。本文所提基于D-S的方法对较大程度的异常检测良好,但对某些轨迹的局部异常效果不佳。由图 6可以看出,本文结果基本与人工判读结果较一致,明显好于SVM的检测效果。

      图  6  3种方法结果对比

      Figure 6.  Result Comparison of Three Methods

    • 对于大量的浮动车数据而言,OD 分布广泛多样,以往以同一OD对中大多数相似轨迹为参照寻找异常轨迹的方法计算开销非常大,且其效果在样本量少的情况并不理想。本文提出了一种基于证据理论和出租车出行时空约束和择路经验特征的出租车异常轨迹检测方法,通过证据理论对每条轨迹都给定一个异常度区间[Bel,Pl],能有效检测行驶轨迹超出正常范畴较为明显的轨迹。本文提出的方法不基于OD对之间的样本数目,通过约束条件判定轨迹的异常度。实验结果表明该方法对异常轨迹效果很好,可用于司机择路行为分析前期的数据过滤。

      下一步工作可结合道路等级、速度限制、突发事件等更丰富的交通信息,以及司机行驶过程中的转向次数等更丰富的行为证据检测异常轨迹。

参考文献 (13)

目录

    /

    返回文章
    返回