-
城市交通拥堵的问题在欧洲城市快速发展时期就逐步显现,是各个国家在城市化进程中共同面临的难题。交通拥堵或交通事故发生后,如果不能及时准确地获取拥堵或事故的时间、位置和严重程度等信息,交通管控部门就很难做出正确的调控解决方案,且拥堵沿路网持续扩散或将造成二次事故。由交通拥堵引发的问题也是多方面的,仅依靠增加供给已经不能满足居民对出行的要求[1]。因此,对交通拥堵的检测和管控能力亟需提升,以分析拥堵的演变规律,进而制定相应的交通治理策略。
依据拥堵发生的空间特性,可以将拥堵分为路段拥堵、区域拥堵和设施点处拥堵这3种类型。基于路段和区域的拥堵检测研究相对成熟,文献[2-6]利用浮动车数据(floating car data,FCD)估计道路运行速度或车辆行程时间,进而对路段交通运行状态进行检测;田薇等[7]利用从路段上下游检测器处获取的数据,实现路段交通拥堵的自动检测;牛嘉郡[8]利用交通视频数据,实现路段交通视频拥堵信息的自主检测;宋茜萌[9]以区域为检测单元,探测各个子区域的交通拥堵状况,从而实现对城市整体路网交通运行状态的监控和管理。但沈敬伟等[10]认为目前基于微观道路的方法存在缺陷,原因是缺少揭示城市交通信息时空分布规律的整体研究。现有设施点处拥堵检测研究[11-13]大多只针对交通事件,检测内容单一,且多利用固定交通检测器数据,以两个交通检测设备间的路段来定位交通事件,位置精度较为粗略。因此,本文结合交通拥堵的时空分布和演变特征,通过拥堵演变模型检测交通拥堵点及拥堵类型,实现拥堵的精细化检测。
依据数据源类型,拥堵检测方法可分为两类:(1)基于固定线圈[11,14-15]和监控设备[16-18]等固定交通检测器获取的数据进行检测,但固定交通检测器数据时效性差、数据质量低、布设成本高,且两个固定交通检测器之间存在检测盲点,拥堵检测结果偏离实际;(2)利用实时FCD进行动态、实时、全方位的拥堵检测[19]。FCD数据具有采集成本低、精度高、覆盖范围广等优势[20]。因此,本文利用FCD提取路段路况信息,提高拥堵分类检测的精度。
分类是一种提取刻画数据类的模型预测分析,通过模型分类器预测分类的类标号,在目标营销、医疗诊断和欺诈检测等领域广泛应用。在模型分类器训练阶段,其目标为构建描述数据类的分类器,如k最近邻(k nearest neighbor,kNN)分类、决策树分类和支持向量机(support vector machine,SVM)分类等。在分类阶段,需要对分类器预测的准确率进行评估,使用训练的模型对新数据进行分类。首先,拥堵点分类检测任务是发现不同类型拥堵点的交通运行状态变化规律,对拥堵点进行分类,因此,模型分类器的专业可解释性尤为重要。决策树模型分类器是类似于流程图的树结构,分类过程易于理解,可解释性强。其次,决策树学习和分类简单、快速,且能对高维数据进行分类,不需要进行参数设置,因此,本文采用决策树分类算法训练拥堵点分类模型。
综上,本文提出一种基于决策树的拥堵点分类检测方法。首先,提取时空维路况演变异常规则和异常模式,并以此划分拥堵类型,以拥堵点为单元,分析不同类型拥堵的时空演变模式;然后,利用FCD提取路段交通运行状态数据,以路段点为单元进行路况检测,对拥堵点进行分类标记后提取样本的速度属性集合;最后,提取数据集训练拥堵点分类决策树,应用于拥堵点的实时分类检测。
-
在对城市交通运行状态进行检测时,需将检测结果精细化。具体来说,实现检测结果精细化需要结合两方面:(1)根据交通拥堵的产生规律对不同拥堵模式进行分析,按照不同类型进行拥堵检测;(2)将拥堵检测单元细化至点。精细化的拥堵点检测结果将为城市交通管理提供有效的拥堵疏导和应急部署信息源。将路段等间隔划分,并将划分后的路段分别映射为点,即为路段点。假设路段点路况之间的时空相关性具有一阶马尔可夫性,即当前路段点是否拥堵只与最邻近的下游路段点相关,且只与前一个时间框架相关[21]。同时顾及空间维和时间维时空序列的异常探测[22],对不同类型拥堵的时空演变模式进行分析,进而提取各类拥堵点。
-
各地图应用平台中拥堵等级均分为4个等级,文献[23]中的拥堵评价指标体系利用路段平均行驶速度将拥堵等级划分为畅通、缓行、拥堵和严重拥堵,因此,路段上游至下游和上一时刻至当前时刻的路况演变均为16(4×4)种组合方式,表 1和表 2分别为T时刻空间维和时间维的路况演变异常规则,其中,“√”代表异常的路况演变。
表 1 T时刻上游至下游空间维路况演变异常规则
Table 1. Abnormal Rules of Evolution of Spatial Road Conditions from Upstream to Downstream at Time T
下游 上游 畅通 缓行 拥堵 严重拥堵 畅通 - - √ √ 缓行 - - - - 拥堵 √ √ √ √ 严重拥堵 √ √ √ √ 表 2 T-1至T时刻时间维路况演变异常规则
Table 2. Abnormal Rules of Evolution of Temporal Road Conditions from Time T-1 to Time T
T T-1 畅通 缓行 拥堵 严重拥堵 畅通 - - - - 缓行 - - - - 拥堵 √ √ √ √ 严重拥堵 √ √ √ √ 表 1中10种空间维路况演变可分为3种异常模式,即拥堵消散型(上游→下游:拥堵或严重拥堵→畅通)、增长型(上游→下游:畅通或缓行→拥堵或严重拥堵)和持续型(上游→下游:拥堵或严重拥堵→拥堵或严重拥堵)。
表 2中8种时间维路况演变可分为两种异常模式,即拥堵增长型(T-1时刻→T时刻:畅通或缓行→拥堵或严重拥堵)和持续型(T-1时刻→T时刻:拥堵或严重拥堵→拥堵或严重拥堵)。
同时顾及空间维和时间维路况异常模式,提取了交通事件性拥堵、继发性拥堵、事件持续性拥堵和持续性拥堵4种拥堵类型,如表 3所示。
表 3 基于时空维路况异常模式的拥堵类型
Table 3. Congestion Types Based on Spatiotemporal Dimension Abnormal Model
空间维 时间维 消散型 增长型 持续型 增长型 交通事件性拥堵 - 继发性拥堵 持续型 事件持续性拥堵 - 持续性拥堵 由表 3可知,依据4种拥堵类型在空间维和时间维的路况异常模式,可分析不同类型交通拥堵的演变模式,在此基础上,分类提取各时间段的交通拥堵点。
-
交通事件点即引发路段拥堵的交通事件的位置,其中,交通事件包括交通事故、路段维修和车辆故障等。
在空间维上,上游路段点的路况只与下游路段点的路况相关,即同一路段点的路况具有空间相关性。T时刻交通事件下的路况如图 1所示。
图 1中,路段被等间隔划分后映射为路段点,空间维下仅考虑路段拥堵(红色为拥堵或严重拥堵)和通畅(绿色为畅通)两种情况。若A点为交通事件点,“上游路段→A→下游路段”的等间隔路段点为“上游路段点→A'→下游路段点”,其路况空间序列演变模式为:拥堵→交通事件→通畅。在时间维上,当前时刻路段点的路况只与上一时刻的路况相关,即同一路段点的路况具有时间相关性。交通事件发生时连续时刻的路况如图 2所示。
图 2 交通事件发生时连续时刻路段点路况示意图
Figure 2. Schematic Diagram of Road Points Condition at Continuous Time When Traffic Event Occurs
图 2中,仅考虑路段拥堵(红色为拥堵或严重拥堵)和通畅(绿色为畅通或缓行)两种情况,其路况时间序列演变模式为:T-1时刻A'点通畅,T时刻变为拥堵。若T时刻某一路段点的路况时空序列满足交通事件性拥堵的时空维路况演变模式,则此路段点为T时刻的交通事件点。
相比常发性交通拥堵,由交通事件造成的拥堵蔓延至上游的速度更快。城市道路交通运行中的交通事件检测是道路交通智慧应急系统部署的重要任务。将拥堵点分类检测模型应用于引发交通拥堵的交通事件点检测研究,便于交通管控部门从微观层面分析交通拥堵的产生机理,同时交通事件信息可作为数据源接入交通应急管理系统。
-
在路段拥堵被有效疏缓之前,拥堵路段长度将随时间的推移向路段上游逐渐增加,将上游路段点中新增的拥堵点定义为继发性拥堵点。连续时刻拥堵路段的路段点路况示意图如图 3所示,T时刻
至 的路段点为继发性拥堵点。 图 3 连续时刻拥堵路段的路段点路况示意图
Figure 3. Schematic Diagram of Road Points Condition of Continuously Congested Road Section
图 3中,仅考虑路段拥堵(红色为拥堵或严重拥堵)和通畅(绿色为畅通或缓行)两种情况,T-1时刻
至 的路段点通畅, 下游路段点拥堵,T时刻拥堵向上游蔓延至路段点 ,若T时刻某一路段点的路况时空序列满足继发性拥堵的时空维路况演变模式,则此路段点为T时刻的继发性拥堵点。 由图 3可知,继发性拥堵点检测可用于监测拥堵蔓延至上游的严重程度,若在短时间内同一条道路中出现大量继发性拥堵点,说明该道路的交通流量较大,上游车辆不断涌入,下游拥堵未扩散之前拥堵将持续向上游扩散,此时,应针对上游车辆采取分流的拥堵治理策略。
-
交通事件发生后,交通事件点在一定时间段内极可能保持持续拥堵的状态,因此,需对交通事件点的持续过程进行监测。事件持续点是指交通事件发生后,仍保持持续拥堵状态的交通事件点。交通事件下连续时刻的路段点路况示意图如图 4所示,T时刻A'点为事件持续点。
图 4 交通事件下连续时刻的路段点路况示意图
Figure 4. Schematic Diagram of Road Points Conditions at Continuous Time Under Traffic Events
由图 4可知,仅考虑路段拥堵(红色为拥堵或严重拥堵)和通畅(绿色为畅通)两种情况,假设T-1时刻A'点为交通事件点,T时刻交通事件引起的拥堵仍未缓解,表现为持续拥堵的状态。若某一路段点的路况时空序列满足事件持续性拥堵的时空维路况演变模式,则此路段点为事件持续点。事件持续点检测可用于监测交通事件的严重程度。检测交通事件拥堵点及其持续拥堵点可用于监测交通事件的持续时间,同时,可作为应急数据源接入应急管理系统。
-
持续性拥堵点是指某一时刻发生拥堵,且前一时刻仍为拥堵的路段点。连续时刻拥堵路段的路段点路况示意图如图 5所示,T时刻
至 的路段点为持续性拥堵点。 图 5 连续时刻拥堵路段的路段点路况示意图
Figure 5. Schematic Diagram of Road Points Condition of Continuously Congested Road Section
由图 5可知,仅考虑路段拥堵(红色为拥堵或严重拥堵)和通畅(绿色为畅通或缓行)两种情况,T-1时刻
至 的路段点拥堵,且T时刻仍为拥堵状态,若某一路段点的路况时空序列满足持续性拥堵的时空维路况演变模式,则此路段点为持续性拥堵点。持续性拥堵点检测可用于监测持续拥堵的路段点,有助于交通管理人员及时发现并优先疏缓瓶颈路段。 -
决策树算法是一种有效的规则提取方法[24],在拥堵点检测的实际应用中,决策树算法提取到的规则可用于实时性的拥堵分类检测。首先,要提取路况时空序列;然后,根据各类拥堵模式对路段点的拥堵类型进行标记;最后,选定属性集合用于决策树训练。
-
以路段为单元的拥堵检测存在两个弊端:(1)若以两个路口之间的路段为基本检测单元,每个单元内存在检测盲点,导致检测结果准确性较差;(2)若以动态分段的路段为基本检测单元,各单元、各时段的路段长度极有可能相差较大,很难对路段的路况进行时空演变模式分析。
因此,需要将路段划分为等间隔的路段点,提取路段点路况时空序列后,可根据不同类型拥堵的路况演变模式分类检测拥堵点。路况检测时间间隔一般为3~10 min,文献[23]和本文中涉及的路段路况检测均以出租车全球定位系统(global positioning system,GPS)数据为数据基础,因此,参照文献[23]将时间间隔设为5 min;路段划分间隔一般为100~400 m[12],为使拥堵点检测结果在不冗余的条件下检测精度最高,本文将路段划分间隔确定为100 m,路段长度不足100 m的不进行划分。
提取路段点路况时空序列可分为3个步骤:(1)路段路况检测:基于出租车GPS数据对路段平均行驶速度以及拥堵等级进行检测,并以路况值代表不同的拥堵等级(畅通、缓行、拥堵和严重拥堵)。(2)路段等间隔划分:将每条路段按照一定的间隔进行划分,并将划分的子路段转为点要素,即为路段点。(3)路况时空序列提取:若
为路段 等间隔划分后的路段点, 为路段 在 时刻被虚拟划分的若干连续子路段,且各子路段路况状态一致。假设路段点 对应 时刻的虚拟子路段 , , ,则 时刻路段点 的路况值 , 为虚拟子路段 在 时刻的路况值。 在
时刻,沿交通流方向连续提取路段 各路段点的路况,以一维矩阵[ ]T的形式组织,即为此路段在当前时刻的路况空间序列;连续提取当前路段在各时刻的路况空间序列,以二维矩阵 的形式组织, 即为此路段在特定时间段( )内的路况时空序列,其表达式为: -
根据不同类型拥堵的时空演变模式,提取路段点路况分类标记的规则,如表 4所示。
表 4 路段点路况分类标记规则
Table 4. Road Points Condition Classification Marking Rules
C [3, 4] 1 [1, Sit) 1 1 [3, 4] [Sit [1, 3) [3, ] 2 [3, 4] 1 [3, 4] 1 3 [3, 4] [3, 4] [3, 4] [3, 4] 4 表 4中,
为从某条路段交通流上游起第 个路段点在上一时刻 的路况值,取值为 中的整数,1、2、3和4分别代表畅通、缓行、拥堵和严重拥堵,从该路段交通流上游起第 个路段点在当前时刻 的路况值 与路况值 、 和 在空间维和时间维上相关,共同决定第 个路段点在当前时刻的拥堵类别;C为拥堵点类别,类别1、2、3、4分别代表交通事件点、继发性拥堵点、事件持续点、持续性拥堵点,若第 个路段点在当前时刻 的路况值 与 、 、 同时满足表 4中某一类别对应的规则,则该路段点在当前时刻的拥堵点属于该类别。若条件 ,且 , , 成立,则此条道路第 个路段点在 时刻的类别标记为1,表示发生交通事件,若不满足表 4中的4项规则,则划分为其他类别,C标记为5。 -
路况时空序列以拥堵等级为数据属性,属离散数据,不利于实时性、精细化的拥堵点分类检测,不能直接作为本文的数据集,需进一步提取连续数据属性张成的样本空间。路段点
和最近邻下游路段点 在时刻 和时刻 的路况示意图如图 6所示。 根据不同类型的交通拥堵演变模式,
与 、 和 在空间维和时间维上相关,每一时刻各路段点的路况又由路段平均行驶速度决定,因此,需要提取速度属性集V= = ,其中, 为 在当前时刻 的路段平均行驶速度。按属性集合提取样本空间后,与分类标记列共同组成实验数据集。 -
决策树是分类算法中一种常用的分类模型,是由一个根节点、多个内部节点和多个叶节点组成有多个分支的树形决策结构。决策树学习的目的是产生强泛化能力的决策树,对于新的待分类实例,从根节点开始,根据最优划分属性选择结果将该实例划分至相应节点,直至该实例被划分至叶节点,此时该实例被划分为叶节点代表的类别。CART分类树算法是在ID3(iterative dichotomiser 3)决策树算法基础上进行优化的二叉分类树算法,相比ID3和其改进算法C4.5,CART分类树算法具有以下两方面的优势:(1)ID3仅支持特征离散的数据集,而CART分类树算法同时支持特征离散和连续的数据处理。本文数据集属性集合中均为连续数据,因此,CART分类树算法更适合拥堵点分类决策树学习。(2)决策树学习选择内部节点的最优划分属性时,ID3和C4.5分别采用运算较为复杂的信息增益和增益率,CART分类树算法使用基尼指数对最优划分属性选择模型进行简化,并选择基尼指数最小的属性作为该节点的最优划分属性。CART分类树算法训练模型时效率高,有助于提升实时拥堵点分类检测的时效性。
对于给定的数据集D,其基尼值的表达式为:
式中,
表示数据集 中的类别数; 表示属于第k个类别的样本数量; 表示数据集 中的样本总量。基尼指数反映了数据集中数据的纯度,基尼指数越小,数据集纯度越高。 若给定属性A,其某个取值将数据集
划分为 和 ,此时属性A的基尼值的表达式为: 首先,本文拥堵点分类决策树学习采用CART分类树算法对每个训练样本进行学习,得到初始决策树后使用网格搜索法产生所有可能的剪枝后的树;然后,采用交叉验证法,基于基尼指数选择泛化能力最好的剪枝策略,以此作为最终的拥堵点分类决策树模型;最后,对模型分类检测的正确率和召回率进行评估。
-
出租车GPS数据包含该车辆位置的经纬度、行驶速度、行驶方向等基本字段数据,可以用于交通运行状态判别[4]。实验数据为上海市2007-02-20T07:00~24:00的出租车数据,根据GPS点分布范围选取研究区域,共有GPS点6 079 902个,研究路段为研究区域内的主干道。
数据集提取步骤:(1)路段路况检测。根据GPS点所在路段及其瞬时速度大小估计相应路段的平均行驶速度,划分拥堵等级后作为路况时空序列提取的数据源;(2)拥堵点分类标记。提取路况时空序列后,按照分类标记规则对交通事件点、继发性拥堵点、事件持续点、持续性拥堵点和其他类型拥堵点进行标记;(3)按照属性集合
提取样本空间;(4)数据集提取。在样本空间添加标记列,组合为实验数据集。按照以上流程共提取283 528个拥堵点样本,部分数据集如表 5所示,用于学习拥堵点分类决策树。 表 5 实验数据集(部分)
Table 5. Experimental Dataset (Part)
编号 v1/(km h-1) v2/(km h-1) v3/(km h-1) v4/(km h-1) C 编号 v1/(km h-1) v2/(km h-1) v3/(km h-1) v4/(km h-1) C 1 5.333 67.000 12.667 54.000 1 9 3.000 50.571 7.000 52.167 3 2 5.000 43.000 46.000 46.000 1 10 11.500 11.500 5.400 5.400 4 3 1.000 38.500 53.333 53.333 1 11 3.200 3.200 4.000 4.000 4 4 5.333 5.333 28.500 28.500 2 12 17.500 4.000 3.333 3.333 4 5 11.000 12.400 36.000 36.000 2 13 10.000 42.333 14.000 14.000 5 6 18.000 18.000 20.000 20.000 2 14 15.000 22.000 47.000 59.000 5 7 10.000 34.000 5.000 36.941 3 15 16.000 16.000 37.200 8.000 5 8 4.800 43.286 6.000 34.000 3 -
将原始数据集按照7∶2∶1的比例划分为训练集、测试集和独立的验证集[25],采用CART分类树算法在训练集上训练出原始决策树,为了防止对训练集的过拟合,需要对原始决策树进行剪枝。
本文采用后剪枝的方式,使用网格搜索法产生所有可能的剪枝后的树,通过交叉验证法在各独立测试集上计算各子树的基尼指数,从中选择基尼指数最小的子树作为最优子树,最终生成最优拥堵点分类决策树。由训练集学习生成的最优拥堵点分类树如图 7所示。
图 7 由训练集生成的最优拥堵点分类决策树
Figure 7. Optimal Decision Tree of Congestion Point Classification Generated by Training Set
用最优拥堵点分类树提取的规则,根据各时段、各路段点的平均行驶速度分类检测拥堵点。分别提取12:00和12:05连续时刻的路况和拥堵点,对部分检测结果进行可视化分析,可视化结果如图 8所示,各类型拥堵点均被精细地检测,且拥堵点均沿拥堵路段分布。对比连续时刻同一区域的放大图可以看出,拥堵点分类检测结果符合各类型拥堵的时空演变模式。
-
经过训练得到最优拥堵点分类决策树模型后,利用测试集对训练的决策树模型进行评估。采用混淆矩阵的形式对测试结果进行分析,混淆矩阵是监督学习中评价分类算法性能的一种可视化形式,表示为n×n大小的矩阵,n为类别数。混淆矩阵的每一行代表真实类别中的实例,每一行真实类别实例的总数代表该类别的真实实例个数,每一列代表预测类别中的实例个数,每一列预测类别实例的总数代表该类别的预测实例个数。
将测试集的预测结果以混淆矩阵的形式进行可视化,如图 9所示。由图 9可以看出,总体上各类别的预测结果沿混淆矩阵的对角线分布,说明决策树对测试集的分类正确率较高,即对各类别拥堵点的预测效果较好。
为进一步对训练模型进行评估,训练SVM分类模型,以拥堵点分类的正确率、召回率和F1值为评价指标,对测试集的预测结果进行量化评估,各项指标的计算结果如表 6所示。
表 6 模型评估结果对比
Table 6. Comparison of Evaluation Results of Different Models
方法 C 正确率 召回率 F1值 样本数 训练时长/s 本文分类决策树模型 1 1.00 0.98 0.99 770 21.11 2 1.00 1.00 1.00 36 455 3 0.79 0.97 0.87 74 4 1.00 1.00 1.00 17 979 5 0.98 1.00 0.99 1 428 均值 0.95 0.99 0.97 SVM分类模型 1 0.99 0.63 0.77 770 5 337.89 2 1.00 1.00 1.00 36 455 3 1.00 0.01 0.03 74 4 1.00 1.00 1.00 17 979 5 0.73 0.98 0.84 1 428 均值 0.94 0.72 0.73 由表 6可知,在模型测试结果方面,本文分类决策树模型总体分类正确率为0.95,召回率为0.99,F1值为0.97,均优于SVM分类模型的测试结果,训练得到的分类决策树模型泛化能力很好,能够准确地检测拥堵点的类别。相比其他类别的拥堵点,决策树模型在检测事件持续点时的正确率稍低,其原因是事件持续性拥堵在城市交通运行中发生的次数较少,从而导致训练集中此类拥堵点较少,训练的决策树模型对事件持续点的分类正确率略低于其他类别。但在拥堵点分类检测应用于实际后,随着事件持续点历史数据的累积,拥堵点分类决策树模型的分类效果将趋于优化。在模型训练时效方面,本文分类决策树模型训练时长为21.11 s,远小于SVM分类模型的训练时长。综合以上分析,本文分类决策树模型能够实现准确、完整、快速的拥堵点分类检测。
-
拥堵检测是城市交通管控的重要工作之一,精细化的拥堵检测可以满足实际工作中对拥堵成因及演变规律分析的需求。本文提出一种基于CART分类树的交通拥堵点分类检测方法,一方面在以往路段拥堵检测的基础上增加拥堵点检测,细化了拥堵检测的基本单元;另一方面增加了对拥堵点类型的检测。对拥堵点进行分类检测有助于交通管理部门快速获取拥堵相关信息,掌握交通拥堵的时空演变规律,提升交通治理工作效率。相比SVM分类模型,本文训练得到的拥堵点分类决策树模型具有较好的泛化性能,且在拥堵点分类检测的实际应用中,可以利用相关路段的速度实时检测拥堵,判别拥堵类型。
今后工作将进一步扩大各类型样本数量,并基于训练得到的决策树模型设计与实现精细化拥堵检测系统,实现智能化城市交通拥堵管理技术的应用。
-
摘要: 交通拥堵检测是城市交通管理工作的重点和难点之一,现有的拥堵检测以路段为单位,不利于拥堵时空演变规律信息的提取,且检测内容大多只涉及拥堵程度,缺少对拥堵类型的识别。基于CART(classification and regression tree)分类树算法,提出一种以路段点为检测单元的拥堵点分类检测方法,该方法可根据路段平均行驶速度实时检测拥堵点及其类型。首先,将路段等距离划分后映射为路段点,根据时空维路况异常规则和异常模式,以路段点为单元分析了4种拥堵类型的时空演变模式;其次,在路段路况检测的基础上,提取路段点路况时空序列,根据不同类型的拥堵模式对路况时空序列进行分类标记;然后,选取4种速度指标作为样本属性集合,按照属性集合提取各路段点在各时段的速度,以此作为决策树学习的数据集;最后,基于CART分类树算法,采用交叉验证的方式训练出最优模型,使其达到最佳的泛化能力。与支持向量机(support vector machine, SVM)分类模型进行比较,实验结果表明,该方法在分类检测交通拥堵点时具有较高的正确率和召回率,且分类检测时效性较好。Abstract:
Objectives Traffic congestion detection is one of the key points and difficulties of urban traffic management. The existing congestion detection methods are based on road sections, which is not conducive to the extraction of spatiotemporal evolution information of congestion. Moreover, most of the detection only involves the degree of congestion but lacks the congestion type identification. With the classification and regression tree (CART) algorithm, this paper proposes a method for the classification and detection of traffic congestion points, which takes the road section point as the detection unit. In the practical application of this method, congestion points and their categories can be detected in real time according to the average running speed on the road section. Methods Firstly, the road section is divided at a specific interval and mapped to be road section points. According to the abnormal rules and patterns of spatiotemporal road conditions, the spatiotemporal evolution patterns of four congestion types are analyzed with road section points as units. Secondly, the spatial and temporal sequence of road conditions of road section points is extracted on the basis of the road condition detection of road sections, and the spatial and temporal sequence of road conditions is classified and labeled according to different congestion types. Thirdly, four speed indexes are selected to constitute the attribute set of samples, and the speed of each road section point at each period is extracted according to the attribute set, which forms the dataset of decision tree learning. Finally, with the CART algorithm, the optimal model is obtained by the training with cross-validation to achieve the best generalization ability. Results This paper proposes a classification and detection method of traffic congestion points based on CART. On one hand, congestion point detection is added to refine the basic unit of congestion detection, and on the other hand, congestion point type detection is also involved. Classification and detection of congestion points is helpful to improve the efficiency of traffic management. Conclusions The proposed method is compared with the support vector machine classification model, and the experimental results show that the method in this paper has higher accuracy, higher recall rate, and better classification and detection timeliness. -
表 1 T时刻上游至下游空间维路况演变异常规则
Table 1. Abnormal Rules of Evolution of Spatial Road Conditions from Upstream to Downstream at Time T
下游 上游 畅通 缓行 拥堵 严重拥堵 畅通 - - √ √ 缓行 - - - - 拥堵 √ √ √ √ 严重拥堵 √ √ √ √ 表 2 T-1至T时刻时间维路况演变异常规则
Table 2. Abnormal Rules of Evolution of Temporal Road Conditions from Time T-1 to Time T
T T-1 畅通 缓行 拥堵 严重拥堵 畅通 - - - - 缓行 - - - - 拥堵 √ √ √ √ 严重拥堵 √ √ √ √ 表 3 基于时空维路况异常模式的拥堵类型
Table 3. Congestion Types Based on Spatiotemporal Dimension Abnormal Model
空间维 时间维 消散型 增长型 持续型 增长型 交通事件性拥堵 - 继发性拥堵 持续型 事件持续性拥堵 - 持续性拥堵 表 4 路段点路况分类标记规则
Table 4. Road Points Condition Classification Marking Rules
C [3, 4] 1 [1, Sit) 1 1 [3, 4] [Sit [1, 3) [3, ] 2 [3, 4] 1 [3, 4] 1 3 [3, 4] [3, 4] [3, 4] [3, 4] 4 表 5 实验数据集(部分)
Table 5. Experimental Dataset (Part)
编号 v1/(km h-1) v2/(km h-1) v3/(km h-1) v4/(km h-1) C 编号 v1/(km h-1) v2/(km h-1) v3/(km h-1) v4/(km h-1) C 1 5.333 67.000 12.667 54.000 1 9 3.000 50.571 7.000 52.167 3 2 5.000 43.000 46.000 46.000 1 10 11.500 11.500 5.400 5.400 4 3 1.000 38.500 53.333 53.333 1 11 3.200 3.200 4.000 4.000 4 4 5.333 5.333 28.500 28.500 2 12 17.500 4.000 3.333 3.333 4 5 11.000 12.400 36.000 36.000 2 13 10.000 42.333 14.000 14.000 5 6 18.000 18.000 20.000 20.000 2 14 15.000 22.000 47.000 59.000 5 7 10.000 34.000 5.000 36.941 3 15 16.000 16.000 37.200 8.000 5 8 4.800 43.286 6.000 34.000 3 表 6 模型评估结果对比
Table 6. Comparison of Evaluation Results of Different Models
方法 C 正确率 召回率 F1值 样本数 训练时长/s 本文分类决策树模型 1 1.00 0.98 0.99 770 21.11 2 1.00 1.00 1.00 36 455 3 0.79 0.97 0.87 74 4 1.00 1.00 1.00 17 979 5 0.98 1.00 0.99 1 428 均值 0.95 0.99 0.97 SVM分类模型 1 0.99 0.63 0.77 770 5 337.89 2 1.00 1.00 1.00 36 455 3 1.00 0.01 0.03 74 4 1.00 1.00 1.00 17 979 5 0.73 0.98 0.84 1 428 均值 0.94 0.72 0.73 -
[1] 朱明皓. 城市交通拥堵对社会经济发展的动力学机制与疏导策略[M]. 北京: 电子工业出版社, 2017 Zhu Minghao. Dynamic Mechanism and Dispersal Strategy of Social Economic Impact on Urban Traffic Congestion[M]. Beijing: Publishing House of Electronics Industry, 2017 [2] Kerner B S, Demir C, Herrtwich R G, et al. Traffic State Detection with Floating Car Data in Road Networks[C]//IEEE Intelligent Transportation Systems, Vienna, Austria, 2005 [3] 付子圣, 李秋萍, 柳林, 等. 利用GPS轨迹二次聚类方法进行道路拥堵精细化识别[J]. 武汉大学学报·信息科学版, 2017, 42(9): 1264-1270 doi: 10.13203/j.whugis20150036 Fu Zisheng, Li Qiuping, Liu Lin, et al. Identification of Urban Network Congested Segments Using GPS Trajectories Double-Clustering Method[J]. Geomatics and Information Science of Wuhan University, 2017, 42(9): 1264-1270 doi: 10.13203/j.whugis20150036 [4] 孙超, 张红军, 陈小鸿. 基于多源浮动车数据融合的道路交通运行评估[J]. 同济大学学报(自然科学版), 2018, 46(1): 46-52 https://www.cnki.com.cn/Article/CJFDTOTAL-TJDZ201801008.htm Sun Chao, Zhang Hongjun, Chen Xiaohong. Road Traffic Operation Assessment Based on Multi-source Floating Car Data Fusion[J]. Journal of Tongji University(Natural Science), 2018, 46 (1): 46-52 https://www.cnki.com.cn/Article/CJFDTOTAL-TJDZ201801008.htm [5] 曾伟良, 何兆成, 沙志仁, 等. 结合卡尔曼滤波的城市路段速度估计[J]. 测绘科学, 2013, 38(1): 96-99 https://www.cnki.com.cn/Article/CJFDTOTAL-CHKD201301032.htm Zeng Weiliang, He Zhaocheng, Sha Zhiren, et al. Urban Link Speed Estimation with Kalman Filter [J]. Science of Surveying and Mapping, 2013, 38 (1): 96-99 https://www.cnki.com.cn/Article/CJFDTOTAL-CHKD201301032.htm [6] Yin X T, Ma C Q, Qu L P. The Analysis of Urban Road Traffic State Based on Kinds Floating Car Data [J]. Applied Mechanics and Materials, 2014, 694: 80-84 doi: 10.4028/www.scientific.net/AMM.694.80 [7] 田薇, 张锦明. 拥堵路段的判断与分析[J]. 遥感信息, 2017, 32(1): 149-154 https://www.cnki.com.cn/Article/CJFDTOTAL-YGXX201701029.htm Tian Wei, Zhang Jinming. Judgment and Analysis of Congested Road[J]. Remote Sensing Information, 2017, 32(1): 149-154 https://www.cnki.com.cn/Article/CJFDTOTAL-YGXX201701029.htm [8] 牛嘉郡. 基于视频处理的道路交通流跟踪统计系统设计与实现[D]. 成都: 电子科技大学, 2018 Niu Jiajun. Design and Implementation of Traffic Flow Tracking Statistics System Based on Video Processing[D]. Chengdu: University of Electronic Science and Technology of China, 2018 [9] 宋茜萌. 基于公交车轨迹数据的交通拥堵区域检测[D]. 大连: 大连理工大学, 2017 Song Ximeng. Detection of Traffic Congestion Regions Based on Bus Trajectory Data[D]. Dalian: Dalian University of Technology, 2017 [10] 沈敬伟, 周廷刚, 朱晓波. 基于GPS浮动车数据的交通信息时空分布研究[J]. 西南大学学报(自然科学版), 2015, 37(8): 157-162 https://www.cnki.com.cn/Article/CJFDTOTAL-XNND201508026.htm Shen Jingwei, Zhou Tinggang, Zhu Xiaobo. On the Spatial and Temporal Distribution of Traffic Information Based on GPS Floating Car Data[J]. Journal of Southwest University (Natural Science Edition), 2015, 37(8): 157-162 https://www.cnki.com.cn/Article/CJFDTOTAL-XNND201508026.htm [11] Persaud B N, Hall F L. Catastrophe Theory and Patterns in 30-Second Freeway Traffic Data: Implications for Incident Detection[J]. Transportation Research Part A: General, 1989, 23(2): 103-113 doi: 10.1016/0191-2607(89)90071-X [12] 颜安. 基于GPS浮动车的城市道路交通事件检测技术研究[D]. 西安: 长安大学, 2010 Yan An. Study on the Technology of Traffic Incident Detection for Urban Road Based on GPS Equipped Floating Car[D]. Xi?an: Chang?an University, 2010 [13] 隋靓, 党建武. 基于运动目标轨迹的高速公路异常事件检测算法研究[J]. 计算机应用与软件, 2018, 35(1): 246-252 https://www.cnki.com.cn/Article/CJFDTOTAL-JYRJ201801044.htm Sui Jing, Dang Jianwu. Traffic Anomaly Detection Based on Moving Object Trajectory[J]. Computer Applications and Software, 2018, 35(1): 246-252 https://www.cnki.com.cn/Article/CJFDTOTAL-JYRJ201801044.htm [14] 庞根明. 城市道路交通事件自动检测方法研究[D]. 长春: 吉林大学, 2007 Pang Genming. Study on the Methods of Automatic Incident Detection for Urban Road[D]. Changchun: Jilin University, 2007 [15] 余思远, 杜豫川. 城市快速路瓶颈拥堵分析[J]. 交通科学与工程, 2018, 34(1): 93-98 https://www.cnki.com.cn/Article/CJFDTOTAL-CSJX201801017.htm Yu Siyuan, Du Yuchuan. Analysis on the Congestion of Bottlenecks in Urban Expressway[J]. Journal of Transport Science and Engineering, 2018, 34 (1): 93-98 https://www.cnki.com.cn/Article/CJFDTOTAL-CSJX201801017.htm [16] Lozano A, Manfredi G, Nieddu L. An Algorithm for the Recognition of Levels of Congestion in Road Traffic Problems[J]. Mathematics and Computers in Simulation, 2009, 79(6): 1926-1934 [17] 方勇, 党倩, 万剑, 等. 基于深度学习的道路交通拥堵检测[J]. 智能城市, 2018, 4(23): 1-3 https://www.cnki.com.cn/Article/CJFDTOTAL-ZNCS201823002.htm Fang Yong, Dang Qian, Wan Jian, et al. Road Traffic Congestion Detection Based on Deep Learning[J]. Intelligent City, 2018, 4(23): 1-3 https://www.cnki.com.cn/Article/CJFDTOTAL-ZNCS201823002.htm [18] 孙慧, 姜宝华. 道路拥堵视频监控信息智能检测仿真[J]. 计算机仿真, 2018, 35(5): 431-434 https://www.cnki.com.cn/Article/CJFDTOTAL-JSJZ201805095.htm Sun Hui, Jiang Baohua. Intelligent Detection and Simulation of Road Congestion Video Surveillance Information[J]. Computer Simulation, 2018, 35 (5): 431-434 https://www.cnki.com.cn/Article/CJFDTOTAL-JSJZ201805095.htm [19] 王冬根, 孙冰夏, 宋璟璐. 利用被动式GPS数据的交通行为信息提取方法: 发展现状及趋势[J]. 武汉大学学报·信息科学版, 2014, 39(6): 671-681 doi: 10.13203/j.whugis20140136 Wang Donggen, Sun Bingxia, Song Jinglu. Methods for Detecting Activity-Travel Behavior Information from Passive GPS Data: State-of-the-Art[J]. Geomatics and Information Science of Wuhan University, 2014, 39(6): 671-681 doi: 10.13203/j.whugis20140136 [20] 唐炉亮, 杨雪, 阚子涵, 等. 一种基于朴素贝叶斯分类的车道数量探测[J]. 中国公路学报, 2016, 29(3): 116-123 https://www.cnki.com.cn/Article/CJFDTOTAL-ZGGL201603018.htm Tang Luliang, Yang Xue, Kan Zihan, et al. Traffic Lane Numbers Detection Based on the Naive Bayesian Classification[J]. China Journal of Highway and Transport, 2016, 29(3): 116-123 https://www.cnki.com.cn/Article/CJFDTOTAL-ZGGL201603018.htm [21] Adeli H, Karim A. Fuzzy-Wavelet RBFNN Model for Freeway Incident Detection[J]. Journal of Transportation Engineering, 2000, 126 (6) : 464-471 [22] 邓敏, 石岩, 龚健雅, 等. 时空异常探测方法研究综述[J]. 地理与地理信息科学, 2016, 32 (6): 43-50 https://www.cnki.com.cn/Article/CJFDTOTAL-DLGT201606008.htm Deng Min, Shi Yan, Gong Jianya, et al. A Summary of Spatio-Temporal Outlier Detection[J]. Geography and Geo-Information Science, 2016, 32(6): 43-50 https://www.cnki.com.cn/Article/CJFDTOTAL-DLGT201606008.htm [23] 杨婷婷. 基于出租车GPS轨迹数据的实时交通状态获取和现有实时路况系统评估[D]. 上海: 华东师范大学, 2016 Yang Tingting. The Real-Time Traffic Status Acquirement and System Assessment Based on Taxis GPS Trajectory Data[D]. Shanghai: East China Normal University, 2016 [24] 李国和, 王峰, 郑阳, 等. 基于决策树生成及剪枝的数据集优化及其应用[J]. 计算机工程与设计, 2018, 39(1): 205-211 https://www.cnki.com.cn/Article/CJFDTOTAL-SJSJ201801036.htm Li Guohe, Wang Feng, Zheng Yang, et al. Optimization of Data Set and Its Application Based on Construction and Pruning of Decision Tree[J]. Computer Engineering and Design, 2018, 39(1): 205-211 https://www.cnki.com.cn/Article/CJFDTOTAL-SJSJ201801036.htm [25] 洪烨. 基于机器学习算法的糖尿病预测模型研究[D]. 哈尔滨: 哈尔滨工业大学, 2016 Hong Ye. Research on Diabetes Prediction Models Based on Machine Learning Algorithm[D]. Harbin: Harbin Institute of Technology, 2016 -