留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于约束高斯混合模型的车道信息获取

唐炉亮 杨雪 靳晨 刘章 李清泉

唐炉亮, 杨雪, 靳晨, 刘章, 李清泉. 基于约束高斯混合模型的车道信息获取[J]. 武汉大学学报 ● 信息科学版, 2017, 42(3): 341-347. doi: 10.13203/j.whugis20140965
引用本文: 唐炉亮, 杨雪, 靳晨, 刘章, 李清泉. 基于约束高斯混合模型的车道信息获取[J]. 武汉大学学报 ● 信息科学版, 2017, 42(3): 341-347. doi: 10.13203/j.whugis20140965
TANG Luliang, YANG Xue, JIN Chen, LIU Zhang, LI Qingquan. Traffic Lane Number Extraction Based on the Constrained Gaussian Mixture Model[J]. Geomatics and Information Science of Wuhan University, 2017, 42(3): 341-347. doi: 10.13203/j.whugis20140965
Citation: TANG Luliang, YANG Xue, JIN Chen, LIU Zhang, LI Qingquan. Traffic Lane Number Extraction Based on the Constrained Gaussian Mixture Model[J]. Geomatics and Information Science of Wuhan University, 2017, 42(3): 341-347. doi: 10.13203/j.whugis20140965

基于约束高斯混合模型的车道信息获取

doi: 10.13203/j.whugis20140965
基金项目: 

国家自然科学基金 41271442

国家自然科学基金 40801155

国家自然科学基金 41571430

国家自然科学基金 41671442

中国航天科技集团公司卫星应用研究院创新基金 2014_CXJJ-DSJ_02

详细信息
    作者简介:

    唐炉亮, 博士, 教授。从事时空GIS、交通GIS(GIS-T)和时空数据获取与分析等研究。tll@whu.edu.cn

    通讯作者: 杨雪, 博士生。yangxue@whu.edu.cn
  • 中图分类号: P208

Traffic Lane Number Extraction Based on the Constrained Gaussian Mixture Model

Funds: 

The National Natural Science Foundation of China 41271442

The National Natural Science Foundation of China 40801155

The National Natural Science Foundation of China 41571430

The National Natural Science Foundation of China 41671442

the Open Research Fund of the Academy of Satellite Application 2014_CXJJ-DSJ_02

More Information
    Author Bio:

    TANG luliang, PhD, professor, specializes in T-GIS, GIS-transportation. E-mail:tll@whu.edu.cn

    Corresponding author: YANG Xue, PhD candidate. E-mail:yangxue@whu.edu.cn
图(6) / 表(2)
计量
  • 文章访问数:  1132
  • HTML全文浏览量:  98
  • PDF下载量:  397
  • 被引次数: 0
出版历程
  • 收稿日期:  2015-05-22
  • 刊出日期:  2017-03-05

基于约束高斯混合模型的车道信息获取

doi: 10.13203/j.whugis20140965
    基金项目:

    国家自然科学基金 41271442

    国家自然科学基金 40801155

    国家自然科学基金 41571430

    国家自然科学基金 41671442

    中国航天科技集团公司卫星应用研究院创新基金 2014_CXJJ-DSJ_02

    作者简介:

    唐炉亮, 博士, 教授。从事时空GIS、交通GIS(GIS-T)和时空数据获取与分析等研究。tll@whu.edu.cn

    通讯作者: 杨雪, 博士生。yangxue@whu.edu.cn
  • 中图分类号: P208

摘要: 针对现有车道级道路信息获取方法大多存在数据采集成本高、更新周期长、数据处理难度大等缺点,提出了一种基于浮动车数据(floating car data,FCD)的城市车道数量信息快速获取方法。首先根据浮动车数据的空间分布特征,利用Delaunay三角网方法对数据进行优选,通过探测优选后浮动车数据覆盖的宽度间接得到道路宽度;然后将一部分已知车道数量及浮动车数据覆盖宽度的路段作为训练样本,分析其车道数量和浮动车数据覆盖宽度之间的关系构建基本分类器;最后按照待测路段的浮动车数据分布宽度查找基本分类器,获取待测路段可能存在的若干个车道数量类型候选值,并利用约束高斯混合模型对最终车道数量类型进行确认。实验结果表明,该方法实现了从低精度浮动车数据中快速获取车道数量信息,提取精度达到了82.3%。

English Abstract

唐炉亮, 杨雪, 靳晨, 刘章, 李清泉. 基于约束高斯混合模型的车道信息获取[J]. 武汉大学学报 ● 信息科学版, 2017, 42(3): 341-347. doi: 10.13203/j.whugis20140965
引用本文: 唐炉亮, 杨雪, 靳晨, 刘章, 李清泉. 基于约束高斯混合模型的车道信息获取[J]. 武汉大学学报 ● 信息科学版, 2017, 42(3): 341-347. doi: 10.13203/j.whugis20140965
TANG Luliang, YANG Xue, JIN Chen, LIU Zhang, LI Qingquan. Traffic Lane Number Extraction Based on the Constrained Gaussian Mixture Model[J]. Geomatics and Information Science of Wuhan University, 2017, 42(3): 341-347. doi: 10.13203/j.whugis20140965
Citation: TANG Luliang, YANG Xue, JIN Chen, LIU Zhang, LI Qingquan. Traffic Lane Number Extraction Based on the Constrained Gaussian Mixture Model[J]. Geomatics and Information Science of Wuhan University, 2017, 42(3): 341-347. doi: 10.13203/j.whugis20140965
  • 道路信息 (道路级别信息和车道级别信息) 是智能辅助驾驶系统应用的基础,其获取方法和精细程度随数据源和需求不断发展演变[1]。现有的道路信息获取方法按数据源不同,主要分为从图像数据中提取道路信息[2]、从激光点云数据中获取道路信息[3-4]以及从时空GPS轨迹数据中挖掘道路信息[5-6]三类。利用时空GPS轨迹大数据提取道路信息是目前研究的热点话题。Rogers[5]利用时空DGPS (difference global positioning system) 轨迹数据提取道路中心线以及车道边界线。随后在Rogers等研究的基础上,利用时空GPS轨迹数据获取道路信息逐渐发展成为一种端对端的模式[5-6],细化到城市道路的车道信息、复杂交叉口几何结构、转向信息等。文献[6]提出一种脱离原始地图的道路信息获取模式,该模式首先采用轨迹分类和融合方法从大量DGPS轨迹数据中提取道路级别信息,然后利用高斯混合模型从归属于每一条路段的大量轨迹数据中提取车道信息。利用高质量DGPS轨迹数据提取道路信息虽然具有精细程度高且精度可靠的特点,但是也存在数据采集成本高、周期长且无法反映因为交通管制、城市建设和车道功能改变等引起的道路信息变化的缺陷。

    安装GPS接收机的出租车通常被称为浮动车,其海量轨迹数据布满城市任何道路,是一种采集速度快、成本低、蕴含丰富车道信息的数据来源。利用低精度浮动车数据获取高精度道路信息室一个难点,而目前大量的研究仍然停留在道路级别信息的获取[7-18]。Uduwaragod等[12]利用核密度聚类方法从车载GPS轨迹数据中探测车道数量和车道线位置。本文针对浮动车数据的特点,提出了一种城市车道数量信息快速获取方法。该方法首先根据FCD (floating car data) 的空间分布特征,利用Delaunay三角网方法优选数据,通过探测优选后FCD覆盖的宽度间接得到道路宽度;然后将一部分已知车道数量及FCD覆盖宽度的路段作为训练样本,分析其车道数量和FCD覆盖宽度之间的关系构建基本分类器;最后根据待测路段的FCD分布宽度查找基本分类器,获取待测路段归属的若干个车道数量类型候选值,并利用约束高斯混合模型确认最终车道数量类型。实验结果表明,该方法实现了车道数量信息的快速获取,可以及时反映交通管制、城市建设和车道功能改变等引起的车道数变化。

    • 数万辆出租车每天行驶在城市大街小巷,以60 s左右的采样频率24 h不间断采集,数据涵盖的城市交通信息内容丰富、实时性强,并且海量轨迹布满城市任何道路和车道。但是,由于采集环境和装备等限制,使得原始FCD中夹杂了大量噪音信息。根据FCD轨迹方向信息,将道路面上行驶方向相反的FCD进行区分,然后对每一条路段上单向行驶的FCD进行特征分析。由于GPS误差服从正态分布,所以每一个轨迹点的位置与实际值的接近程度也服从正态分布。这种由单条轨迹分布蔓延至整条道路横截面上全部轨迹的分布状态叠加,使得分布在道路面上轨迹点的密度要明显高于道路面以外漂移点的密度,并且位于道路中心线处的密度值最高,然后密度值依次向两边衰减。按照FCD在道路横截面分布的特点,本文采用Delaunay三角网方法对轨迹密度值低的数据进行剔除,把留下的点作为路面点。

    • 通过分析Delaunay三角网的空间剖分特性及FCD空间分布特征,本文提出采用Delaunay三角网方法对原始FCD进行粗差处理。

      采用Delaunay三角网进行粗差处理,主要以三角形面积和边长为约束条件进行处理。如图 1所示,图 1(a)为区域内若干条路段上分布的浮动车数据;图 1(b)为分布在该区域内的所有FCD的Delaunay三角网。其中对于FCD高密度聚集的区域,三角网的边长和面积比较小,而对于FCD低密度聚集的区域,其三角网出现狭长三角形或者面积非常大三角形。针对三角网在这两种聚集情况下出现的反差,本文提出以三角形面积和边长作为约束条件剔除原始FCD中夹杂的粗差 (图 1(c))。三角形面积和边长阈值为对应粗差剔除比率下的结果。同时,为了避免一些路段上分布的GPS轨迹数据量稀少而被误作为粗差删除,本文选择以路段分割段为基本单元进行处理,并且根据GPS轨迹方向将道路单双向路段进行区分。

      图  1  浮动车数据的Delaunay三角网

      Figure 1.  D-TIN of Floating Car Data

    • 对比高精度、高采样频率且专门采集的GPS轨迹数据,FCD具有海量性与实时性两个非常明显的特点。本文从这两个特点出发,对一定周期内分布在目标路段上的FCD进行覆盖宽度和轨迹特征探测,提出了一种从FCD中提取车道数量信息的新方法。

    • 为了获取FCD在路面分布的宽度,本文采用自适应宽度探测算法对目标路段上覆盖的所有FCD进行宽度探测 (图 2)。

      图  2  浮动车数据覆盖宽度探测

      Figure 2.  Detection of Floating Car Data Covered Width

      假设目标路段Road总长为L,按照分割尺度h依次可以得到n=(L/h) 个分割段,记为{x1x2,…,xn},其分割点记为{n1, n2,…,nm}。根据文献[13]提出的轨迹聚类方法获取各分割段上覆盖的FCD中心线,以中心线作为相应分割段上坐标系的横轴,各分割点即为每段分割段上对应坐标系的坐标原点,UYiDYi分别为每一个分割段内移动窗口沿坐标系上下移动后的纵坐标值,其测宽结果为{w1, w2, w3, …, wm}。其算法具体步骤如下:

      /*Initialization*/

      坐标原点: n1; 横坐标轴: x1的中心线; 纵坐标轴:UYi=0;DYi=0;移动窗口:移动窗口长为h; 移动窗口宽为0.1 m; 窗口内FCD占总体FCD比例为0。

      /*Assignment*/

      for each xj(j=1, 2,…,n),do

      repeat

      沿纵轴上下平移移动窗口,每次计算移动窗口内FCD占分割段上分布的总体FCD的比例 (Proportion),并进行累加。

      until Proportion==100%

      set Dwi=max |UYi|+| max |DYi|;

      set坐标原点更新为nt+1; UYi=0;DYi=0;(t=1, 2…m, i=0)

      end for

    • 城市路网及浮动车数据采集环境非常复杂。本文为了提高待测路段的分类度,将训练数据的选择定位于有遮挡类和无遮挡类两个类别,同时训练数据与待测数据在总体样本占的比例为2:1。

    • FCD在道路面的分布宽度一定程度上表征了实际道路面的宽度信息,而实际路面宽度则与车道数量息息相关。根据现有国内的车道建设相关规范和标准,道路车道数量主要有单向双车道、单向三车道、单向四车道、单向五车道等4种。不同等级的道路车道建设宽度也会不同,例如根据我国道路建设标准,3级以上道路的车道宽度一般为3.5~3.75 m。假设实验区域内有m条已知道路车道数量的目标路段,其FCD覆盖宽度探测值分别为Wi1,…,Wim,将这些目标路段的覆盖宽度和对应车道数量进行统计分析,构建车道数量与浮动车数据分布宽度对应关系的基本分类器,如表 1所示。表 1中,min表示浮动车数据分布宽度的最小值,average表示浮动车数据分布宽度的平均值;max表示浮动车数据分布的最大值。DWiminDWiaverageDWimax分别表示每一种车道数量其浮动车数据分布宽度所对应的具体值,其中i=2, 3, 4, 5。

      表 1  基本分类器

      Table 1.  Primary Classifier

      有遮挡类/无遮挡类车道数量浮动车数据分布宽度/m样本个数
      最小值平均值最大值
      单向两车道2DW2minDW2averageDW2maxn1
      单向三车道3DW3minDW3averageDW3maxn2
      单向四车道4DW4minDW4averageDW4maxn3
      单向五车道5DW5minDW5averageDW5maxn4

      由于FCD自身精度,即使经过Delaunay三角网粗差处理后,噪音信息仍然会存在。所以相邻类型的车道之间,其FCD宽度存在重叠区域。为了获得待测路段分割段的最终车道数量,本文提出了采用限制性高斯混合模型。

    • 本文根据GPS轨迹点误差分布特征,提出利用约束高斯混合模型确定最终的车道数量。其原理就是通过模拟道路面上浮动车数据的分布状态,比较不同高斯成分个数组合后的高斯混合模型优劣,选取模型最优时所对应的高斯成分个数作为该路面分布的车道数量。对于待测路段,当获悉其分割段的浮动车数据分布宽度后,参照基本分类器即可确定该分割段可能归属的若干个车道类型,然后利用约束高斯混合模型确定最终的车道数量。约束高斯混合模型可以定义为:

      (1)

      式中, k是高斯混合模型中高斯成分的个数,即分割段根据基本分类器初步确定的若干个车道数量候选值;wj是每一个高斯成分的权重,其中i=1, 2, …, k,且w1+w2+…+wk=1;σ是属于每个高斯成分的标准差,由于每一个车道宽度一致,所以每一个高斯成分的σ都相同;μ1, …, μk是每一个高斯成分的均值。构建高斯混合模型前,需要求解各类参数值。

      采用最大期望算法 (expectation maximization,EM) 来解算未知高斯参数θj(m)(ωj(m), μj(m), σ(m)),其中m则为迭代计算的次数。高斯参数的初始值ωj(0)μj(0)σ(0)(j=1, …, k) 可以被设定为ω1(0)=ω2(0)=…=ωk(0)=1/k,而μ1(0),…,μk(0)则为分割段有k个车道时,每个车道的中心线,σ(0)根据道路建设标准设定为1.75 m。

      E步:

      (2)
      (3)
      (4)

      M步

      (5)
      (6)
      (7)

      根据EM算法,可以得到在不同车道数量 (k) 条件下,未知高斯参数θj(m)(ωj(m), μj(m), σ(m)) 的值。为了获取分割段最终的车道数量,本文提出采用模型熵对k属于不同值时所对应的约束高斯混合模型进行评价,如式 (8) 所示。当熵值最小时表示该模型最优,其对应的k值即为该分割段的车道数量,如式 (9) 所示,其中Num为待测分割段最终的车道数量,n为分布在待测路段分割段上所有浮动车数据点的个数。

      (8)
      (9)

      其中, R(D, θk) 为赤池信息量准则 (AIC),定义为:

      (10)
    • 本文以武汉市出租车采集的浮动车数据作为研究对象,选取1 000条路段作为样本,其中665条路段为训练样本,其余335条路段为待测样本,如图 3所示。

      图  3  实验路网数据

      Figure 3.  Experimental Road Network

    • 1) 选取非高峰期时段浮动车数据,并剔除载客状态为0以及行驶速度为0的信息记录,减少因交通特征不同和驾驶员驾驶行为导致的FCD在道路横截面上分布异常;

      2) 对GPS轨迹分方向处理,将位于同一条道路不同行驶方向的轨迹进行区分,并将路段上分布的FCD进行等距离分割 (实验中分割距离为10 m);

      3) 采用基于Delaunay三角网的数据剔除方式,剔除多余漂移点 (对一部分已知路面宽度的样本按照路段环境分为无遮挡类和有遮挡类,然后采取不同的粗差剔除比率进行粗差剔除。统计结果表明,对于无遮挡类数据,当剔除比率为25%~30%时,浮动车数据分布宽度与实际路面宽度平均差异在2 m以内,也即路面宽度探测的精度为2 m;对于有遮挡类数据,当剔除率为35%~40%时,浮动车数据分布宽度与实际路面宽度平均差异在2 m以内,也即路面宽度探测精度为2 m)。

      按照Delaunay三角网粗差处理统计结果,对实验区内其他路段分割段逐一进行处理,如图 4所示。图 4(a)为覆盖在基础路网上的原始浮动车数据;图 4(b)是经过Delaunay三角网处理后,红色轨迹点为保留下来的有效点,而黑色轨迹点则为被删除的粗差数据。将经过处理后的FCD与影像图叠加如图 4(c)图 4(d),其中图 4(c)是剔除后的数据与真实影像叠加;图 4(d)图 4(c)的放大图,从图 4(d)中可以发现FCD均匀地分布在道路边界线以内。

      图  4  浮动车数据异常值处理

      Figure 4.  Process of Floating Car Data

    • 训练数据的选取需要注意以下几个方面。

      首先,路段类型要涵盖城市内部高等级道路、低等级道路,同时需要涉及高架桥、跨江大桥道路;

      其次,浮动车数据采集周期选取需要满足一定条件。通常由于浮动车数量限制和城市不同区域客流量影响,不同路段每一天覆盖的FCD数量不同,为了使目标路段宽度探测更加贴近真实情况,本文通过随机抽取一部分路段,对不同周期内所覆盖的FCD进行宽度探测,如图 5所示。

      图  5  FCD覆盖宽度周期研究

      Figure 5.  Research on Floating Car Data Collecting Period

      图 5(a)为实验路段中一小部分路段1~8 d不同周期浮动车覆盖宽度探测结果,当采集周期由7 d变为8 d时,路段上分布的FCD宽度不再发生变化。图 5(b)是同一条路段在相邻周期内探测宽度变化,7 d内浮动车数据分布宽度与8 d内浮动车数据分布宽度变化基本为0。因此,本文在后续车道数量信息探测过程中,选择一周以上的FCD作为实验样本。

    • 对665条路段分别进行FCD覆盖宽度和其在道路横截面状态进行探测,并将探测结果与路段对应实际车道数量进行统计构建基本分类器,如表 2所示。表 2中前者宽度为有遮挡类路段分布宽度,后者宽度为无遮挡类路段分布宽度。例如,表中的7.9/7.5,7.9为有遮挡类时,单向两车道上浮动车数据分布宽度的最小值;7.5为无遮挡类时,单向两车道上浮动车数据分布宽度的最小值。

      表 2  实验区车道数量探测基本分类器

      Table 2.  Basic Classifier of Lane Numbers Detection in Experimental Area

      有遮挡类/无

      遮挡类
      车道数量浮动车数据分布宽度/m训练样本个数
      最小值平均值最大值
      单向两车道27.90/7.510.02/8.912.20/11.3分割段3 841/2 108
      单向三车道39.96/10.312.15/12.119.8/15.4分割段9 660/3 213
      单向四车道413.45/13.417.82/14.225.92/18.9分割段13 230/986
      单向五车道517.8/16.722.78/20.227.79/22.8分割段1 650/523

      假设待测路段分割段的浮动车数据分布宽度为12.1 m,其路段环境为由遮挡类,参照实验区车道数量探测基本分类器,可以大致推测该分割段可能属于单向两车道和单向三车道,可分别计算当k=2和当k=3时的高斯参数。

      k=2时,w1=0.506 8, w2=0.493 1;σ=1.799 6;Δμ=4.282 8;F(2)=0.005 1。

      k=3时,w1=0.427 7, w2=0.527 4, w3=0.048;σ=1.819 7;Δμ=3.901 2;F(3)=0.07,其模拟图如图 6所示。图 6(a)表示当k=2时的高斯混合模型分布;图 6(b)表示当k=3时的高斯混合模型分布。

      图  6  分割段对应的高斯混合模型

      Figure 6.  Gaussian Mixture Model for Segment

      根据计算结果,当k=2时,模型熵F(2) 值最小,模型最优,也即该分割段的车道数量为单向两车道。实验采用本文所提方法对其余目标路段进行车道数量探测。结果表明,采用本文方法探测车道数量的总体精度为82.3%,同时存在17.7%的错误率。通过分析车道数量判断错误的路段,发现其原因如下。

      1) 交叉口红绿灯、转向限制及其他交通特征引起不同车道车流量差异,导致接近交叉口附近路段车道数量判断错误率较高,从而影响整体车道数判断的精度;

      2) 由于现有FCD丢失了高程信息,所以暂时无法区分高架桥与其下遮挡的普通道路上的轨迹数据,尤其对于叠合部分比较多的双层路段,导致其车道数量判断结果与实际结果不一致;

      3) 包含隧道的路段,由于FCD丢失,造成无法获取其车道数量信息。

    • 本文在分析目前国内外车道信息探测方法的基础上,提出了一种基于约束高斯混合模型的车道信息获取新方法。实验结果表明,该方法从浮动车数据的空间分布特征出发实现了目标路段车道数量的提取,缩短了车道数量信息获取的周期,降低信息提取成本。此外,本文提出的以路段分割段为基本单元的车道数量探测模式还可以应用到城市路段变化快速检测方面。然而,对于交叉口附近路段及高架桥与普通路段叠合的部分,车道数量探测结果精度不高。未来研究中将会进一步对本文方法进行改进和完善,并将研究如何从浮动车数据中提取各车道中心线和转向信息。

参考文献 (18)

目录

    /

    返回文章
    返回