-
出租车司机群体日常运营行为之外的非运营停靠行为如就餐、加油(气)、休息等行为的时空分布规律一方面能够反映出租车司机群体的时空运行效率,另一方面能反映出租车司机群体对非运营设施布设的需求。随着位置服务和车联网应用的不断普及,位置大数据已经成为当前用来感知人类社群活动规律和构建智慧城市的重要战略资源[1]。出租车时空GPS轨迹是一种覆盖范围广、采集成本低的位置大数据,可从中挖掘出各类有关于社会环境与人类活动的知识。本文根据出租车GPS轨迹大数据,研究出租车短时非运营行为整体(包括司机就餐、加油(气)、休息等短时非运营行为)的时空分布特性以及与城市非运营设施之间的相关性,探测出租车短时非运营城市群体活动的时空分布规律,揭示城市群体活动与城市资源配置的适应性。
对于出租车时空GPS轨迹,目前已有研究主要包括两方面的内容:一是挖掘城市交通动态,二是挖掘出有关人类行为的社会动态。城市交通动态研究包括城市道路网的提取和更新[2-3]、行程时间和交通流分析[4-5],以及基于出租车经验知识的路径优化与推荐[6-7]。近年来利用出租车GPS轨迹定量分析人类行为成为研究热点。从GPS轨迹中挖掘人类行为的研究主要分为两类:第一类是研究人类行为所反映出的宏观的城市动态,包括城市热点探测[8-10]、土地利用分析[11-12]等;第二类研究关注出租车司机行为,分析出租车运营策略,例如优质客源的时空分布[13]、出租车寻客推荐[14]、高收入出租车轨迹的时空分布[15]等。以上研究通过分析出租车运营期间位置的移动或载客状态的变化,可以较好地挖掘出有关于城市交通动态和人类活动的知识。然而大数据时代研究人类行为存在关注移动行为、忽略停留期间行为的问题[16],出租车停留行为反映了出租车群体的时空运行效率,并能够反映出租车司机群体对非运营设施布设的需求。本文根据出租车GPS轨迹大数据,对出租车短时非运营群体活动进行时空分布探测并分析其时空特征,利用平面线要素核密度估计方法[17-18]分析其时空分布,采用Ripley’s K函数法[19-20]分析了武汉市徐东大街区域的短时非运营行为与加气站的距离-聚集度相关性。
-
本文采用武汉市2013年7~8月共10 614辆出租车的GPS轨迹数据作为数据源。出租车GPS轨迹数据部分原始记录如表 1所示。
表 1 出租车GPS轨迹原始记录
Table 1. Original Record of Taxis GPS Traces
V_ID UTC时间 X Y v attri 11 201 1375459200 529 994 3 379 254 0.0 0 11 201 1375459240 529 933 3 379 279 11.5 0 11 201 1375459280 529 791 3 379 296 14.0 1 11 201 1375459360 529 694 3 379 308 2.6 1 表 1中,V_ID为出租车的编号,UTC时间为根据GPS原子钟记录的时间,(X,Y)为GPS定位瞬间出租车所在位置,v为出租车的瞬时速度;attri表示出租车的载客状态,其中“1”表示满载,“0”表示空载。本文中出租车GPS轨迹采样间隔大约为40 s,定位误差为10~15 m左右,一天的采样记录大于1 000万条。为了得到更准确的短时非运营行为,需要对出租车GPS轨迹进行预处理,剔除异常数据。经分析,常见的异常有:(1) 同一时间记录了多条同一位置的数据;(2) 受建筑物遮挡位置为0的数据;(3) 位置具有较大漂移的数据。
-
本文基于出租车GPS轨迹大数据进行出租车短时非运营行为的提取与分析过程如图 1所示。首先将出租车短时非运营行为定义并描述为具有起止点的线事件,通过时间特征与距离特征进行出租车短时非运营线事件的探测,然后进行出租车短时非运营行为时空分布分析。分析过程中,首先分析出租车短时非运营线事件的时间分布特征;然后利用平面核密度估计方法分析出租车短时非运营线事件的一阶分布模式效应,即基于密度分布分析其空间聚集效应;并利用Ripley’s K函数分析出租车短时非运营行为与加气站的二阶分布模式,即在不同距离尺度下出租车短时非运营行为与加气站之间的相关分布关系。
-
出租车短时非运营行为的共性特征本质上是出租车在一定时间内非运营状态下的短时停靠行为。在停靠过程中,出租车的位置保持不变,GPS不接收和返回信号。在出租车GPS轨迹中,“停靠”特征反映为相邻两轨迹点之间回传时间间隔较长,远大于正常的回传时间40 s左右。但从已知的出租车GPS轨迹中,却无法准确获知出租车“停靠”的位置点。这是由于出租车轨迹点的位置只能代表GPS轨迹数据采集瞬间的位置,当相邻两轨迹点时间间隔较大时,只能确定在这两点之间发生了停车事件,而无法获知停车事件具体发生的时间和位置。因此,本文根据出租车GPS轨迹数据特征,将出租车短时非运营行为定义为具有起点和终点的线事件,如图 2所示。
将出租车短时非运营线事件LE的定义为:
其中,ID为线事件LE的编号;S、E分别为LE发生的起止位置点;L为起止点间线事件发生和分布的地理空间;Ts、Te分别为线事件起止时间点。
本文根据出租车短时非运营行为的时间特征和空间特征,从出租车GPS轨迹中探测出能够反映出租车非运营状态下停靠行为的线事件,即通过探测线事件的发生时间特征和长度特征特征完成出租车短时非运营行为的探测。对于时间特征,本文通过实地调查,发现出租车短时非运营行为中,加油(气)事件的平均时长最低,且最低不小于3 min,就餐事件平均时长为10~15 min,休息、交接班、购物等事件的时长不确定性较大,但最大不超过60 min。因此,本文定义短时非运营行为的时间间隔在180~3 600 s之间。对于距离特征,出租车短时非运营行为的极限情况是出租车在回传信息之后正常行驶40 s后开始停车,并在停车完成之后正常行驶40 s才回传一条记录。在这种情况下,一个停车线事件中出租车正常行驶了80 s。假设出租车以50 km/h的速度行驶,80 s时间内最大行驶距离不超过1 200 m。因此将出租车短时非运营行为的起止点间距离限制为1 200 m。以武汉市2013-07-31T00:00~02:00时间段内提取的出租车短时非运营线事件为例,其空间分布如图 3所示。
-
本文首先分析出租车短时非运营行为的时间分布,然后利用线要素的核密度分析方法分析不同时间粒度下出租车短时非运营行为的空间分布。
-
本文根据不同时段对出租车短时非运营行为进行分组,从两个时间粒度分别研究了出租车短时非运营行为量随时间的变化:一天内24 h的短时非运营行为数变化和一周7 d每天中午时段短时非运营行为数变化。
1) 以每两小时为一组的一天内24 h的短时非运营行为数变化如图 4所示。从图 4中可以看出,出租车短时非运营行为从06:00~08:00左右开始增加,并且在整个白天都保持在较高的水平。其中,16:00~18:00时段内的短时非运营行为最多,是一天中的峰值,这是由于16:00~18:00是出租车交班、晚餐以及加油(气)等短时非运营行为集中发生的时间段。另外,10:00~12:00时间段内的短时非运营行为也较多,反映该时段内出租车对午餐、休息等短时非运营行为需求较大。相比于白天,晚间的短时非运营行为数整体较少,但夜间时段事件数比凌晨时段事件数多。晚间22:00~02:00时段内的短时非运营行为数量与白天相似,但之后短时非运营行为数急剧减少,并在02:00~06:00之间达到谷值。
2) 一周7 d内,午间时段的短时非运营行为数变化如图 5所示。
图 5 午间短时非运营行为在一周中的变化
Figure 5. Volume Change of Short-Term Out-of-Service Linear Events at Noon in a Week
图 5反映了出租车午间短时非运营行为在一周中的变化。出租车午间短时非运营行为主要包括出租车司机午餐、加油(气)、午休等行为。从图 5中可以看出,出租车午间短时非运营行为整体上在工作日发生比双休日多。从周一到周四,午间短时非运营行为不断增加,并在周四达到最大;从周五开始,午间短时非运营行为数开始降低,并在周末保持较低水平,这表明出租车司机在双休日的行为不如工作日规律。
-
本节研究一天内24 h午间短时非运营行为的空间分布变化。利用线要素的平面核密度估计方法,以100 m为栅格尺寸,500 m为带宽进行出租车短时非运营行为的空间分布热点图绘制,如图 6(a)~6(l)所示。
图 6 一天12个时段内出租车短时非运营行为空间分布
Figure 6. Spatial Distribution of Taxis Short-Term Out-of-Service Behaviors of 12 Periods in a Day
图 6(a)~6(l)反映了一天中12个时段内出租车短时非运营行为的空间分布变化,从图 6中可以发现短时非运营行为热点在武昌和汉口分布较多,而在汉阳分布较少。在武昌城区,短时非运营行为热点主要位于雄楚大道、武汉大道、中北路加油(气)站附近,以及武昌火车站附近,汉阳主要有汉阳大道、墨水湖北路附近两个核心聚集区域,汉口的热点区域主要分布在汉口中一路后湖片区、建设大道营北社区、解放大道及发展大道汉口火车站附近。
1) 在武昌城区,从00:00~24:00,中北路、武汉大道、团结大道附近短时非运营行为一直呈现“L”形线状聚集,这些街道分布有蓝焰油气、中北路CNG加气站;火车站附近的热点一直存在,这与出租车待客短时非运营行为有关;而雄楚大道、晒湖附近的短时非运营行为在00:00~02:00聚集热点比较分散,随着时间的推移,分散分布的小热点慢慢聚集为更大、更集中的热点,并在12:00以前都保持这种集中的分布;12:00之后,雄楚大道、晒湖附近聚集的大热点又重新分散成小热点。这一范围内分布着武昌火车站、雄楚加气站以及晒湖小区附近餐饮中心。靠近中午时段,出租车司机的就餐、休息、加油(气)等行为更可能同时进行,因此短时非运营行为发生的位置比较聚集。而在其他时段,出租车司机一般只进行一种短时非运营行为,因此热点重新分散开。
2) 在汉口城区,整体上短时非运营行为的聚集效应更强,热点更多,范围更大。白天最明显的聚集点位于解放大道和建设大道附近,并呈线状分布,这一热点在08:00左右开始形成,18:00以后逐渐消亡。在解放大道和建设大道一带分布有很多小型餐饮,并有居民区聚集,这为出租车提供了很好的就餐、休息、购物条件,还为出租车提供了停车的便利。此外,在汉口,短时非运营行为也较多集中在加油(气)站附近和火车站,例如竹叶山加油(气)站及汉口火车站,这些位置附近聚集的热点随时间变化不明显。
3) 在汉阳城区,出租车短时非运营行为较集中于汉阳大道上大隆通佳翠微加气站等,这些加油(气)站周围同样分布着一些小型餐饮,为出租车司机加油(气)、就餐等短时非运营行为提供便利条件。
图 6(a)~6(l)反映了武汉市出租车短时非运营行为的热点分布的时空动态。出租车的短时非运营行为不仅和司机行为意愿、兴趣点类型有关,还与兴趣点的服务能力有关,例如餐饮的消费水平、停车限制以及停车容量等。
-
本节采用Ripley’s K函数的二元形式分析不同空间尺度下,出租车短时非运营行为在加油(气)站周围的聚集-均匀分布模式,即短时非运营行为的二阶空间分布模式。首先根据2013-07-31 T12:00~14:00出租车短时非运营行为形成的热点区域,与加气站位置进行叠加分析,结果如图 7所示。
图 7 短时非运营行为分布与加油(气)站位置
Figure 7. Spatial Distribution of Taxis Short-Term Out-of-Service Behaviors and Gas Station
从图 7中可以看出,武汉市出租车短时非运营行为整体与加气站分布具有一定相关性。在武昌城区事件的聚集和加气站的分布更加吻合,而在汉口和汉阳,加气站与短时非运营行为的热点匹配较弱。特别是在汉口,中心城区内解放大道、建设大道附近大范围内短时非运营行为呈现聚集状态,而这一区域并没有加气站的分布。同时,在一些加气站周围短时非运营行为呈强聚集状态,而另外一些加气周围则很少甚至没有短时非运营行为的聚集分布,这在一定程度上反映出武汉市加气资源配置的不合理。
选取武昌城区徐东大街、黄鹂路、中北路区域进行出租车短时非运营行为与加气站分布的定量相关性分析,该实验区域面积为3 800 m×4 000 m,分布有蓝焰油气(徐东大街)、中北路加气站、黄鹂路加气站、岳家嘴加气站,如图 8(1)所示。采用Ripley’s K函数分析多距离尺度下,短时非运营行为在加油(气)站周围的聚集程度。Ripley’s K函数是一种多距离空间聚类分析方法,可分析在不同的空间尺度下,同类事件本身或不同类事件之间在不同空间尺度下的聚集-均匀分布模式。Ripley’s K函数的具体公式为:
图 8 局部范围内短时非运营行为分布与加其站位置相关性
Figure 8. Correlation Between Taxis Short-Term Out-of-Service Behaviors and Gas Station in a Local Scale
(1) 其中,d为空间尺度;A为研究区域面积;n为研究区域内事件个数;JD为以i为圆心、d为半径所得的圆形范围;Iij为权重,通常若j在JD中,则Iij等于1,若不在JD中,则Iij等于0,因此
通常表示JD中事件的数量。通过计算在连续多个空间尺度d下的K函数值,并与该尺度下随机分布模式的事件K函数值相比较,可得出不同空间尺度下事件的聚集-均匀分布模式。本文利用Ripley’s K函数分析不同空间尺度下,短时非运营行为在加气站周围的聚集-均匀分布模式。由于K函数在使用中并不直观,实际中通常进行K函数的L变换:(2) 通过式(2)所示K函数的变体,在随机分布模式下的L(d)值等于空间距离d,即L(d)的预测值为空间距离d。本文利用变体式(2)得到的短时非运营行为在加油(气)站周围的空间分布模式结果如图 8(b)所示。
图 8中给定距离d,若L(d)值大于对应的期望值,说明在d距离尺度下事件呈聚集分布;若L(d)值小于对应的期望值,说明在d距离尺度下事件呈均匀分布。从图 8(b)中可以看出,加气站周围1 600 m以内,短时非运营行为都呈聚集分布,且与加气站距离越近的位置短时非运营行为的聚集性越高;与加气站距离1 600 m之外,短时非运营行为呈均匀分布模式,且越远离加油气站的位置,事件的均匀程度越高。因此,在1 600 m范围内,短时非运营行为与加气站位置高度相关,说明这一区域的短时非运营行为很大程度上都是加气事件。
-
现有的关于出租车GPS轨迹大数据的研究均没有考虑出租车司机本身的非运营行为(如出租车加油(气)、就餐、交接班)。本文根据出租车GPS时空轨迹大数据,研究出租车短时非运营行为整体(包括司机就餐、加油(气)、休息等短时非运营行为)的时空分布特性,分析出租车短时非运营城市群体活动的时空分布规律,揭示城市群体活动与城市资源配置的适应性。本文将出租车短时非运营行为定义和描述为线事件,利用平面线要素核密度估计方法分析其时空分布,采用Ripley’s K函数方法分析出租车短时非运营行为与加气站空间分布的相关性。实验结果表明,分析出租车短时非运营行为时空分布能有效地揭示出租车司机群体的短时非运营行为需求,以及其与现有公共资源不匹配引发的资源低效配置现状,为公共资源优化调整提供科学有效的辅助决策支撑。
本文后续将深入具体区分加油(气)、就餐、交接班等不同短时非运营行为种类,对出租车加油(气)、就餐、交接班等具体短时非运营行为进行建模,分别探测其时空分布规律以及与城市环境的相互作用,以及不同短时非运营行为需求与城市相关基础设施资源配置的匹配程度。
-
摘要: 现有的关于出租车GPS轨迹大数据的研究均没有考虑出租车司机本身的非运营行为(如出租车加油(气)、就餐、交接班)的特征和需求。根据出租车轨迹大数据,研究了出租车短时非运营行为特征,从轨迹数据中提取出租车短时非运营行为,利用平面线要素核密度分析其时空分布,并采用Ripley's K函数分析了武汉市徐东大街区域的短时非运营行为与加气站的空间相关性。实验结果表明,分析出租车短时非运营行为时空分布能有效地揭示出租车司机群体的短时非运营行为需求,以及需求与现有公共资源不匹配引发的资源低效配置现状,为公共资源优化调整提供科学有效的辅助决策支撑。Abstract: Existing studies of big data taxi GPS tracesdo not consider the characteristics and demands of out-of-service taxi driver activities, such as refueling, dining, and shifting activities. This paper studies the these short-term out-of-service behaviors, extracts short-term out-of-service behaviors from taxi trace data, and analyzes the spatio temporal distribution of these events with kernel density estimation (KDE) for linear features. We also analyze the spatial correlation between short-term taxi out-of-service behaviors and locations of gas stations, using Ripley's K function. Our experimental results show that this approach effectively uncovers short-term taxi driver out-of-service demands and exposed the ineffective allocation of urban public resources, by analyzing spatio temporal distribution of short-term out-of-service taxi activities. Our results couldsupport decision-making concerning adjustment and optimization of public resources.
-
表 1 出租车GPS轨迹原始记录
Table 1. Original Record of Taxis GPS Traces
V_ID UTC时间 X Y v attri 11 201 1375459200 529 994 3 379 254 0.0 0 11 201 1375459240 529 933 3 379 279 11.5 0 11 201 1375459280 529 791 3 379 296 14.0 1 11 201 1375459360 529 694 3 379 308 2.6 1 -
[1] 刘经南, 方媛, 郭迟, 等. 位置大数据的分析处理研究进展[J]. 武汉大学学报·信息科学版,2014,39(4):379-385 http://ch.whu.edu.cn/CN/abstract/abstract2947.shtml Liu Jingnan, Fang Yuan, Guo Chi, et al. Research Progress in Location Big Data Analysis and Processing[J]. Geomatics and Information Science of Wuhan University, 2014, 39(4):379-385 http://ch.whu.edu.cn/CN/abstract/abstract2947.shtml [2] Chen Y H, Krumm J. Probabilistic Modeling of Traffic Lanes from GPS Traces[C]. The 18th SIGSpatial International Conference on Advances in Geographic Information System, San Jose, CA, USA, 2010 [3] Jang S, Kim T, Lee E. Map Generation System with Lightweight GPS Trace DatSL[C]. The 12th IEEE International Conference on Advanced Communication Technology, Gangwon-Do, South Korea, 2010 [4] Zhao M Y, Li X. Deriving Average Delay of Traffic Flow Around Intersections from Vehicle Trajectory Data[J]. Front Earth Sci, 2013, 7(1): 28-33 doi: 10.1007/s11707-012-0341-z [5] Wang Z, Kan Z, Huang F, et al. Path Optimization Based on City Intersection Turning Analysis from Floating Car Data[J]. Applied Mechanics and Materials, 2014, 577:1055-1060 doi: 10.4028/www.scientific.net/AMM.577 [6] 唐炉亮,常晓猛,李清泉,等. 基于蚁群算法与出租车GPS数据的公众出行路径优化[J]. 中国公路学报,2011,24(2):89-95 http://www.cnki.com.cn/Article/CJFDTOTAL-ZGGL201102017.htm Tang Luliang, Chang Xiaomeng, Li Qingquan, et al. Public Travel Route Optimization Based on Ant Colony Optimization Algorithm and Taxi GPS Data[J]. China Journal of Highway and Transport, 2011, 24(2):89-95 http://www.cnki.com.cn/Article/CJFDTOTAL-ZGGL201102017.htm [7] 唐炉亮, 常晓猛, 李清泉. 出租车经验知识建模与路径规划算法[J]. 测绘学报, 2010, 39 (4) :404-409 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB201004014.htm Tang Luliang, Cuang Xiaomeng, Li Qingquan. The Knowledge Modeling and Route Planning Based on Taxi's Experience[J]. Acta Geodaetica et Cartographica Sinica, 2010, 39(4): 404-409 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB201004014.htm [8] 桂智明,向宇,李玉鉴. 基于出租车轨迹的并行城市热点区域发现[J]. 华中科技大学学报(自然科学版), 2012,40(Sup1):187-190 http://www.cnki.com.cn/Article/CJFDTOTAL-HZLG2012S1045.htm Gui Zhiming, Xiang Yu, Li Yujian. Parallel Discovering of City Hot Spot Based on Taxi Trajectories[J]. J Huazhong Univ of Sci & Tech (Natural Science Eedition), 2012, 40(Sup1): 187-190 http://www.cnki.com.cn/Article/CJFDTOTAL-HZLG2012S1045.htm [9] Giannotti F, Nanni M, Pedreschi D, et al. Unveiling the Complexity of Human Mobility by Querying and Mining Massive Trajectory Data[J]. The VLDB Journal, 2011, 20(5):695-719 doi: 10.1007/s00778-011-0244-8 [10] Li B, Zhang D, Sun L, et al. Hunting or Waiting? Discovering Passenger-Finding Strategies from a Large-Scale Real-World Taxi Dataset[C]. The 8th IEEE International Workshop on Managing Ubiquitous Communications and Services, Seattle, WA, 2011 [11] Liu Y, Wang F, Xiao Y, et al. Urban Land Uses and Traffic 'Source-Sink Areas': Evidence from GPS-enabled Taxi Data in Shanghai[J]. Landscape and Urban Planning, 2012, 106(1): 73-87 doi: 10.1016/j.landurbplan.2012.02.012 [12] Pan G, Qi G, Wu Z, et al. Land-Use Classification Using Taxi GPS Traces[J]. IEEE Transactions on Intelligent Transportation Systems, 2013, 14(1): 113-123 doi: 10.1109/TITS.2012.2209201 [13] 孙飞, 张霞, 唐炉亮, 等. 基于GPS轨迹大数据的优质客源时空分布研究[J]. 地球信息科学学报, 2015, 17(3): 329-335 http://www.cnki.com.cn/Article/CJFDTOTAL-DQXX201503011.htm Sun Fei, Zhang Xia, Tang Luliang, et al. Temporal and Spatial Distribution of High Efficiency Passengers Based on GPS Trajectory Big Data[J]. Journal of Geo-information Science, 2015, 17(3): 329-335 http://www.cnki.com.cn/Article/CJFDTOTAL-DQXX201503011.htm [14] Li X, Pan G, Wu Z, et al. Prediction of Urban Human Mobility Using Large-Scale Taxi Traces and Its Applications [J]. Frontiers of Computer Science in China, 2012,6(1):111-121 http://cn.bing.com/academic/profile?id=2113298739&encoded=0&v=paper_preview&mkt=zh-cn [15] Liu L, Andris C, Ratti C. Uncovering Cabdrivers' Behavior Patterns from Their Digital Traces [J]. Computers Environment & Urban Systems, 2010, 34:541-548 http://cn.bing.com/academic/profile?id=2073794668&encoded=0&v=paper_preview&mkt=zh-cn [16] 萧世伦,方志祥. 从时空GIS视野来定量分析人类行为的思考[J]. 武汉大学学报·信息科学版, 2014,39(6):667-670 http://ch.whu.edu.cn/CN/abstract/abstract3012.shtml Shaw Shihlung, Fang Zhixiang. Rethinking Human Behavior Research from the Perspective of Space-time GIS[J]. Geomatics and Information Science of Wuhan University, 2014, 39(6): 667-670 http://ch.whu.edu.cn/CN/abstract/abstract3012.shtml [17] Silverman B W. Density Estimation for Statistics and Data Analysis [M]. London: CRC Press, 1986 [18] Bailey T C, Gatrell A C. Interactive Spatial Data Analysis [M]. Essex: Longman, 1995 [19] Ripley B D. The Second-Order Analysis of Stationary Point Process [J]. Journal of Applied Probability, 1976, 13: 255-266 doi: 10.1017/S0021900200094328 [20] Ripley B D. Modelling Spatial Patterns[J]. Journal of the Royal Statistical Society B, 1977, 39(2):172-212 -