留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

城市群体移动模式研究中空间尺度影响的定量分析

鲁仕维 方志祥 萧世伦 张希瑞 尹凌

鲁仕维, 方志祥, 萧世伦, 张希瑞, 尹凌. 城市群体移动模式研究中空间尺度影响的定量分析[J]. 武汉大学学报 ● 信息科学版, 2016, 41(9): 1199-1204. doi: 10.13203/j.whugis20140524
引用本文: 鲁仕维, 方志祥, 萧世伦, 张希瑞, 尹凌. 城市群体移动模式研究中空间尺度影响的定量分析[J]. 武汉大学学报 ● 信息科学版, 2016, 41(9): 1199-1204. doi: 10.13203/j.whugis20140524
LU Shiwei, FANG Zhixiang, SHAW Shihlung, ZHANG Xirui, YIN Ling. Quantitative Analysis of the Effects of Spatial Scales on Intra-urban Human Mobility[J]. Geomatics and Information Science of Wuhan University, 2016, 41(9): 1199-1204. doi: 10.13203/j.whugis20140524
Citation: LU Shiwei, FANG Zhixiang, SHAW Shihlung, ZHANG Xirui, YIN Ling. Quantitative Analysis of the Effects of Spatial Scales on Intra-urban Human Mobility[J]. Geomatics and Information Science of Wuhan University, 2016, 41(9): 1199-1204. doi: 10.13203/j.whugis20140524

城市群体移动模式研究中空间尺度影响的定量分析

doi: 10.13203/j.whugis20140524
基金项目: 

国家自然科学基金 41231171

国家自然科学基金 41371420

资源与环境信息系统国家重点实验室开放基金 201303

深圳市战略性新兴产业发展专项资金 JCYJ20121019111128765

深圳市科技创新委员会基础研究项目 JCYJ20140610151856728

详细信息
    作者简介:

    LU Shiwei, PhD candidate, specializes in the big data analysis, human dynamics and GIS for transportation. E-mail: lusw@whu.edu.cn

    通讯作者: 方志祥,博士,教授。zxfang@whu.edu.cn
  • 中图分类号: P208

Quantitative Analysis of the Effects of Spatial Scales on Intra-urban Human Mobility

Funds: 

The National Natural Science Foundation of China 41231171

The National Natural Science Foundation of China 41371420

State Key Laboratory of Resources and Environmental Information System Open Funding Program 201303

Shenzhen Dedicated Funding of Strategic Emerging Industry Development Program JCYJ20121019111128765

the Fundamental Research Foundation of Shenzhen City JCYJ20140610151856728

More Information
图(6) / 表(1)
计量
  • 文章访问数:  1252
  • HTML全文浏览量:  49
  • PDF下载量:  487
  • 被引次数: 0
出版历程
  • 收稿日期:  2014-07-13
  • 刊出日期:  2016-09-05

城市群体移动模式研究中空间尺度影响的定量分析

doi: 10.13203/j.whugis20140524
    基金项目:

    国家自然科学基金 41231171

    国家自然科学基金 41371420

    资源与环境信息系统国家重点实验室开放基金 201303

    深圳市战略性新兴产业发展专项资金 JCYJ20121019111128765

    深圳市科技创新委员会基础研究项目 JCYJ20140610151856728

    作者简介:

    LU Shiwei, PhD candidate, specializes in the big data analysis, human dynamics and GIS for transportation. E-mail: lusw@whu.edu.cn

    通讯作者: 方志祥,博士,教授。zxfang@whu.edu.cn
  • 中图分类号: P208

摘要: 城市群体移动研究通常以网格为空间分析单元,其分析存在可塑性面积单元问题(modifiable area unit problem,MAUP),目前的研究缺乏对不同大小的网格面积单元所忽略的城市群体移动规律的定量分析结论。对城市空间进行有限的不同大小的等间距格网划分并对城市群体移动忽略部分进行分析,发现格网内群体移动量随格网大小线性递增,格网间的群体移动量随格网大小线性递减,并以提取城市重要位置的空间分布和属性特征的不一致为例,表明应对忽略的短距离移动予以重视,避免决策上的偏差。与此同时,不同格网划分大小情况下格网内的移动量在住宅用地、工业用地上被忽略程度较为严重,建议根据实际研究的目的采取不均匀划分空间格网方法,避免过多忽略群体移动。

English Abstract

鲁仕维, 方志祥, 萧世伦, 张希瑞, 尹凌. 城市群体移动模式研究中空间尺度影响的定量分析[J]. 武汉大学学报 ● 信息科学版, 2016, 41(9): 1199-1204. doi: 10.13203/j.whugis20140524
引用本文: 鲁仕维, 方志祥, 萧世伦, 张希瑞, 尹凌. 城市群体移动模式研究中空间尺度影响的定量分析[J]. 武汉大学学报 ● 信息科学版, 2016, 41(9): 1199-1204. doi: 10.13203/j.whugis20140524
LU Shiwei, FANG Zhixiang, SHAW Shihlung, ZHANG Xirui, YIN Ling. Quantitative Analysis of the Effects of Spatial Scales on Intra-urban Human Mobility[J]. Geomatics and Information Science of Wuhan University, 2016, 41(9): 1199-1204. doi: 10.13203/j.whugis20140524
Citation: LU Shiwei, FANG Zhixiang, SHAW Shihlung, ZHANG Xirui, YIN Ling. Quantitative Analysis of the Effects of Spatial Scales on Intra-urban Human Mobility[J]. Geomatics and Information Science of Wuhan University, 2016, 41(9): 1199-1204. doi: 10.13203/j.whugis20140524
  • 信息和通信技术[1]的迅速发展使得收集海量的人类跟踪数据,如手机定位数据[2-3]、GPS定位数据[4]、位置签到数据[5]等成为现实。这些跟踪数据可以帮助研究者更加深入地理解人类移动、停留等动态模式和本质特征,为用户提供更加精准的个性化的基于位置的服务[6],在城市规划[7]、疾病传播与控制[8]等领域具有重要的作用。

    当研究城市内部的人类群体移动模式时,部分工作对数据预处理的步骤是对城市空间进行等距离格网划分,例如,划分城市空间的格网大小为200 m[9]、250 m[10-11]、500 m[12]、1 000 m[13-14]等不同单元尺度(即研究对象的最小可辨识单元),然后利用手机定位数据来研究格网单元之间的移动特征。另外,文献[15]利用上海市内签到数据分析不同活动之间切换的可能性,同时阐述了格网尺度影响移动形态;文献[10]用250 m大小的格网划分城市空间,通过出租车、公交车的即时定位数据来研究人群的移动特征。不同的是,文献[16]采用400 m大小的格网,利用出租车历史定位数据评价位置的吸引力。但是,不同尺度和形式的划分单元会对群体流动产生统计上的偏差[17]。将采样数据从小计数单元聚合成更大单元的数据处理问题,即是地理学的可塑性面积单元问题(modifiable area unit problem,MAUP)[18]。文献[19]也指出GIS定量分析人类行为研究中的理想与现实间存在鸿沟。当前研究群体移动中,格网大小的选择缺乏规范的标准或参考。不仅如此,通过调查问卷获得的居民出行数据或是浮动车定位数据等,由于覆盖的群体数量相对较少,不足以反映整个城市群体移动特征,对不同大小格网单元所反映的人类群体移动的忽略程度的定量规律还有待分析研究。

    本文力图从海量的短期规则采样的手机定位数据中,分析不同格网大小划分对城市群体移动的影响,量化其规律以及在不同土地利用类型上的影响差异,并以利用PageRank算法[20]提取城市重要位置为例,得出不同格网单元所提取出的重要位置在空间分布和属性特征上不一致,表明由于不同尺度格网单元划分而忽略的移动应予以重视。本文研究可为大数据时代的人类行为研究的真实性和完整性探索拓展思路,并能够提供一定的借鉴基础。

    • 本文的研究数据是中国深圳某通讯公司提供的手机数据集,这份数据集包含了超过16 000 000个用户的1 d(星期五)中超过3亿条的规则采样数据。如果手机信号正常,为手机提供信号服务的手机基站就会每隔0.5~1 h给手机发送一个信号,并记录该手机用户位置信息,如表 1所示。手机用户的ID已经经过匿名化处理。2012年深圳常住人口为1 054.74万人,根据社会科学院报告,深圳流动人口数量已占常住人口的一半以上,所以这份规则采样的大规模数据能比较完整地反映该工作日内整个城市用户的时空特征,基本涵盖了用户当天的整体移动信息,是研究群体移动模式的理想数据源。

      表 1  手机数据记录示例

      Table 1.  An Example of Mobile Phone Data Records

      ID 日期 时间 经度/(°) 纬度/(°)
      用户1 2012-03-23 07:45:27 114.265 1 22.698 5
      用户1 2012-03-23 08:23:36 114.175 8 22.498 6
      用户2 2012-03-23 03:28:46 114.203 0 23.235 2
    • 手机基站在空间上是异质性分布的,两两基站之间的最短距离平均值为214 m,在人口密集或活动频繁区域则基站分布密集,定位精度相对较高,得到的群体移动模式相对精细全面,此时如果选择尺度较大的行政区划单元(如街道),难以保留群体移动的细节。“大数据”情形下,选择合适的分析单元是相关研究的基础,也是常常被忽略的一个问题。本文采用现有研究中划分格网的方法来分割城市空间,不同格网大小内部所包含的基站数目不同,如图 1中所示,当格网大小为300 m时,蓝色区域划分为4个格网,均只包含1个基站;但当格网大小为600 m时,该区域划分为1个格网,包含4个基站。

      图  1  不同大小格网下基站的归属问题

      Figure 1.  Ownerships of Mobile Phone Sites to Different Sizes of Grid Cells

      考虑到深圳市社区的最大面积为3.3 km2(面积约等同于规则格网大小1.82 km×1.82 km),本文将深圳市城市空间按照不同大小划分为20个等级的规则格网,其中划分空间的起始点相同,格网大小依次是100 m、200 m、…、2 000 m。图 2所示为1 000 m大小的格网单元示例,其中不包含基站的格网将不作考虑。

      图  2  城市空间格网划分示意图

      Figure 2.  An Example of Dividing Urban Space Into Grid Cells

      结合深圳市详细的土地利用情况和土地利用现状分类国家标准,本文将土地利用分为住宅用地、公共用地、商业用地、工业用地、特殊用地、交通用地、农业用地、未利用地和其他用地9类,用以分析格网划分对所忽略的群体移动在这9类土地利用上的不同影响程度。

    • 本文首先关注的是整个深圳市手机用户的整体移动形态特征。当用户的位置发生变化时,移动距离定义为发生移动的个体在相邻记录时刻的基站之间的欧氏距离。与已发现的个体的出行距离服从幂律分布[2]或指数分布[19]特征有所不同,当考虑到整个城市内部所有的移动分布时,其并不完全服从幂律分布,观察到的移动距离在 101.5 km(即31.6 km)之内服从幂律分布特征:

      (1)

      式中,r = 2.12(拟合优度为R2 = 0.986);p(d)表示移动距离为d的概率;超过101.5 km后,曲线衰减加快(如图 3中所示)。

      图  3  移动距离分布

      Figure 3.  Aggregated Movements Distribution

      统计发现,97.85%的移动发生在15 km以内,因此中短距离内人类频繁发生移动,是人群日常移动中极为重要的组成部分。而在相当长的距离间隔内则很少有人类移动行为,距离超过50 km的移动仅仅占到0.033%,平均移动距离为2.0 km左右。当划分城市空间为格网或其他面积单元时,短距离移动受到的影响程度最大。格网大小超过1 km后,将无法观察到1 km以内的移动,所以格网划分改变了移动距离分布特征。下文定量分析不同大小格网划分对群体移动的影响。

    • 选择合适的格网大小是常常被忽略的一个问题,因为在群体移动模型[21-22]中不考虑计算单元内部的移动。本文通过将深圳市城市空间进行不同大小的等间距格网划分,来观察格网内部和格网之间的移动量变化。如图 4所示,其中格网间的移动量为不同格网所包含的基站之间的移动次数占总移动次数的百分比;当格网内包含两个或两个以上的基站时,格网内的移动量为格网内部基站之间的移动次数占总移动次数的百分比。在格网大小为100 m时格网间的移动量为96.74%,当格网大小为1 000 m时格网内部的移动量占到32.33%,当格网大小约为1 800 m时格网内部的移动量和格网之间的移动量相当。更进一步,在格网大小为2 000 m时移动量降为47.76%,表明部分群体在小格网划分下表现出移动特征,而在大格网划分下则很有可能被当做格网单元内部移动,通常视为静止状态[21-22]。格网越大,被视为格网内部移动的数量越多,格网间的移动量则越少。

      图  4  不同大小格网单元内和格网单元间的流量

      Figure 4.  Percentages of Intra-grid and Inter-grid Movements in Different Sizes of Grid Cells

      特别地,在100~2 000 m的格网大小之间,划分为格网内部的移动量几乎呈现出线性增长的模式:

      (2)

      式中,y表示移动量百分比;x表示格网的大小;R2非常趋近于1表示拟合度很好。

      所以,随着格网单元的增大,城市群体移动数量呈现出明显的线性递减模式,反映出的群体移动的真实性减弱,例如1 km大小的格网划分将忽略整个城市32.33%的移动。这些大量的短距离移动既是群体移动的重要组成部分,也是当前群体动力学研究所忽略的。所以,选择何种尺度的格网单元最能反映真实情况,在当前大数据时代是一个更加值得关注的问题。

    • 不同大小的格网单元呈现出的流动形态不一致,较大尺度的格网单元忽略了部分群体的短距离移动。本文利用群体移动构建不同位置之间的流量网络,来衡量不同格网位置在城市人群流动体系中的重要程度。分别以500 m、100 0 m和1 500 m大小的格网为分析单元,以格网间的流量大小值为基础,用PageRank算法[20](式(3)所示)对不同格网位置的重要性进行排序。

      (3)

      式中,Bi是第i次迭代后的排序向量;N为格网的数量;I是单位矩阵;α是一个很小的常数;A为格网间流量矩阵;设置迭代收敛阈值为0.000 1。从图 5中可以看出,不同尺度的格网划分下,PageRank能够提取出部分比较一致的重要区域,如福田口岸,是深圳进入香港的重要关口,集聚了大规模的人群流动。但是,仍然有一些重要位置(或“热点区域”)在空间分布和属性特征上存在不一致的情况。例如,从500 m格网大小的流量网络中能提取出宝安机场、深圳东站等重要交通枢纽位置;500 m格网和1 000 m格网中均能提取出深圳北站这一重要交通枢纽;然而,从1 500 m格网大小的流量网络中前十名重要位置中没有上述重要交通枢纽,但可以提取出前两者不能识别的大型购物中心(海岸城购物中心)。根本原因是不同大小的格网单元对群体移动中的短距离移动的忽略程度不同,所反映的城市流动形态不一致。

      图  5  不同大小格网单元PageRank排序前十名

      Figure 5.  PageRank Value of the Top Ten Grids with Different Sizes

      以上实例结果表明,选取的分析单元大小不同,则会提取出不一致热点区域的空间分布形态,从而可能造成空间公共设施布置决策上的偏差。根据群体移动研究的细致程度,合理地选择格网单元大小,可以减少可塑性面积单元问题的影响。

    • 个体的活动类型与所在土地利用类型紧密相关。例如,在住宅用地上主要是居家活动,在工矿用地上的活动可以是工作及其相关的活动,在交通运输用地上的活动可以是工作,或是运输等活动,这些活动与城市群体日常活动息息相关。文献[23]指出,采用格网的方法可以避免统计单元与城市空间统计信息之间相互关联的缺失。为了定量分析格网内所忽略的群体移动所在的土地利用类型[9, 23],本文提取出每个格网内部占主导的土地利用类型,用以确定格网内移动的性质。

      本文统计不同尺度格网下9类土地利用属性格网单元内部的移动量,如图 6所示。发现不同土地利用类型的格网内包含的移动量的变化趋势不同:未利用地、其他用地、特殊用地等土地利用类型格网内移动量受格网大小的影响较小,均低于1.2%;在住宅用地、工业用地、交通用地和农业用地等土地利用类型格网内部移动量总体上随着格网的增大而逐渐变大,在1 000 m格网时均超过2.9%,2 000 m格网时均超过7.5%。其中,在住宅用地和工业用地两种类型的格网内部移动量受格网大小影响最大,最大值分别为18.8%和16.6%。此外,在住宅用地(式(4))和工业用地(式(5))内部的移动量是局部线性增长的:

      图  6  不同尺度格网内九类土地利用类型移动量分布

      Figure 6.  Percentages of Movements Within Different Land Use Types of Grids

      (4)
      (5)

      其中,在住宅用地上的增长率(1.414)最大,工业用地上的增长率(1.232)次之,随后变化程度变缓慢。住宅用地和工业用地上群体移动的忽略程度最为严重,主要原因是这两种土地利用类型是城市居民工作日中最主要的用地类型,基站分布较为密集,观察到的移动较为频繁细致,其中日常用品购物、部分休憩活动常常发生在住家附近。由于深圳集聚了劳动密集型企业(如富士康、华为等),所以工业用地周围的移动也较为频繁,通勤距离十分短。当选择格网大小为1 000 m时,会忽略在住家周围的13.0%的移动,以及在工业用地周围的10.1%的移动。

      因此,可塑性面积单元的选取在分析城市内部人群移动形态中是至关重要的环节,群体活动建模时计算单元的选取要根据所需要研究活动的精细程度合理选取。比如住宅用地、工业用地等土地利用类型选取较小的格网单元(比如小于200 m的格网),以较大程度地保留群体移动特征;而在未利用地、其他用地等土地利用类型可以选择较大的格网单元,减少计算量的同时还可以保全群体的真实移动特征。

    • 本文定量分析了网格MAUP对城市群体移动的忽略程度,发现有限大小的格网单元内部的移动量随格网增大呈现出线性增长模式;结合土地利用分析时,在住宅用地、工业用地等类型格网内忽略的移动量呈现出局部线性规律,且忽略程度最为严重,这些量化规律是对群体移动模式分析的新补充。定量研究不同单元尺度对群体移动的忽略影响,有助于正确理解城市内部群体移动的真实形态,合理从群体移动网络中提取城市热点区域,有效地评价人群移动对区域性交通所带来的负担,也可以合理布设城市基础设施。由于不同大小的格网单元造成的群体移动的忽略是当前群体动力学研究的缺失。由此,在下一步研究中,将综合考虑群体移动建模的计算单元选取对不同性质移动的影响,采用不一致大小的切分方法,从而提高相关研究工作的完整性和可信性。

参考文献 (23)

目录

    /

    返回文章
    返回