留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

利用Minkowski距离逼近道路网络距离算法研究

卢宾宾 杨欢 孙华波 于清德

卢宾宾, 杨欢, 孙华波, 于清德. 利用Minkowski距离逼近道路网络距离算法研究[J]. 武汉大学学报 ● 信息科学版, 2017, 42(10): 1373-1380. doi: 10.13203/j.whugis20160225
引用本文: 卢宾宾, 杨欢, 孙华波, 于清德. 利用Minkowski距离逼近道路网络距离算法研究[J]. 武汉大学学报 ● 信息科学版, 2017, 42(10): 1373-1380. doi: 10.13203/j.whugis20160225
LU Binbin, YANG Huan, SUN Huabo, YU Qingde. Algorithm of Approximating Road Network Distance Via the Minkowski Distance[J]. Geomatics and Information Science of Wuhan University, 2017, 42(10): 1373-1380. doi: 10.13203/j.whugis20160225
Citation: LU Binbin, YANG Huan, SUN Huabo, YU Qingde. Algorithm of Approximating Road Network Distance Via the Minkowski Distance[J]. Geomatics and Information Science of Wuhan University, 2017, 42(10): 1373-1380. doi: 10.13203/j.whugis20160225

利用Minkowski距离逼近道路网络距离算法研究

doi: 10.13203/j.whugis20160225
基金项目: 

国家自然科学基金 41401455

国家自然科学基金 U1533102

地理国情监测国家测绘地理信息局重点实验室开放基金 2015NGSM10

详细信息
    作者简介:

    卢宾宾, 博士, 讲师, 主要从事空间统计与地理加权建模的理论与方法研究.binbinlu@whu.edu.cn

    通讯作者: 杨欢, 硕士生.yanghuan1007@whu.edu.cn
  • 中图分类号: TP311;P208

Algorithm of Approximating Road Network Distance Via the Minkowski Distance

Funds: 

The National Natural Science Foundation of China 41401455

The National Natural Science Foundation of China U1533102

the Open Fund from Key Laboratory for National Geographic Census and Monitoring 2015NGSM10

More Information
  • 摘要: 道路网络背景下的距离度量(如道路网络距离、旅行时间)是在空间分析或空间统计过程中常用的距离度量,但在科研过程中由于道路数据的可获得性和精度等方面的限制,该类距离的计算可能较为困难。Minkowski距离函数是欧氏空间中的广义距离函数,其参数p值的不同代表着对空间不同的度量。利用Minkowski的通用性和灵活性(参数p不同的取值),研究如何更好地逼近道路网络距离。同时,探索不同道路网络的部分计量特征(如密度、弯曲度等)与最优p值之间的关系。实验证明,相对于最常用的欧氏距离度量,优选p值后的Minkowski距离函数能够更大程度上逼近道路距离。而通过对道路网络计量特征与最优p值之间的关系的分析,指出了弯曲度与最优p值之间的对应关系,它对于p值的选择具有重要的指导意义。此外,为了验证Minkowski距离逼近算法的可行性,以地理加权回归分析为例,通过对比传统的欧氏距离度量、最优Minkowski距离度量和道路网络距离(旅行时间)对模型解算结果的影响,指出优选后Minkowski距离一定程度上更接近于采用旅行时间对模型解算的结果。
  • 图  1  不同p值下距离原点的Minkowski距离为1的等值线形状特征

    Figure  1.  Distance Unit Contour Plots with Nine Different Values of p

    图  2  4种不同类型的道路网络数据

    Figure  2.  Road Network Data Sets for Case Studies

    图  3  不同p值下Minkowski距离和路网距离的离差平方和变化

    Figure  3.  RSS Values Between Road Network and Minkowski Distances with Different Values of p

    图  4  不同p值下Minkowski距离与道路网络距离的误差

    Figure  4.  Errors Between Road Network Distances and the Corresponding Minkowski Distances with Different p

    图  5  加拿大安大略省道路网络

    Figure  5.  Canada Ontario Road Network

    图  6  不同道路网络定量特征与最优p值的关系图

    Figure  6.  Relationships Between Optimum Values of p and Quantitative Features of a Road Network

    图  7  分别采用欧氏距离、Minkowski距离和旅行时间度量的GWR模型系数估计

    Figure  7.  Coefficient Estimates of the GWR Model Using TT, MD and ED Respectively

    表  1  不同距离度量下的GWR模型求解结果诊断信息

    Table  1.   The Diagnosis of GWR Model Under Different Distance Measurement

    校正R2 AIC值
    ED-GWR 0.840 0 37 382.97
    MD-GWR 0.840 4 37 375.57
    ND-GWR 0.847 5 37 337.39
    TT-GWR 0.854 4 37 293.96
    下载: 导出CSV
  • [1] Shahabi C, Kolahdouzan M R, Sharifzadeh M. A Road Network Embedding Technique Fork-Nearest Neighbor Search in Moving Object Databases[J]. Geoinformatica, 2015, 7(3):255-273
    [2] 陈继东, 孟小峰, 赖彩凤.基于道路网络的对象聚类[J].软件学报, 2007, 18(2):332-344 http://www.cnki.com.cn/Article/CJFDTOTAL-RJXB200702019.htm

    Chen Jidong, Meng Xiaofeng, Lai Caifeng. Clustering Objects in a Road Network[J]. Journal of Software, 2007, 18(2):332-344 http://www.cnki.com.cn/Article/CJFDTOTAL-RJXB200702019.htm
    [3] 禹文豪, 艾廷华.核密度估计法支持下的网络空间POI点可视化与分析[J].测绘学报, 2015, 44(1):82-90 doi:  10.11947/j.AGCS.2015.20130538

    Yu Wenhao, Ai Tinghua, The Visualization and Analysis of POI Features under Network Space Supported by Kernel Density Estimation[J]. Acta Geodaetica et Cartographica Sinica, 2015, 44(1):82-90 doi:  10.11947/j.AGCS.2015.20130538
    [4] Lu B B, Charlton M, Fotheringham A S. Geographically Weighted Regression Using A Noneuclidean Distance Metric with A Study on London House Price Data[J].Procedia Environmental Sciences, 2011, 7(8): 92-97 http://eprints.maynoothuniversity.ie/5756/1/MC_GWR%20London.pdf
    [5] Lu B B, Charlton M, Harris P, et al. Geographically Weighted Regression with A Non-Euclidean Distance Metric: A Case Study Using Hedonic House Price Data[J]. International Journal of Geographical Information Science, 2014, 28 (4): 660-681 doi:  10.1080/13658816.2013.865739
    [6] Shahid R, Bertazzon S, Knudtson M L, et al. Comparison of Distance Measures in Spatial Analytical Modeling for Health Service Planning[J]. BMC Health Services Research, 2009, 9(1), 200-214 doi:  10.1186/1472-6963-9-200
    [7] Miller H J, Wentz E A. Representation andSpatial Analysis in Geographic Information Systems[J].Annals of the Association of American Geographers, 2003, 93 (3): 574-594 doi:  10.1111/1467-8306.9303004
    [8] 王炜, 徐吉谦, 杨涛, 等.城市交通规划理论及其应用[M].南京:东南大学出版社, 1998

    Wang Wei, Xu Jiqian, Yang Tao. Urban Traffic Planning Theory and Its Application[M]. Nanjing: Publishing House of Southeast University, 1998
    [9] Gollini Isabella, Lu Binbin, Charlton Martin. GWmodel: An R Package for Exploring Spatial Heterogeneity Using Geographically Weighted Models[J]. Journal of Statistical Software, 2013, 63(17):1-48 http://www.academia.edu/5244406/GWmodel_an_R_Package_for_Exploring_Spatial_Heterogeneity_using_Geographically_Weighted_Models
    [10] Brunsdon C, Fotheringham A S, Charlton M. Geographically Weighted Regression: A Method for Exploring Spatial Nonstationarity[J]. Geographical Analysis, 1996, 28(4): 281-298 https://asu.pure.elsevier.com/en/publications/geographically-weighted-regression-a-method-for-exploring-spatial-2
    [11] Fotheringham A S, Charlton M E, Brunsdon C. Geographically Weighted Regression: A Natural Evolution of the Expansion Method for Spatial Data Analysis[J]. Journal of the Royal Statistical Society, 2002, 60(2):271-293 doi:  10.1068/a301905
    [12] Hurvich C M, Simonoff J S, Tsai C L. Smoothing Parameter Selection in Nonparametric Regression Using an Improved Akaike Information Criterion[J]. Journal of the Royal Statistical Society, 2002, 60(2):271-293
    [13] Lu Binbin, Charlton M, Brunsdon Chris, et al, The Minkowski Approach for Choosing the Distance Metric in Geographically Weighted Regression[J]. International Journal of Geographical Information Science, 2015, 30(2): 1-18
  • [1] 祝会忠, 路阳阳, 徐爱功, 李军.  长距离GPS/BDS双系统网络RTK方法 . 武汉大学学报 ● 信息科学版, 2021, 46(2): 252-261. doi: 10.13203/j.whugis20190352
    [2] 蔡先华, 刘凯丽, 胡卓良, 张远.  利用街区面块拓扑构建道路网络的算法 . 武汉大学学报 ● 信息科学版, 2021, 46(8): 1170-1177. doi: 10.13203/j.whugis20190348
    [3] 卢宾宾, 葛咏, 秦昆, 郑江华.  地理加权回归分析技术综述 . 武汉大学学报 ● 信息科学版, 2020, 45(9): 1356-1366. doi: 10.13203/j.whugis20190346
    [4] 田晶, 方华强, 刘佳佳, 赵风, 任畅.  运用复杂网络方法分析城市道路网的鲁棒性 . 武汉大学学报 ● 信息科学版, 2019, 44(5): 771-777. doi: 10.13203/j.whugis20150334
    [5] 万幼, 刘耀林.  基于地理加权中心节点距离的网络社区发现算法 . 武汉大学学报 ● 信息科学版, 2019, 44(10): 1545-1552. doi: 10.13203/j.whugis20180025
    [6] 王腾, 王艳东, 赵晓明, 付小康, 蒋波涛.  顾及道路网约束的商业设施空间点模式分析 . 武汉大学学报 ● 信息科学版, 2018, 43(11): 1746-1752. doi: 10.13203/j.whugis20160558
    [7] 行瑞星, 武芳, 张浩, 巩现勇.  基于正对投影距离的双线道路提取方法 . 武汉大学学报 ● 信息科学版, 2018, 43(1): 152-158. doi: 10.13203/j.whugis20150783
    [8] 马超, 孙群, 陈换新, 徐青, 温伯威.  加权网页排序算法在道路网自动选取中的应用 . 武汉大学学报 ● 信息科学版, 2018, 43(8): 1159-1165. doi: 10.13203/j.whugis20160127
    [9] 田晶, 余梦婷, 任畅, 熊富全.  城市道路网元胞模式分析的网络景观指数分析法 . 武汉大学学报 ● 信息科学版, 2018, 43(10): 1588-1594. doi: 10.13203/j.whugis20150640
    [10] 秦晓琼, 杨梦诗, 廖明生, 王寒梅, 杨天亮.  应用PSInSAR技术分析上海道路网沉降时空特性 . 武汉大学学报 ● 信息科学版, 2017, 42(2): 170-177. doi: 10.13203/j.whugis20150430
    [11] 付仲良, 杨元维, 高贤君, 赵星源, 逯跃锋, 陈少勤.  利用多元Logistic回归进行道路网匹配 . 武汉大学学报 ● 信息科学版, 2016, 41(2): 171-177. doi: 10.13203/j.whugis20150112
    [12] 刘海龙, 钱海忠, 王骁, 何海威.  采用层次分析法的道路网整体匹配方法 . 武汉大学学报 ● 信息科学版, 2015, 40(5): 644-651. doi: 10.13203/j.whugis20130350
    [13] 栾学晨, 范红超, 杨必胜, 李秋萍.  城市道路网主干道提取的形态分析方法 . 武汉大学学报 ● 信息科学版, 2014, 39(3): 327-331. doi: 10.13203/j.whugis20120078
    [14] 田晶, 何遒, 周梦杰.  运用主成分分析识别道路网中的网格模式 . 武汉大学学报 ● 信息科学版, 2013, 38(5): 604-607.
    [15] 薛树强, 杨元喜.  广义反距离加权空间推估法 . 武汉大学学报 ● 信息科学版, 2013, 38(12): 1435-1439.
    [16] 李清泉, 曾喆, 杨必胜, 李必军.  城市道路网络的中介中心性分析 . 武汉大学学报 ● 信息科学版, 2010, 35(1): 37-41.
    [17] 肖晖, 杨必胜.  一种改进的基于道路网络距离的K近邻查询算法 . 武汉大学学报 ● 信息科学版, 2008, 33(4): 437-439.
    [18] 朱庆, 李渊.  道路网络模型研究综述 . 武汉大学学报 ● 信息科学版, 2007, 32(6): 471-476.
    [19] 翁敏, 毋河海, 杜清运, 李林燕.  基于道路网络知识的启发式层次路径寻找算法 . 武汉大学学报 ● 信息科学版, 2006, 31(4): 360-363.
    [20] 李杰文, 康朝贵.  一种基于时空棱柱的乘车行程可拼性判断模型 . 武汉大学学报 ● 信息科学版, 0, 0(0): -. doi: 10.13203/j.whugis20210633
  • 加载中
图(7) / 表(1)
计量
  • 文章访问数:  1084
  • HTML全文浏览量:  93
  • PDF下载量:  306
  • 被引次数: 0
出版历程
  • 收稿日期:  2017-02-24
  • 刊出日期:  2017-10-05

利用Minkowski距离逼近道路网络距离算法研究

doi: 10.13203/j.whugis20160225
    基金项目:

    国家自然科学基金 41401455

    国家自然科学基金 U1533102

    地理国情监测国家测绘地理信息局重点实验室开放基金 2015NGSM10

    作者简介:

    卢宾宾, 博士, 讲师, 主要从事空间统计与地理加权建模的理论与方法研究.binbinlu@whu.edu.cn

    通讯作者: 杨欢, 硕士生.yanghuan1007@whu.edu.cn
  • 中图分类号: TP311;P208

摘要: 道路网络背景下的距离度量(如道路网络距离、旅行时间)是在空间分析或空间统计过程中常用的距离度量,但在科研过程中由于道路数据的可获得性和精度等方面的限制,该类距离的计算可能较为困难。Minkowski距离函数是欧氏空间中的广义距离函数,其参数p值的不同代表着对空间不同的度量。利用Minkowski的通用性和灵活性(参数p不同的取值),研究如何更好地逼近道路网络距离。同时,探索不同道路网络的部分计量特征(如密度、弯曲度等)与最优p值之间的关系。实验证明,相对于最常用的欧氏距离度量,优选p值后的Minkowski距离函数能够更大程度上逼近道路距离。而通过对道路网络计量特征与最优p值之间的关系的分析,指出了弯曲度与最优p值之间的对应关系,它对于p值的选择具有重要的指导意义。此外,为了验证Minkowski距离逼近算法的可行性,以地理加权回归分析为例,通过对比传统的欧氏距离度量、最优Minkowski距离度量和道路网络距离(旅行时间)对模型解算结果的影响,指出优选后Minkowski距离一定程度上更接近于采用旅行时间对模型解算的结果。

English Abstract

卢宾宾, 杨欢, 孙华波, 于清德. 利用Minkowski距离逼近道路网络距离算法研究[J]. 武汉大学学报 ● 信息科学版, 2017, 42(10): 1373-1380. doi: 10.13203/j.whugis20160225
引用本文: 卢宾宾, 杨欢, 孙华波, 于清德. 利用Minkowski距离逼近道路网络距离算法研究[J]. 武汉大学学报 ● 信息科学版, 2017, 42(10): 1373-1380. doi: 10.13203/j.whugis20160225
LU Binbin, YANG Huan, SUN Huabo, YU Qingde. Algorithm of Approximating Road Network Distance Via the Minkowski Distance[J]. Geomatics and Information Science of Wuhan University, 2017, 42(10): 1373-1380. doi: 10.13203/j.whugis20160225
Citation: LU Binbin, YANG Huan, SUN Huabo, YU Qingde. Algorithm of Approximating Road Network Distance Via the Minkowski Distance[J]. Geomatics and Information Science of Wuhan University, 2017, 42(10): 1373-1380. doi: 10.13203/j.whugis20160225
  • 在空间分析和统计技术应用的过程中,空间距离度量的使用非常普遍,如插值技术、空间相关性分析和空间聚类分析等。而欧氏距离(Euclidean distance)度量往往是默认选择。但是,在融合了道路网络背景的空间分析或统计案例中,欧氏距离往往并不是唯一的或最合适的替代距离度量。Shahabi等[1]指出道路网络中两点之间的空间距离往往取决于道路真实路径的长度,而采用欧氏距离度量进行简化替代是不合理的。陈继东等[2]在基于道路网络语境的空间聚类算法应用过程中,提出对象间邻近性的度量更倾向于采用道路网络距离;禹文豪等[3]在城市兴趣点(point of interest, POI)分布研究中指出,传统核密度估计方法由于采用欧氏距离,忽略了POI的服务功能和空间关联特征,导致对POI分布特征、影响因素的分析缺乏说服力;Lu等[4, 5]在地理加权回归(geographically weighted regression, GWR)分析方法中,分别采用道路网络距离和旅行时间对模型进行解算,相对于传统的使用欧氏距离度量的模型解算,其结果在预测精度和参数估计的合理性方面都有了显著提高。因此,在道路网络背景下的空间分析和统计中,选择能够直接反映其结构和几何特征的道路网络距离会是更加合理的选择。

    另一方面,道路网络距离度量的计算需要较为全面的数据支撑,对数据精度、拓扑一致性、完整性等有较高的要求。但道路网络数据获取困难和质量不高是科研实践中普遍存在的问题,尤其受到国内的高精度矢量数据保密制度的限制,造成了道路网络距离的精确计算非常困难,甚至某些情况下无法计算。因此,如何采用一种高效、便捷、合理的替代距离度量便成了空间分析和统计过程中的常见问题。

    众所周知,Minkowski距离(Minkowski distance, MD)是欧氏几何空间中的广义距离度量,提供了灵活、丰富的度量选择。Shahid等[6]尝试了采用Minkowski距离函数在健康服务规划过程中分别对道路网络距离和旅行时间进行逼近;Miller和Wentz[7]指出当Minkowski距离函数的参数值在1~2之间时,更能接近道路网络距离。

    本文进一步研究利用Minkowski距离函数实现对道路网络距离的最优逼近,同时,研究针对不同类型道路网络的最优逼近情况下的参数值特征,以及道路网络定量描述特征的变化对道路网络形态差异的影响。最后以GWR技术在伦敦市房地产市场建模中的应用为分析案例,采用Minkowski距离实现对道路网络距离的逼近,从实际应用的角度验证本文方法的可行性与有效性。

    • Minkowski距离是欧氏空间中广义的距离度量定义,其计算公式为:

      $${\rm{M}}{{\rm{D}}_p}\left( {x,{\rm{ }}y} \right) = {\left[ {\sum\limits_{i = 1}^n {{{\left| {{x_i} - {y_i}} \right|}^p}} } \right]^{1/p}}$$ (1)

      式中,x= (x1, x2, …, xn)与y=(y1, y2, …, yn)分别为欧氏空间中任意n维向量,p为任意正实数。

      以二维欧氏空间为例,图 1展示了当参数p分别取9个不同的值的时候,距离中心点距离为1的等值线形状特征。从图 1中可以看出,不同的p值给出了不同的空间度量,而相邻的p值所给出的度量特征是近似的。当p值分别为1、2和∞时,式(1) 则分别对应曼哈顿距离、欧氏距离和切比雪夫距离。

      图  1  不同p值下距离原点的Minkowski距离为1的等值线形状特征

      Figure 1.  Distance Unit Contour Plots with Nine Different Values of p

      从Minkowski距离函数的定义以及图 1所展示的不同p值对应的不同度量特征,其具有明显的通用性和灵活性。因此,本文选择其作为工具函数,通过变换和优选参数p的取值,实现对道路网络距离的最优逼近。

    • 在现实地理世界中,由于地形、历史背景、城区规划等因素的影响,道路网络复杂多样、形状各异。一般情况下,道路网络可分为4种典型形式:棋盘式、环形放射式、自由式和混合式[8]。针对不同特征的道路网络,道路网络距离(network distance, ND)的度量也存在较大差异。这意味着针对不同特征的道路网络,Minkowski距离函数对道路网络距离度量达到最优逼近时也将对应不同的p值。因此,本文将结合道路网络形态和分布的定量描述指标,包括网络密度、连接密度、弯曲度和集聚系数,分别研究每个指标与最优p值之间的关系,为采用Minkowski距离函数进行最优距离逼近提供理论依据。

    • 图 2所示,本文针对4种不同类型道路网络(棋盘式、环形放射式、自由式和混合式)分别进行基于Minkowski距离函数的道路网络距离逼近实验,实验步骤设计如下。

      1) 针对每个给定的道路网络,在网络上随机抽取N个点(本文实验采用N=1 000);

      2) 采用Dijkstra算法计算N个点两两之间的道路网络距离(即连接两点的最短路径长度);

      3) 针对任意给定的参数p值,计算这N个点两两之间的Minkowski距离;

      4) 将道路网络距离与给定p值下的Minkowski距离进行比较,通过两组距离值之间的离差平方和(residual sum of squares,RSS)作为当前Minkowski距离对道路网络距离逼近程度的量化表示。通过不断变换参数p的值,使得RSS的值达到最小,此时可认为该p值下定义的Minkowski距离达到了道路网络距离的最优逼近,即误差最小。此过程可表示为:

      $$\begin{array}{l} {\rm{M}}{{\rm{D}}_{{\rm{Optimum}}}} = \\ \mathop {{\rm{min}}}\limits_{p \in \left( {0,\infty } \right)} \left\{ {{\rm{RS}}{{\rm{S}}_p}\left| {\begin{array}{*{20}{l}} {{\rm{RS}}{{\rm{S}}_p} = }\\ {\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {{{\left[ {{\rm{M}}{{\rm{D}}_{ij}}\left( p \right) - {\rm{N}}{{\rm{D}}_{ij}}} \right]}^2}} } } \end{array}} \right.} \right\} \end{array}$$ (8)

      式中,MDij(p)为参数为p时点i与点j之间的Minkowski距离;NDij为对应的道路网络距离。本文所进行的实验均在开源软件R中实现,采用了GW model[9]和shp2graph函数工具包。

    • 为了验证Minkowski距离函数对道路网络距离的逼近效果,本文针对棋盘式、环形放射式、自由式和混合式4种不同类型道路网络分别进行了模拟实验。需要注意的是,实验所采用的数据并非真实道路网络数据,而是依据不同类型道路网络的特点绘制或与真实道路网络结合而成,如图 2(d)中所示路网源于实际的北京市道路网络。

      图  2  4种不同类型的道路网络数据

      Figure 2.  Road Network Data Sets for Case Studies

    • 针对上述4种类型的道路网络,按照实验步骤设计分别进行计算其对应的最优p值。图 3中的4条折线分别展示了不同道路网络对应最优p值的选择过程。其中最优p值点以红色的点标识,分别为1.003 8(棋盘式)、1.444 6(环形放射式)、1.086 2(自由式)、1.201 2(混合式)。其结果与经验预期值也是相符的,如棋盘格式路网对应的最优p值最接近于1,即曼哈顿距离度量。

      图  3  不同p值下Minkowski距离和路网距离的离差平方和变化

      Figure 3.  RSS Values Between Road Network and Minkowski Distances with Different Values of p

      图 3可以看出,在不同p值下的Minkowski距离与路网距离的之间的RSS值形成了对号形状的曲线,具有较为明显的最小值点,即对应的最优p值。因此,整个搜索过程可采用黄金分割法或二分法对p值的搜索区间进行优化和自动确定搜索区间,而不是简单地罗列和穷举式计算,在此不进行详述。此外,从图 3中几条曲线的形状可以看出,以2为分界,当p变大或变小时,Minkowski距离度量对p值的反应也越来越敏感。因此在搜索最优p值时,可依据搜索值域区间与2之间的距离灵活定义搜索步长,值域越靠近2,可采用较粗粒度的搜索;反之,采用较细粒度的搜索。

      为了进一步说明最优p值下Minkowski距离对道路网络距离逼近效果,在环形放射式道路网络上随机取100个点对抽样。针对每一次点抽样过程,分别比较了p=1、p=2和p=1.444 6(最优)时Minkowski距离与道路网络距离之间的RSS值,如图 4所示(为了可视化效果,图 4中所展示的纵坐标值为归一化后的误差值,即所有误差值除以最大误差值)。总体而言,相对于p=1(曼哈顿距离)和p=2(欧氏距离)来说,p=1.444 6(最优)时的Minkowski距离在大多数情况下与道路网络距离之间的误差最小,即其更能精确地逼近道路网络距离,这也说明此算法具备良好的鲁棒性特征。

      图  4  不同p值下Minkowski距离与道路网络距离的误差

      Figure 4.  Errors Between Road Network Distances and the Corresponding Minkowski Distances with Different p

      综合图 3图 4中所示结果,说明不同形态的道路网络对应的最优p值也可能存在较大差异。而且由于真实世界中道路网络的形态复杂、地域差异大等特点,所以针对不同的道路网络所对应的最优p值也不尽相同,甚至不能要求对应的Minkowski距离处处都达到最优逼近。因此,要进一步探索最优p值与道路网络定量描述特征之间的关系,发现不同道路形态和属性特征对应的最优p值分布的影响。

    • 不同形态的道路网络对应的最优p值存在较大的差异,为了发现造成这种差异的原因,本文将探索道路网络的定量描述特征与对应最优p值之间的关系。为了使本部分的结论更具实用性和说服力,实验将采用真实的道路网络数据——加拿大安大略省道路网络(Ontario road network, ORN)。

      为了更好地研究道路网络特征关系,增加样本的丰富程度,将ORN数据分割为15份,其中每一份都具有相对明确的道路特征,如图 5所示。

      图  5  加拿大安大略省道路网络

      Figure 5.  Canada Ontario Road Network

      本文将分别研究最优p值与道路网络弯曲度、网络平均度、路网密度、连接密度和网络集聚系数5个定量描述特征之间的关系。为避免单次随机抽样造成的特殊性,针对每个区域分别进行100次独立随机抽样,最终取每一次随机抽样优选p值的平均值作为该区域道路网络对应的最优p值。

      图 6(a)~6(e)分别展示了最优p值与道路网络弯曲度、网络平均度、路网密度、连接密度和网络集聚系数5个定量描述特征之间的散点图,并采用线性回归分析法分别对其关系进行拟合,所得到的调整R2值分别为0.794 1、-0.061 38、0.162 9、-0.008 86和0.005 44。从结果可以看出,路网的弯曲度和最优p值的大小具有非常强的负相关关系(斜率系数为-1.057 2),即路的弯曲度越小,其最优p值越大(接近于2);而道路弯曲度越大,其最优p值越小(远离2),这也符合从分形学的角度对道路网络形态特征和Minkowski距离函数的测度特征的理解。而其他定量描述特征与最优p值之间并不存在十分明显的线性相关关系,即它们对最优p值的选取影响并非十分明显。为了确保试验结果真实可靠,重新对ORN数据进行了不同形式的分割,所得到的结论基本类似,而针对弯曲度和最优p值进行线性拟合所得到的调整R2值处于0.74~0.80之间,斜率系数集中在-1左右。值得注意的是,针对不同的实验数据,所得到的线性相关关系也会有细微的不同。因此,本部分实验中所得到相关关系并不能作为直接求取最优p值的标准量化准则,仅提供一定意义上的参考作用。

      图  6  不同道路网络定量特征与最优p值的关系图

      Figure 6.  Relationships Between Optimum Values of p and Quantitative Features of a Road Network

    • 为了探索采用Minkowski距离函数对道路网络距离进行逼近的算法在相关空间分析和统计中应用的可行性,本文以GWR技术[10, 11]为例进行了验证。GWR技术通过随空间位置变化而改变的模型系数估计,反映空间数据关系的异质性特征,提供了直观、实用的空间异质性和多相性分析手段。GWR模型解算以回归分析点与周围数据点之间的空间临近度为基础,即空间距离度量,进行权重计算。针对伦敦市房地产市场数据,Lu等[5, 12]使用道路网络距离和旅行时间对模型进行求解,结果表明相对于传统的欧氏距离,道路网络距离和旅行时间能够显著改善模型预测精度,是更合适的距离度量选择。沿用同样的数据和模型,本文将探索是否能够使用Minkowski距离函数对道路网络距离进行逼近,从而改善模型的解算结果。本文所使用的GWR模型为:

      $$\begin{array}{l} {\rm{PURCHAS}}{{\rm{E}}_i} = {\beta _{0i}} + {\beta _{1i}}{\rm{FLOORS}}{{\rm{Z}}_i}\\ + {\beta _{2i}}{\rm{BATH}}{2_i} + {\beta _{3i}}{\rm{PRO}}{{\rm{F}}_i} \end{array}$$ (9)

      式中,PRUCHASE是指房屋的出售价格;FLOORSZ指房屋面积,单位为m2;BATH2与房屋的卫生间个数有关,当房屋有2个或2个以上的卫生间,则取值为1,否则取值为0;PROF指当地从事高收入职业的居民所占比例。

      利用Minkowski距离函数对道路网络距离和旅行时间进行逼近,以赤池信息量准则(Akaike information criterion,AIC)值最小化为标准选取Minkowski距离函数的最优p值,具体逼近算法见文献[13]中的描述,最终选择的p值为0.75。表 1展示了分别采用欧氏距离ED、最优Minkowski距离(MD)、道路网络距离(ND)和旅行时间(travel time, TT)对GWR模型进行解算的结果诊断信息。结果表明相对于欧氏距离度量,优选后的Minkowski距离也能够显著改善GWR模型的求解结果(AIC值减少了7.4),尽管这些模型校正R2值的变化相对较少。

      表 1  不同距离度量下的GWR模型求解结果诊断信息

      Table 1.  The Diagnosis of GWR Model Under Different Distance Measurement

      校正R2 AIC值
      ED-GWR 0.840 0 37 382.97
      MD-GWR 0.840 4 37 375.57
      ND-GWR 0.847 5 37 337.39
      TT-GWR 0.854 4 37 293.96

      为了进一步展示Minkowski距离的逼近效果,图 7展示了分别采用ED、MD和TT(最优解算结果)对式(9) 进行系数估计的结果。其中,图 7(a)7(b)7(c)分别是对自变量FLOORSZ、BATH2和PROF的估计结果,7(d)对回归截距(Intercept)进行估计的结果,红色、绿色和蓝色的线分别对应采用ED、MD和TT进行模型估计的系数曲线。从图 7中可知,相对于采用ED模型求解的传统方式,采用MD一定程度上更接近于最优的估计结果,即采用TT对模型进行解算。此外,MD对连续型自变量FLOORSZ和PROF对应参数的改进效果要优于BATH2和Intercept,其原因有待进一步验证和分析。

      图  7  分别采用欧氏距离、Minkowski距离和旅行时间度量的GWR模型系数估计

      Figure 7.  Coefficient Estimates of the GWR Model Using TT, MD and ED Respectively

    • 本文提出了采用Minkowski距离函数对道路网络背景下的距离度量进行逼近的方法,解决了在空间分析或空间统计过程中无法精确计算道路网络距离所带来的困难。实验表明,相对于较为传统的欧氏距离或曼哈顿距离度量,通过遍历一定范围内(通常为0~2) 不同的参数p值进行优选能够较好地逼近道路网络距离。同时,实验指出道路弯曲度与最优p值之间存在明显的负相关,对缩小p值的优选范围有重要的意义。

      为了阐述采用Minkowski距离对道路网络距离进行逼近的可行性和合理性,在实验过程中采用了道路网络距离和对应Minkowski距离度量之间的RSS值作为比较标准,寻找最优逼近的p值,探索了不同道路网络所对应的不同最优p值与道路网络定量描述特征的之间的关系。而这种方法最大的意义在于道路网络距离未知的情形下,如何利用Minkowski距离函数对其逼近。此时针对实际的空间分析或空间统计技术,需要借助于其他诊断统计量作为标准,通过变换Minkowski距离函数参数值,实现“最优”逼近。本文以GWR技术为应用示例,借助于AIC值的变化寻找对TT最优逼近的p值,从而改善基于伦敦市房地产数据的GWR模型解算结果。因此,本文的真正意义在于指出了Minkowski距离函数对某种未知“最优”距离度量的逼近能力,而不仅限于道路网络距离度量,同时提出了针对具体的空间分析和统计技术如何选择合适的准则进行优化的过程。该方法需要在更多的空间分析和统计技术中应用,利用更丰富的案例分析不断进行完善和提高。

参考文献 (13)

目录

    /

    返回文章
    返回