Ripley’s K函数方法修正与估计方法比较

葛莹, 刘尉, 李勇

葛莹, 刘尉, 李勇. Ripley’s K函数方法修正与估计方法比较[J]. 武汉大学学报 ( 信息科学版), 2023, 48(6): 970-978. DOI: 10.13203/j.whugis20210451
引用本文: 葛莹, 刘尉, 李勇. Ripley’s K函数方法修正与估计方法比较[J]. 武汉大学学报 ( 信息科学版), 2023, 48(6): 970-978. DOI: 10.13203/j.whugis20210451
GE Ying, LIU Wei, LI Yong. Algorithm Modification and Estimation Comparison of Ripley's K-function[J]. Geomatics and Information Science of Wuhan University, 2023, 48(6): 970-978. DOI: 10.13203/j.whugis20210451
Citation: GE Ying, LIU Wei, LI Yong. Algorithm Modification and Estimation Comparison of Ripley's K-function[J]. Geomatics and Information Science of Wuhan University, 2023, 48(6): 970-978. DOI: 10.13203/j.whugis20210451

Ripley’s K函数方法修正与估计方法比较

基金项目: 

国家自然科学基金 41071347

云南省重大科技专项计划 202002AE090010

详细信息
    作者简介:

    葛莹, 博士, 教授, 主要从事空间数据分析研究。geying@hhu.edu.cn

  • 中图分类号: P208

Algorithm Modification and Estimation Comparison of Ripley's K-function

  • 摘要: 深入研究空间点格局分析方法,探讨Ripley’s K函数应用问题,梳理其边界效应改正的定义,综合考虑随机模拟动态性、参数定义合意性和算法可靠性,详细分析各种边界改正算法的优缺点,避免函数的误用。以中国云南省某柑橘种植园为例,采用Ripley’s K函数修正的各种方法,对柑橘植株营养分布的空间点格局进行估计与比较。研究发现,蒙特卡洛模拟次数越多,空间点格局估计结果越准确,建议模拟次数大于2 000次;受困于动态性难题,基于商业软件的算法会导致空间点格局分析结论具有一定的不确定性,建议先构建一组虚拟的空间点格局, 再做蒙特卡洛模拟;推荐使用基于GIS技术的边界效应改正算法,可将一般的矩形研究区推广至任意多边形,能够提高Ripley’s K函数估计结果的可靠性。
    Abstract:
      Objectives  The Ripley's K-function has been widely applied to test for spatial point patterns in many fields such as economic geography, plant geography, and epidemiology. Because of the mathematical confusion of spatial point processes, there are many errors in measuring the distributions of spatial point objects in the corresponding published papers.
      Methods  This paper discusses Monte Carlo simulation method in the application of Ripley's K-function from perspectives of dynamics of random point patterns, suitability of parameter definition, and reliability of edge correction algorithms. First, we introduce the estimation methods of spatial point pattern analysis based on Ripley's K-function. Second, the formula of Ripley's K-function is corrected by various edge effect correction methods and compared in the applications. Finally, the modified algorithm is employed for spatial point pattern analysis of the nutrient concentrations of orange plants in Xinping County, Yunnan Province, China.
      Results  The preliminary results indicated that the number of Monte Carlo simulations has a great influence on the analysis of the observed spatial point patterns. The significance tests of the observed spatial point patterns change in the process of running ArcGIS Ripley's K-function software package, showing some degree of uncertainty of the observed results. The edge effect correction of Ripley's K-function based on GIS techniques is greatly recommended due to its extension to an arbitrary polygon from a common rectangular shape.
      Conclusions  Considering the popularity of Monte Carlo simulation in statistics and spatial data analysis, this paper provides important insights on edge correction and significance tests in other spatial clustering methods.
  • 城市化发展使城市产生不同功能的区域, 发掘并理解功能区域和人类移动规律可制定更好的城市规划便利人类生活[1]。Fusco等[2]将地域定义为地理上有相邻关系的站点,本文在此基础上定义基于地域的移动模式(zone-based movement pattern, ZMP)为一种移动轨迹及该轨迹关联的一对地域——起始地域O和目的地域D,任意ZMP p表示为p=OD。对ZMP的发掘即可达到对地域和移动模式的双重发掘。随着GPS技术的快速发展,车辆的移动记录更容易获取,因此被广泛应用于交通[3-4]、人类活动[5]分析等。本文利用出租车GPS数据对城市居民的出行移动路径进行分析,根据乘客移动轨迹的分布与特征得到地域之间的关系,从而实现对ZMP的发掘。

    目前对移动轨迹的研究有如下几点:①针对城市区域中特定地域间的运动方式的挖掘,如通过基于动态规划和基因算法的方法分析特定区域间的活动模式[6];②通过移动数据进行行为分析,如通过结合空间特征和社会经济学特征的模型分析家庭的旅行模式[7],通过乘客的乘车记录定性分析乘客的搭乘行为[8]等。此外,移动模式的分析还可通过不同领域的数据进行分析[9],如通过智能卡数据评估未来的公共交通情况[10-11]。而在地域的发掘方面,普通的空间聚类方法如K-means[12]、BIRCH[13]等已发展完善,由此产生基于普通空间算法的改进算法,如基因算法[14]、基于层次结合Voronoi的空间聚类算法[15]等。此外,部分方法将聚类方法与约束方法相结合,如通过变化的人口普查数据进行区域的划分[16],通过离散的Voronoi图结合位置关系和种子权重进行区域的划分[17]等。

    以上方法在同时发掘地域和移动轨迹时仍具有一定的局限性。Kim等[18]开创性地提出了一种通过地铁搭乘记录同时发掘地域及乘客移动模式的方法。但该方法只考虑了空间关系而忽略了属性关系,这将产生有失实际的结果,如将距离很近但功能性质相差较远的地域当成相似类地域进行合并。且地铁只能在固定路线行驶,这导致该方法使用范围受限。相较地铁,出租车可从任意出发点行驶到任意目的点,为研究人类移动动态提供更独特的视窗[3]。因此本文在此研究基础上提出一种通过出租车轨迹发掘基于地域的移动模式的方法,它通过空间和属性特征的双重约束,保证了地域间的无重复性,使发掘的ZMP关联的地域的功能更集中,为使用者提供更有力的决策选择。

    本文方法基于聚类分析迭代的合并同一等级的相似实体,通过ZMP的合并实现保留移动方向性前提下的ZMP发掘,达到发掘地域和移动模式的目的。距离和专题属性组成的相邻约束保证了地域专题属性和地域间距离关系的相近性。如图 1所示, ZMP的发掘是通过连接矩阵进行迭代的过程,连接矩阵的元素表征所有ZMP间合并的可能程度,选出最大值后检查其是否满足迭代停止条件,若不满足,则将最大值对应的两个ZMP进行合并并更新连接矩阵,否则返回当前ZMP结果。在了解具体方法前,先介绍数据预处理及与方法相关的概念定义。

    图  1  ZMP发掘的基本流程
    Figure  1.  The Process of Discovering ZMP

    GPS数据源包含大量冗余的信息,需筛选出正确有用的信息,并进行格式编辑,以在发掘算法中被高效利用。预处理主要包括如图 2所示的4个步骤。

    图  2  数据预处理流程
    Figure  2.  Flow Chart of Data Preprocessing

    第1步:GPS数据的筛选包括两方面:①剔除错误和无用的GPS记录,如点范围不合理、非载客状态、非上下客状态时以及重复和不全的记录,仅保留正确的上下客点记录;②每条GPS记录仅保留有用的经纬度值、载客状态等项目。第2步:需确定站点,出租车没有固定的停靠点,GPS点数据是随机分散的,可借助站点进行移动模式确认工作。类似地域的定义,本文将站点定义为地理上有相邻关系的点的聚类结果点,可通过所有上下客点聚类得到站点数据。K-means是一种广泛使用的简单快速的基本聚类方法,经过上步筛选后的GPS点数据基本无噪声,因此本文通过K-means对GPS点聚类得到站点,每个上下客点都有一个隶属站点。第3步:确定移动轨迹记录,乘客的移动情况只需通过起始点和目的点反映,一条上客点记录和一条下客点记录即可组成一条移动记录。更新移动记录的起始点和目的点为其隶属的站点, 则得到最终的移动记录。此外需剔除起始站点和目的站点相同的移动记录,在某种意义上它表示乘客没有移动。第4步:对移动记录数据分类以获取不同移动模式,将起始站点相同且目的站点相同的移动记录归为一类移动模式,并统计该类移动模式中移动记录的数目。

    本文相邻约束实现几何和属性的双重约束。几何约束主要通过Delaunay三角网与Voronoi图[19]实现,即一个实体只与其直接Delaunay相邻实体间有较为明显的作用。本文定义一个实体与它的Delaunay相邻实体的邻接值g与它们之间的空间距离的平方成反比;而对于Delaunay相邻实体之外的对象,g迅速衰减到可以忽略的程度。

    $$ g\left( {p,q} \right) = k\frac{1}{{{d_E}{{\left( {p,q} \right)}^2}}},k = \left\{ \begin{array}{l} 1,q \in {N_p}\\ 0,q \notin {N_p} \end{array} \right. $$ (1)

    式中,dE(p, q)表示实体p与其他实体q间的空间距离;k为邻近标志;Np表示与实体p的Delaunay相邻的实体集合。

    但实体分布较分散时距离相隔很远的实体也可能是Delaunay相邻的,这可能导致此类实体的合并。因此需加入空间距离进一步约束,仅当两个实体Delaunay相邻且两者间的空间距离dE不超过阈值δ时才是几何相邻的。从而g值表示为:

    $$ \begin{array}{*{20}{c}} {g\left( {p,q} \right) = \frac{k}{{{{d'}_E}{{\left( {p,q} \right)}^2}}},}\\ {k = \left\{ \begin{array}{l} 1,q \in {N_p}\;且\;{d_E}\left( {p,q} \right) \le \delta \\ 0,q \notin {N_p}\;或\;{d_E}\left( {p,q} \right) > \delta \end{array} \right.} \end{array} $$ (2)

    式中,Np表示实体p的几何相邻实体的集合; d′E(p, q)是dE(p, q)归一化结果。

    属性约束通过专题属性实现。即将空间属性与专题属性归一化后分别计算空间距离与专题属性距离,再进行加权融合即得到相邻距离DE, 表达式为:

    $$ \begin{array}{*{20}{c}} {{D_E}\left( {p,q} \right) = {w_1}\sqrt {{{\left( {{x_p} - {x_q}} \right)}^2} + {{\left( {{y_p} - {y_q}} \right)}^2}} + }\\ {{w_2}\sqrt {\sum\limits_{k = 1}^n {\left( {{A_{pk}} - {A_{qk}}} \right)} } } \end{array} $$ (3)

    式中,Apk表示实体p的第k维专题属性值; w1w2表示几何约束与属性约束的权值,默认情况为w1=w2=0.5。

    通过DE替代式(2)中的d′E得到两个实体的最终g值为:

    $$ \begin{array}{*{20}{c}} {g\left( {p,q} \right) = k\frac{1}{{{D_E}{{\left( {p,q} \right)}^2}}},}\\ {k = \left\{ \begin{array}{l} 1,q \in {N_p}\;且\;{d_E}\left( {p,q} \right) \le \delta \\ 0,q \notin {N_p}\;或\;{d_E}\left( {p,q} \right) > \delta \end{array} \right.} \end{array} $$ (4)

    给定N个站点的集合S={s1sN},则有如下定义。

    定义1  地域zi是由一个或若干站点组成的,即zi={sisk}(1≤ikN)。不同地域不包含相同的站点,即对任意地域zizj(ij)都有spsq(spzi, sqzj)。任意站点可看作单地域,即由单个站点组成的地域。

    定义2  两个地域间的邻接值为两个地域zizj中站点间邻接值的平均值:

    $$ g\left( {{z_i},{z_j}} \right) = \frac{{\sum {g\left( {{s_p},{s_q}} \right)} }}{n},{s_p} \in {z_i},{s_q} \in {z_j} $$ (5)

    式中,g(sp, sq)为站点sp和站点sq间的邻接值;nzizj中站点对的数目。

    定义3  地域zi的属性平均值$\overline {A\left( {{z_i}} \right)} $为该地域中所有站点的属性的平均值:

    $$ \overline {A\left( {{z_i}} \right)} = \frac{{\sum\limits_{i = 1}^n {A\left( {{s_p}} \right)} }}{n},{s_p} \in {z_i} $$ (6)

    式中,A(sp)为站点sp归一化后的专题属性值;n为地域zi中的站点数目。

    定义4  地域zizj间的相邻系数为邻接值与专题属性平均值差异的比值,记为G(zi, zj):

    $$ G\left( {{z_i},{z_j}} \right) = \frac{{g\left( {{z_i},{z_j}} \right)}}{{\left| {\overline {A\left( {{z_i}} \right)} - \overline {A\left( {{z_j}} \right)} } \right|}} $$ (7)

    G(zi, zj)值越大, 表明地域zizj空间距离越小, 属性越接近,反之亦然。

    定义5  地域zizj是相邻的, 当且仅当G(zi, zj)≥γ成立,否则不相邻。γ为地域合并最小值,只有相邻的地域才可能合并。

    在以上地域的定义的基础上,对ZMP可定义为:已知初始状态下包含有N1个地域的集合Z={z1zN1}关联了N2种ZMP,可表示为ZMP集M={m1mN2},其中mk=z0zd(1≤kN2, z0Z, zdZz0zd)。通过该ZMP集M迭代发掘到的第i种ZMP为:pi=OiDi(OiZ, DiZOiDi)。

    定义6  对ZMP pi=OiDipj=OjDj,若OiOj相邻且DiDj相邻,则这两个ZMP相邻。

    定义7  两个ZMP pi=OiDipj=OjDj间的连接值为两者的起始地域的合并地域中站点到目的地域的合并地域站点的平均数目[18]

    $$ \begin{array}{*{20}{c}} {{\rho _{i,j}} = \rho \left( {{p_i},{p_j}} \right) = k\frac{{n\left( {{O_i} \cup {O_j} \to {D_i} \cup {D_j}} \right)}}{{\left| {{O_i} \cup {O_j}} \right| \cdot \left| {{D_i} \cup {D_j}} \right|}},}\\ {k = \left\{ \begin{array}{l} 1,{p_j} \in {N_{{p_i}}}\\ 0,{p_j} \notin {N_{{p_i}}} \end{array} \right.} \end{array} $$ (8)

    式中,n(OiOjDiDj)表示从合并起始地域OiOj到合并目的地域DiDj的移动数目;Npipi相邻的ZMP集合。两种相邻的ZMP覆盖的轨迹数目越多,关联的站点越少,ρi, j就越大,两者越可能合并。且根据定义有ρi, j=ρj, i

    定义8   已知两个ZMP pi=OiDipj=OjDj,定义两者合并得到的新ZMP为:

    $$ {p_t} = {Q_t} \to {D_t}\left( {{O_t} = {O_i} \cup {O_j},{D_t} = {D_i} \cup {D_j}} \right) $$ (9)

    定义9  已知ZMP pi=OiDipj=OjDj,若OjOiDjDi, 则pjpi的子集。

    定义10  已知ZMP pi=OiDipj=OjDj,若Oi=OjDjDi=OjDj,则pjpi的子集。子集解决不同地域出现相同站点的问题,使得新发掘的地域无交叠,更易理解。

    通过式(8)可构建表示ZMP集中任意ZMP间连接值的连接矩阵。由于pi, j=pj, i,可采用上三角连接矩阵表示MN2个ZMP间的连接值:

    $$ \mathit{\boldsymbol{C}} = \left( {\begin{array}{*{20}{c}} 0&{{\rho _{1,2}}}& \cdots &{{\rho _{1,{N_2} - 1}}}&{{\rho _{1,{N_2}}}}\\ 0&0& \cdots &{{\rho _{2,{N_2} - 1}}}&{{\rho _{2,{N_2}}}}\\ \vdots&\vdots&\ddots&\vdots&\vdots \\ 0&0& \cdots &0&{{\rho _{{N_2} - 1,{N_2}}}}\\ 0&0& \cdots &0&0 \end{array}} \right) $$ (10)

    新ZMP的发掘算法通过连接矩阵C获取当前迭代中最优合并的两个ZMP。整体流程如下:

    在初始化阶段,将每个站点初始化为单地域得到地域集Z,移动模式初始化为ZMP得到ZMP集M,则可得初始连接矩阵C(1);第k次迭代时对当前M包含的Rk条ZMP计算连接矩阵C(k),将矩阵最大元素ρ*(k)=max(ρi, j(k))(i, j=1…Rkij)关联的两个ZMP合并成新ZMP pt,在剩余ZMP中找到pt的子集合并到pt,M将移除所有合并入pt的ZMP并加入新ZMP pt,同时移除的ZMP关联的地域会从Z中移除,而pt关联的两个新地域将被加入。此外,pt的自集关联的两个地域在更新关联地域后同属一个,需从M中移除。一次迭代后,M中会减少至少2个ZMP,新增1个A类ZMP,有若干C类ZMP可能更新为B类ZMP。更新完ZM及连接矩阵后继续下一次迭代,直到剩余的ZMP不能合并或连接矩阵中的最大值比阈值θ小,停止迭代,将M返回得到最终结果。

    本文将类似pt这样由其他ZMP合并成的新ZMP记为A类ZMP。若被移除的地域在M中仍有其他关联的ZMP,则需用其所属的新地域更新这些ZMP的关联地域,本文记这类与新地域关联但不是新合成的ZMP为B类ZMP,剩下与新地域无关联的ZMP记为C类ZMP,三类ZMP的区别如表 1所示。

    表  1  三类ZMP的区别
    Table  1.  Difference of Three Trpes of ZMP
    条件A类B类C类
    由两个ZMP合并成××
    关联地域中有新地域×
    下载: 导出CSV 
    | 显示表格

    本文采用北京市连续3天的出租车GPS数据。筛选后得到195 622条移动轨迹记录,覆盖了391 244个上下客站点(见图 3(a))。通过K-means对其初聚类得到站点数据,K值决定了初始地域的粒度,继而影响最终结果地域的粒度,K值越大, 产生的新地域的覆盖范围越小、越精细,根据不同的数据及需求可选择不同的K值。本文以中粒度100个站点为例进行实验(见图 3(b)),本文专题属性采用不同类型的兴趣点在北京的分布来表示(见图 3(c)图 3(d)),选取的5种类型的兴趣点分别为购物点、教育点、景点、企业点和居民区。这与人类的日常生活关联较为紧密,因此足够表达出城市的不同的功能,本文兴趣点数据来源于百度地图。

    图  3  实验数据成图
    Figure  3.  Visualization of the Data

    图 4(a)是100个站点间的Voronoi图,图中的数字是相应站点的标识码,由此可推断站点间Delaunay相邻关系。对195 622条移动记录分类,并去掉起始站点与目的站点相同的记录,得到674种移动模式共覆盖182 519条移动轨迹。对移动模式覆盖的移动记录数目的统计结果如图 4(b)所示,横、纵坐标分别为起始和目的站点标识码,站点标志码从0增到100,图中格子颜色越深,表示移动数目越多,其能反映更多人的活动轨迹,会优先被用到算法中。但该图中浅色占大部分,这类移动轨迹数目较少的移动模式在发掘算法中大部分是不被用到的,去掉这部分移动模式可减少算法的计算和时间耗费,并消除噪声。本文以去掉移动数目小于100的移动模式为例进行实验,经筛选后剩余336种移动模式共覆盖48 644条移动轨迹。将每个站点初始化单地域,则336种移动模式可全部初始化C类ZMP进行后续发掘。

    图  4  100个站点间的关系
    Figure  4.  Relation Between the 100 Stations

    为定量评估新产生的ZMP和地域,本文采用3种评估值[30]:评估覆盖度的v值、评估精准度的a值和对前两者折中评估的c值。如对ZMP pi=OiDi的评估方法如式(11)所示。

    $$ \left\{ \begin{array}{l} v\left( {{p_i}} \right) = r\left( {{O_i} \to {D_i}} \right) = \frac{{n\left( {{O_i} \to {D_i}} \right)}}{m}\\ a\left( {{p_i}} \right) = \frac{{r\left( {{O_i} \to {D_i}} \right)}}{{r\left( {{O_i} \to D.} \right) \cdot r\left( {O. \to {D_i}} \right)}} = \\ \;\;\;\;\;\;\;\;\;\;\frac{{mn\left( {{O_i} \to {D_i}} \right)}}{{n\left( {{O_i} \to D.} \right) \cdot n\left( {O. \to {D_i}} \right)}}\\ c\left( {{p_i}} \right) = \sqrt {v\left( {{p_i}} \right)a\left( {{p_i}} \right)} = \\ \;\;\;\;\;\;\;\;\;\;\frac{{n\left( {{O_i} \to {D_i}} \right)}}{{\sqrt {n\left( {{O_i} \to D.} \right) \cdot n\left( {O. \to {D_i}} \right)} }} \end{array} \right. $$ (11)

    其中,r(OiDi)、r(O·Di)、r(OiD·)依次为从OiDi的移动轨迹数目比例、以Di为目的地域的移动轨迹数目比例、以Oi为起始地域的移动轨迹数目的比例;n(OiDi)是从OiDi移动轨迹数目;m是移动轨迹的总数目。v值通过ZMP覆盖的移动轨迹数目计算,v值越高,则相应ZMP的关联地域间的联系更紧密;a值通过ZMP关联的起始地域和目的地域的独立度计算,其暗示关联的两个地域间有内在联系;c值是覆盖度和准确度的平衡,它可挖掘到性能较好但不易发现的隐藏ZMP。

    地域合并最小值γ的影响将在后文详细描述。本文以γ=10为例,使算法迭代到没有可合并的ZMP为止,最终共迭代了19次后返回最终结果。图 5(a)-5(d)依次是第5、10、15、19次迭代后产生的A类ZMP关联的新地域。

    图  5  迭代中产生的新地域
    Figure  5.  Newly Discovered Zones in Iteration

    最终ZMP集中有238个ZMP,包含14个A类ZMP(见图 6),124个B类ZMP以及100个C类ZMP。最终结果产生了13个新地域(见表 2)。

    图  6  新发掘的A类ZMP
    Figure  6.  Newly Discovered A Type ZMP
    表  2  新地域
    Table  2.  Newly Discovered Zones
    地域组成站点
    z195,83,78
    z253,34
    z322,11,1
    z413,2
    z582,80
    z633,27
    z754,24
    z852,43,37
    z940,28,3
    z1051,42,30
    z1196,39
    z1276,69
    z1321,19,8
    下载: 导出CSV 
    | 显示表格

    为评估238个ZMP,分别计算3类ZMP的v值、a值、c值的平均值,并与336个初始ZMP和238个结果ZMP的总体平均值对比。图 7(a)是平均v值的对比结果,可发现A类ZMP>B类ZMP>C类ZMP,即发掘的新地域关联的ZMP(A、B类ZMP的并集)相较普通ZMP有较好的覆盖度;同时结果ZMP相比初始ZMP,平均v值有很大提升,从侧面反映出发掘的新ZMP有较大的覆盖度。图 7(b)图 7(c)是平均a值和平均c值的对比结果,与平均v值结果相同,即A类ZMP不论在覆盖度、精准度还是两者折中的评估标准上都有最好的评估结果,B类ZMP次之,且都优于C类ZMP以及未经处理的初始ZMP。由此反映算法发掘到的新ZMP相较其他ZMP有更优的性能。

    图  7  平均v值、a值、c值对比
    Figure  7.  Comparison of the Average v, a, c Values

    为研究γ值影响,固定迭代次数为15次,改变γ值,变化如表 3所示。随着γ的增大,新地域的数目先从5增加到11后减小至0,参与合并新地域的初始地域数目也有相同的变化趋势,而新地域中的最大地域(组成地域数目最多的地域)组成的地域数目却一直在减少。当γ较小时如γ∈[0, 1]时,更多地域间的相邻系数满足G>γ,导致更多地域被合并到同一新地域中,从而产生的新地域不多,且更多次迭代耗费在合并初始地域与另一新地域而非两个初始地域上,因此参与合并的初始地域总数增势缓慢;当γ在[1, 5),满足G>γ的地域对的数目逐渐减小,更多地产生由初始地域两两合成的新地域,新地域数目增幅明显。同理,更多次迭代会耗费在将合并两个初始地域上,参与合并的初始地域总数随之增多,直到γ=5达到最大。当γ继续增大,满足G>γ的地域对数目剧烈减少,各项指标也随之降低,直到γ=220时已无满足G>γ的地域对可合并,几项指标也随之降到0。

    表  3  γ值对产生的新地域的影响
    Table  3.  Influence of γ on the Newly Discovered Zone
    地域γ值
    00.1151020304050200220
    新地域5561110943220
    参与合并初始地域20202126251886420
    最大地域组成地域1211943222210
    下载: 导出CSV 
    | 显示表格

    表 4为不同γ值下的结果ZMP的c值评估。γ≥220时不会产生新ZMP,因此不对该范围讨论。随着γ的增大,C类ZMP平均的c值与结果ZMP的平均c值基本持平,A类、B类ZMP的平均c值大体呈下降的趋势,但一直都高于初始ZMP的平均c值,证明通过该算法可在初始ZMP中发掘到性能优良的隐藏ZMP。且不论γ为何值,都有A类ZMP >B类ZMP >C类ZMP,即算法发掘的新地域关联的ZMP的c值优于普通ZMP,反映出该算法在多种条件下都能发掘当前较优的ZMP和地域。

    表  4  γ值对c值的影响
    Table  4.  Influence of γ on c Value
    ZMPγ值
    00.1151020304050200220
    A类ZMP0.346 80.332 80.295 80.218 10.238 90.202 40.172 30.178 60.193 60.168 9-
    B类ZMP0.142 60.139 00.137 10.138 80.136 70.142 20.130 10.145 50.151 40.135 9-
    C类ZMP0.098 00.104 60.112 10.133 90.122 30.111 80.091 40.086 80.083 00.080 3-
    结果ZMP0.103 60.109 90.118 10.138 50.127 50.114 60.092 40.087 60.083 70.080 6-
    初始ZMP0.076 7-
    下载: 导出CSV 
    | 显示表格

    本文研究了基于出租车乘车记录的ZMP的发掘即移动模式和地域的双重发掘。通过从出租车轨迹数据筛选出有用的数据来达到同时确认地域和地域之间的移动模式的目的,并以北京出租车数据为例进行了模型验证分析,实验结果显示,本文方法在发掘ZMP上能得到满意的结果,新发掘到的移动模式与其关联地的地域将有助于决策者更好地理解地域的存在以及这些地域之间的关系。下一步的工作将比较预处理中不同聚类算法对ZMP发掘的影响,同时会考虑采纳更多属性因素以及对连接矩阵的迭代算法进一步优化,以提高新发掘的ZMP的性能与分析效率。

  • 图  1   柑橘种植研究区

    Figure  1.   Study Area of Citrus Planting

    图  2   蒙特卡洛模拟次数的影响

    Figure  2.   Influence of Monte Carlo Simulation Number

    图  3   蒙特卡洛模拟动态性的影响

    Figure  3.   Influence of Monte Carlo Simulation Dynamics

    图  4   ArcGIS算法和修正算法的比较

    Figure  4.   Comparison of ArcGIS and Modified Algorithms

    图  5   边界效应改正算法的比较

    Figure  5.   Comparison of Edge Effect Correction Algorithms

  • [1] 刘生龙, 胡鞍钢. 交通基础设施与中国区域经济一体化[J]. 经济研究, 2011, 46(3): 72-82. https://www.cnki.com.cn/Article/CJFDTOTAL-JJYJ201103007.htm

    Liu Shenglong, Hu Angang. Transportation Infrastructure and Regional Economic Integration in China[J]. Economic Research Journal, 2011, 46(3): 72-82. https://www.cnki.com.cn/Article/CJFDTOTAL-JJYJ201103007.htm

    [2] 李郇, 徐现祥. 中国撤县(市)设区对城市经济增长的影响分析[J]. 地理学报, 2015, 70(8): 1202-1214.

    Li Xun, Xu Xianxiang. Impact Analysis of Turning Counties (Cities) into Districts to the Urban Economic Growth in China[J]. Acta Geographica Sinica, 2015, 70(8): 1202-1214.

    [3] 王小鲁. 中国城市化路径与城市规模的经济学分析[J]. 经济研究, 2010, 45(10): 20-32. https://www.cnki.com.cn/Article/CJFDTOTAL-JJYJ201010003.htm

    Wang Xiaolu. Urbanization Path and City Scale in China: An Economic Analysis[J]. Economic Research Journal, 2010, 45(10): 20-32. https://www.cnki.com.cn/Article/CJFDTOTAL-JJYJ201010003.htm

    [4]

    Besag J. Discussion on Dr Ripley's Paper[J]. Journal of the Royal Statistical Society: Series B, 1977, 39(2): 192-212.

    [5]

    Ripley B D. Tests of 'Randomness' for Spatial Point Patterns[J]. Journal of the Royal Statistical Society: Series B, 1979, 41(3): 368-374.

    [6]

    Getis A. Interaction Modeling Using Second-order Analysis[J]. Environment and Planning A: Economy and Space, 1984, 16(2): 173-183. doi: 10.1068/a160173

    [7]

    McIntire E J B, Fajardo A. Beyond Description: The Active and Effective Way to Infer Processes from Spatial Patterns[J]. Ecology, 2009, 90(1): 46-56. doi: 10.1890/07-2096.1

    [8]

    Sweeney S H, Feser E J. Plant Size and Clustering of Manufacturing Activity[J]. Geographical Analysis, 2010, 30(1): 45-64. doi: 10.1111/j.1538-4632.1998.tb00388.x

    [9]

    Marcon E, Puech F. Evaluating the Geographic Concentration of Industries Using Distance-Based Methods[J]. Journal of Economic Geography, 2003, 3(4): 409-428. doi: 10.1093/jeg/lbg016

    [10]

    Barff R A. Industrial Clustering and the Organization of Production: A Point Pattern Analysis of Manufacturing in Cincinnati, Ohio[J]. Annals of the Association of American Geographers, 1987, 77(1): 89-103. doi: 10.1111/j.1467-8306.1987.tb00147.x

    [11]

    Arbia G, Espa G, Quah D. A Class of Spatial Econometric Methods in the Empirical Analysis of Clusters of Firms in the Space[J]. Empirical Economics, 2008, 34(1): 81-103. doi: 10.1007/s00181-007-0154-1

    [12]

    Ge Y, Pu Y X, Sun M D. Alternative Measure of Border Effects Across Regions: Ripley's K-function Method[J]. Papers in Regional Science, 2021, 100(1): 287-302. doi: 10.1111/pirs.12565

    [13]

    Perry G L W, Miller B P, Enright N J. A Comparison of Methods for the Statistical Analysis of Spatial Point Patterns in Plant Ecology[J]. Plant Ecology, 2006, 187(1): 59-82. doi: 10.1007/s11258-006-9133-4

    [14]

    Law R, Illian J, Burslem D F R P, et al. Ecological Information from Spatial Patterns of Plants: Insights from Point Process Theory[J]. Journal of Ecology, 2009, 97(4): 616-628. doi: 10.1111/j.1365-2745.2009.01510.x

    [15] 马志波, 肖文发, 黄清麟, 等. 生态学中的点格局研究概况及其在国内的应用[J]. 生态学报, 2017, 37(19): 6624-6632. https://www.cnki.com.cn/Article/CJFDTOTAL-STXB201719035.htm

    Ma Zhibo, Xiao Wenfa, Huang Qinglin, et al. A Review of Point Pattern Analysis in Ecology and Its Application in China[J]. Acta Ecologica Sinica, 2017, 37(19): 6624-6632. https://www.cnki.com.cn/Article/CJFDTOTAL-STXB201719035.htm

    [16]

    Gottwald T R, Sun X A, Riley T, et al. Geo-Referenced Spatiotemporal Analysis of the Urban Citrus Canker Epidemic in Florida[J]. Phytopathology, 2002, 92(4): 361-377. doi: 10.1094/PHYTO.2002.92.4.361

    [17]

    Polonsky J A, Martínez-Pino I, Nackers F, et al. Descriptive Epidemiology of Typhoid Fever During an Epidemic in Harare, Zimbabwe, 2012[J]. PLoS One, 2014, 9(12): e114702. doi: 10.1371/journal.pone.0114702

    [18]

    Yamada I, Rogerson P. An Empirical Comparison of Edge Effect Correction Methods Applied to K -function Analysis[J]. Geographical Analysis, 2003, 35(2): 97-109.

    [19]

    Ripley B D. The Second-Order Analysis of Stationary Point Processes[J]. Journal of Applied Probability, 1976, 13(2): 255-266. doi: 10.2307/3212829

    [20]

    Ripley B D. Modelling Spatial Patterns[J]. Journal of the Royal Statistical Society Series B, 1977, 39(2): 172-192.

    [21]

    Ripley B D. The Analysis of Geographical Maps[M]//Exploratory and Explanatory Statistical Ana-lysis of Spatial Data. Dordrecht: Springer Netherlands, 1979: 53-72.

    [22]

    Ripley B D. Spatial Statistics[M]. New York: Wiley, 1981

    [23]

    Diggle P J. Statistical Methods for Spatial Point Patterns in Ecology [M]//Spatial and Temporal Ana-lysis in Ecology. Fairland: International Co-operative Publishing House, 2008.

    [24]

    Besag J, Diggle P. Simple Monte Carlo Tests for Spatial Pattern[J]. Applied Statistics, 1977, 26: 327-333. doi: 10.2307/2346974

    [25]

    Getis A. Second-order Analysis of Point Patterns: The Case of Chicago as a Multi-center Urban Region[J]. The Professional Geographer, 1983, 35(1): 73-80. doi: 10.1111/j.0033-0124.1983.00073.x

    [26]

    Cliff A D, Ord J K. Spatial Processes: Models and Applications[M]. London: Pion, 1981.

    [27]

    Hope A C A. A Simplified Monte Carlo Significance Test Procedure[J]. Journal of the Royal Statistical Society Series B: Statistical Methodology, 1968, 30(3): 582-598.

    [28]

    Ripley B D, Silverman B W. Quick Tests for Spatial Interaction[J]. Biometrika, 1978, 65(3): 641-642. doi: 10.1093/biomet/65.3.641

    [29]

    Diggle P. Statistical Analysis of Spatial Point Patterns[M]. London: Academic Press, 1983.

    [30]

    Haase P. Spatial Pattern Analysis in Ecology Based on Ripley's K-function: Introduction and Methods of Edge Correction[J]. Journal of Vegetation Science, 1995, 6(4): 575-582. doi: 10.2307/3236356

    [31]

    Griffith D A. The Boundary Value Problem in Spatial Statistical Analysis[J]. Journal of Regional Science, 1983, 23(3): 377-387. doi: 10.1111/j.1467-9787.1983.tb00996.x

    [32]

    Diggle P. Statistical Analysis of Spatial Point Patterns[M]. London: Arnold, 2003.

    [33]

    Wiegand T, Moloney A K. Rings, Circles, and Null-Models for Point Pattern Analysis in Ecology [J]. Oikos, 2004, 104(2): 209-229. doi: 10.1111/j.0030-1299.2004.12497.x

    [34]

    Upton G, Fingleton B. Spatial Data Analysis by Example. Volume 1: Point Pattern and Quantitative Data [M]. Chichester: Wiley, 1985.

    [35]

    Sterner R W, Ribic C A, Schatz G E. Testing for Life Historical Changes in Spatial Patterns of Four Tropical Tree Species[J]. Journal of Ecology, 1986, 74(3): 621. doi: 10.2307/2260386

    [36]

    Szwagrzyk J, Czerwczak M. Spatial Patterns of Trees in Natural Forests of East-central Europe[J]. Journal of Vegetation Science, 1993, 4(4): 469-476. doi: 10.2307/3236074

    [37]

    Getis A, Franklin J. Second-order Neighborhood Analysis of Mapped Point Patterns[J]. Ecology, 1987, 68(3): 473-477. doi: 10.2307/1938452

    [38]

    Goreaud F, Pelissier R. On Explicit Formulas of Edge Effect Correction for Ripley's K-function[J]. Journal of Vegetation Science, 1999, 10(3): 433-438. doi: 10.2307/3237072

    [39] 张金屯. 植物种群空间分布的点格局分析[J]. 植物生态学报, 1998, 22(4): 344-349. doi: 10.3321/j.issn:1005-264X.1998.04.008

    Zhang Jintun. Analysis of Spatial Point Pattern for Plant Species[J]. Acta Phytoecologica Sinica, 1998, 22(4): 344-349. doi: 10.3321/j.issn:1005-264X.1998.04.008

    [40] 张金屯, 孟东平. 芦芽山华北落叶松林不同龄级立木的点格局分析[J]. 生态学报, 2004, 24(1): 35-40. doi: 10.3321/j.issn:1000-0933.2004.01.006

    Zhang Jintun, Meng Dongping. Spatial Pattern Analysis of Individuals in Different Age-classes of Larix Principis-rupprechtii in Luya Mountain Reserve, Shanxi, China[J]. Acta Ecologica Sinica, 2004, 24(1): 35-40. doi: 10.3321/j.issn:1000-0933.2004.01.006

    [41] 杨洪晓, 张金屯, 吴波, 等. 毛乌素沙地油蒿种群点格局分析[J]. 植物生态学报, 2006, 30(4): 563-570. doi: 10.3321/j.issn:1005-264X.2006.04.004

    Yang Hongxiao, Zhang Jintun, Wu Bo, et al. Point Pattern Analysis of Artemisia Ordosica Population in the Mu Us Sandy Land[J]. Journal of Plant Ecology, 2006, 30(4): 563-570. doi: 10.3321/j.issn:1005-264X.2006.04.004

    [42] 惠刚盈, 李丽, 赵中化, 等. 林木空间分布格局分析方法[J]. 生态学报, 27(11): 4717-4728. doi: 10.3321/j.issn:1000-0933.2007.11.040

    Hui Gangyin, Li Li, Zhao Zhonghua, et al. The Comparison of Methods in Analysis of the Tree Spatial Distribution Pattern [J]. Acta Ecologica Sinica, 27(11): 4717-4728. doi: 10.3321/j.issn:1000-0933.2007.11.040

    [43] 李立, 陈建华, 任海保, 等. 古田山常绿阔叶林优势树种甜槠和木荷的空间格局分析[J]. 植物生态学报, 2010, 34(3): 241-252. doi: 10.3773/j.issn.1005-264x.2010.03.001

    Li Li, Chen Jianhua, Ren Haibao, et al. Spatial Patterns of Castanopsis Eyrei and Schima Superba in Mid-subtropical Broad-leaved Evergreen Forest in Gutianshan National Reserve, China[J]. Chinese Journal of Plant Ecology, 2010, 34(3): 241-252. doi: 10.3773/j.issn.1005-264x.2010.03.001

    [44] 沈陈华. 丹阳市农村居民点空间分布尺度特征及影响因素分析[J]. 农业工程学报, 2012, 28(22): 261-268. https://www.cnki.com.cn/Article/CJFDTOTAL-NYGU201222038.htm

    Shen Chenhua. Spatial Distribution Scale Characteristics of Rural Settlements and Analysis on Influencing Factors in Danyang City[J]. Transactions of the Chinese Society of Agricultural Engineering, 2012, 28(22): 261-268. https://www.cnki.com.cn/Article/CJFDTOTAL-NYGU201222038.htm

    [45] 方忠权. 广州会展企业空间集聚特征与影响因素[J]. 地理学报, 2013, 68(4): 464-476.

    Fang Zhongquan. The Agglomeration Characteristics and Influencing Factors of Exhibition Enterprises in Guangzhou[J]. Acta Geographica Sinica, 2013, 68(4): 464-476.

    [46] 佘冰, 朱欣焰, 呙维, 等. 基于空间点模式分析的城市管理事件空间分布及演化: 以武汉市江汉区为例[J]. 地理科学进展, 2013, 32(6): 924-931. https://www.cnki.com.cn/Article/CJFDTOTAL-DLKJ201306011.htm

    She Bing, Zhu Xinyan, Guo Wei, et al. Spatial Distribution and Evolution of City Management Events Based on the Spatial Point Pattern Analysis: A Case Study of Jianghan District, Wuhan City[J]. Progress in Geography, 2013, 32(6): 924-931. https://www.cnki.com.cn/Article/CJFDTOTAL-DLKJ201306011.htm

    [47] 葛莹, 朱国慧, 王华辰, 等. 基于Ripley's K函数浙江城市空间格局及其影响分析[J]. 地理科学, 2014, 34(11): 1361-1368.

    Ge Ying, Zhu Guohui, Wang Huachen, et al. Pattern and Impact of Urban Spatial Distribution in Zhejiang Province Based on Ripley's K Function[J]. Scientia Geographica Sinica, 2014, 34(11): 1361-1368.

    [48] 胡美娟, 李在军, 侯国林, 等. 江苏省乡村旅游景点空间格局及其多尺度特征[J]. 经济地理, 2015, 35(6): 202-208. https://www.cnki.com.cn/Article/CJFDTOTAL-JJDL201506029.htm

    Hu Meijuan, Li Zaijun, Hou Guolin, et al. Multi-scale Spatial Patterns Characteristic of Rural Tourism Attractions in Jiangsu Province[J]. Economic Geo-graphy, 2015, 35(6): 202-208. https://www.cnki.com.cn/Article/CJFDTOTAL-JJDL201506029.htm

    [49] 王结臣, 卢敏, 苑振宇, 等. 基于Ripley's K函数的南京市ATM网点空间分布模式研究[J]. 地理科学, 2016, 36(12): 1843-1849.

    Wang Jiechen, Lu Min, Yuan Zhenyu, et al. Point Pattern Analysis of ATMs Distribution Based on Ripley's K-function Method in Nanjing City[J]. Scientia Geographica Sinica, 2016, 36(12): 1843-1849.

    [50] 曾璇, 崔海山, 刘毅华. 基于网络空间点模式的餐饮店空间格局分析[J]. 地球信息科学学报, 2018, 20(6): 837-843. https://www.cnki.com.cn/Article/CJFDTOTAL-DQXX201806016.htm

    Zeng Xuan, Cui Haishan, Liu Yihua. Analysis on Spatial Distribution Characteristics of Restaurant Based on Network Spatial Point Model[J]. Journal of Geo-Information Science, 2018, 20(6): 837-843. https://www.cnki.com.cn/Article/CJFDTOTAL-DQXX201806016.htm

    [51] 王平, 李芳, 杨清培, 等. 基于Ripley's K函数和Taylor幂法则的江西省豚草种群空间分布的点格局分析[J]. 植物保护学报, 2019, 46(1): 130-135.

    Wang Ping, Li Fang, Yang Qingpei, et al. Point Pattern Analysis of Spatial Distribution of Ragweed Population in Jiangxi Province Based on Ripley's K Function and Taylor's Power Law[J]. Journal of Plant Protection, 2019, 46(1): 130-135.

    [52] 湛东升, 章倩芸, 张文忠, 等. 杭州市房地产企业空间集聚特征与区位选择[J]. 地理科学进展, 2021, 40(5): 736-745.

    Zhan Dongsheng, Zhang Qianyun, Zhang Wenzhong, et al. Spatial Agglomeration and Location Choice Factors of Real Estate Enterprises in Hangzhou City[J]. Progress in Geography, 2021, 40(5): 736-745.

    [53] 葛莹, John Miron, 蒲英霞, 等. 基于边际K函数的长三角地区城市群经济空间划分[J]. 地理学报, 2015, 70(4): 528-538. https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB201504003.htm

    Ge Ying, Miron J, Pu Yingxia, et al. Dividing Economic Space into Urban Agglomerations Using the Marginal K Function: A Case Study of the Yangtze River Delta Region[J]. Acta Geographica Sinica, 2015, 70(4): 528-538. https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB201504003.htm

    [54] 张健, 郝占庆, 宋波, 等. 长白山阔叶红松林中红松与紫椴的空间分布格局及其关联性[J]. 应用生态学报, 2007, 18(8): 1681-1687. https://www.cnki.com.cn/Article/CJFDTOTAL-YYSB200708002.htm

    Zhang Jian, Hao Zhanqing, Song Bo, et al. Spatial Distribution Patterns and Associations of Pinus Koraiensis and Tilia Amurensis in Broad-leaved Korean Pine Mixed Forest in Changbai Mountains[J]. Chinese Journal of Applied Ecology, 2007, 18(8): 1681-1687. https://www.cnki.com.cn/Article/CJFDTOTAL-YYSB200708002.htm

    [55] 牛丽丽, 余新晓, 岳永杰. 北京松山自然保护区天然油松林不同龄级立木的空间点格局[J]. 应用生态学报, 2008, 19(7): 1414-1418. https://www.cnki.com.cn/Article/CJFDTOTAL-YYSB200807003.htm

    Niu Lili, Yu Xinxiao, Yue Yongjie. Spatial Patterns of Different Age-class Individuals in Pinus Tabulaeformis Forest in Songshan Nature Reserve of Beijing, China[J]. Chinese Journal of Applied Ecology, 2008, 19(7): 1414-1418. https://www.cnki.com.cn/Article/CJFDTOTAL-YYSB200807003.htm

    [56] 闫海冰, 韩有志, 杨秀清, 等. 华北山地典型天然次生林群落的树种空间分布格局及其关联性[J]. 生态学报, 2010, 30(9): 2311-2321.

    Yan Haibing, Han Youzhi, Yang Xiuqing, et al. Spatial Distribution Patterns and Associations of Tree Species in Typical Natural Secondary Mountain Forest Communities of Northern China[J]. Acta Ecologica Sinica, 2010, 30(9): 2311-2321.

    [57] 袁春明, 孟广涛, 方向京, 等. 珍稀濒危植物长蕊木兰种群的年龄结构与空间分布[J]. 生态学报, 2012, 32(12): 3866-3872. https://www.cnki.com.cn/Article/CJFDTOTAL-STXB201212025.htm

    Yuan Chunming, Meng Guangtao, Fang Xiangjing, et al. Age Structure and Spatial Distribution of the Rare and Endangered Plant Alcimandra Cathcartii[J]. Acta Ecologica Sinica, 2012, 32(12): 3866-3872. https://www.cnki.com.cn/Article/CJFDTOTAL-STXB201212025.htm

    [58] 汤孟平, 唐守正, 雷相东, 等. Ripley's K(d)函数分析种群空间分布格局的边缘校正[J]. 生态学报, 2003, 23(8): 1533-1538.

    Tang Mengping, Tang Shouzheng, Lei Xiangdong, et al. Edge Correction of Ripley's K(d) Function on Population Spatial Pattern Analysis[J]. Acta Ecologica Sinica, 2003, 23(8): 1533-1538.

    [59] 时培建, 戈峰, 杨清培, 等. 点格局分析中边缘校正的一种新算法及其应用[J]. 生态学报, 2009, 29(2): 804-809. https://www.cnki.com.cn/Article/CJFDTOTAL-STXB200902033.htm

    Shi Peijian, Ge Feng, Yang Qingpei, et al. A New Algorithm of the Edge Correction in the Point Pattern Analysis and Its Application[J]. Acta Ecologica Sinica, 2009, 29(2): 804-809. https://www.cnki.com.cn/Article/CJFDTOTAL-STXB200902033.htm

    [60] 欧阳芳, 戈峰, 袁哲明, 等. 点格局分析函数的边缘校正及其在昆虫种群格局分析中的应用[J]. 生态学报, 2009, 29(4): 1804-1813.

    Ouyang Fang, Ge Feng, Yuan Zheming, et al. Edge Correction of Point Pattern Analysis'Function and Its Application on Spatial Pattern Analysis of Insect Population[J]. Acta Ecologica Sinica, 2009, 29(4): 1804-1813.

    [61]

    Ge Y, Sun M D, Pu Y X. Geographic Information System-based Edge Effect Correction for Ripley's K-function Under Irregular Boundaries[J]. Geographical Research, 2019, 57(4): 436-447.

  • 期刊类型引用(5)

    1. 沙洪俊,袁修孝. 双目影像密集匹配方法的回顾与展望. 武汉大学学报(信息科学版). 2023(11): 1813-1833 . 百度学术
    2. 曾兴国,左维,李春来,刘建军,任鑫,严韦,刘宇轩,高兴烨. 中国月球地形制图研究进展. 武汉大学学报(信息科学版). 2022(04): 570-578 . 百度学术
    3. 曾兴国,刘建军,左维,任鑫,严韦,张舟斌,高兴烨,陈王丽,刘宇轩,李春来. 泛地图理论下深空探测场景空间制图表达思考. 武汉大学学报(信息科学版). 2022(12): 2123-2133 . 百度学术
    4. 林璐,谭龙,王爽,梁爽. 利用卫星立体影像生产DEM的关键技术研究. 北京测绘. 2021(02): 157-160 . 百度学术
    5. 马顶,赵尚民,程维明. 基于LROC NAC影像的高分辨率连续DEM数据制作. 测绘通报. 2021(09): 93-97 . 百度学术

    其他类型引用(4)

图(5)
计量
  • 文章访问数:  2040
  • HTML全文浏览量:  206
  • PDF下载量:  102
  • 被引次数: 9
出版历程
  • 收稿日期:  2022-03-09
  • 网络出版日期:  2022-05-19
  • 发布日期:  2023-06-04

目录

/

返回文章
返回