-
城市犯罪往往呈现出时空交互性, 即在时间上邻近的事件, 在空间上也邻近[1]。常用的时空交互检验方法有Knox指数法[2]、Mantel指数法[3]、Jacquez K邻近法[4]等。其中, Knox指数法由于易于理解、运算方便等特性[5], 已被广泛运用于流行病学研究[3]、公共卫生管理[6]、犯罪分析[1]、交通事故分析[7]、城市管理[8]等诸多领域。
然而, Knox检验需要事先确定分析阈值。在缺乏相关知识与参考资料时, Knox检验阈值常通过人为主观确定。例如, 佘冰等在研究城市管理事件时空分布时, 人为指定时间阈值为3 h, 空间阈值为500 m[8]; 徐冲等选取200 m和14 d作为街头抢劫案件的时空聚集性检测分析阈值[9]; 此外, 100 m是另一个常用的空间阈值, 如Ye等[10]、Johnson等[11]、Elmes等[12]在进行不同事件时空交互性检验时, 均以100 m作为空间阈值。
在不同阈值下, 事件表现出的时空交互性具有较大差异, 而主观确定阈值的方法具有一定随意性, 基于该阈值的Knox检验不一定能反映出事件真实的时空交互模式[13]。因此需要寻找一种阈值确定方法, 使得Knox检验在该阈值下能最大限度地体现事件的时空聚集模式。为此, 一些学者根据已有知识确定Knox检验阈值, 例如刘巧兰等在利用Knox检验探测传染病时空聚集性时, 根据流行性脑膜炎发病潜伏期及病例之间的平均空间距离, 确定时间阈值为13 d, 空间分析阈值为29.67 km[14]; Townsley等利用平均街区长度作为Knox检验的空间阈值[15]。
此外, 已有研究提出若干空间阈值确定方法, 如Grubesic等利用尝试法不断改变时空阈值并依次计算时空交互程度, 据此得到最合适的时空阈值[1], 但该重复性实验过程会造成系统性偏差[13]; Kalantari等比较了平均距离法、Ripley’s K函数临界值法、自然断点分级法这3类阈值确定方法的效果, 结果表明自然断点分级法确定的空间阈值能更有效地探测出案件时空聚集性[13], 然而该方法需要人工指定分类数, 且分类结果容易受异常值影响[16]。
本文基于事件空间邻近性这一重要特征, 提出以点对平均最邻近距离作为Knox检验的空间阈值, 以武汉市江汉区唐家墩社区2013年1月-8月期间的入室盗窃、盗窃电动车和扒窃事件为研究对象进行实验论证, 并与常见的几种阈值确定方法进行对比, 结果表明本文所提出的Knox阈值确定方法能检测出更多的显著性交互事件对数, 从而更有效地识别出事件的时空聚集模式。
HTML
-
Knox时空交互检验模型首先需要人工指定时间阈值t和空间阈值s, 继而将所有n个事件点两两配对成n(n-1)/2个时空事件对, 并计算空间距离sij和时间距离tij。当sij≤s时, 认为事件点空间邻近; 当tij≤t时, 认为事件点时间邻近。通过判断事件对是否时空邻近, 可将事件对映射到一个2×2的矩阵中计数, 如表 1所示。表 1中Q1为时空邻近事件对数, 也即Knox指数。
类别 时间邻近 时间非邻近 距离邻近 Q1(时空邻近) Q2(空间邻近) 距离非邻近 Q3(时间邻近) Q4(非邻近) Table 1. Logical Structure of Knox Index
得到事件时空邻近结构后, 常用卡方检验对其统计显著性进行检验[2]。卡方检验假设事件不存在时空交互性, 在此零假设前提下计算4类邻近情况Q1、Q2、Q3、Q4的期望值, 通过观测值Qi和期望值E(Qi)的差异程度可以判断时空邻近的显著性。
如表 1所示, 当且仅当事件对空间邻近且时间邻近时才存在时空交互性。记事件对总数为N=Q1+Q2+Q3+Q4, 记S1=Q1+Q2, S2=Q3+Q4, S3=Q1+Q3, S4=Q2+Q4。在零假设条件下, 不存在时空交互作用, 则Q1至Q4的期望值分别为:E(Q1)=S1×S3/N, E(Q2)=S1×S4/N, E(Q3)=S2×S3/N, E(Q4)=S2×S4/N。通过比较实际时空事件对数与期望事件对数的差异, 构造卡方检验统计量:
通过卡方值χ2即可判断时空交互统计显著性。
-
在Knox检验中, 时空阈值的选择对于实验结果具有决定性作用, 因为它决定了在哪一时空尺度下零假设将会被拒绝或接受。在已有研究中, 空间阈值通常由经验确定或借鉴其他领域研究结果, 例如100 m常作为各类事件时空交互检验的空间阈值; 此外, 一些学者提出了相关阈值确定方法。
-
对于n个事件点集, 平均距离法首先分别计算点i与其他n-1个点的距离, 得到n-1个距离值并对其求平均; 对每个点均重复上述过程, 得到每个点与其他点距离的平均值; 对n个点的该平均值再次取平均, 得到平均距离, 该平均距离值即作为Knox检验的空间阈值[13]。
-
空间Ripley’s K函数(简称K函数)是一种多距离空间聚类分析方法[17], 通过给定距离范围, K函数能以一系列连续尺度确定点要素或与其相关联的属性值在该范围内随距离变化的聚集性或离散性变化情况。
通过判断K函数观测曲线与零假设条件下期望值包络线的交点, 可以确定聚集模式与离散模式对应距离的临界值, 该临界值可以作为Knox检验的空间阈值。K函数是一种累积性的计算过程, 大尺度的分析结果包含了小尺度信息, 因此混淆了大尺度与小尺度效应[18], 以K函数临界值作为Knox检验空间阈值可能无法得到较为显著性的交互模式。
-
自然断点分级法是一种单变量分类方法, 分类原则为使分类对象类内方差最小、类间方差最大。这种分类方法利用了数据自身固有的自然分组, 可对相似变量进行最恰当的归类, 同时使得各类之间的差异最大, 并在变量差异相对较大处设置分类界限[16]。
在利用Knox检验分析3类犯罪案件的时空聚集性时, 采用自然断点分级法将点要素最邻近距离集合分为5级, 并以分级界限作为Knox检验的空间阈值[13]。自然断点分级法的缺陷在于需要指定分类数k, 分类结果受k影响较大, 且容易产生异常结果[16]。
-
地理学第一定律表明, 邻近事件比疏远事件存在更为紧密的关系[19], 因此, 两事件越邻近, 其空间交互性越大。传统的阈值主观确定法存在一定的随意性, 而上述两种阈值确定方法均存在不足。在没有其他参考资料的情况下, 以事件最邻近距离为依据确定Knox检验的空间阈值是一种较为合理的方法。因此, 本文提出基于平均最邻近距离的Knox检验空间阈值确定方法。首先计算每个点i与其最邻近点j的距离min(dij), 进而对所有的最邻近距离求平均, 得到平均最邻近距离[20], 并以该值作为Knox检验的空间阈值。平均最邻近距离的计算公式为:
式中, dij为点i与点j之间的距离; n为事件点总数。
2.1. 平均距离法
2.2. 平均Ripley’s K函数临界值法
2.3. 自然断点分级法
2.4. 平均最邻近距离法
-
本文使用武汉市江汉区唐家墩社区2013年1月-8月发生的入室盗窃、盗窃电动车和扒窃案件进行实验分析。通过指定不同的时空阈值, Knox检验可以用来检测事件在不同时间尺度和不同空间尺度下的分布特征。在案件时空交互特征未知的情况下, 分析不同空间阈值确定方法在30 d内检测出的案件时空交互特征[1, 13]。p值常用来判断时空聚集性检验结果的统计显著性。本文研究中, 选取常用的95%置信度(即p < 0.05)作为显著性判断标准。
-
在许多研究领域, 100 m常用来作为Knox检验的空间阈值。图 1为3类案件在100 m空间阈值下30 d内的Knox检验p值分布曲线。
-
利用平均距离法确定3类案件的空间阈值, 基于该距离的Knox检验结果如图 2所示。
-
为了检验K函数结果的显著性, 本文利用蒙特卡罗方法进行999次模拟实验, 得到置信度为99%的包络线。结果表明, 入室盗窃、盗窃电动车和扒窃案件分别在375 m、438 m和430 m空间范围内具有显著的空间聚集性。以3类案件的空间K函数临界值作为空间阈值得到Knox检验结果, 如图 3所示。
-
本文利用自然断点分级法将最邻近距离集合分为5级, 得到3类案件的分级界限分别为:入室盗窃32 m、66 m、122 m、206 m、341 m; 盗窃电动车28 m、59 m、90 m、133 m、208 m; 扒窃19 m、45 m、80 m、129 m、211 m。图 4为3类案件在各自分级界限处的Knox时空交互检验结果。
-
通过式(2)计算得到3类案件的平均最邻近距离分别为:入室盗窃50 m, 盗窃电动车43 m, 扒窃36 m。图 5为3类案件以平均最邻近距离为空间阈值的时空检验结果。结果表明, 与上述3种常用阈值选择方法相比, 在平均最邻近距离尺度下, 3类案件均表现出更为显著的聚集性特征。
-
实验结果表明, 在不同的时空阈值下, 事件时空交互特征差异较大。为了比较5种阈值确定方法的效果, 表 2列出了3类案件在不同空间阈值下, 1~30 d内具有显著交互性的事件对数及其平均数、总平均数; 表 3列出了不同空间阈值确定方法检验得到的3类案件的显著性时空交互对数总平均数。
空间阈值确定方法 入室盗窃 盗窃电动车 扒窃 空间阈值/m 1~30 d内显著性交互事件对数(p < 0.05) 平均数 总平均数 空间阈值/m 1~30 d内显著性交互事件对数(p < 0.05) 平均数 总平均数 空间阈值/m 1~30 d内显著性交互事件对数(p < 0.05) 平均数 总平均数 常用阈值法 100 13 13 13.08 100 26 26 22.88 100 4 4 6.12 平均距离法 970 10 10 907 11 11 1 027 0 0 Ripley’s K函数临界值法 375 3 3 438 23 23 430 0 0 自然断点分级法 32 18 28 29 19 10 66 25 59 23 45 8 122 8 12.4 90 26 24.4 80 5 6.6 206 9 133 25 129 6 341 2 208 19 211 9 平均最邻近距离法 50 27 27 43 30 30 36 20 20 Table 2. Frequencies of Significant Interactions of Five Methods at Different Intervals for 30 Days
空间阈值确定方法 3类案件显著交互对数平均数 3类案件显著交互对数方差 常用阈值法 14.3 122.33 平均距离法 7 37 Ripley’s K函数临界值法 8.67 156.33 自然断点分级法 14.47 82.41 平均最邻近距离法 25.67 26.33 Table 3. Mean Values of Significant Interactions of Five Methods for Three Types of Crimes
Kalantari等[13]在利用Knox检验分析汽车配件盗窃、商店盗窃、摩托车盗窃这3类常见盗窃事件的时空交互模式时指出, 某阈值下得到的时空显著性交互事件对数越多, 表明该阈值对应的事件时空交互模式越显著, 以该尺度进行进一步分析, 能更充分地了解事件的真实分布模式, 掌握不同事件的发生和分布规律, 为有效地对事件进行监管、最大程度地减少有害事件的发生提供决策依据。因此, 利用某方法确定的空间阈值检验出的显著性时空交互对数越大, 即表明该空间阈值确定方法能越有效地识别出案件的时空交互特征[13]。表 2表明, 盗窃电动车案件的时空邻近事件对数总平均数最大(22.88), 即该案件具有较强的时空交互程度, 其次是入室盗窃(13.08)和扒窃案件(6.12)。表 3表明, 本文提出的平均最邻近距离阈值确定方法检验得到的3类案件的时空邻近事件对数平均数最大(25.67), 其次是自然断点法(14.47)、常用阈值法(14.3)、Ripley’s K函数临界值法(8.67)和平均距离法(7);另外, 3类案件的显著交互对数方差体现了该阈值确定方法在探测不同类型的案件时空交互性的稳定性, 结果表明本文所提方法具有更好的稳定性(方差为26.33, 最小)。因此, 本文所提方法能更有效地检测出案件的时空交互模式, 且具有较好的稳定性。
3.1. 常用阈值法
3.2. 平均距离法
3.3. Ripley’s K函数临界值法
3.4. 自然断点分级法
3.5. 平均最邻近距离法
3.6. 结果分析
-
在利用Knox检验进行事件时空交互模式分析时, 阈值的选择对于实验结果具有决定性作用。本文在分析几种常见阈值选择方法的缺陷的基础上, 提出了利用平均最邻近距离作为Knox检验空间阈值确定的方法。实验通过对城市入室盗窃、盗窃电动车和扒窃3类案件的时空交互模式进行分析, 结果表明, 由于顾及到了事件对间的空间邻近性, 基于该阈值确定方法的Knox检验检测出了最大数量的显著性交互事件对数, 能够有效地识别出城市犯罪时空交互模式及邻近重复发生事件对的分布区域。本文所提方法能够为基于Knox检验的事件时空聚集模式分析提供一种有效的空间阈值确定手段, 进而为城市犯罪的重点时段、重点区域的针对性防控提供参考依据[21], 以便优化警力资源部署, 减少或抑制犯罪的发生[22]。未来将研究本文所提方法在一维路网空间约束下的运用效果, 并进一步探讨其他类型城市犯罪的时空交互模式及其形成原因。