留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

犯罪网络构建及其时空分析——以入室盗窃为例

王增利 刘学军 陆娟 吴伟 张宏

王增利, 刘学军, 陆娟, 吴伟, 张宏. 犯罪网络构建及其时空分析——以入室盗窃为例[J]. 武汉大学学报 ● 信息科学版, 2018, 43(5): 759-765. doi: 10.13203/j.whugis20150666
引用本文: 王增利, 刘学军, 陆娟, 吴伟, 张宏. 犯罪网络构建及其时空分析——以入室盗窃为例[J]. 武汉大学学报 ● 信息科学版, 2018, 43(5): 759-765. doi: 10.13203/j.whugis20150666
WANG Zengli, LIU Xuejun, LU Juan, WU Wei, ZHANG Hong. Construction and Spatial-Temporal Analysis of Crime Network: A Case Study on Burglary[J]. Geomatics and Information Science of Wuhan University, 2018, 43(5): 759-765. doi: 10.13203/j.whugis20150666
Citation: WANG Zengli, LIU Xuejun, LU Juan, WU Wei, ZHANG Hong. Construction and Spatial-Temporal Analysis of Crime Network: A Case Study on Burglary[J]. Geomatics and Information Science of Wuhan University, 2018, 43(5): 759-765. doi: 10.13203/j.whugis20150666

犯罪网络构建及其时空分析——以入室盗窃为例

doi: 10.13203/j.whugis20150666
基金项目: 

国家十二五科技支撑计划 2012BAH35B02

国家自然科学基金 41501488

国家自然科学基金 41471372

国家自然科学基金 41401436

南京林业大学青-科技创新基金 CX2015007

江苏省测绘地理信息科研项 JSCHKY201602

详细信息
    作者简介:

    王增利, 博士生, 主要从事视频GIS、犯罪时空分析与模拟等研究。wangzl@njfu.edu.cn

    通讯作者: 刘学军, 博士, 教授。liuxuejun@njnu.edu.cn
  • 中图分类号: P208

Construction and Spatial-Temporal Analysis of Crime Network: A Case Study on Burglary

Funds: 

The National "Tewlfth Five-Year" Plan for Science & Technology Pillar Program of China 2012BAH35B02

the National Natural Science Foundation of China 41501488

the National Natural Science Foundation of China 41471372

the National Natural Science Foundation of China 41401436

Youth Science & Technology Innovation Fund of Nanjing Forest University CX2015007

Surveying and Mapping Geographic Information Scientific Research Project in Jiangsu Province JSCHKY201602

More Information
图(8)
计量
  • 文章访问数:  1073
  • HTML全文浏览量:  64
  • PDF下载量:  451
  • 被引次数: 0
出版历程
  • 收稿日期:  2016-06-10
  • 刊出日期:  2018-05-05

犯罪网络构建及其时空分析——以入室盗窃为例

doi: 10.13203/j.whugis20150666
    基金项目:

    国家十二五科技支撑计划 2012BAH35B02

    国家自然科学基金 41501488

    国家自然科学基金 41471372

    国家自然科学基金 41401436

    南京林业大学青-科技创新基金 CX2015007

    江苏省测绘地理信息科研项 JSCHKY201602

    作者简介:

    王增利, 博士生, 主要从事视频GIS、犯罪时空分析与模拟等研究。wangzl@njfu.edu.cn

    通讯作者: 刘学军, 博士, 教授。liuxuejun@njnu.edu.cn
  • 中图分类号: P208

摘要: 提出了一种基于时空影响范围的网络构造方法,构造了一种基于节点影响强度的犯罪传输网络,并引入复杂网络的度、平均度、聚集系数等特征参数分析犯罪传输网络。提取了犯罪预测过程中需要关注的重要节点,分析了其时间分布和空间分布特性,研究结果表明:(1)近邻的时空单元的犯罪率具有一定的关联关系。其中,节点的出度与入度具有正相关性,因此可以引入邻居时空单元的犯罪密度以量化和分析犯罪规律。(2)节点的度分布具有无标度特性,犯罪较少的小区也可能出现度较大的节点,而节点的度与未来犯罪率具有较大的关联性。因此,即便犯罪率较低的小区也要关注节点的度变化情况。(3)犯罪聚集系数大小与未来犯罪率的变化具有一定的关联性,较高的聚集系数意味着未来犯罪状态的变化。

English Abstract

王增利, 刘学军, 陆娟, 吴伟, 张宏. 犯罪网络构建及其时空分析——以入室盗窃为例[J]. 武汉大学学报 ● 信息科学版, 2018, 43(5): 759-765. doi: 10.13203/j.whugis20150666
引用本文: 王增利, 刘学军, 陆娟, 吴伟, 张宏. 犯罪网络构建及其时空分析——以入室盗窃为例[J]. 武汉大学学报 ● 信息科学版, 2018, 43(5): 759-765. doi: 10.13203/j.whugis20150666
WANG Zengli, LIU Xuejun, LU Juan, WU Wei, ZHANG Hong. Construction and Spatial-Temporal Analysis of Crime Network: A Case Study on Burglary[J]. Geomatics and Information Science of Wuhan University, 2018, 43(5): 759-765. doi: 10.13203/j.whugis20150666
Citation: WANG Zengli, LIU Xuejun, LU Juan, WU Wei, ZHANG Hong. Construction and Spatial-Temporal Analysis of Crime Network: A Case Study on Burglary[J]. Geomatics and Information Science of Wuhan University, 2018, 43(5): 759-765. doi: 10.13203/j.whugis20150666
  • 犯罪是一个复杂系统,其复杂性不仅体现在犯罪事件与周围环境之间错综复杂的关联关系,还体现在犯罪事件之间也存在复杂的关联关系。在以往犯罪地理学的研究中,人们大多从空间环境的角度分析犯罪与地理特征的关联关系[1-2]。文献[3]利用统计的方式分析犯罪影响目标未来受侵犯风险的规律,量化结果表明犯罪的空间影响范围在4 km以内。文献[4]利用武汉市的入室盗窃数据分析其时空影响规律,不仅证明了入室盗窃在近时空区域内有聚集现象,而且量化了其时空影响规律:在犯罪发生后的100 m和7 d时间范围内,再次发生犯罪的风险提高55%;在犯罪发生后200 m和14 d时间范围内再次发生犯罪的风险提高24%~40%。此外,研究人员还从热点变化和转移的角度分析了犯罪的时空变化规律:文献[5]用三维可视化的方式形象展示了犯罪热点的时空变化过程;文献[6]用时空聚类的方式证明了犯罪时空转移的存在;文献[7]基于路网提取了时空热点,进一步验证了时空热点转移现象。研究表明犯罪热点会随着时间的推移而产生形变或位移,证明了犯罪分散和转移规律的存在。聚集与转移的存在使得犯罪形成疏密不等的时空分布,而相邻时空单元中的犯罪相互影响的特点使犯罪具备了传播的特点,这些特点使得犯罪之间的时空规律变得异常复杂。为了更加准确地认识犯罪规律,有必要从一种全新的角度对犯罪系统展开研究。复杂网络理论是认识复杂系统、研究事件传播规律的一种动力学方法。相较于随机网络和规则网络,复杂网络可以更准确地描述网络系统,测度网络的结构性特征[8]。研究复杂网络的特性可以发现网络分布特征,掌握事件的传播规律,为疾病传染控制、地震预警、犯罪预测等提供服务。

    • 复杂网络是在图论的基础上发展而来的。从统计物理上看,网络是由大量个体和个体之间相互作用组成的系统,是把个体现实世界的个体抽象为点,把个体之间的相互作用抽象为线,并用点和线组成的网络描述现实世界中某种现象或组织的一种方法。钱学森也曾经给出复杂网络的定义:具有小世界、无标度、自相似、吸引子等特征中部分或全部性质的网络称为复杂网络。这些特点使得网络具有高度复杂的特性[8]

      假设每次犯罪为一个节点,那么该节点会“接收”到环境因素和过去的犯罪对于该时空节点的作用力;同时,以该时空节点为起点,对于未来的一段时空范围会“发射”一定的作用力。存在作用力的两个时空节点可以连接成边,该边的权重和方向均与作用力的大小和方向相同。所有存在作用力的节点之间进行连接,即可分别构成受到作用力的“接收”网、施加作用力的“发射”网两个有向网络。

      设图G=(V, E)是由n个节点组成的有向图(图 1)。AB分别代表一次犯罪事件,它们的发生时间分别为tAtB,空间距离为rAB,时间距离为tAB。如果tBtA,且两者的时间差tB-tA和空间距离rAB同时满足:

      $$ \left\{ \begin{array}{l} {t_B}-{t_A} < \Delta t\\ {r_{AB}} < \Delta s \end{array} \right. $$ (1)

      图  1  节点间时空拓扑关系示意图

      Figure 1.  Schematic Diagram of Spatio-Temporal Topological Relations Between Nodes

      那么两个节点之间存在作用力fAB。当两者的空间距离rAB>Δs或者tB-tA>Δt时,可认为事件B的时空距离超出了A的时空影响范围。因此,两者之间不存在作用力。本文将所有位于影响范围内的连接边权重设置为1,超出影响范围的连接边权重为0:

      $$ {f_{AB}} = \left\{ \begin{array}{l} 1, {t_B}-{t_A} < \Delta t\;\;{\rm{且}}{r_{AB}} < \Delta s\\ 0, {\rm{其他}} \end{array} \right. $$ (2)

      连接边的方向按照时间顺序进行连接。图 1A点位于B之前,则连接边的方向为由A指向B。该力相对于A为“发射”的作用力,相对于B为“接收”的作用力。而相对于其他几个点(CDE),则由于超出了其时间或空间的影响范围,因而与A点之间不存在作用力。为了描述方便,本文把犯罪之间的相互作用力称作影响强度,把“发射”的作用力为输出强度,“接收”的作用力为输入强度。

      将所有存在作用力的节点相互连接即可构成“点-边”的网络。这样,所有的犯罪事件构成了基于影响强度的输入和输出网络,其中每个点的作用力可以通过计算位于时空范围内的点数量得到。目前对于入室盗窃的研究表明其时间影响范围主要集中于2周以内,空间影响范围主要集中于200 m以内的范围。鉴于文献[4]与本文研究均采用国内犯罪数据,因此本文研究采用的时空域分别为2周、200 m。

    • 复杂网络特征参数是通过统计网络的结构特征分析网络的时空分布、探索网络时空传输过程的重要手段。本文选定了复杂网络特定的特征参数对犯罪的时空行为进行网络分析,具体包括度、平均度、聚集系数等[8]

    • 复杂网络中节点的度分布情况可以用D来描述,由与该节点连接边Di的总量计算得到。对于有向网络可以分为入度和出度,分别表示以该点作为终点和起点的连接边的数量[8]

      $$ D = \sum\limits_{i = 1}^n {{D_i}} $$ (3)

      式中,Di表示边i的连接权重; D为节点的度。度是用来衡量节点作为直接传输点(起点或终点)重要性的指标。在犯罪网络中,一个节点即一起犯罪,度指的是与节点相邻时空单元的犯罪密度。因此,分析度分布即分析一起犯罪与相邻时空单元内犯罪密度的关联关系。其中,节点度越大说明该点周边的节点数量越多,该节点在犯罪网络中的重要性越大。在入度网络中,节点的入度越大,则该节点相邻过去的时空单元内犯罪数量较多,该节点受过去犯罪的影响会较大;在出度网络中,节点的出度越大,则该节点相邻未来的时空单元内犯罪数量越多。研究出入度关系的意义在于,分析节点出度和入度的关联关系以获取每个节点前后两段时空范围内的犯罪通过节点进行传播的规律。此时若犯罪节点的出入度关联越强,则说明节点入度对未来时空单元的影响越大,则利用该节点预测犯罪率的精度越高。

      网络平均度为所有节点度的平均值。本文中的平均度D为相对于小区的参数,用小区内所有节点度D的平均值获得[8]

      $$ \overline D = \frac{1}{n}\sum D $$ (4)

      平均度越大,则该网络内部连接越密集,网络节点之间的传输性越强;平均度越小,网络内部连接越稀疏,网络节点之间的传输性越弱。

      在犯罪复杂网络中,平均度指的是小区内的犯罪与周围一定空间范围内犯罪密度的关联性。平均度越大,该小区在犯罪网络中重要性则越强;平均度越小,该小区在犯罪网络中重要性则越弱。在出度网络中,小区的平均出度表示小区影响周围小区犯罪强度的能力;在入度网络中,小区的平均入度表示小区受周围小区犯罪影响的大小,即“容纳”犯罪影响能力的大小。

    • 在连接网络中,不同节点之间由于种种原因往往形成以某几个节点为中心的团簇。网络的这种特性称为聚集性。节点分布越密集,节点之间连接越多,聚集系数越高;犯罪节点分布越稀疏,节点之间连接越少,聚集系数越低。如果网络的度为k,那么这k个节点之间最多可能产生k(k-1)/2条连接边,而实际存在的边数为E,则节点的聚集系数为[8]

      $$ C = \frac{{2E}}{{k\left( {k-1} \right)}} $$ (5)

      网络的平均聚集系数即为网络中所有节点聚集系数的平均值。因此,当网络中所有节点之间没有连接边时,聚集系数为0;而当所有节点之间存在连接边时,聚集系数为1。

      在犯罪复杂网络中,聚集系数标志着犯罪聚集程度[8]。聚集系数越高,犯罪密度越高;聚集系数越低,犯罪密度越小。从聚集系数的定义可以看出,聚集系数研究对象为相互关联的犯罪团簇,其大小依赖于犯罪节点与相邻时空单元内犯罪的关联性。因此,研究犯罪的聚集系数即研究犯罪团簇的强度特征(包括密度特征、时间分布特征以及空间分布特征等),以此为基础提取犯罪团簇的聚集和转移规律[20]

      将度和聚集系数进行比较可以看出,犯罪网络中的度研究的是单个节点与相邻的时空单元内犯罪密度的关联关系,而聚集系数研究的是相互关联的时空单元簇的时空规律。

    • 本文选取长三角地区的N市作为研究区域,选取入室盗窃作为研究对象。犯罪数据时间跨度为2013-01-01-2013-12-30。每条记录包含案发的位置和时间信息。

    • 基于时空影响域的约束,本文构建了犯罪网络(见图 2)。图 2中每一个节点代表一次犯罪,每一条线段为位于时空影响域内的节点之间的连接边。在网络构建中,首先提取犯罪节点所在的小区,然后提取与该节点相邻的节点所在的小区。若两个节点所在小区的空间距离小于阈值,则继续计算两节点的时间距离,否则计算下一个节点;若两节点的时间距离小于时间阈值,则连接两个节点,否则计算下一个节点。因此,存在连接边的节点代表两起犯罪之间存在影响与被影响的关系。

      图  2  基于时空影响域的犯罪网络

      Figure 2.  Crime Network Based on Spatio-Temporal Influence Domain

      在研究区域中,犯罪数据呈现不均匀分布特征,其中西南地区和东部地区的犯罪较为稀疏,因此犯罪网络在该区域的连接边较少。中部地区的犯罪较为密集,因此犯罪网络在该区域比较密集。

    • 本文分别计算得出了输入网络和输出网络的度及其分布函数。输入网络和输出网络均为幂律分布(幂指数分别为γ=-1.66和γ=-1.67)。这说明对于犯罪传输网络而言,大部分犯罪节点的影响力较小,少数的几个犯罪节点影响力较大(见图 3)。为了表述方便,在后文的叙述中将其中具有较强影响力的节点称为关键节点。

      图  3  输入和输出网络度分布的双对数曲线

      Figure 3.  Loglog Coordinate Figures of the Degree Distribution of Input and Output Networks

      选取引起犯罪数量大于3起的节点作为关键节点(图 4(a))。分析关键节点的时间分布特性,可以看出关键节点的时间分布大多集中在4、7、10月份,其时间间隔体现出较好的规律性分布特征。

      图  4  关键节点的时空分布

      Figure 4.  Spatial-Temporal Distribution of the Key-Nodes

      以节点所在小区全年的犯罪数量为横轴,以关键节点的数量为纵轴,分析节点的空间分布特性。如果关键节点集中于几个犯罪数量较多的小区,说明关键节点具有空间差异性;如果关键节点分散比较均匀,说明关键节点空间分布没有较强的空间差异性。采用Pearson相关性分析,结果显示关键节点的分布与小区的总体犯罪数量并没有明显的正相关性(图 4(b))。因此,即便平时发生犯罪较少的小区,也有可能会存在关键节点,从而引起未来多起犯罪的发生。与之相对应,在犯罪较多的小区关键节点的数量也不一定会较多。在犯罪学的角度看来,即平时较少发生犯罪的小区也可能会出现短时间内连续发生多次犯罪的现象。引起这一现象的原因一方面可能是由于犯罪本身存在一定的反侦察特征,即犯罪分子为了避免风险不会在某些小区多次造成连续犯罪;另一方面可能是由于连续多次犯罪为系列案件,该类案件的发生更多依赖于前一次犯罪发生的位置。总之,节点的空间分布不依赖于小区犯罪数量,说明通过统计小区内的犯罪数量(即犯罪热点)较难预测犯罪概率。

      通过分析节点的出入度的关联关系(图 5)可以看出,节点出度与入度存在一定的正相关性。这种正相关说明针对每一个时空节点而言,该节点过去相邻时空单元内发生犯罪的数量与未来相连时空单元内发生犯罪的数量具有一定的正关联性。该结论与近重复现象描述的“每一起犯罪会引起未来一定时空范围内再次犯罪的概率提升”有所不同:近重复现象将每个时空节点引起未来时空单元犯罪率提升的权重视作相同;而本结论说明每个时空节点引起未来时空单元内的犯罪概率并不完全相同,其权重与过的犯罪数量具有一定的正相关性。这为基于近重复的犯罪分析和预测提供了另一个参照物,对犯罪分析和预测具有重要意义。

      图  5  出度与入度的相关性

      Figure 5.  Correlation Between Output Degree and Input Degree

      以小区为单位,对每个小区内节点的入度取平均值,作为该小区的平均入度。对每个小区的节点出度取平均值,作为该小区的平均出度(见图 6)。可以看出小区的平均入度和平均出度具有极强的正相关性,即小区输入和输出的强度保持平衡。

      图  6  平均入度与平均出度的相关性

      Figure 6.  Correlation Between Average of Output Degree and Average of Input Degree

    • 犯罪网络分为输入网络和输出网络(见图 7)。两个网络依旧存在较强的聚集性特征:少数的节点具有较强的聚集性特征,大部分节点的聚集性特征较弱。为了进一步分析聚集度的时间分布特性,将聚集度分为0~0.05、0.05-0.1、0.1~0.15等3个区间,分别代表低、中、高3类聚集系数,在3个区间上分析输入网络和输出网络的时间分布特性(见图 8)。

      图  7  输入网络和输出网络的聚集系数统计

      Figure 7.  Clustering Coefficient Statistics of Input and Output Networks

      图  8  不同聚集系数的时间分布特征

      Figure 8.  Distribution of Different Clustering Coefficients

      在输入网络中,高聚集系数的节点在4、10月份形成两个高峰期,其他月份相对平稳(图 8(a));中聚集系数的节点在4~10月份之间形成高峰期,其他月份形成相对的低谷期(图 8(b));低聚集系数的节点全年保持基本平稳(图 8(c))。从中可以看出,低聚集系数的节点分散均匀,在中聚集系数高发的4~10月份,高聚集系数形成两个明显的高峰期,说明高聚集系数的节点对于大量犯罪的出现具有明显的指标性意义。

      在输出网络中,高聚集系数的节点仅在4月份形成单一的高峰(图 8(d))期。此外,6月和10月的聚集系数分别形成两个次高峰。对应于中聚集系数的节点,在4月形成突然上升的阶段,在6月、10月形成两个缓慢变化的时期(图 8(e))。低聚集系数在全年基本保持稳定(图 8(f))。由此可见,高聚集系数在输出网络中也具有极强的指示作用。当高聚集系数突然发生变化时,往往意味着该区域内犯罪的发生强度会发生较大的变化。

      聚集系数为节点在网络中重要的程度。节点聚集系数较高时,其对于未来的犯罪率具有重要的指示性。实验结果表明,每次高聚集系数节点的出现都预示着未来犯罪率的改变。

    • 本文通过将犯罪点抽象为节点,把节点之间的影响强度作为节点之间的连接强度,构建了有向的犯罪输入网络和输出网络,引入了复杂网络中的度、平均度、聚集系数等概念,应用于犯罪复杂网络的分析。在此基础上,得出了几个结论:

      1) 节点是否发生犯罪的概率与相邻节点的犯罪密度具有较强的关联关系。利用节点间的关联为犯罪预测提供更多参数,对于犯罪分析、量化甚至预测均有重要意义。

      2) 节点度的分布与小区内犯罪数量没有显著的关联性,即平时较少发生犯罪的地方也可能存在度较大的节点,而经常发生犯罪的地方也可能存在度较小的节点。因此,在预测犯罪的过程中需要关注常年犯罪数量较少的小区,这种小区也有可能在短期内连续发生多起犯罪。

      3) 空间单元内的平均入度和平均出度基本保持相等。从能量守恒的角度看,小区吸收的能量会在一段时期内以相同的能量散发出去。因此,容易受到犯罪影响的小区对周围小区的影响也会较大。

      4) 分析本文构建的入室盗窃传输网络,其中入度网络在6月和10月分别形成了两个高聚集系数的高峰,出度网络在4月份形成了一个高聚集系数的高峰。高聚集系数意味着未来发生犯罪的概率会显著增加或者降低。

参考文献 (8)

目录

    /

    返回文章
    返回