留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

改进的GA-BP神经网络模型在财产犯罪预测中的应用

李卫红 闻磊 陈业滨

李卫红, 闻磊, 陈业滨. 改进的GA-BP神经网络模型在财产犯罪预测中的应用[J]. 武汉大学学报 ● 信息科学版, 2017, 42(8): 1110-1116, 1171. doi: 10.13203/j.whugis20160911
引用本文: 李卫红, 闻磊, 陈业滨. 改进的GA-BP神经网络模型在财产犯罪预测中的应用[J]. 武汉大学学报 ● 信息科学版, 2017, 42(8): 1110-1116, 1171. doi: 10.13203/j.whugis20160911
LI Weihong, WEN Lei, CHEN Yebin. Property Crime Forecast Based on Improved GA-BP Neural Network Model[J]. Geomatics and Information Science of Wuhan University, 2017, 42(8): 1110-1116, 1171. doi: 10.13203/j.whugis20160911
Citation: LI Weihong, WEN Lei, CHEN Yebin. Property Crime Forecast Based on Improved GA-BP Neural Network Model[J]. Geomatics and Information Science of Wuhan University, 2017, 42(8): 1110-1116, 1171. doi: 10.13203/j.whugis20160911

改进的GA-BP神经网络模型在财产犯罪预测中的应用

doi: 10.13203/j.whugis20160911
基金项目: 

国家自然科学基金 41171141

详细信息
    作者简介:

    李卫红, 副教授, 主要从事时空数据挖掘和犯罪地理研究。hongweili9981@163.com

  • 中图分类号: P208

Property Crime Forecast Based on Improved GA-BP Neural Network Model

Funds: 

The National Natural Science Foundation of China 41171141

More Information
    Author Bio:

    LI Weihong, associate professor, specialized in criminal geographic research and spatial-temporal data mining. E-mail:hongweili9981@163.com

  • 摘要: 发现犯罪时空分布规律并预测犯罪发生,是提高警务策略有效预防、控制犯罪的重要方法。在分析财产犯罪时空规律的基础上,利用BP神经网络模型自动学习训练各因子与财产犯罪的非线性关系,建立了财产犯罪预测模型。针对BP神经网络模型易陷入局部最优和模型不稳定的缺陷,提出了利用遗传算法(GA)选择各因子最优的初始化权重和参数,并以此作为BP神经网络模型的初始化权重矩阵,通过对历史数据的学习及训练建立了改进后的GA-BP神经网络模型。利用某市2007~2012年财产犯罪、人口、GDP、土地利用等35个综合影响因子数据,对改进前后的模型进行了预测对比试验。结果表明,改进后的GA-BP神经网络模型成功克服了BP模型的缺陷,收敛迭代最小次数从117次改进到8次;10次计算收敛迭代次数最大误差从370次提高到5次;模型预测精度(RMES)从0.043 0提高到0.019 95。
  • 图  1  研究方法流程图

    Figure  1.  Flowchart of Methodology

    图  2  3层BP神经网络结构示意图

    Figure  2.  Three-Layer BP Neural Network Structure

    图  3  研究区

    Figure  3.  Study Area

    图  4  2007~2012年分时段财产犯罪案件统计图

    Figure  4.  24 Hours Chart of Property Crime, 2007~2012

    图  5  2007~2012年财产犯罪案件分月统计图

    Figure  5.  12 Months Chart of Property Crime, 2007~2012

    图  6  2007~2012年案件热点分布图

    Figure  6.  2007~2012 Map of Hot Spot Case

    图  7  模型迭代次数统计图

    Figure  7.  Iterations Chart

    图  8  BP模型预测结果图

    Figure  8.  Result of BP Model

    图  9  BP模型预测误差图

    Figure  9.  Deviation of BP Model

    图  10  GA-BP预测结果图

    Figure  10.  Result of GA-BP Model

    图  11  GA-BP模型预测误差图

    Figure  11.  Deviation of GA-BP Model

    图  12  财产犯罪案件密度预测分级图

    Figure  12.  Property Crime Density of Forecasting

    图  13  财产犯罪案件密度真实分级图

    Figure  13.  Property Crime Density of Reality

    表  1  研究区犯罪案件统计表/起

    Table  1.   Statistic Data of Crime in a City from 2008~2012

    年份 总案件量 财产犯罪案件量
    2008~2012 190 55 15 574
    2008 2 941 2 326
    2009 3 341 2 848
    2010 4 415 3 641
    2011 3 796 3 196
    2012 4 562 3 563
    下载: 导出CSV

    表  2  研究区流动人口数据

    Table  2.   Floating Population of Study Area

    派出所 2008年 2010年 2012年
    P1 583 1 257 5 130
    P2 286 511 1 015
    P3 532 878 5 223
    P4 367 676 1 340
    P5 365 731 1 496
    下载: 导出CSV

    表  3  研究区经济数据

    Table  3.   GDP of Study Area

    街道办事处 居村委 2008年 2010年 2012年
    J1 J1-1 736.074 175 775.109 200 530.751 450
    J1-2 1 912.512 726 2 013.935 904 1 379.030 724
    J2-1 357.728 688 315.738 450 394.055 784
    J2-2 128.595 280 113.500 750 141.654 040
    J2-3 5 579.866 104 4 924.900 725 6 146.497 572
    J2-4 633.624 016 559.249 150 697.968 088
    J2-5 287.585 808 253.828 950 316.789 944
    J2-6 3 986.453 680 3 518.523 250 4 391.275 240
    J2 J2-7 1 104.750 360 975.074 625 1 216.936 980
    J2-8 6 143.347 240 5 422.240 375 6 767.199 820
    J2-9 6 220.504 408 5 490.340 825 6 852.192 244
    J2-10 4 221.432 328 3 725.920 075 4 650.115 804
    J2-11 7 380.200 024 6 513.911 225 8 129.654 132
    J2-12 20 178.937 528 17 810.331 325 22 228.094 404
    J2-13 7 476.061 960 6 598.520 875 8 235.250 780
    J3-1 3 445.532 768 3 499.526 528 3 732.517 368
    J3-2 4 174.163 384 4 239.575 264 4 521.836 934
    J3-3 3 750.260 272 3 809.029 312 4 062.626 172
    J3-4 4 418.548 808 4 487.790 368 4 786.577 658
    J3-5 3 487.772 224 3 542.427 904 3 778.275 024
    J3-6 4 951.067 664 5 028.654 144 5 363.450 964
    J3-7 3 860.384 568 3 920.879 328 4 181.922 918
    J3-8 8 726.973 320 8 863.730 720 9 453.858 570
    J3 J3-9 3 940.337 824 4 002.085 504 4 268.535 624
    J3-10 3 060.852 008 3 108.817 568 3 315.795 858
    J3-11 1 087.665 992 1 104.710 432 1 178.259 642
    J3-12 11 231.169 640 11 407.169 440 12 166.633 890
    J3-13 4 889.217 032 4 965.834 272 5 296.448 682
    J3-14 4 174.163 384 4 239.575 264 4 521.836 934
    J3-15 6 974.035 896 7 083.323 616 7 554.915 846
    J3-16 3 374.630 824 3 427.513 504 3 655.709 874
    J3-17 3 053.309 248 3 101.156 608 3 307.624 848
    J3-18 4 828.874 952 4 904.546 592 5 231.080 602
    J3-19 1 672.984 168 1 699.200 928 1 812.330 018
    下载: 导出CSV

    表  4  研究区土地利用类型分类

    Table  4.   Land Use Classification of Study Area

    序号 土地类型
    01 林地
    02 裸地
    03 公路用地
    04 公园与绿地
    05 高密度住宅用地
    06 中密度住宅用地
    07 低密度住宅用地
    08 商业及服务业用地
    09 机关团体用地
    10 工矿仓储用地
    11 耕地
    12 水体
    13 科教用地
    14 医疗卫生慈善用地
    15 公共设施用地
    16 建筑用地
    下载: 导出CSV

    表  5  模型对比试验表

    Table  5.   Experiment Between BP and GA-BP Model

    实验次数 BP迭代次数 GA-BP迭代次数
    1 487 9
    2 117 12
    3 178 11
    4 211 9
    5 192 10
    6 126 13
    7 488 9
    8 263 8
    9 472 10
    10 148 9
    下载: 导出CSV
  • [1] 1] Cohen L E, Felson M. Social Change and Crime Rate Trends:A Routine Activity Approach[J].American Sociological Review, 1979, 44(4):588-608 doi:  10.2307/2094589
    [2] Brantingham P L, Brantingham P J. Nodes, Paths and Edges:Considerations on the Complexity of Crime and the Physical Environment[J].Journal of Environmental Psychology, 1993, 13(1):3-28 doi:  10.1016/S0272-4944(05)80212-9
    [3] Caplan J M, Kennedy L W, Miller J. Risk Terrain Modeling:Brokering Criminological Theory and GIS Methods for Crime Forecasting[J].Justice Quarterly, 2011, 28(2):360-381 doi:  10.1080/07418825.2010.486037
    [4] Spicer V, Reid A A, Ginther J, et al. Bars on Blocks:A Cellular Automata Model of Crime and Liquor Licensed Establishment Density[J].Computers, Environment and Urban Systems, 2012, 36:412-422 doi:  10.1016/j.compenvurbsys.2012.02.004
    [5] Kianmehr K, Alhajj R. Effectiveness of Support Vector Machine for Crime Hot-Spots Prediction[J].Applied Artificial Intelligence, 2008, 22:433-458 doi:  10.1080/08839510802028405
    [6] Mohler G O, Shorta M B, Brantinghama P J, et al. Self-Exciting Point Process Modeling of Crime[J].Journal of the American Statistical Association, 2012, 106(493):100-108 https://www.researchgate.net/publication/227369342_Self-Exciting_Point_Process_Modeling_of_Crime
    [7] 徐冲, 柳林, 周素红.DP半岛街头抢劫案件的临近重复发生模式[J].地理研究, 2015, 34(2):384-394 http://www.cnki.com.cn/Article/CJFDTOTAL-DLYJ201502018.htm

    Xu Chong, Liu Lin, Zhou Suhong. Patterns of Near-Repeat Street Robbery in DP Peninsula[J]. Geographical Research, 2015, 34(2):384-394 http://www.cnki.com.cn/Article/CJFDTOTAL-DLYJ201502018.htm
    [8] Townsley M. Spatial Autocorrelation and Impacts on Criminology[J].Geographical Analysis, 2009, 41:452-461 doi:  10.1111/j.1538-4632.2009.00775.x
    [9] Anselin L, Cohen J, Cook D, et al. Spatial Analyses of Crime[J].Criminal Justice, 2000, 4:213-262 https://www.researchgate.net/publication/235217015_Spatial_Analyses_of_Crime
    [10] Salleh S A, Mansor N S, Yusoff Z, et al. The Crime Ecology:Ambient Temperature vs. Spatial Setting of Crime (Burglary)[J].Procedia-Social and Behavioral Sciences, 2012, 42:212-222 doi:  10.1016/j.sbspro.2012.04.184
    [11] Tekeli S, Günsoy G. The Relation Between Education and Economic Crime:An Assessment for Turkey[J]. Procedia-Social and Behavioral Sciences, 2014, 106:3012-3025 https://www.researchgate.net/publication/270848149_The_Relation_between_Education_and_Economic_Crime_An_Assessment_for_Turkey
    [12] Groot W, Van den Brink H M. The Effects of Education on Crime[J].Applied Economics, 2010, 42(3):279-289 doi:  10.1080/00036840701604412
    [13] Rephann T J. Rental Housing and Crime:The Role of Property Ownership and Management[J].Annals of Regional Science, 2008, 43:435-451 doi:  10.1007/s00168-008-0215-1
    [14] Toomey T L, Erickson D J, Carlin B P, et al. The Association Between Density of Alcohol Establishments and Violent Crime Within Urban Neighborhoods[J].Alcoholism Clinical & Experimental Research, 2012, 36(8):1468-1473 doi:  10.1111/j.1530-0277.2012.01753.x/full
    [15] Piza E L, Caplan J M, Kennedy L W. Analyzing the Influence of Micro-Level Factors on CCTV Camera Effect[J].Journal of Quantitative Criminology, 2014, 30:237-264 doi:  10.1007/s10940-013-9202-5
    [16] Aitken C, Moore D, Higgs P, et al. The Impact of a Police Crackdown on a Street Drug Scene:Evidence from the Street[J].International Journal of Drug Policy, 2002, 13:193-202 doi:  10.1016/S0955-3959(02)00075-0
    [17] Almeida J S. Predictive Non-Linear Modeling of Complex Data by Artificial Neural Networks[J].Current Opinion in Biotechnology, 2002, 13:72-76 doi:  10.1016/S0958-1669(02)00288-4
    [18] Li S, Kuo S, Tsai F. An Intelligent Decision-Support Model Using FSOM and Rule Extraction for Crime Prevention[J].Expert Systems with Applications, 2010, 37:7108-7199 doi:  10.1016/j.eswa.2010.03.004
    [19] 于红志, 刘凤鑫, 邹开其.改进的模糊BP神经网络及在犯罪预测中的应用[J].辽宁工程技术大学学报(自然科学版), 2012, 31(2):244-247 http://www.cnki.com.cn/Article/CJFDTOTAL-FXKY201202025.htm

    Yu Hongzhi, Liu Fengxin, Zou Kaiqi. Improved Fuzzy BP Neural Network and Its Application in Crime Prediction[J].Journal of Liaoning Technical University (Natural Science), 2012, 31(2):244-247 http://www.cnki.com.cn/Article/CJFDTOTAL-FXKY201202025.htm
    [20] 张永怀, 刘君华.采用BP神经网络及其改进算法改善传感器特性[J].传感技术学报, 2002, 3:185-188 doi:  10.3969/j.issn.1004-1699.2002.03.001

    Zhang Yonghuai, Liu Junhua. Improvement of Sensors Performance by Using BP Neutral Network and Its New Algorithms[J].Chinese Journal of Sensors and Actuators, 2002, 3:185-188 doi:  10.3969/j.issn.1004-1699.2002.03.001
    [21] Wang J, Wang J, Zhang Z, et al. Stock Index Forecasting Based on a Hybrid Model[J].Omega, 2012, 40:758-766 doi:  10.1016/j.omega.2011.07.008
    [22] Yu F, Xu X. A Short-Term Load Forecasting Model of Natural Gas Based on Optimized Genetic Algorithm and Improved BP Neural Network[J].Applied Energy, 2014, 134:102-113 doi:  10.1016/j.apenergy.2014.07.104
    [23] Wang S. Optimized Light Guide Plate Optical Brightness Parameter:Integrating Back-Propagation Neural Network (BPN) and Revised Genetic Algorithm (GA)[J].Materials and Manufacturing Processes, 2014, 29:1-8 doi:  10.1080/10426914.2013.832852
  • [1] 张新, 林晖, 朱长明, 王劲峰, 李满春, 徐成东, 胡茂桂, 孟斌, 曹春香.  COVID-19疫情早期中国确诊时间的时空特征及动态过程分析 . 武汉大学学报 ● 信息科学版, 2020, 45(6): 791-797. doi: 10.13203/j.whugis20200255
    [2] 应申, 徐雅洁, 窦小影, 陈学业, 赵军, 郭晗.  地理位置关联的COVID-19传播时空分析 . 武汉大学学报 ● 信息科学版, 2020, 45(6): 798-807. doi: 10.13203/j.whugis20200241
    [3] 刘宵婧, 桂志鹏, 曹军, 李锐, 吴华意.  GWR与STARMA结合的WMS响应时间时空预测模型 . 武汉大学学报 ● 信息科学版, 2018, 43(6): 951-958. doi: 10.13203/j.whugis20160370
    [4] 王增利, 刘学军, 陆娟, 吴伟, 张宏.  犯罪网络构建及其时空分析——以入室盗窃为例 . 武汉大学学报 ● 信息科学版, 2018, 43(5): 759-765. doi: 10.13203/j.whugis20150666
    [5] 杨喜平, 方志祥, 赵志远, 萧世伦, 尹凌.  顾及手机基站分布的核密度估计城市人群时空停留分布 . 武汉大学学报 ● 信息科学版, 2017, 42(1): 49-55. doi: 10.13203/j.whugis20150646
    [6] 李广春, 戴吾蛟, 杨国祥, 刘斌.  时空自回归模型在大坝变形分析中的应用 . 武汉大学学报 ● 信息科学版, 2015, 40(7): 877-893. doi: 10.13203/j.whugis20130549
    [7] 李冲, 李建成, 黄瑞金, 谭理.  考虑欧拉矢量的BP神经网络模型建立区域地壳运动速率场 . 武汉大学学报 ● 信息科学版, 2014, 39(3): 362-366. doi: 10.13203/j.whugis20120046
    [8] 萧世伦, 方志祥.  从时空GIS视野来定量分析人类行为的思考 . 武汉大学学报 ● 信息科学版, 2014, 39(6): 667-670. doi: 10.13203/j.whugis20140127
    [9] 祁春燕, 邱国庆, 张海荣.  底板突水预测模型的影响因素分析 . 武汉大学学报 ● 信息科学版, 2013, 38(2): 153-156,247.
    [10] 俞肇元, 袁林旺, 罗文, 易琳.  GIS时空分析系统的Clifford代数设计与实现 . 武汉大学学报 ● 信息科学版, 2011, 36(12): 1397-1401.
    [11] 张波, 侯四国, 张红, 王超.  R-D与共线模型在星载SAR影像正射纠正应用中的对比分析 . 武汉大学学报 ● 信息科学版, 2010, 35(9): 1069-1073.
    [12] 李清泉, 杨必胜, 郑年波.  时空一体化GIS-T数据模型与应用方法 . 武汉大学学报 ● 信息科学版, 2007, 32(11): 1034-1041.
    [13] 吕恒, 李新国, 曹凯.  基于BP神经网络模型的太湖悬浮物浓度遥感定量提取研究 . 武汉大学学报 ● 信息科学版, 2006, 31(8): 683-686.
    [14] 王建梅, 覃文忠.  基于L-M算法的BP神经网络分类器 . 武汉大学学报 ● 信息科学版, 2005, 30(10): 928-931.
    [15] 潘国荣.  基于时间序列分析的动态变形预测模型研究 . 武汉大学学报 ● 信息科学版, 2005, 30(6): 483-487.
    [16] 王新洲, 邓兴升.  大坝变形预报的模糊神经网络模型 . 武汉大学学报 ● 信息科学版, 2005, 30(7): 588-591.
    [17] 蔡永香, 郭庆胜, 桂志先, 丁虹.  基于地震-测井数据预测储层参数空间分布规律的神经网络模型 . 武汉大学学报 ● 信息科学版, 2005, 30(4): 366-370.
    [18] 邵黎霞, 何宗宜, 艾自兴, 宋晓东.  基于BP神经网络的河系自动综合研究 . 武汉大学学报 ● 信息科学版, 2004, 29(6): 555-557.
    [19] 尹晖, 王尚庆.  基于灰关联聚类分析的多点时空非线性模型及其应用 . 武汉大学学报 ● 信息科学版, 1998, 23(2): 100-104.
    [20] 江芸, 李同文, 程青, 沈焕锋.  利用时空神经网络模型的长江经济带气温反演 . 武汉大学学报 ● 信息科学版, 0, 0(0): 0-0. doi: 10.13203/j.whugis20210192
  • 加载中
图(13) / 表(5)
计量
  • 文章访问数:  1177
  • HTML全文浏览量:  77
  • PDF下载量:  545
  • 被引次数: 0
出版历程
  • 收稿日期:  2016-07-25
  • 刊出日期:  2017-08-05

改进的GA-BP神经网络模型在财产犯罪预测中的应用

doi: 10.13203/j.whugis20160911
    基金项目:

    国家自然科学基金 41171141

    作者简介:

    李卫红, 副教授, 主要从事时空数据挖掘和犯罪地理研究。hongweili9981@163.com

  • 中图分类号: P208

摘要: 发现犯罪时空分布规律并预测犯罪发生,是提高警务策略有效预防、控制犯罪的重要方法。在分析财产犯罪时空规律的基础上,利用BP神经网络模型自动学习训练各因子与财产犯罪的非线性关系,建立了财产犯罪预测模型。针对BP神经网络模型易陷入局部最优和模型不稳定的缺陷,提出了利用遗传算法(GA)选择各因子最优的初始化权重和参数,并以此作为BP神经网络模型的初始化权重矩阵,通过对历史数据的学习及训练建立了改进后的GA-BP神经网络模型。利用某市2007~2012年财产犯罪、人口、GDP、土地利用等35个综合影响因子数据,对改进前后的模型进行了预测对比试验。结果表明,改进后的GA-BP神经网络模型成功克服了BP模型的缺陷,收敛迭代最小次数从117次改进到8次;10次计算收敛迭代次数最大误差从370次提高到5次;模型预测精度(RMES)从0.043 0提高到0.019 95。

English Abstract

李卫红, 闻磊, 陈业滨. 改进的GA-BP神经网络模型在财产犯罪预测中的应用[J]. 武汉大学学报 ● 信息科学版, 2017, 42(8): 1110-1116, 1171. doi: 10.13203/j.whugis20160911
引用本文: 李卫红, 闻磊, 陈业滨. 改进的GA-BP神经网络模型在财产犯罪预测中的应用[J]. 武汉大学学报 ● 信息科学版, 2017, 42(8): 1110-1116, 1171. doi: 10.13203/j.whugis20160911
LI Weihong, WEN Lei, CHEN Yebin. Property Crime Forecast Based on Improved GA-BP Neural Network Model[J]. Geomatics and Information Science of Wuhan University, 2017, 42(8): 1110-1116, 1171. doi: 10.13203/j.whugis20160911
Citation: LI Weihong, WEN Lei, CHEN Yebin. Property Crime Forecast Based on Improved GA-BP Neural Network Model[J]. Geomatics and Information Science of Wuhan University, 2017, 42(8): 1110-1116, 1171. doi: 10.13203/j.whugis20160911
  • 财产犯罪是目前最常见的犯罪类型,其案件数量占各类案件总数的60%以上。探究财产犯罪时空分布规律,建立时空预测模型,根据预测结果制定(调整)警务对策,实现精准巡防与防控,可有效预防、控制财产犯罪的发生。

    目前有关犯罪预测的研究主要分为两大部分,一是基于日常活动理论[1],将犯罪条件归结于嫌疑人、合适的侵害目标、防范力量的缺失3部分相互作用的结果。日常活动理论指出犯罪活动与物理环境间具有复杂的相关关系[2],可根据犯罪活动相关影响因子,实现对于犯罪风险区的预测[3, 4];二是基于GIS空间分析统计与时空建模,利用犯罪时空数据,分析犯罪活动分布的时空规律,挖掘影响犯罪的相关因子,建立模型实现犯罪热点的预测[5, 6]

    已有研究表明,犯罪的发生与前期案件的空间分布有关,如案件的临近重复发生[7],案件空间自相关[8],以及案发地区的地理环境,如土地利用[9]、人口密度[10]、人口年龄[11]、学历[12]、出租屋和路网密度[13]、娱乐场所[14]、视频监控[15]、治安岗亭[16]等因子存在明显的相关性,因此可利用这些因子建立预测模型,对案件进行预测。

    随着社会的快速发展,财产犯罪作案模式也越来越多,其影响因子也变得复杂多样,线性的预测分析模型已不能满足目前财产犯罪的需要。神经网络模型通过机器学习,数据训练能描述更多复杂的非线性相关关系[17]。在犯罪地理学研究领域中,神经网络模型常被用于犯罪预测[18, 19]。BP神经网络模型(back propagation neural network model)是一种局部探测方法,它通过梯度下降法迭代更新神经网络中各自变量的权重,以探测神经网络误差的最小值。BP神经网络模型在进行数据训练过程中,可能陷入局部最小值[20]。遗传算法可用于预测模型以探测全局最优解,利用遗传算法(genetic algorithm, GA)改进后的BP神经网络模型GA-BP神经网络模型(genetic algorithm—back propagation neural network model)将弥补BP神经网络模型的局部最小值缺陷,从而避免BP神经网络模型陷入局部最小值[21]。GA-BP在众多领域的预测研究中得到了大量应用[22, 23], 但在犯罪地理研究领域中尚不多见。本研究旨在分析犯罪时空分布规律,探索影响犯罪的综合因子,通过模型对比实验建立适用于财产犯罪的时空预测的优化模型,利用模型实现对犯罪的分析预测,为警务部提供量化分析预测结果,达到以最优的警务效能实现最好的犯罪防控的目的。

    • 利用收集到的财产犯罪时空数据,相应时段的土地利用、人口、GDP、出租屋、流动人口、警务对策等数据,进行探索性数据分析。分析财产犯罪时空规律及与财产犯罪相关的因子,作为模型的训练因子。设计BP神经网络模型,利用前期案件密度及各类犯罪因子数据进行训练建立预测模型。将本期各类犯罪因子数据作为输入数据,对本期各格网的案件密度进行预测模拟;为预防BP模型随机生成的初始权重在训练时陷入局部最优,从而影响预测模型,引入GA改进BP神经网络模型初始权重矩阵,建立改进后的遗传神经网络预测模型。针对两种预测模型进行了精度评估,研究方法流程如图 1

      图  1  研究方法流程图

      Figure 1.  Flowchart of Methodology

    • BP神经网络为信号正向传播,误差反向传播有监督学习模型。理论上,通过合理的神经网络架构和权重,BP神经网络可以拟合任何形式的非线性连续函数。BP算法通过梯度下降法,迭代更新神经网络中各自变量的权重,使得神经网络输出值和真实值之间的均方误差达到最小值。3层(输入层、隐含层、输出层)BP神经网络结构如图 2,训练过程中,隐含层根据返回的误差赋予各个因子权重值ω。BP算法的权重调节公式如式(1)、(2):

      图  2  3层BP神经网络结构示意图

      Figure 2.  Three-Layer BP Neural Network Structure

      $$ \left\{ \begin{array}{l} {\Delta \omega _{jk}} = - \eta \frac{{\partial E}}{{\partial {\omega _{jk}}}} = \eta {\delta _k}{y_j} = \\ \eta ({p_l} - {z_k}){y_j}f\prime ({\rm{ne}}{{\rm{t}}_k})\\ \Delta {\omega _{ij}} = - \eta \frac{{\partial E}}{{\partial {\omega _{ij}}}} = \eta {\delta _j}{y_i} = \\ \eta (\sum\limits_{k = 1}^M {{\delta _k}{\omega _{jk}}} ){x_j}f\prime ({\rm{ne}}{{\rm{t}}_j}) \end{array} \right. $$ (1)
      $$ E = \frac{1}{2}\sum\limits_{k = 1}^M {{{({p_l} - {z_k})}^2}} $$ (2)

      式中,ω为权重;E为网络总误差;η为学习率;δ为误差信号;xi为输入分量;yi为输出分量;zk为连接权分量。

    • 遗传算法从包含潜在解集的种群中,通过若干代的繁殖、交叉、变异,对种群个体进行组合,产生最优的解。遗传算法使用适应度函数值判定解的质量,适应度函数值越大,解的质量越好。适应度函数如下:

      $$ {f_j} = {\left[ {\frac{1}{n}\sum\limits_{j = 1}^m {\sum\limits_{i = 1}^n {e_{ij}^2} } } \right]^{ - \frac{1}{2}}} $$ (3)

      式中,fj为第j个候选解的适应度值;n为神经网络输入集的数量;m为遗传算法的种群规模;eij为第j个候选解在第i次神经网络输入的误差。

    • 由于BP神经网络的初始权重及阈值的随机性,可能会陷入局部最小值。利用GA遗传算法改进BP神经网络模型,通过GA模拟自然选择过程,以及遗传理论对BP神经网络生成的初始解进行繁衍迭代,生成全局最优解解。将最优的初始值输入BP神经网络模型进行数据训练,以生成最合理的GA-BP预测模型(改进模型流程详见图 1),以期得到最佳的预测值。

      利用预测数据与真实数据确定预测模型的标准误差RMSE(root mean square error)评价预测模型的精度。RMSE计算公式为:

      $$ {\rm{RMSE}} = \sqrt {\frac{{\sum\limits_{i = 1}^n {{{\left( {{{\hat x}_i} - {x_i}} \right)}^2}} }}{n}} $$ (4)

      式中,${{{\hat x}_i}}$为各格网中预测值;xi为各格网真实值;n为参与计算的样本数量。

    • 本研究选择位于中国华南地区的A市,市区面积约1 200 km2。截止2013年末A市户籍人口为329.65万,流动人口超过53.7万,是典型的工业城市,具有华南地区典型的人文、社会、犯罪类型等特征。A市的警务信息化程度较高,犯罪数据、流动人口、警务对策数据较全面,具有较好的代表性。研究区选择A市市中心区,人口密集财产犯罪相对集中的5个派出所下辖的34个居村委为研究区(图 3)。

      图  3  研究区

      Figure 3.  Study Area

    • 以2008~2012年发生在研究区的财产犯罪案件数据作为研究对象。案件数据属性包括案件类型、案发地址、案发时间,数据详见表 1

      表 1  研究区犯罪案件统计表/起

      Table 1.  Statistic Data of Crime in a City from 2008~2012

      年份 总案件量 财产犯罪案件量
      2008~2012 190 55 15 574
      2008 2 941 2 326
      2009 3 341 2 848
      2010 4 415 3 641
      2011 3 796 3 196
      2012 4 562 3 563
    • 警务对策分为警务力量、警务设施、巡防布控策略3大类数据。警务力量包括各级公安机关;警务设施包括视频、卡口、电子警察;巡防布控策略包括治安岗亭、巡防路线、控制面等共8类数据。

    • 研究区含3个街道、5个派出所及下辖的34个居委。人口数据按常住人口、流动人口收集整理,经济数据按街道年GDP收集整理。常住人口按居村委统计,并按照年龄及学历分类整理:年龄分为16岁以下、16~30岁、30~60岁、60岁以上4个阶段;学历分为小学及以下、中学/中专/职高、大专及以上3个层次。流动人口按派出所统计,见表 2。经济指标GDP按据村委统计,见表 3

      表 2  研究区流动人口数据

      Table 2.  Floating Population of Study Area

      派出所 2008年 2010年 2012年
      P1 583 1 257 5 130
      P2 286 511 1 015
      P3 532 878 5 223
      P4 367 676 1 340
      P5 365 731 1 496

      表 3  研究区经济数据

      Table 3.  GDP of Study Area

      街道办事处 居村委 2008年 2010年 2012年
      J1 J1-1 736.074 175 775.109 200 530.751 450
      J1-2 1 912.512 726 2 013.935 904 1 379.030 724
      J2-1 357.728 688 315.738 450 394.055 784
      J2-2 128.595 280 113.500 750 141.654 040
      J2-3 5 579.866 104 4 924.900 725 6 146.497 572
      J2-4 633.624 016 559.249 150 697.968 088
      J2-5 287.585 808 253.828 950 316.789 944
      J2-6 3 986.453 680 3 518.523 250 4 391.275 240
      J2 J2-7 1 104.750 360 975.074 625 1 216.936 980
      J2-8 6 143.347 240 5 422.240 375 6 767.199 820
      J2-9 6 220.504 408 5 490.340 825 6 852.192 244
      J2-10 4 221.432 328 3 725.920 075 4 650.115 804
      J2-11 7 380.200 024 6 513.911 225 8 129.654 132
      J2-12 20 178.937 528 17 810.331 325 22 228.094 404
      J2-13 7 476.061 960 6 598.520 875 8 235.250 780
      J3-1 3 445.532 768 3 499.526 528 3 732.517 368
      J3-2 4 174.163 384 4 239.575 264 4 521.836 934
      J3-3 3 750.260 272 3 809.029 312 4 062.626 172
      J3-4 4 418.548 808 4 487.790 368 4 786.577 658
      J3-5 3 487.772 224 3 542.427 904 3 778.275 024
      J3-6 4 951.067 664 5 028.654 144 5 363.450 964
      J3-7 3 860.384 568 3 920.879 328 4 181.922 918
      J3-8 8 726.973 320 8 863.730 720 9 453.858 570
      J3 J3-9 3 940.337 824 4 002.085 504 4 268.535 624
      J3-10 3 060.852 008 3 108.817 568 3 315.795 858
      J3-11 1 087.665 992 1 104.710 432 1 178.259 642
      J3-12 11 231.169 640 11 407.169 440 12 166.633 890
      J3-13 4 889.217 032 4 965.834 272 5 296.448 682
      J3-14 4 174.163 384 4 239.575 264 4 521.836 934
      J3-15 6 974.035 896 7 083.323 616 7 554.915 846
      J3-16 3 374.630 824 3 427.513 504 3 655.709 874
      J3-17 3 053.309 248 3 101.156 608 3 307.624 848
      J3-18 4 828.874 952 4 904.546 592 5 231.080 602
      J3-19 1 672.984 168 1 699.200 928 1 812.330 018
    • 利用2008、2010、2012年3期遥感影像,对应时段的1:2 000地形图矢量数据和警务管理数据,将研究区3期的土地利用类型分为16类,共48组数据,详细分类见表 4

      表 4  研究区土地利用类型分类

      Table 4.  Land Use Classification of Study Area

      序号 土地类型
      01 林地
      02 裸地
      03 公路用地
      04 公园与绿地
      05 高密度住宅用地
      06 中密度住宅用地
      07 低密度住宅用地
      08 商业及服务业用地
      09 机关团体用地
      10 工矿仓储用地
      11 耕地
      12 水体
      13 科教用地
      14 医疗卫生慈善用地
      15 公共设施用地
      16 建筑用地
    • 空间自相关分析发现,在Moore(Queen)邻域,案件密度具有最强的空间自相关性,全局Moran’s I指数均为0.33以上。因此在构建预测模型时,需要将每个格网的Moore(Queen)邻域的8个案件密度作为影响因子参与模型训练。

      Spearman相关分析发现,警务对策、人口因素、经济指标、土地利用类型与财产犯罪均具有相关性,因此在构建预测模型时,需要将全部共27个影响因子参与模型训练。

    • 1) 时间规律分析。将2007~2012年财产犯罪,分别按照每天24 h时段、每年12个月的时间维度进行统计分析,发现财产犯罪在每天的时段上有明显规律,但在每年的月份上没有明显规律。

      财产犯罪案件量在时段具有明显的聚集性,每年的财产犯罪案件高发时段均为18:00~19:00时段。该时段为下班高峰期,人流量大,发生街头犯罪的风险较大,并且该时段中大部分居民在户外活动,从而发生入室犯罪活动的风险较大,具体见图 4

      图  4  2007~2012年分时段财产犯罪案件统计图

      Figure 4.  24 Hours Chart of Property Crime, 2007~2012

      财产犯罪案件量在月份没有明显的聚集性,这可能是由于研究区地处中国大陆华南地带,气候相对炎热,四季温差不明显所致,如图 5所示。

      图  5  2007~2012年财产犯罪案件分月统计图

      Figure 5.  12 Months Chart of Property Crime, 2007~2012

      2) 空间分布规律。将2007~2012年财产犯罪按年进行热点分析(图 6),发现案件的空间重复度非常高,案件高发区几乎没有太大的空间转移,证明了案件高发区域与其所处的地理环境是高度相关的。因此需要将相关性分析的所有因子纳入到模型训练与预测中。

      图  6  2007~2012年案件热点分布图

      Figure 6.  2007~2012 Map of Hot Spot Case

    • 设模型迭代收敛阈值为0.000 01,最大迭代次数为500次。将研究区按100 m×100 m格网进行空间采样标准化,时间窗设为1 a。利用2007~2011年数据作为输入训练模型,预测2012年财产犯罪(图 7)。针对原始BP神经网络模型、改进后的GA-BP神经网络模型进行10次重复计算实验,实验结果见表 5

      图  7  模型迭代次数统计图

      Figure 7.  Iterations Chart

      表 5  模型对比试验表

      Table 5.  Experiment Between BP and GA-BP Model

      实验次数 BP迭代次数 GA-BP迭代次数
      1 487 9
      2 117 12
      3 178 11
      4 211 9
      5 192 10
      6 126 13
      7 488 9
      8 263 8
      9 472 10
      10 148 9
    • 在两模型10次预测计算中,选精度最佳的预测结果与2012年真实财产犯罪数据进行精度评估。BP神经网络模型预测结果如图 8所示,与真值之间的误差如图 9所示,全部格网点预测精度RMES=0.043 0;GA-BP遗传神经网络模型预测结果与真值之间的误差如图 10所示,全部格网点预测精度RMES=0.019 95。

      图  8  BP模型预测结果图

      Figure 8.  Result of BP Model

      图  9  BP模型预测误差图

      Figure 9.  Deviation of BP Model

      图  10  GA-BP预测结果图

      Figure 10.  Result of GA-BP Model

    • 表 5图 7中可以看出,BP神经网络模型在10次计算中,每次迭代次数偏差较大,每次计算的结果也存在较大偏差,说明BP神经网络模型是不稳定的;GA-BP神经网络模型在10次计算中,每次迭代次数偏差不大,最多计算13次即可达到收敛要求,每次计算的结果精度稳定。

      图 8~11可以看出,GA-BP神经网络模型在预测结果、预测误差两个方面均得到了有效的改善。

      图  11  GA-BP模型预测误差图

      Figure 11.  Deviation of GA-BP Model

      模型对比实验结果说明,改进后的GA-BP神经网络模型,有效地避免了BP神经网络模型已陷入局部最优、预测结果不稳定等缺陷, 在计算效率、预测结果、预测精度3方面均得到了明显的优化。改进后的模型预测精度RMES=0.019 95,预测结果满足警务实际应用需求,如图 12~13所示。

      图  12  财产犯罪案件密度预测分级图

      Figure 12.  Property Crime Density of Forecasting

      图  13  财产犯罪案件密度真实分级图

      Figure 13.  Property Crime Density of Reality

    • 本文对财产犯罪时空规律、BP神经网络模型用于财产犯罪预测进行了研究,提出利用遗传算法优化BP神经网络模型初始权重矩阵的方法,建立了GA-BP模型。利用实际发生的财产犯罪时空数据进行了预测分析,验证了GA-BP模型的可靠性。

      基于GA-BP模型财产犯罪预测结果,将改变警务策略制定不能时空量化分析的现状,并在警务策略制定、警务效能评估等应用中发挥作用。

参考文献 (23)

目录

    /

    返回文章
    返回