想写关于“犯罪预测”的论文,在万方进行检索,想看看以前相关论文都使用了哪些数据,结果如下。发现选取的数据集有中国的也有国外的,我经过各种方式的查找,发现无法获得中国的犯罪统计数据,请问各位虫友有没有好的办法?
此外,如果中国的数据找不到,国外的犯罪数据也可以,希望得到虫友多多整理和提供!感谢!
我这里找到一个 https://www.ojjdp.gov/ojstatbb/crime/JAR.asp 美国司法部“青少年司法与犯罪预防办公室”给出的美国青少年犯罪相关年份数据。下面是以前论文中使用的数据:
本文使用的数据集来源于芝加哥市警察局的公民执法分析和报告系统。该数据集包括了2015年1月1日至2017年12月31日芝加哥市警察局接报的所有犯罪事件的案由、地址(经纬度)、时间、案情描述等22个字段。本文抽取字段名为“Theft”即一般盗窃的数据,总量为182673条
[1]朱小波,次晋芳.基于改进PSO-BP神经网络算法在一般盗窃犯罪预测中的应用[J].计算机应用与软件,2020,37(1):37-42,75. DOI:10.3969/j.issn.1000-386x.2020.01.007.
文中实证数据来源于WH市公安局大数据实战应用中心110接警平台2015年1月3日至2018年5月28日1242天经脱敏处理的所有报案数据共934698条。
[2]沈寒蕾,张虎,张耀峰, 等.基于长短期记忆模型的入室盗窃犯罪预测研究[J].统计与信息论坛,2019,34(11):107-115.
本部分选取的数据为美国旧金山地区的官方公开犯罪数据。该数据集包含2003-2017年该地区的所有·92·第9期刘美霖,等:基于时空序列混合模型的犯罪情报预测分析犯罪数据。选择此数据是因为旧金山长期以来对犯罪数据的统计较为详细且公开,加之国内公安工作保密性和各部门之间的工作习惯和工作模式的差异,以及利用数据挖掘技术在犯罪情报获取上的应用起步较晚,难以找到周期较长的数据,所以选择了旧金山的数据证明模型的可行性
[3]刘美霖,高见,黄鸿志, 等.基于时空序列混合模型的犯罪情报预测分析[J].情报杂志,2018,37(9):27-31,37. DOI:10.3969/j.issn.1002-1965.2018.09.005.
实验所用数据为洛杉矶司法部门统计并公开的犯罪数据,时间范围为2016年1月1日至2016年12月31日,记录了全年发生的共304977起犯罪事件
[4]黄娜,何泾沙,孙靖超, 等.基于改进LSTM网络的犯罪态势预测方法[J].北京工业大学学报,2019,45(8):742-748. DOI:10.11936/bjutxb2018070018.
某地区2010—2013年公安机关缴获海洛因的数量
[5]苏国强,兰月新.灰色预测在边防毒品情报分析中的应用[J].情报杂志,2011,30(z1):21-22. DOI:10.3969/j.issn.1002-1965.2011.z1.006.
因此本文所选择的盗窃案件和诈骗案件的数量为2014年度发案量最高的两类案件,分别为6.7万件和5.2万件。本文规定在预测过程中,训练集为2004~2013年的所有数据,预测集为2014年的数据。最后将预测的案件数量与真实案件数量进行比较得出RMSE、MAE以及准确率。
[6]翟一鸣,丁宁,李成龙.基于节假日因素的多尺度犯罪时序预测方法研究[J].中国人民公安大学学报(自然科学版),2020,26(3):78-84.
|