【公安大数据专家谈】美国预测警务中基于大数据的犯罪情报分析
【作者简介:吕雪梅,山东警察学院副教授。研究方向:公安情报学和警察学。本文引自《情报杂志》2015(12):16-20】
本文关键词:大数据 | 犯罪情报分析 | 预测警务 | 战术犯罪分析
美国预测警务中的犯罪情报分析是一种典型意义上的基于大数据的犯罪情报分析。它不仅改变了犯罪情报分析的理论基础,拓展了犯罪情报分析的外延,改变了犯罪情报分析的形态,也重新界定了犯罪情报的概念,助推了大数据时代情报主导警务的发展。借鉴美国犯罪情报分析的成功经验,我国既需要从“推进犯罪情报分析队伍专业化建设、促进大数据融合、提炼犯罪分析模型、研发犯罪情报分析系统、开展战略或战术情报分析业务、解决犯罪问题"的角度,不断推进犯罪情报分析的层次和水平,同时也要合理把握好犯罪分析与公民隐私权保障的平衡。
2008年,美国洛杉矶市时任警察局长WilliamJ.Bratton(即前纽约警察局局长,Compstat模式的创始人)与美国司法援助局代理主任詹姆斯.伯奇和国家司法委员会(NIJ)代理主任克里斯蒂娜.罗丝密切配合,开始探索“预测警务”这一新的执法理念。
2009年11月和2010年6月,美国国家司法委员会主办召开了两次预测警务座谈会,美国预测警务开始受到执法机构、研究人员、警察指挥官、媒体等方面的持续关注。
IBM公司拍摄了一个犯罪预测分析的商业广告,展示了一个警察通过数据分析,先于抢劫犯到达其意图抢劫的便利店,视频最后的结语“终结犯罪在犯罪发生之前,给予大数据时代的犯罪情报分析以无限的想象空间。
美国预测警务在洛杉矶、孟菲斯、圣克鲁斯等多地取得标志性的胜利,彰显了大数据时代犯罪情报分析的创新发展。
1
美国预测警务及其犯罪情报分析概览
根据2013年美国兰德公司撰写的题为《预测警务——犯罪预测在执法机构业务运作中的作用》的研究报告,预测警务是应用分析技术,特别是定量分析技术,通过统计预测为警方打击和预防犯罪,或预测已发犯罪案件最可能的目标的警务。
一、美国预测警务的业务流程
图1 预测警务业务流程
美国预测警务的业务流程图如图1所示,分为以下4个步骤:
第一步是数据收集。所有的预测警务技术都依赖于巨量的数据,融合不同的数据资源是美国预测警务的基础。这些数据不仅包括警方收集的各类犯罪数据,还包括附加商业、基础设施和人口统计等犯罪发生时的环境数据。
第二步是分析。也就是分析犯罪数据以产出一个预测。美国预测警务将预测方法分为四个大类:一是预测犯罪风险增加的地点和时间;二是预测将来有犯罪风险的个人;三是预测已知犯罪案件最有可能的犯罪嫌疑人;四是预测可能的犯罪受害群体或在某些情况下最容易成为犯罪受害人的个人。
第三步是警方干预。分析只有能够影响警务实践才有可能影响犯罪率的升降。持续评估警务运行的过程,也是犯罪分析的重要内容。上图中显示了三个宽泛的干预类型:一般干预主要是指分配更多的资源响应增加的风险,比如向犯罪热点区域投放更多的警察等。特定犯罪的干预主要是指针对特定的犯罪类型而采取的干预措施。特定问题的干预主要是针对识别出的产生犯罪风险的特定位置、人群或个体等而采取的干预措施。无论什么样的干预类型,犯罪分析人员都需要向执行这些干预行动的指挥官或警察,尽可能提供足够的信息和知识,以构建正确的情景意识。
第四步是刑事(Criminal)响应。一旦警方发起干预,一些罪犯可能被逮捕或者远离街道。其他人可能选择停止犯罪,改变他们实施犯罪的地点或者改变实施犯罪的方法,以应对警方的干预行动。因此,一个热点位置冷却下来,可能一些犯罪活动转移到其它地区,那么,新一轮的数据收集、犯罪分析和干预行动的工作循环将再次开始。
二、美国预测警务中的犯罪情报分析
美国预测警务中的犯罪情报分析主要使用统计学的基本知识和技术方法,侧重于犯罪数据与社会人口统计、时间、空间等因素的关联分析,来发现犯罪数据中的“非线性关系”,帮助警方更全面、深刻地解读犯罪现象。
美国犯罪情报分析呈现出以下三个特点:
第一,广泛的数据融合为犯罪情报分析奠定了坚实的基础,数据融合不仅是将不同数据源的数据集中在一起,更重要的是要根据分析主题,确定不同的数据在这一主题下应当贡献的价值,将这些数据有机的结合起来,亦即多种不同的数据以某种科学的方式协同服务于分析主题。这种“科学的方式冶就是分析模型,以及建立在分析模型基础之上的算法。
第二,基于统计的犯罪分析模型是美国预测警务中犯罪分析的主要工具,分析模型来自于大数据的分析识别出的某类犯罪在人口统计、时间、空间等方面的模式,犯罪分析师根据概率合理设计这些模式的权重,提炼出某类犯罪的分析模型。犯罪分析系统通过执行犯罪分析模型,测算出犯罪高风险地域、人员,易害人群或个人以及与特定案件相关度较高的犯罪嫌疑人员。
第三,在美国当前的犯罪情报分析中,融合了“热点成像冶和“地理画像冶技术的犯罪空间分析所占的比重高达80%,探究风险地域、风险时段、风险人员、易害群体等要素的空间分布特征,为合理部署警力提供了更直观、更具针对性的依据。
图2和图3分别是华盛顿的犯罪时间热度图和犯罪风险地域图,可以从一个侧面展示美国基于大数据犯罪情报分析的新发展。
图2 华盛顿入室盗窃和抢劫犯罪热度图
图3 华盛顿抢劫女性手提包犯罪风险地域图
2
美国预测警务中犯罪情报分析与传统犯罪情报分析的比较
传统的犯罪分析通常是基于有限的“小数据”而开展的经验分析。美国预测警务中犯罪分析显然与之有着质的不同。两者的区别具体可以通过表1说明:
表1 传统的犯罪情报分析与美国预测警务中的犯罪情报分析之区别
从上表可以归纳出美国预测警务中的犯罪情报分析,在以下几个方面取得了新的突破和发展:
一、美国预测警务改变了犯罪情报分析的理论基础
传统犯罪情报分析的理论基础是侦查学,主要是从打击犯罪、定罪量刑的角度出发,围绕刑法学意义上的犯罪构成要件展开分析。美国预测警务中犯罪情报分析的理论基础是犯罪学,它把犯罪作为一种特殊的社会现象,主要是从预防和减少犯罪的角度出发,围绕犯罪环境、犯罪诱因、犯罪机会、责任主体、社会控制措施等开展分析,寻找犯罪的相关因素及变化规律,运用环境犯罪学的理论及情境预防、社区预防等现代犯罪学的理论,指导建立有效的犯罪防控体系,有效减少、降低和预防犯罪。
二、美国预测警务拓展了犯罪情报分析的外延
传统犯罪情报分析中的犯罪通常是指刑法学意义上的犯罪,也就是那些同时具备了“社会危害性、刑事违法性、应受刑罚处罚性冶三个条件的犯罪案件。美国预测警务中犯罪分析则是指犯罪学意义上的犯罪问题。犯罪学意义上的犯罪是指具有严重社会危害性的,应当采取社会性预防对策的行为。也就是说,包括了我们传统意义上的“刑事犯罪冶“违法冶和“有必要予以预防和控制的‘待法律化爷的有社会危害性的行为冶三个层面。这使得犯罪情报分析的范围由“已发生或正在发生的犯罪案件冶拓展到了“犯罪及其相关问题冶,这就把各种犯罪隐患、犯罪苗头、犯罪环境中蕴含的犯罪机会、未遂事件、社会控制措施等违法犯罪的相关问题全部纳入了犯罪分析的范畴。
三、美国预测警务改变了犯罪情报分析的形态
传统的犯罪情报分析的主体是侦查等专业警察,大多是根据有限的“小数据冶而开展的战术性情报分析。因为数据量少,主观性强,分析结论对数据质量和专业经验的依赖度极高,错误的数据或者偏见极有可能使警务工作误入歧途。犯罪分析的假定主要来源于直觉、经验、类比和常识,推理方法主要是从一般到个别的演绎推理,即从一般性的原理和认识出发,应用于个案的推理得出分析结论。传统犯罪分析得出的往往是个案分析所体现出来的“技战法冶,因为世界上不存在两个完全一致的案例,故而“技战法冶往往无法复制。而美国预测警务中犯罪情报分析的主体是犯罪分析师,大多是基于大数据而开展的战略性情报分析。
这种分析摆脱了人为主观上的盲目和偏见,让“数据冶发声,通过数据间的相关关系分析,”洞见冶犯罪现象中的客观规律,提升了犯罪分析的科学性。其推理方法主要是从个别到一般的归纳推理,即通过海量数据的定量分析,更多地运用统计的方法测量犯罪现象,犯罪分析得出的往往是“技战术冶,也就是将数据分析识别的犯罪模式提炼成分析模型,用于犯罪预测,因而可以推而广之,取得犯罪控制的扩散效应。
四、美国预测警务中的犯罪情报分析重新界定了犯罪情报的概念
传统犯罪情报分析基于“小情报”观,把“犯罪情报冶界定为更多的是利用隐蔽手段获得“有价值的情报线索冶。犯罪情报工作更多地被理解为“一小群被边缘化、神秘化的警察偷偷摸摸地执行命令的情形冶,而有被“妖魔化冶的倾向。美国预测警务中犯罪情报分析则是基于“大情报冶”,把“犯罪情报冶界定为大数据分析后得来的“知识”,是一种更具智慧层面的产品。它通过探究犯罪模式、犯罪诱因、犯罪机会与犯罪风险,为警力部署和犯罪预防提供智慧。美国预测警务中的犯罪分析更像是数据“加工厂”,在保障个人隐私和信息安全的前提下,警方可以每天向普通市民每天提供类似“天气预报冶那样的“犯罪预报”,让犯罪情报工作更多地具有了在“法治阳光”下操作的社会公益性质。
五、美国预测警务中的犯罪情报分析助推了情报主导警务的新发展
从本质上来说,美国的预测警务是通过数据分析得出情报产品,并据此部署警力,提高犯罪防控的效能,这与情报主导警务的基本特征相符,从这个意义上说,预测警务并不是一种新的警务模式,只是更为宽泛意义上的情报主导警务的重要组成部分。情报主导警务是世界第五次警务革命的主题,成为世界许多国家现代警务改革的主流方向。犯罪分析作为情报主导警务的核心环节,一直受困于犯罪数据融合度和犯罪分析技术方法的局限,因而情报主导警务一度被认为是一种空的理想,这种倾向在中国尤其明显。
美国预测警务中的犯罪情报分析展示了最有前途的预测工具和战术方法,极大地推动了大数据背景下情报主导警务的创新发展。
3
美国预测警务中的犯罪情报分析对我国的借鉴
美国预测警务中的犯罪情报分析是一种典型意义上的基于大数据的犯罪情报分析。按照维基百科的定义:“大数据是无法在一定时间内用常规软件对其内容进行抓取、管理和处理的数据集合。基于大数据的犯罪情报分析就是围绕违法犯罪问题和相关警务问题,结合社会人口统计、空间和时间等相关因素对大数据集的犯罪数据进行统计分析和系统研究,识别犯罪模式,寻找犯罪诱因,优化警力资源配置,为有效预防、减少犯罪和提升警务效能提供决策依据。
我们可以用图4概览美国大数据语境下犯罪情报分析的基本理论框架:美国基于大数据的犯罪情报分析实践所取得显著成效,对推进我国情报主导警务改革,构建大情报工作格局,提升犯罪情报分析层次和水平,均有十分积极的借鉴作用。借鉴美国预测警务的经验,我国应从以下几个方面着力推进基于大数据的犯罪情报分析工作。
图4 大数据语境下犯罪分析的基本框架
一、推进我国犯罪情报分析队伍专业化建设
基于大数据的犯罪情报分析显然需要专门的分析技能,掌握犯罪热点、犯罪时空、犯罪地理画像、犯罪高风险人员识别等分析业务,设立犯罪分析主管、高级犯罪分析师、专业犯罪分析师、初级犯罪分析师、犯罪分析助理等岗位在美国已成趋势,国际上犯罪分析师职业化的趋势将越来越明显。
而这其中,情报分析部门与大学犯罪研究机构的合作,对犯罪情报分析队伍专业化的发展起到了积极作用。在我国,犯罪情报分析职业化的呼声越来越高,与相关教育研究机构密切合作,加大各类犯罪情报分析师的培训与认证工作,积极推进我国公安情报分析专业队伍建设,既有利于各类专业犯罪情报分析师的成长,更有利于提升犯罪情报分析的专业水平。
二、转变数据管理传统观念,促进大数据的有机融合
2015年8月31日,国务院发布的《促进大数据发展行动纲要》,推动政府数据开放共享,促进社会事业数据融合和资源整合,提升政府整体数据分析能力,为有效处理复杂社会问题提供新的手段。这一纲领性文件将极大地对促进包括犯罪情报分析在内的大数据分析快速发展,为犯罪情报分析提供更加丰富的数据资源。
但是,从犯罪情报分析的角度看,我们需要转变数据管理的传统观念。
第一,摒弃追求数据数量的做法,确立数据质量第一的观念和有效的质量把关制度;
第二,以犯罪情报分析需求为导向,科学论证数据采集的渠道、种类和内容,增加犯罪空间数据采集与分析;
第三,摈弃按照职位高低分配数据权限的做法,按照分析和应用需求配置数据权限,基于大数据的犯罪情报分析需要对数据进行下载、清洗、整理、重组、分析等一系列专业化的处理,按照分析需求进行数据融合,这显然是国内目前仅提供简单的信息查询或比对功能的信息系统所无法实现的。
因此,破除数据管理的利益与权限障碍,确立公安数据的开放原则,是推进我国犯罪情报分析工作的前提条件。
三、提炼犯罪分析模型,研发犯罪情报分析工具
基于大数据的犯罪分析更多地使用回归和数据挖掘技术,来探索可用的数据集,以便发现更为深刻的洞察。这种探索是通过犯罪分析系统,执行犯罪风险评估、热点、高风险地域等犯罪分析统计模型,测算出分析结果。而这些先进犯罪分析模型,来自于前期对犯罪专题和犯罪模式的研究。
比如识别某类犯罪易害人群的分析模型,就来自于被害人群的人口学统计分析,以及被害时间、空间的分析所识别出的犯罪模式,将这些犯罪模式合理设计出权重,就组成了此类犯罪易害人群的分析模型。学会应用犯罪学的理论和分析方法解读犯罪现象,识别犯罪模式,不断提炼犯罪分析模型,在此基础上研发犯罪情报分析工具十分重要。
四、开展战略和战术犯罪分析,解决当地突出的治安问题
战略犯罪分析的基本任务是指通过对犯罪问题和相关警务问题的进行研究,识别长期行为模式,评估警察响应和组织程序,解决当地突出的治安问题。
主要内容包括:a.监测犯罪动态;b.识别和分析长期犯罪问题;c.通过战略或战术任务协作开展犯罪的社会治理,从根本上解决犯罪问题;d.评估犯罪防控成效;e.关注犯罪转移和利益扩散;f.评估警务运行效能;g.规划警务未来的战略需求。
战术犯罪分析的基本任务是指通过分析近期发生的犯罪事件和犯罪行为的特征,识别犯罪在时间、空间、犯罪过程及人口特征方面的模式,为重大事件预警、识别犯罪高风险人员、易害群体、特定案件犯罪嫌疑人以及串并案件提供决策依据。具体而言包括:识别潜在的重大事件;识别犯罪高风险人员;识别易害群体和个人;识别特定案件的犯罪者;识别犯罪热点;预测系列案件下一起作案地点;预测犯罪嫌疑人落脚点。
五、把握犯罪情报分析与公民隐私权保护之间的平衡
美国学者帕特里克·塔克尔写了一本有关大数据的专著,书名就叫做《赤裸裸的未来》,书中预言:未来的大数据将在你意想不到的程度上,向消费者、激进分子和其他普通人开放。
事实上,大数据仅仅是大潮流中的一个波浪,遥测技术就是现代和赤裸裸的未来的分水岭。遥测技术就是将某地测量数据远距离传输、记录或播放操作的技术。远程医疗、手机APP、智慧家居、服饰、配饰、电器、汽车等内置的遥感设备,将把人类社会带入无隐私的时代。这一方面为大数据的犯罪分析提供强大的数据支持,另一方面,大数据的犯罪分析也极有可能成为一把会给公民隐私权带来极大威胁的利刃。
提前做好准备,设定好规则,防患于未然,是推进我国“依法治国冶的基本国策不可或缺的重要内容。
美国预测警务将保护公民隐私作为其执法的前提,要求警方在收集和使用个人隐私数据时,必须遵守美国第四修正案及相关公民隐私权法案的规定,其中确定的基本原则包括:
a.公开原则。犯罪分析的开发者、实践者和相关个人数据的政策应当有一个公开的总方针。
b.收集限制原则。对于个人数据收集应当有限制,并且任何数据应当通过合法和公平的获得,适当情况下相对人应具有知情权。
c.目的明确原则。收集个人数据应该明确的警务目的,不得将数据用于其他非法目的。
d.使用限制原则。除数据主体同意或法律授权外,个人数据不应当公开或用于特定目的。
e.数据质量原则。个人数据使用应当与正当的使用目的相关,对于这些目的的必要程度,应当准确、全面、相关并保持最新。
f.个人参与原则。个人有权知道与其哪些机构获取了其个人数据,并且有权查询与其有关的个人数据。
g.安全保护原则。个人数据应当进行合理的安全防护,以应对遗失或越权访问、破坏、使用、修改或泄露。
h.责任原则。数据收集者如果违反以上原则,应当负相应的责任。
我国也建立起了比较完善的信息安全制度,但相关犯罪数据收集、储存、共享、使用等方面的立法还是空白,在恰当的时机完善相关立法和制度十分迫切。在大数据时代来临的时候,警察毫无疑问地将变得越来越依赖数据以获取资源并且有效地处理它们。美国预测警务的实践,凸显了大数据语境下的犯罪分析在现代警务中的价值,也向我们展示了情报主导警务前所未有的发展空间。
但是,我们也要清醒地看到,当大数据的犯罪分析带来更高的犯罪预防和治理效率的同时,带给公民隐私权保护和信息安全的威胁也会与日俱增,当大数据时代“赤裸裸的未来冶走入现实,确保以犯罪分析为核心的预测警务始终保持在维护公平正义的法治轨道上,我们任重而道远。