推进公安大数据战略中需要关注的若干问题

2020-12-14 16:55:27 阅读 4680



----在第十三届全国治安学年会暨华东地区第二十二届公安院校治安管理学术研讨会上的发言

 

商建学

2020125

 

各位嘉宾:

  大家好!
  非常感谢会议组织者的邀请,我就“推进公安大数据战略中需要关注的若干问题”作个发言。
  大家知道,在推进国家治理体系和治理能力现代化过程中,大数据战略将发挥关键作用。公安大数据战略的实施已有几年,在全国各地、各业务条线都能看到实施大数据战略给公安工作带来的巨大进步,进展确实令人鼓舞。

  不过,当我们不断为大数据应用的水平和成果鼓掌时,如果能够比较理性地剖析一下目前的不足,思考一下后续的发展方向和策略,相信对公安大数据战略的深入实施会有更大的促进作用。所以,我想利用今天的机会,就公安大数据战略实施中若干问题(或者说若干话题)谈些看法,供各位参考。


一、关于大数据条件下对公安工作的新认知

  重视并使用数据是深入到政府基因中的,即便是在非信息化时代亦是如此,更不要说我们已进入信息化时代,而警方对数据的态度更具有典型性。所以,用数据对我们来讲从来不是问题,如何用对用好数据才是问题,而这很大程度上取决于我们能否站在数据的角度上看清公安工作。
信息化给我们带来的一个重要机遇是数据资源的丰富、数据处理能力的增强可以让我们对许多事物有新的、更为全面的、更接近真相的认知,从而拥有更好的能力和工作方式。然而,我们对大数据条件下公安工作的新认知却显得不足。公安工作现在所依赖的基础理论、基本方法、核心观点并不是在大数据条件下形成的。随着信息化的发展,我们现在有了除实验验证、逻辑推理和计算机仿真以外的第四种科学研究范式--数据分析,也积累了海量数据特别是数据化了的案例,但我们是否花了足够的时间和精力,利用积累的数据去研究公安工作的基本问题?目前看不到,我们只是忙着用数据解决面对的事务。在新的大数据条件下尚未产生足以支撑或影响公安业务的基础性理论与观点,对数据的应用主要致力于解决具体业务问题,尚做不到从数据中发现基础性、规律性的东西。比如各地公安机关的大数据应用项目中,即便是最基本的对事物或人物属性的赋值也往往来自经验或主观判断,缺乏有力的统计学意义上的支撑,更不要说基于新的数据(案例)的修正了。
  另外,我们的注意力绝大部分都在关注对象身上,经过这些年的发展,我们在用数据说清楚关注人或事件方面进步巨大,但是,我们一直没有能力用数据说清楚我们自身。我们在信息系统中记录了一些与我们行为相关的数据,如访问日志、业务流程等,但这些数据主要用来解决具体的业务管理问题,而非针对公安机关的业务形态,即我们没法用数据来说明各层级各条线在干什么、干得对不对,干得好不好,这是我们在自我认知上存在的明显不足。

  基于大数据对公安工作的新认知,包括相应的理论基础、核心观点、业务模式以及对关注对象和我们自身的认知等,应该成为今后公安工作的重要行为基础,这是在公安大数据战略实施中迫切需要做的事情。


二、关于基于数据应用的能力及输送机制的构建

  大数据战略实施中构建基于数据应用的能力并将其输送到业务一线是优先考虑的,也是主要推进抓手和主要应用模式。我们面临几个问题:

  首先是到底构建多强大的能力才是合适的?我们一般的认识当然是能做多强就做多强,但能力构建是需要投入成本的,包括数据、算法、算力上的投入和基于业务需求的封装与输出上的投入。如果要构建的能力非同一般,还会存在可观的应用成本,比如为防止能力被滥用而需要投入的监管成本和事后补救成本等。实践中,我们基本忽视了能力构建带来的成本问题。其实,能力是否足够强大,在于是否能够通过它的应用以期望的效率处理相关事务。即便从技术角度讲,我们也没有办法衡量一种能力是否足够强大,更不要说从业务角度来衡量了。至于能力是否“合适”,要看它是否足以但不过度满足处理业务的需求。构建过度强大的、没有良好应用控制机制的能力是有风险的,这种风险不仅是投资方面的,甚至还有可能是政策或政治方面的,迄今为止,我们对这种风险的认识是不足的。

  其次是构建的能力如何与业务一线的工作相匹配?能力与业务处理的匹配既有工具性要求,也有机制性要求。满足工具性要求是解决业务中对处理具体问题的能力支撑的需求,需要的是“合适”的能力。但有些信息化支撑能力的应用是需要相应的业务机制配套的,比如在某些业务环节应该核验身份,某些业务环节应该确认既往表现等。还有一些信息化支撑能力的应用则需要一定的监管机制,以防被滥用。目前存在的主要问题是对机制性要求普遍重视不足。

  再有是能力是否畅通地输送到业务一线?大数据的发展导致基于数据应用的能力构建基本上趋于集约化,能力输送的“开关”(授权、监管等)掌握在上层手中,能力输送问题因而凸显出来。我们在基层调研时经常发现,基层不知道、不会用上级研发的信息系统功能,即便是在公安信息化建设与应用水平相当不错的地区也有这样的情况存在。2018年,公安部开展了“畅通大数据服务基层渠道”专项工作,我受邀主持评审了来自全国各地的120多个项目,深深感觉到能力输送问题确实需要认真对待。当然,不同层级和岗位对这个问题是有不同考虑的。对使用者来讲,畅通输送的要求体现为尽可能大的授权以及使用的便捷;对建设与管理者来讲,畅通输送不仅意味着要满足使用者的需求,还必须关注能力应用的规范性以及能力发展的可持续性。


三、关于数据资源的深度应用

  在公安机关,“深度应用”这个术语是浙江于2005率先提出的,当时我们已经认识到按照传统模式和习惯以及对数据的传统认知应用数据,不足以发挥数据的重要作用,因此在编制浙江“十一五”科技强警规划时提出“以信息资源的综合应用、深度应用、应急应用为主要目标开展公安信息化建设”。十多年过去了,今日的数据资源、处理能力、应用水平已非2005年的状况可比,数据应用确实在深化,但我不得不说还没有达到我们所期望的水平。

  我们知道,大数据应用有三个基本模式,即描述性应用、预测性应用和决策支持性应用。描述性应用是我们所习惯和擅长的,而真正体现数据应用深度的预测性应用和决策支持性应用目前看还很不成熟。近几年,我有幸参与了全国各地公安机关数百个信息化项目的评比评审,看到了不少优秀项目,但遗憾的是预测类和决策支持类项目基本上都不够成熟。

  我们把预测称为大数据应用的灵魂,所以,讲数据资源深度应用是不能不提预测性应用的。总的来看,预测性应用由于数据资源、业务模型、算法、业务机制等方面因素而显得不够成熟,严重制约了预测警务的发展。实事求是地讲,我们目前绝大多数对数据的认识与应用与以前相比并没有“质”的突破,在一直就有的思维和应用模式中很容易找到目前所做的,只不过是在新的条件下做了一定的延伸和拓展罢了。我们对传统的理论、经验如何用数据描述没有足够深入的研究,对数据中可能含有的新东西同样没有足够的能力去发掘。比如,我们都认可社会环境对犯罪的产生具有非常大的影响,但我们还没有能力用数据描述清楚与犯罪相关的社会环境,没有较为完善的数据资源和业务模型来判断社会环境的异常变动,而这些正是预测警务的基础。此外,我们拥有的存量数据以及对数据资源的规划很少是基于预测性应用的,这意味着现有的和将要有的数据资源是否足以支撑预测性业务令人怀疑。在现有水平下,我们确实不敢仅凭电脑的预测来调配使用警务资源。在预测警务的构建中,我们要面对两个问题:一是有没有能力预测,二是相不相信预测结果。对于前者,需要知道哪些事项的发生发展是可预测的,相关的数据如何规划,预测模型如何构建。我们现在总体上还处在不知道预测什么以及该如何预测的状态。对于后者,本质上是态度问题和理念问题。直白地讲,我们要回答信不信数据,在数据资源的深度应用中,这是个不可回避的问题。如果不信,就不要再讲大数据。如果信,我们再从技术、业务和机制诸方面努力。

  决策支持性应用存在的问题要比预测性应用存在的问题更严重,这个领域几乎还是未开垦的处女地。依据数据进行决策,古已有之,在信息化特别是大数据背景下讲这事,当然有特别意义。因为信息化的发展、大数据时代的到来,我们掌握的数据资源不同以往,拥有的处理技术不同以往,面对的社会形态不同以往,自身能力与警务资源不同以往,......这么多的不同足以说明数据应用对决策的重要性。然而,迄今为止的公安信息化在决策支持方面没有实质性进步。在我们众多的信息系统中基本上没有决策者的数据应用需求,没有为决策者定制的数据应用功能。我们能看到听到的决策意图中所引用的数据并不能充分体现大数据应用的特征,因为同类数据的引用或者数据的引用方式几十年前就有。目前的公安大数据战略的价值指向主要是提高一线业务的工作效率和精准性,但我们知道,决策者对数据的应用与业务一线对数据的应用是根本不同的。决策支持是大数据应用的重要模式,目前的状况距离我们想要的结果恐怕还差得很远。我们不知道决策者们自身对大数据的兴趣点在哪里,不知道决策需要对数据做什么样的规划和加工,不知道应该以什么样的形式向决策者呈现数据分析结果,不知道如何通过业务来评价决策的科学性。这些情况表明,运用大数据实现决策科学化还有很远的路要走,决策者、执行者以及专门从事基础理论研究和信息化工作的人都有许多事要做。


四、关于大数据应用对体制改革的推进

  说实话,我们目前的体制依然是传统的,与几十年前相比,没有本质的变化。总体看,体制设计是基于对当前事务的应对,体制架构具有极强的稳定性,以信息化发展速度和水平作为衡量尺度,体制的问题显然存在。大数据应用带来的特征,如对事物的多维度、多层次、更为精准的描述,不同层级条线对信息掌握的对称性增加以及数据汇聚、集中计算等应用模式意味着固有的业务、层级、岗位界限很容易被打破,或者已经被打破,这无疑是推动体制改革的重大动力。但我们现在尚没有看到这方面的明显进展,我们尚不敢通过大数据应用去充分影响或触动体制,主要目标只是借助数据应用提高业务工作效率和水平,从大数据应用中获取的好处主要还是信息技术本身的优势带来的。

现行的公安机关体制架构总体上比较散,业务事权、信息化建设事权等被分散到不同层级和部门,由于业务边界、对信息管理的不同要求以及独立的信息化建设事权等因素,导致业务割裂、信息分散、业务归属与信息共有对立等问题,大数据在业务规范化、流程再造、业务重组、跨部门协同等方面的作用没有很好的发挥空间与氛围。在近几年以跨政府部门数据共享为驱动力的“最多跑一次”改革以及更深入的政府数字化转型中,传统体制存在的问题更为凸显。我们现在的跨部门业务协同依赖数据共享,但数据在业务条线或部门跑进跑出都会受到体制的约束,体制有什么问题,数据就有什么问题。这一点,我们现在已感受到了。在基层,体制带来的问题更为突出,派出所存在的问题就具有典型意义。上级机关的复杂体制结构到了派出所,就成了所谓的“上面千条线,下面一根针”,派出所本身是大体制中的一环,更是上级体制的融合点,但对派出所业务工作的整合、重组没有很好地作相应设计,而我们知道,从大数据的角度看派出所业务,是完全有条件在它这一小“块”上进行整合重组的。

  值得一说的一个现象是,我们总是非常敬佩阿里巴巴、腾讯等互联网服务商的数据应用能力和业务创新能力,全国各地公安机关请他们来讲课也无不与技术应用、互联网创新理念等有关,但我们都疏忽了一点,就是这些企业经常性地对其业务体制进行改革重组。

  我们不能总是指望通过业务一线的大数据应用潜移默化地影响公安体制,以我们目前的认识水平和大数据战略的实践,应该也有能力主动作为,将下一阶段大数据战略的规划实施与公安机关的体制改革同步起来。


五、关于大数据战略的制度化环境

  大数据战略的实施不能总是处于开放的、无约束的状态,为它构建一个制度化的环境,形成良好的运行生态是非常必要的。

  首先要解决让数据(包括原始采集的数据和加工处理后的数据)可信的问题。我们经常听到类似“数据不会说谎”的说法,确实我们看到的数据一是一、二是二,但数据后面的真相是一,还是二,或者是三,这是应该打问号的。“数据不会说谎”之类的说法是基于对数据的技术性认识,但我们清楚,对数据的规划、采集、处理和应用都要受制于相关人的价值观,当然还有技术性因素,如对业务的认识水平、数据处理的方式方法、数据采集的约束条件、人为差错等,价值观因素和技术性因素必然导致我们用到的数据存在可信度问题。因此,需要建立相应的机制,让制度为数据的可信度背书。

  其次要解决大数据理念落地的机制化。在现阶段,大多数人还是愿意相信经验,这既有数据不完备、技术不成熟的原因,也有观念问题。在大数据战略实施中,对诸如“数据驱动”“跨界思维”之类的理念讨论很多,但距离真正落地仍有不小的距离,比如我们在意在一线业务中应用数据对人或事的属性、动态进行精确描述,但通过业务数据分析对决策和业绩进行评价却很少做。大数据理念能否真正落地,既有认识问题,也有主观意愿问题,所以,如同数据可信度需要制度背书一样,大数据理念的落地也需要制度背书。

  再次要解决数据应用的规范化管理。我们在为业务一线提供强大的数据应用工具的时候,忽视了对数据应用的规范化管理,数据过度应用甚至滥用的现象并不少见,也面临数据应用中发生违规甚至违法行为的风险。总的来讲,目前的数据应用管理是粗放的,既存在效能问题,也存在风险问题,迫切需要加以规范。

  还有就是要构建适应大数据发展的业务工作机制。我在前面提到了要构建基于数据应用的能力向基层输送的机制,其实,大数据应用中存在大量影响业务工作发展的可能性和不确定性,为确保成效,建立相应的业务机制是必不可少的。特别是前面提到的预测性应用和决策支持性应用,如果没有机制化保障,基于这两类应用的相关工作是难以有好的成效的。比如预测警务,其关键是要通过警务活动特别是日常警务活动对预测结果进行响应,包括根据预测结果去实施相关的业务行为以及根据业务行为产生的结果去调整预测方法两方面。前者涉及对预测结果的价值判断、资源投入判断和业务机制设计,后者涉及对数据资源的重新规划与采集、预测模型的修正等。这种响应是预测警务的核心,没有这样的响应就不能说开展了预测警务。但我们知道,对预测结果作出响应是存在风险的,毕竟预测结果是可能性描述,而响应则需要实际的投入,考虑到各种成本因素以及业务资源总体有限的现实情况,需要考虑业务部门或基层是否愿意接受具有不确定性的预测结果,在充满不确定性的情况下怎么确定响应的规模,怎样对响应产生的效益进行评价等问题,所以,预测警务需要有很好的业务机制设计,而这是目前非常欠缺的。从决策的角度讲,如果不建立健全大数据辅助决策的机制,决策科学化也是难以实现的。我想,较为完备的、与信息化建设配套的、有效规范工作运作的机制一定是大数据战略成功实施的重要标志。


  上述五个方面问题涉及的影响因素很多,简单地看,这些问题似乎都有正面的答案,但是,到目前为止,很难说已有令人满意的实践。在我看来,甚至对这些问题的讨论也还远远不够,这就是我今天专门提出这些问题的理由。


谢谢各位。


关注微信公众号,获取最新信息小编微信(zqykj0811),加入微信群与悟空团队的数据分析师一起交流

返回新闻活动列表