打破政法信息部门壁垒,建立政法大数据共享交换平台是政法部门信息化的必然趋势。早在2008年,中央政法委就下发文件,启动了政法部门网络设施共建和信息资源共享平台建设,规划了顶层设计方案。中央政法委在《关于进一步加强执法工作信息化建设的通知》及《关于推进政法部门网络设施共建和信息资源共享的意见》文件中,明确指出各级政法部门要从大局出发,按照国家信息化发展战略和司法体制改革的要求,加强统筹安排和协调配合,依托已经建成的业务系统,尽早建成网络互联互通和信息资源共享平台。在去年召开的全国司法体制改革推进会上,孟建柱书记对进一步深化司法体制改革、推进政法部门信息共享应用等工作作出全面部署,要求以“数据文化”引领,创新理念思路、体制机制和方法手段,大力加强政法部门信息共享和协同应用。
一、政法部门数据共享交换需要解决的问题
(一)网络隔离
公、检、法等部门都建设了自己的业务专网、视频专网等,各部门的专网之间是物理隔离的。对于业务专网的接入,各部门出于安全性的考虑都比较谨慎,检察机关专网还需要符合分级保护的规范要求,公安网络对于网络接入则有一整套完整的边界接入安全规范。构建政法数据共享平台第一步就是要打通网络,但其实网络接入问题根本上还是观念认识问题。各部门专网连通的同时在网络边界加入安全边界隔离设备,设置一整套标准的边界接入规范,可以在保证各专网安全性的同时,进行数据共享交换。
(二)系统独立
公安机关依托一体化运行的警务综合平台进行案件办理,实现执法办案网上流转。检察机关部署全国统一业务应用系统,实现所有案件网上流转,覆盖检察业务的各个条线。法院建立统一的审判执行综合信息系统,实现了审判执行等业务工作的网上流转和应用。司法局建设统一的办案智能平台,实现了司法行政各项业务和对外服务的网上应用。这些系统之间相互独立,开发平台各异、部署方式各异、业务流程各异。要想实现数据共享交换,就需要制定统一的业务工作规范和制度,构建政法业务协同系统,对接公、检、法、司等部门业务系统,通过构建闭环式的网上业务流程,实现案件协同办理、执法监督管理、案件质量评估、辅助决策指挥等功能。
(三)数据异构
公、检、法、司等部门的业务系统包含了大量异构数据源,数据库不同、数据结构不同、数据表达不同。如何将大量的异构数据整合在一起并正确链接成完整的案件数据链条,这就要求政法各部门根据各自业务标准规范,共同研究制定统一的政法部门数据接口标准。通过搭建数据处理支撑平台,将各部门系统的数据进行清洗、过滤、转换为统一的数据仓库。就好比搭建了一个数据翻译中介平台,将各系统不同的语言进行翻译,保证各自能读懂对方的内容。在此基础上就可以进行数据共享交换。
二、网络连通模式的选择
(一)以检察专网为核心的紧耦合网络模式
紧耦合网络就是政法各部门通过专线的方式,将各自业务专网直接互连,在各自的网络边界上加入网闸等安全接入设备,设置安全接入规则。在这种网络连接模式下,需要将政法大数据共享平台部署在检察机关专网内。主要是因为检察机关处于案件办理的中间环节,数据共享快捷方便,同时也有利于检察机关依托共享平台引导侦查,开展侦查活动监督、审判监督等各项检察监督工作。由于各业务专网直接互联,这就对安全接入、互信认证提出了更高的要求,需要严格划定数据共享的范围、权限、周期等,保证各专网内部数据的安全性。
(二)以政法专网为核心的松耦合网络模式
松耦合网络就是政法部门通过专线的方式,将各自业务专网接入政法主干专网,在政法专网内构建政法大数据共享平台、业务协同系统、数据处理支撑系统等。这种网络连接模式可以保证政法各部门的专网相对隔离,通过政法专网进行数据交换,具有更好的安全性。但是对数据的交换处理,系统响应速度等会造成一定的影响,对网络带宽要求更高。
三、数据共享交换模式的选择
数据共享交换的前提是构建政法大数据共享交换平台,在平台内搭建数据支撑处理系统、业务协同系统、数据交换共享系统等。公、检、法、司等部门办案系统通过前置服务与政法数据共享平台进行对接,完成业务协同和数据交换。
(一)基于文件流的FTP共享交换模式
在各个网络内搭建FTP服务,各专网的数据交换共享通过FTP服务来实现。将公、检、法、司等部门业务系统的数据按照具体的业务协同流程,提取出相应的结构化数据和非结构化数据,整合为一个完整的文件包。通过FTP服务将此文件包发送到政法数据共享平台,经由数据支撑系统进行分析处理存储,生成新的文件包,然后在经由FTP服务发送至目标部门的网络。以案件审查逮捕为例,公安部门在自己业务系统内提请逮捕,然后系统自动打包案件相关信息、案件卷宗等,将文件包发送到前置服务器,再通过FTP服务从公安专网发送至政法共享平台所在网络,然后由共享平台进行解析、存储,二次打包相关数据发送至检察专网的前置服务器,解析数据后进入统一业务应用系统。
这种模式需要针对不同的业务协同流程和特定数据共享需求,制定数据交换内容,改造相应的办案系统,建立数据打包模块来实现政法数据共享交换。此模式技术难度低、构建简单,但是需要改造各方办案系统,建设周期长,沟通成本大。公检法司各方一旦升级自身的办案系统,可能产生的系统问题更多。
(二)基于消息中间件的消息总线模式
可以在政法大数据共享交换平台上搭建基于消息中间件(Message-Oriented Middleware)技术的消息总线。中间件位于数据层和应用层之间,可以独立于应用系统和数据库运行。而消息中间件可以利用高效可靠的消息传递机制进行平台无关的数据交换。它可以屏蔽各种平台和协议的异构性,实现应用系统之间的协同,可以在发送端和接收端之间提供同步或异步的连接,在任何时刻进行消息的传送或者存储转发。我们可以在政法大数据平台上搭建消息总线服务端,在公、检、法、司等部门的前置服务上部署消息中间件客户端。当公安办案系统触发某个业务协同或者数据交换的流程,将数据同步至前置服务器上,然后由前置服务器调用消息中间件将数据发送至政法大数据平台接收端。平台进行一定的数据解析、转译、存储。然后再将数据通过消息总线转发至检察机关的前置服务上。这种模式在公、检、法、司将自身的办案系统数据同步至自己专网内的前置服务环节中还会有两种不同的技术模式。一是改造办案系统。在触发数据交换流程时,由办案系统调用前置服务的消息中间件进行消息发送。二是在前置服务上构建交换数据库副本。在生产数据库设置触发器,当数据交换流程的核心数据发生变化时,自动将数据同步至前置服务上,再由消息中间件将数据发送至政法大数据平台。
利用消息中间件可以进行公检法司系统之间的结构化数据交换共享,也就是案卡数据等。而对于电子卷宗、视频等非结构化数据的交换共享可以通过在政法平台网络内搭建政法私有云来实现。通过消息中间件的消息传递机制自动触发非结构化数据的同步。由发送端将电子卷宗和视频等文件同步至私有云上,然后发送提示给接收端,接收端服务自动至私有云上下载然后存储。
基于消息中间件的数据交换模式部署简便,规避了系统异构矛盾,同时具有更好的系统扩展性。只要符合消息传递的标准数据规范,可以在消息主题上进行任意扩展,对于后期的需求变动维护成本更低。同时基于数据库同步的方式能够避免侵入公、检、法、司等部门的原生办案系统,开发成本低,安全可靠性更高、
(三)基于ETL的大数据仓库模式
ETL就是Extract-Transform-Load的缩写,也就是数据抽取、转换和加载,是大数据处理的核心技术也是构建数据仓库的重要一环。在政法大数据共享交换平台上构建大数据处理支撑平台,部署Kettle、Informatica等ETL工具。在数据交换流程触发的时候,由ETL工具自动抽取发送端前置服务上的数据副本,然后由大数据平台对抽取到的数据进行清洗、转换。根据制定的统一数据标准定义规则将数据转换然后加载到数据仓库中,最后将接收端需要的数据发送至前置服务。这其中数据转换往往是最耗时的环节,主要是因为各办案系统数据的异构性和冗余性,因此定义一个统一的关键数据标准极为重要。
采用ETL来实现数据交换,构建大数据仓库的模式对于异构业务系统的适应性更强,不需要侵入修改业务系统或者在业务系统上安装额外的软件,数据抽取流程自动化,抽取数据及时准确。虽然初期建设有一定技术难度,上手慢,但是对于后期维护更为高效。经过一定培训学习,政法工作人员可以自己通过ETL工具图形界面改变数据抽取规则,增加新的数据抽取规则,减少了寻求专业技术团队修改程序来进行系统更改和升级带来的人力维护成本。
四、政法大数据共享交换平台的发展方向探索
(一)基于区块链技术的联盟链数据防护体系
可以尝试利用区块链技术,在政法数据共享交换体系中构建更为安全可靠的数据安全防护体系。所谓联盟链,就是只允许特定群体授权加入节点网络,根据权限查看消息的机构间的区块链,在政法环境中又可以称之为政法联盟链。不同于公有的区块链技术,联盟链只允许特定成员加入,这就从源头上控制了数据的访问权限,大大提高数据的可控性。在政法联盟链的各个节点的前置服务以及政法大数据平台上部署区块链框架,实现联盟节点和成员控制、链外数据源访问控制、动态节点加入退出机制。利用区块链特有的数据加密技术对节点的原始数据进行加密,防止数据泄密。对节点间的每一次数据交换、数据读写进行记账,然后通知所有节点,各节点确认后将带有时间戳、操作人信息的记账记录记入各节点的数据库中。所有的记账信息不可篡改,一旦发生数据安全问题,可以迅速定位到危险源头,从而构建防护等级更高的数据安全防护体系。
(二)基于深度学习、视频分析的检察监督体系
对于检察机关而言,政法大数据共享平台上的海量数据意味着无限的可能性。政法大数据仓库中存储的海量案件数据可以通过定义分析模型,进行数据挖掘分析,形成刑事监督数据分析体系,作为检察监督信息化平台的数据来源可以说非常合适。除去最基本的业务协同产生的数据交换模型,检察机关可以充分利用数据交换机制,和其他政法部门合作,制定检察监督相关的数据共享模型,更好的开展侦查活动监督、审判监督等工作。既提高检察监督的实效性,也能促进公安、法院等提高法律工作履职能力。可以充分利用政法大数据平台的数据处理能力,对共享数据进行预处理挖掘,然后将需要的数据同步至检察专网的相关监督系统中,进行进一步处理分析。而政法大数据平台存储的大量非结构化数据,包括视频、电子卷宗、文档等,可以尝试利用自然语义分析、视频分析、文本建模、音频转译分析等技术,对电子卷宗、视频等进行预分析处理,生成基本的分析报告,再将处理后的内容发送至检察专网特定的检察智能辅助办案系统中,进行二次处理,有效提高检察专网智能辅助办案系统的系统性能和数据处理速度。因此,政法大数据共享交换平台未来对于检察机关来说是一个充满了机遇和挑战的丰富矿藏,等待检察人去挖掘发现。