□检察大数据战略是国家大数据战略的重要组成部分,也是大数据时代科技强检战略与时俱进的必然要求。在深化检察大数据应用过程中,应高度重视司法检察工作规律与科学技术应用规律的有机结合,严格遵循“三个明确”基本原则,蹄疾步稳推进“数字检察”改革。
□检察大数据的分析应用,不能仅仅是简单的数据罗列,更要分析数据升降变化背后的原因,研判可能涉及的法律适用问题和检察管理问题。数据的深度解读还依赖于检察官的深度参与和学者的各抒己见,以充分挖掘数据背后的实务价值和学理价值。
习近平总书记强调,大数据是信息化发展的新阶段。在国家大数据战略的统筹下,检察机关大数据工作也在积极开展。最高人民检察院检察长张军提出,要跟上、适应信息化大势,充分挖掘、用好大数据,以“数字革命”驱动新时代法律监督整体提质增效。以“检察大数据战略”赋能新时代检察工作高质量发展,是检察机关适应信息化时代新趋势的重要举措。唯有持续推进大数据在检察工作中的深度应用,才能为新时代检察工作提质增效注入强劲动力。在此,试就检察大数据应用基本原则、来源拓展及应用实效等进行分析。
明确检察大数据应用的基本原则,避免“技术业务两张皮”
检察大数据战略是国家大数据战略的重要组成部分,也是大数据时代科技强检战略与时俱进的必然要求。在深化检察大数据应用过程中,应高度重视司法检察工作规律与科学技术应用规律的有机结合,严格遵循“三个明确”基本原则,蹄疾步稳推进“数字检察”改革。
明确“检察长管数据”的检察大数据领导方针。检察大数据工作是新时代检察事业强基础、利长远的战略举措。因此,在组织管理层面,要转变过去数据工作就是检察信息部门、案管部门工作的片面观念,树立检察长管数据原则,由各级检察院检察长直接领导、直接指挥、直接负责。在项目管理层面,要将检察大数据项目作为“一把手工程”优先建设、重点发展、常态管理,整合数据资源和人财物资源,统筹检察大数据发展和数据安全。在队伍管理层面,科技应用能力已成为党中央要求的新时代政法干警五大能力之一,应加强对全体检察人员的数据技能培训。同步推动专业技术类公务员改革,培育一批精通大数据管理、检察数据分析、电子证据鉴定的“检察数据官”高水平人才,真正实现全国检察机关智慧检务工作会议提出的智慧检务从保障、支撑向引领的功能跃升。
明确“以办案为中心”的检察大数据发展方向。在大数据应用中存在业务导向、管理导向、技术导向等不同重心,如果战略方向发生错位,就可能将业务系统建设成管理信息系统,既定战略目标就无法实现。检察机关以办案为中心,这就要求检察大数据应用应以辅助办案为导向;检察大数据项目需求始终以一线检察官、检察辅助人员的办案痛点、难点为导向;检察大数据项目成效评价主要以办案人员使用满意度为导向。在技术路线的选择上,“以办案为中心”的检察业务特殊性还决定了对大数据项目的技术容错率极低,因此,检察大数据战略的技术路线应当以技术的高准确率、高可靠性为首要指标,并在数据安全领域设置一票否决制。
明确“统分结合”的检察大数据管理方式。检察大数据战略的实施要避免“一统就死,一放就乱”。一方面,科技创新需要一定的自主性探索,在业务成熟度、技术成熟度尚达不到较高标准的情况下,一刀切式的统一步调,会扼杀大量的基层创意;另一方面,如果完全放开管理,可能会导致不具备大数据项目上马条件的单位、部门跟风参与,导致大量的重复建设、重复投资,造成浪费。因此,应充分发挥“检察一体化”优势,强调统分结合,在大数据深度应用探索中发挥好最高检和省级院的不同功能,分别采取备案管理和审批管理两种管理方法。最高检应统筹做好检察大数据应用的顶层设计,明确指导原则,采取建设指南、备案管理和专家评价相结合的方式,在充分尊重省级院自主性的基础上进行引导。每个周期内,最高检可以制定“四大检察”“十大业务”的检察大数据建设指南,各省级院从中选择主攻方向,确保每个业务条线都有1至3个省进行探索,每个省级院都有1至3个大数据探索方向;在每个周期的中期、末期,由最高检组织业务、技术专家进行中期评审和结项评审,对最终评审结果为“优”的检察大数据项目予以表彰,并向全国检察机关推荐。省级院则利用省以下检察院人财物统管优势,对本省范围内的检察大数据建设实行审批制,在最高检备案同意的大数据方向和业务场景中,联合高校、科研院所、企业,选择试点检察院牵头进行研发、测试与应用,并做好人财物的统筹保障工作。
拓宽检察大数据来源,防止“巧妇难为无米之炊”
深化检察大数据应用,首先应扩展检察大数据来源,在内生数据、共享数据、开放数据中挖掘线索,采取“大数据初查筛选+检察官复查复核”的方式,将有限的检力资源集中于有价值的线索办理中,提高检察机关法律监督的效能,通过数据碰撞发现、监督大批案件。
加强“内生数据”的数据治理。“内生数据”是指检察机关通过挖掘自身办案“沉淀”的数据资源,主要是全国检察业务应用系统内存储的大量案件的案卡数据和电子卷宗。既往由于多种原因限制,相关数据的深度挖掘无法实现,随着检察业务应用系统2.0平台在检察工作网的部署,《检察业务数据管理办法》《全国检察业务应用系统使用管理办法》等规范性文件的相继制定,相关问题已基本得到解决。下一步的重点工作,是在统一检察数据标准的指引下,加强数据治理工作,在数据产生源头提高数据质量,加强数据治理检测和监控,为基于“内生数据”的各类检察业务大数据分析模型应用,打下坚实的数据基础。
拓展“共享数据”的交换机制。“共享数据”是指检察机关通过“两法衔接”、政法协同以及与其他部门政务信息共享等方式获得的数据资源。通过数据共享,可以延伸检察监督“触角”,实现“人在干、数在转、云在算”。例如,湖北省检察院通过行政执法和刑事司法数据共享机制,共收录湖北省2896个行政执法单位、129个公安机关的行政处罚数据,同时还与人社厅等7个部门的业务系统对接。截至2021年底,共收录行政执法处罚信息102万条,通过分析研判,发现涉刑事犯罪案件线索6000余条,建议行政执法机关移送涉嫌刑事犯罪案件4763件。可以说,“共享数据”是检察大数据发展的重中之重,也是“能动检察”的重要基石,直接关系检察大数据赋能法律监督的成败。
提升“开放数据”的数据价值。“开放数据”是指检察机关通过接受群众检举控告、互联网公益诉讼线索举报、监控网络舆情信息等渠道获得的数据资源,主要作为内生数据、共享数据的补充。例如,裁判文书的公开为检察机关民事法律监督提供了重要的数据资源。2021年4月,浙江省绍兴市检察院运用民事裁判智慧监督系统,通过对近800份公开民事裁判文书进行大数据审查,发现某些被执行企业涉及的大量民事诉讼案件存在明显异常,检察官通过进一步调取法院卷宗,发现涉嫌虚假诉讼,通过制发检察建议及时进行了类案监督。再如,广东省广州市检察院研发了“公益诉讼大数据智能服务平台”,实时监控检察公益诉讼相关领域网络舆情,对网络信息线索进行抓取后,自动形成“准线索”提交给查证系统,由第三方专业分析师查证后形成线索报告,大幅提升检察公益诉讼效率。
提升检察大数据应用实效,推动从“能用”到“好用”的转变
深化检察大数据战略,重在提升检察大数据应用的科学化、智能化、人性化水平,“以‘数字革命’驱动新时代法律监督整体提质增效”,发挥大数据助力法律监督高效化、司法办案规范化、检察决策科学化等积极作用。
科学化选择检察大数据业务应用场景。找准检察大数据赋能法律监督的切入点,以刑事检察为例,在定罪方面,当前识别非结构化的法律文书的自然语言处理、语义分析技术尚不成熟,同时犯罪构成要件符合性审查专业性较强,特别是涉及认识错误问题、共同犯罪问题、犯罪竞合问题时,即使对于受过专业训练的法学生而言,都存在很大的困难,因此,短期内在这一领域广泛应用大数据模型存在较大难度。但在量刑方面,相关技术成熟度较高,检察机关办案人员在撰写量刑建议时,完全可以做到通过大数据辅助方式,提供量刑参考意见。比如,安徽省检察机关开发的智能辅助办案系统就已经将类案检索与量刑建议相结合,囊括相当数量法院刑事案件文书,为办理涉交通肇事罪、诈骗罪、故意伤害罪等10类常见犯罪案件提供量刑辅助。贵州省检察院研发的量刑偏离度分析模型,实现了裁判结果偏离度分析,能够确保类案类办,取得良好效果。
智能化提升检察大数据模型精确率。模型精度的提升不能“毕其功于一役”,需要在确定好业务场景和技术路线的前提下,不断对模型进行调整和优化,实现业务和技术的深度融合。例如,最高检智慧检务创新研究院专门建立了智能语音与人工智能联合实验室,经过全国检察机关多年的长期使用和检务智能语音相关模型的不断优化,目前,语言识别准确率已经达到了90%以上,在部分场景中准确率超过95%。针对方言识别问题,四川省自贡市检察院委托开发自贡语音包,目前,自贡方言的识别准确率达到85%以上。
人性化探索专家参与数据分析机制。检察大数据的分析应用,不能仅仅是简单的数据罗列,更要分析数据升降变化背后的原因,研判可能涉及的法律适用问题和检察管理问题。数据的深度解读还依赖于检察官的深度参与和学者的各抒己见,以充分挖掘数据背后的实务价值和学理价值。2018年,最高检成立业务数据分析研判会商工作小组,启动了检察业务数据分析研判会商工作,围绕业务数据反映的规律、趋势、特点、影响、问题以及需要预警、提出对策的事项,集成各方意见,供检察机关领导决策参阅,在辅助检察决策方面发挥了巨大作用。这些检察业务数据公开后,还产生了检学合作效果。例如,最高检发布的2021年前三季度全国检察机关办案数据显示,全国检察机关共起诉帮助信息网络犯罪活动罪79307人,同比上升21.3倍。这一数据掀起了刑法学界对于帮信罪研究的热潮,为未来相关司法解释的修订奠定了良好的法理基础。
(作者为北京化工大学科学技术与社会研究所副教授)