法安网

法安网内容检索

当前位置: 首页 > 同期活动 > 案例征集 >

2024·智慧检务篇 | 创新经验之“数字赋能检察类案检索与应用现代化”

时间:2025-04-01 17:08:42   来源:

[法安导读]以下推出的是《智慧检务篇 | 创新经验之“数字赋能检察类案检索与应用现代化”》

  为深化政法智能化建设,加强“智慧治理”“智慧法院”“智慧检务”“智慧警务”“智慧司法”等信息平台建设,深入实施大数据战略,实现科技创新成果同政法工作深度融合。法制日报社已连续举办了七届“政法智能化建设技术装备及成果展”。

  作为装备展配套活动,法制日报社于2024年3月继续举办了2024政法智能化建设创新经验征集宣传活动,活动征集了“智慧治理”“智慧法院”“智慧检务”“智慧警务”“智慧司法”创新经验。

  在2024年7月10日至11日举办的成果展上,对入选的创新经验进行了集中展示,并已编辑整理成册——《2024政法智能化建设创新经验汇编》。

  该汇编分为智慧治理篇、智慧法院篇、智慧检务篇、智慧警务篇、智慧司法篇五个篇章,为政法信息化、智能化建设提供及时、准确、 实用的资讯信息与经验观点。

  应广大读者要求,我们特开辟专栏,将部分创新经验进行展示,敬请关注!

  以下推出的是《智慧检务篇 | 创新经验之“数字赋能检察类案检索与应用现代化”》

  

  数字赋能检察类案检索与应用现代化

  朱纯媛 赵悦淳

  山东省威海市环翠区人民检察院

  【摘 要】在大数据时代的背景之下,检察类案检索与应用的数字化、智能化需求凸显。检察类案数据的种类应当扩展,检察类案信息的搜索方式应更加智能,模型开发应更加科学。为了更好满足这些需要,检察机关应当重视类案数据价值的观念重塑,遵循智能化检察类案应用的基本方法,并在建设大数据类案信息库、提升检索交互性、精准度,智能化分析预测等具体方面加强探索。

  【关键词】检察类案检索;案例应用;大数据;人工智能

  2023年,最高人民检察院检察长应勇指出:“推进数字检察工作,必须做实数据治理、聚合、管理、应用,让数据‘开口说话’”。数字赋能检察类案检索应用现代建设路径,应当是大数据累积、类案检索智能化、基于机器学习可自动迭代的模型算法与法律实证方法论的结合。

  

  一、提升检察类案检索系统的交互性

  在语音、图像识别技术的基础上,可以将检察机关在一个案件办理中的大部分工作信息文本化,为实现文本匹配创造条件。自然语言处理技术的发展为检察类案信息文本匹配提供了可能。文本匹配技术从早期的无监督概率算法模型,到早期静态语义浅层神经网络的自监督学习,再到目前的可以结合上下文自监督学习的神经网络,已经可以支持计算机较为准确地理解自然语言长命题。但检察类案检索相较于一般领域有其特殊性,由于检察工作涉及的文书专业术语较多,仅从词汇层对类述进行相似性判定是远远不够的,需要将混淆词人为区分的算法注入深度学习模型中,实现精准区分,如“抢夺”与“抢劫”、“诈骗”与“合同诈骗”、“罚金”与“罚款”等。另外,神经网络的深度学习模型擅长于对案情、行为等案件事实类信息的理解学习,而对于需要法律专业知识提炼总结的法律适用、争议焦点等问题,受专业数据集建设、信息最大处理长度等限制,检索效果仍有提升空间。目前,利用GPT、BERT、ELMO等语言模型,能够将数据库内的多个词组按照自然语言逻辑和语序组合输出为使用者能够理解的句子,或者反向匹配到数据库内的数个词组。第二步通过双向长短时记忆网络(Bidirectional Long Short-Term Memory, BiLSTM)、多尺度卷积神经网络(Convolutional Neural Network, CNN)等模型,来提取检察官输入一段文本的语序逻辑特征和关键词相关性特征。检察机关可以采用外包、购买技术服务等方式,利用上述技术对现有检索系统进行升级,所希望达到的效果是,实现基于自然语言描述的长文本理解,使案件的主体、客体、主观、客观、程序、结果等要件均可作为检索条件精准匹配,如找出“集资参与人超过50人的案件”“贩卖亲生子女的案件”“认罪认罚后又上诉且检察院抗诉的案件”“对书证上的签字做过笔记鉴定的案件”“查找与本案最为类似的案件”等。

  二、建设高标准的检察类案数据库

  从数据识别、数据连通、数据开放、数据安全4个方面着手,建设高标准检察类案数据库。2020年在政法领域全面深化改革推进会要求加快推进跨部门大数据办案平台建设。2021年十四五规划提出推进数据跨部门、跨层级、跨地区汇聚融合和深度应用。检察机关可以充分把握时代契机,建设更高标准的检察类案数据库。对此,最高人民检察院检察长应勇指出,要坚持整体谋划、一体推进,做到一网运行、一网通办、一网赋能,逐步实现一网运维,这是最重要的数字检察顶层设计。根据目前的建设现状,在全国检察机关统一业务应用系统2.0的基础上进行数据库升级是可行性较高的方式。人工填录案卡能够保证准确性,但以牺牲全面性和效率性,用案管部门受案、办案部门每一个办案节点的逐案人工填录的重复劳动为代价。我国刑事司法实践中长期存在内外卷宗的分别归纳制度,这就导致裁判文书和案例仅能反映案件审理的部分内容,为了保障数据的真实性,应当将内部卷宗也适当地纳入文书案例库之中。其次,庭审活动贯穿了法官的审判心路历程,所以数据库还应收集庭审录像等记录审判过程的数据供机器学习,以训练机器去学习庭审中的司法证明规则。通过将视频、图像、音频转化为文本序列的图像识别、语音识别和提取技术,将原来以人工录入为主的信息采集方式转变为以自动采集为主的方式。全国检察机关统一业务应用系统2.0目前已接入目前可以对侦查电子卷宗、判决书、上诉书等材料通过案管部门、检察官办案组人工上传,在一定程度上实现个案全流程重要信息的收录。下一步可以实现对非涉密案件实现检察系统内部的全过程信息公开,同时实现检答网、裁判文书网、法信平台、北大法宝、中国知网等数据库的联通,并定期向社会公布基于类案数据和模型分析的专项领域检察蓝皮书。

  三、提升检索的精准度

  随着人工智能领域新技术的新发展,基于长命题的信息检索已经在网络购物、媒体推送、人工智能问答等领域落地,这为更精准的检察类案检索在技术上提供了基础。由案卡检索、单一关键词检索向全文检索、讯问笔录检索、录音录像检索、复杂语句检索转变。类案信息的精准检索是分析与预测的前提。对于一个具有自学习能力的模型来说,互动、验证、反馈,模型拟合度、准确度的提升基于在重复使用中累计的数据而进行的模型自我进化。重复使用的次数越多,数据越丰富,计算机对类案的核心信息点把握越精确,对检察官意图理解越准确,能够达到的检索效果越好。因此,越早开始全国检察机关统一的智能化类案检索系统的建设,就能越早的积累计算机自我学习需要的互动数据,从而在更大程度上提升检索准确率。检索到需要的类案数据后,对类案数据的排列和呈现上,可以按照指导性案例、最高检典型案例、省院参考性案例、省院典型案例、其他类似案例的排列顺序进行展现,并且提供按照案件管辖、办理环节、文书种类、说理详尽程度等进行类别的功能。甚至可以根据检察官主体的大数据画像不同,而对检索结果进行个性化呈现。比如某待决案件的核心信息为“行为人利用木马程序入侵被害人计算机,操纵被害人股票账户对同一股票进行短期高频卖出交易”,一个经常办理经济犯罪案件的检察官检索结果排在前列的类案是内幕交易类案,一个经常办理重大刑事犯罪案件的检察官检索结果排在前列的是破坏计算机信息系统类案,一个经常办理经济犯罪案件的检察官检索结果排在前列的类案是盗窃金融资产类案。

  四、智能化的分析与预测应用

  类案检索是为类案应用服务的,检索本身不是目的,而是要通过精准的检索发现埋藏在类案大数据中的规律,最终实现高质效办理每一个案件的目标。我国司法类案数据的智能化分析与预测探索自2016年开端已经历8年,目前全国检察系统抓住大数据机遇,提升服务能力和司法水平的大趋势已经形成,全国各地争相开展的检察办案系统、大数据模型开发。检察机关建设类案大数据信息智能分析与预测系统,数据是基础,模型是核心。从目前的建设实践看,检察机关开发的大部分大数据模型关注的重点是对数据进行碰撞、筛选,或者是通过人工分析大量类案数据、结合办案经验和司法规律,总结出可能存在的关联关系、运算法则,是一种人工预先设定计算逻辑和相关数据算法的模型。由于计算逻辑和相关数据算法主要由人工预先设定,加之目前检察系统与其他政法单位自动化系统、政务系统数据连通不畅,通过计算机自学习能力而进行的不同数据种类之间的关联性发现缺乏条件,难以构建具有层次性开放结构的类案信息分析模型。未来,检察机关理想的类案检索与应用工具应当是在数据搜集上实现数据共享、数据可视化、司法证据上链存证、图像采集、图像处理、智能编目、系统对接、文本提取、证据关联、视频转码、视频定位、视频分析等功能,在应用功能上依托丰富的司法大数据以及智能、高效、交互的检索模型,实现快捷又好用的类案检索、类案推送、法律法规检索、辅助阅卷、案件画像、职能审查、案件追踪、办案指引、质效分析等功能。比如针对某行为人的重新犯罪问题,可以通过讯问笔录检索,了解其家庭经济情况、个人性格经历;通过诉讼程序文书检索,了解其前科劣绩次数及监禁时间等;通过认罪认罚录像、庭审录像检索,可以了解其认罪悔罪态度等,进而自动对其社会危险性、再犯可能性进行标准化定量评估。

  责任编辑:晓莉

声明:

本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。

征稿启事

  • 投稿信箱:195024562@qq.com

品牌推荐更多>>