数字司法年度观察报告(2025)

来源:
文章即将刊发于《数字法学评论》第七辑(2026年第2期),转引请注明来源。
* 因原文篇幅较长,已略去注释与参考文献。

目次

引言
一、数字司法关键词:司法大模型
二、数字侦查中的大模型运用考察
三、数字检察中的大模型运用考察
四、数字法院中的大模型运用考察
五、结语:司法大模型运用之展望
摘 要:随着数字中国建设的深入推进,司法数字化转型进入高质量发展阶段,司法大模型逐渐成为司法工作与人工智能深度融合的核心载体,为法治中国建设注入新的动力。司法大模型在不同领域展现出不同的应用模式和发展进路。数字侦查中大模型的应用已呈现“点上开花、线上贯通、面上融合”的立体化格局。检察大模型则发展出以“绍兴模式”为代表的全方位运用和以“杭州模式”为代表的精细化运用。数字法院中的大模型应用可分为国家顶层设计推动型、地方自主创新试点型、平台化整合型等不同类型。司法大模型的运用在技术、制度和法律维度均存在潜在风险,学界应扎根数字司法改革实践,基于改革者的视角展开定性研究,在实践资料的基础上提炼和反思理论,最终提出面向数字司法改革者的风险应对方案。
关键词:数字侦查;数字检察;数字法院;数字司法
一、
数字司法关键词:司法大模型
随着数字中国建设的深入推进,司法数字化转型进入高质量发展阶段,司法大模型逐渐成为司法工作与人工智能深度融合的核心载体。司法大模型是指基于大语言模型技术,经过法律领域专业数据训练或微调,可辅助侦查、检察、审判等全流程司法活动的人工智能系统。值得提醒的是,司法大模型并非通用大模型,而属于垂直大模型,以司法公平正义为价值追求,面临着独特的风险威胁。在国家政策引导和实务需求驱动下,2025年司法大模型已基本实现规范化、规模化、多元化运行。
从实务运行态势来看,司法大模型已经被侦查机关、检察机关和法院等部门认可,继而被其积极构建与投入运行,由此形成分层分类应用的格局。在侦查系统中,上海市公安局积极运用大模型赋能110报警系统。在检察院系统,司法大模型在法律监督、公益诉讼、认罪认罚从宽等场景的应用取得显著成果。例如,河北省检察院基于DeepSeek大模型基座搭建数智平台,2025全年累计推送公益诉讼、民事行政检察监督线索48957条,全省检察机关通过该模型发现监督线索办理案件1446件,充分释放法律监督效能。此外,最高人民检察院组织开展的大数据法律监督模型应用业务竞赛取得扎实成效,竞赛经验也及时反哺检察工作实践。在法院系统,上海法院主动回应数字化转型需求,经过两年多的探索实践,形成了数助办案、数助监督、数助便民、数助治理和数助政务五大板块。
从法治建设层面来看,司法大模型的运行推动了法治中国建设的数字化、智能化升级,为法治建设注入了新的动力。首先,司法大模型的应用促进了法律知识的普及和传播,通过线上咨询、智能普法等场景,将专业的法律知识转化为通俗易懂的内容,向社会公众普及法律法规,提升全民法治素养。其次,司法大模型的运行推动了法律适用的统一,通过整合全国范围内的裁判案例、法律法规,形成统一的法律知识体系,辅助司法人员精准适用法律,减少地域之间、司法人员之间的法律适用差异,维护法律的统一性和权威性。
从社会治理层面来看,司法大模型的应用推动了社会治理体系的智能化升级,在一定程度上提升了社会治理现代化水平。司法作为社会治理的重要组成部分,司法大模型通过整合司法数据、社会数据,实现对社会矛盾纠纷的精准预判、多元化解,推动社会治理从“被动应对”向“主动预防”转变。在效能提升成果方面,司法大模型有效纾解了司法资源紧张的困境,推动司法工作提质增效,实现了“让数据多跑路、群众少跑腿”的目标。
2025年,司法大模型在国家政策引导和实务需求驱动下,基本实现了规范、稳定、高效运行的目标,形成了“国家主导、多方协同、分层应用、安全可控”的运行格局。技术创新、场景应用、效能提升等方面取得的突破性成果,有效破解了司法工作中的痛点难点问题,推动了司法工作的提质增效。司法大模型的实践价值不仅体现在司法实务层面的效能提升、公正保障,更体现在法治建设层面的全民普法、理论创新,以及社会治理层面的智能化升级与和谐秩序的稳定维护,充分契合了数字中国建设和法治中国建设的时代要求。司法大模型的运行实践为未来司法智能化的发展积累了宝贵经验,也为推进国家治理体系和治理能力现代化注入了新的动力,未来将在持续优化技术、规范应用、深化融合中,进一步彰显其时代价值,助力司法事业高质量发展。
二、
数字侦查中的大模型运用考察
数字侦查是一种运用大数据、人工智能技术的主动侦查、智能侦查,其要求侦查人员转变传统的侦查思维,借助新型技术实现侦查思路的变革与创新。有学者将这种转变概括为从因果性转向相关性,从抽样性转向整体性,从回溯性转向预测性的范式变革。数字侦查的核心功能在于犯罪预测、案件侦破等。司法大模型的融入提升了数字侦查的改革广度和深度。
(一)侦察大模型的典型案例
2025年,大模型在数字侦查中的应用已呈现“点上开花、线上贯通、面上融合”的立体化格局。从具体案件的精准打击到治安体系的整体防控,从一线民警的AI助手到全局指挥的智慧大脑,大模型正以前所未有的深度与广度,重塑侦查工作的理念、流程与效能,这标志着数字侦查进入了以“数据智能”为核心驱动力的新阶段。
其一,聚焦核心案件类型。针对发案率高、社会危害性大或侦破难度突出的案件类型,大模型依托智能数据实现了从被动响应到主动预警、从个案打击到类案治理的跃迁。例如,在盗窃、抢劫等侵财案件中,大模型在侦查研判环节能够打通“数据孤岛”,实现涉案信息的快速关联与智能串并。贵州省遵义市公安局汇川分局首创“大模型+知识图+ RAG”融合架构,实现法律文书、审讯录音、监控画面多模态数据的跨模态关联分析。在系列盗窃案侦破过程中,侦查人员借助大模型,通过视频轨迹提取嫌疑人特征,关联知识图谱中的“前科人员库”,2小时内锁定3名涉案人员,较传统手段提速70%。河北省张家口市公安局依托大模型技术,开创性地研发出升级版的“张警官”思维体。“张警官”思维体以该局自主研发的PAG架构(感知命令—自主规划—生成反馈)为核心,构建起“三大引擎”驱动体系。在侦办一起沿街门店系列盗窃案件中,“张警官”思维体通过“三大引擎”联动,3小时内串并12条跨省市线索,较传统流程效率提升65%,数据关联精准度提高30%。
在电信诈骗犯罪案件中,大模型成为预警拦截与精准研判的关键武器。例如,上海市公安局搭建7400余个智能数据模型,统筹“技术反制、研判打击、综合治理、流量瓦解”四大战场,2025年实现了全市电诈案件既遂数、立案数同比分别下降8.6%和8.4%。天津市公安局反诈中心的“大模型+反诈侦查”平台接入了DeepSeek大模型,通过“接警助手”与“导侦助手”模块,将接警工单关键要素抽取准确率提升85%,研判周期从数日压缩至小时级,预警响应速度提升60%,实现了对资金流、信息流的快速冻结与溯源。
在治安管理类案件中,大模型通过对海量警情、社情数据的深度挖掘,赋能风险早期感知与精准干预。江西省新余市公安局以“专业+机制+大数据”新型警务运行模式为引领,依托智慧派出所综合应用平台,全面推动治安态势感知图、可用资源图、风险隐患图“三张图”的融合建设与全警应用,实现了警务模式从被动应对到主动预防的深刻转变。深圳市公安局光明分局紧扣“主动警务、预防警务”理念,聚焦轻微犯罪中打架斗殴可防性特征,抢抓科技发展机遇,全链条夯实“专业+机制+大数据”新型警务运行模式。杭州市公安局临平区分局的“警小爱”,从与群众交流的内容中及时梳理敏感词,大量纠纷隐患得以发现、干预和调解。目前,杭州公安已智能排查矛盾纠纷苗头线索1250条,经主动提前介入,案例化解率达到99.8%。
其二,赋能关键侦查环节。大模型不仅作用于宏观案件类型,更深入到获取线索、研判预警、审讯取证等微观侦查环节,成为侦查工作人员的“AI助手”,全面提升单点作战能力。在获取线索环节,大模型起到了突破性的作用。云南省昆明市公安局引入多模态翻译模型,可自动识别并翻译英文、法文及东南亚小语种内容,在一起跨境网络犯罪案件的电子数据勘验中提供了关键语言支撑。四川省成都市公安局青羊区分局通过“刑事侦查中心”与“大数据实战中心”组成的“智慧双核”,在一起新型网络流量盗窃案中从海量信息精准锁定核心犯罪嫌疑人。苏州执法者利用AI模型对重点排污单位的自动监测大数据进行智能分析,从而侦破某单位数据造假偷排案。在研判预警环节,大模型助力实现精细化、动态化管理。四川省自贡市公安局自主开发建设“矛盾纠纷预防与化解平台”,运用大数据、AI等信息化技术对重大风险及个人极端事件进行精准识别、预警预判、防范处置,提升了个人极端案事件防范处置和矛盾纠纷的化解质效。黑龙江省大庆市公安局整合汇聚各类数据,结合风险赋分加权算法,打造自动化、智能化、集成化的“‘灵敏感知’社会风险隐患分析预警”数据模型,可以有效识别出潜在的人员风险隐患,提前发出预警。在审讯取证环节,大模型开始扮演“策略伙伴”角色。贵州省遵义市公安局汇川分局的大模型平台创新“语音转写+策略推送”双功能模块,支持贵州方言实时转写,自动提取“作案时间、关键物证”等20+关键词并生成审讯提纲;同步对接法律知识库,针对嫌疑人供述内容实时推送《中华人民共和国刑法》《中华人民共和国刑事诉讼法》相关条款,辅助民警快速突破审讯僵局,单案审讯时长平均缩短明显。贵州省公安厅研发的“贵警智脑”大模型更进一步,具备智能笔录生成与点评、案件自动串并等功能,极大提升了侦查讯问的规范化与专业化水平。在智能监管方面,基于大模型核心功能,连信数字创新推出了一款划时代的非接触式生命体征监测智能体。无感生命体征监测系统集成了摄像头、雷达、视觉计算算法和大模型的智能系统,通过非接触设备自动采集用户人脸信息并进行实时分析,能够实时解码心率、呼吸、心率变异性(HRV)、血压、血氧等多种基本生理特征,支持情绪、肢体微动作、异常行为识别,并基于以上指标实现多模态异常预警,帮助工作人员提高管理效率。这一设备实现了对嫌疑人生命体征的实时监测和预警,有效保障了嫌疑人的生命安全。通过实时数据流处理和即时分析算法,不仅让监管工作更加高效、便捷,更确保了数据的客观真实性和准确性,为公安部门在执法办案中提供了强有力的科技支撑。
(二)侦查大模型的运行机理
大模型利用多角度、多类型化赋能的方法路径,逐层、依次地改造数字侦查工作中的线索收集、研判预警以及取证审讯等多个环节。从各地实践看,大模型的运用的机理和方式可以归纳为三类:案件侦办智能增强型、风险防控前置干预型与能力训练与知识支撑型。
其一,案件侦办智能增强型。此类大模型运用的机理是“数据融合”和“智能关联”,旨在针对高发、新发、重大、复杂案件,破除传统侦查中的信息处理壁垒;以多模态理解和知识推理能力为基础,把散落的、异构的数据变成结构化、关联性的信息产品。具体表现为三种方式:一是线索串并,通过实体识别和关系抽取建立动态的知识图谱,发掘案件间跨越时空、跨越地域、突破人案关联关系的蛛丝马迹,实现由“个案侦查”向“类案打击”的跃升;二是证据解构,通过对视频、音频、图文等多种证据源进行同步的深度解析,形成生物特征、行为样态、涉案要素关联等集合证据的视图;三是决策辅助,对于审讯等关键环节,通过实时的交互,获取最新策略信息或者相关法律依据,成为侦查人员的“战术智库”。在实务部署中,此类大模型扮演的角色通常是作为嵌入具体案件侦办流程的垂直化工具或专项解决方案,追求特定侦查场景下的打击效能最大化。
其二,风险防控前置干预型。此类大模型运用的机理是“态势感知”和“预测预警”,依托大模型对海量的警情、社情、舆情以及公共数据的大数据分析能力和模式识别能力,发现并提前介入治安的热点、社情的风险点,从被动处置转变为主动治理。具体表现为两种方式:一方面,实现宏观态势可视化,将地理信息、实时警情、警力分布等数据综合后形成治安“热力图”和资源“部署图”,以辅助侦查决策;另一方面,实现微观风险预测智能化,对存在矛盾纠纷的数据进行情感分析,识别敏感词汇,量化建模风险因子,自动判定出高危的人和事,并形成“预警—推送—处置—反馈”的线上管理闭环,将风险扼杀于萌芽状态。在实务部署中,此类大模型常体现为基于多部门、多警种的“预警指挥中台”或者“社会治理平台”,致力于提高治安整体系统的韧性与前瞻性。
其三,能力训练与知识支撑型。此类大模型运用的机理是“人机协同”和“知识沉淀”,目的是弥补基层能力参差不齐以及知识更新延后的不足,成为一线侦查人员的专属助手,实现系统性赋能。具体表现为三种方式:一是提供伴随式、个性化的侦查辅助,通过自然语言交互,为一线侦查人员提供具体场景下的实时指导;二是提供专业化、工具化的知识补给,通过集成特定领域(如金融、涉外)的知识或者接入专门工具(如翻译软件、专业数据分析),经过大模型分析处理,快速弥补侦查人员在新型犯罪领域的知识短板。三是构建敏捷化、共享化的模型开发生态,提供低代码建模平台并充分撬动“数据—算法”基座,让基层可以针对本地实战需要,自主探索摸查方向、摸索规律,从而实现“基层创新、全省复用”的赋能循环。在实务部署中,此类大模型常体现为“普惠式”面向全警的智能服务平台或者“协同式”面向全警的协同创新门户,将复杂的AI能力封装成易用的场景化工具、动态化的知识图谱,系统性重塑整体侦查能力。
(三)侦查大模型的潜在问题
其一,数据层面的潜在问题。首先,数据壁垒制约信息整合。侦查工作系统化、全面性数字化改革的实现,必须以大量的数据为支撑。但是,政务数据长期存在“条块分割”的格局,各单位各部门之间的数字壁垒并未全部打破,检察数据、司法数据和政务数据难以实现有效共享、充分整合,因此致使数字侦查效能受限。这种数据孤岛现象根源于科层制下各部门的“领地意识”与信息垄断倾向。其次,数据质量参差不齐。在数据接入阶段,不同厂商的设备以及各类的软件采用的数据格式、接口标准各异,造成严重的兼容性问题。同时,公安机关仍然常用大量的老旧系统,导致第三方平台或异构数据的接入难度大。简言之,数据标准化工作严重滞后,某种程度上反映出信息化建设阶段的历史欠账。最后,数据标注与训练成本高昂。检察建议、执法记录等文件均处于原始文本状态,在使用前需要根据不同的监督角度和监督目的进行数据要素提取和标注,相同的数据重复提取、编写提取规则,易造成时间和资源的浪费。可以说,高质量标注数据的稀缺性,已成为制约司法大模型发展的现实瓶颈。
其二,技术层面的潜在问题。首先,算法黑箱削弱可解释性。生成式人工智能“结果导向”式的运行模式直接决定了其算法运行过程本身是难以追溯的,技术提供方、平台服务方和终端用户都无法厘清算法运行程序与输出结果之间的因果关系,由此造成“可解释性困境”。侦查活动贯穿于案件调查的全流程,所运用大模型的算法过程应当具有可解释性、可追溯性与可复现性。其次,智能算力供需失衡。尽管我国算力总规模达到180EFLOPS,位居全球第2位,但其中智能算力规模仅有41EFLOPS,无法满足司法大模型训练和推理需求,不得不溢价购买他国芯片。因此,部分信息基础建设相对薄弱和办案经费相对有限的基层公安单位,难以负担大模型的高额运行成本。这种“算力鸿沟”可能加剧区域间、层级间的数字侦查能力差距,形成新的资源配置不平等。最后,系统架构制约能力调用。由于警务AI模型的计算量非常大,实际工作中服务器集群难以满足其对大模型的训练要求,而且业务系统的模块耦合度过高,也会影响警务能力调用的灵活性。
其三,制度与人才层面的潜在问题。首先,跨层级协作机制不全。一方面,当前大模型的跨地域建用、线索的多层级协作等跨层级、跨地域融合履职,仍依赖于政策协调,缺少相应的制度规范。制度化程度不足导致协作的稳定性与可预期性较差,难以形成常态化的运行机制。另一方面,部门间的协作存在障碍,具体权责划分依据和规范协作机制的缺位,则导致侦查工作存在衔接不畅、推诿扯皮等问题。其次,复合型人才稀缺。数字侦查需要既懂侦查业务又熟悉数字技术的复合型人才,但目前这类人才相对稀缺。经过访谈调查,部分民警存在“技术恐惧症”,对数字智能工具的操作、学习动力不足,过度依赖传统工作模式的现象仍然存在。
其四,伦理与规范层面的潜在问题。首先,伦理规范体系亟待建构。人工智能在公安领域大规模应用必然会面临公平性、透明性以及责任归属等问题,这些问题并非中国独有,国际社会对“预测性警务”(Predictive Policing)的伦理争议由来已久。例如,美国COMPAS系统曾因对黑人男性存在系统性偏见而遭到广泛批评。然而,在国内基于人工智能警务的伦理研究较为缺乏,为数不多的研究即使涉及伦理层面的内容,也没有做到科学合理的具体归类和划分。与此同时,关于人工智能警务的理论与实践规范亦处于缺位状态,出现了难以认定责任主体的情况——技术的关涉者都可能存在主体身份识别与责任认定的问题。上述因素交错,致使人工智能的技术应用无法得到长久的发展。其次,数据隐私保护面临严峻挑战。日常执法采集的个人信息、监控画面存在泄漏风险。虽然公安内网提供了基础安全保障,但如果技术设计者未充分回应“数据脱敏”“最小必要原则”等隐私保护要求,相关人员在使用大模型的过程中,容易有意或无意地将敏感信息泄露出去。此外,大模型训练过程中的“记忆效应”可能导致训练数据中的个人信息在推理阶段被意外“复现”,这一技术特性为隐私保护带来新挑战。
三、
数字检察中的大模型运用考察
随着数字技术的持续进步,数字检察已从1.0阶段迈向2.0阶段。起初,数字检察主要指基于大数据的类案监督,即大数据法律监督;而随着技术迭代与实践深入,数字检察在两方面呈现出新的发展:一是大数据法律监督走向智能化升级,二是人工智能开始辅助检察官办案。
(一)检察大模型的典型案例
检察大模型是数字检察领域的核心。2025年4月,最高人民检察院正式启动检察机关智能化建设及试点工作,在全国10个省级检察院率先开展试点,重点围绕盗窃罪、诈骗罪、危险驾驶罪、故意伤害罪等18个涉案数量较多的罪名,聚焦关键业务场景和办案痛点,探索人工智能与检察业务的深度融合。长三角地区的数字法治建设处于全国前列,结合研究情况,本文选取绍兴模式与杭州模式作为典型案例介绍。
1.绍兴模式:全方位的大模型运用
随着数字中国战略的深入推进,人工智能技术凭借其数据处理、文本识别、逻辑推演等方面的优势,为破解司法资源紧张、办案效率瓶颈、监督精准度不足等问题提供了全新路径。刑事检察作为检察机关体量最大的业务,迫切需要人工智能赋能。在此背景下,作为全国检察机关刑事检察智能化审查办案试点单位,浙江省绍兴市检察院选取诸暨市人民检察院作为试点院,研发“刑检AI智能辅助办案系统”(以下简称“刑检AI”),以轻量化程序嵌入检察办案系统,覆盖刑事办案全流程,实现了证据审查、文书生成、量刑建议、侦查监督、类案推送、审判监督等核心功能的智能化升级。从技术架构来看,“刑检AI”采用“提示词工程+知识库构建”的双轮驱动模式。在提示词方面,研发团队从业务需求、技术实现、法律理性三个维度进行优化,通过构建涵盖犯罪构成要件、证据审查规则、量刑情节等要素的结构化提示词体系,引导大模型生成符合法律逻辑的输出。在知识库方面,系统整合了法律法规、司法解释、指导性案例等专业知识,并建立动态更新机制,确保知识库与最新法律规范保持同步。从功能实现来看,“刑检AI”具备赋能办案、赋能监督、赋能管理三大功能。具体而言:(1)赋能办案指系统通过文书生成、证据审查、量刑建议等模块,自动提取案件要素、识别证据瑕疵、推送类似案例,显著提升办案效率;(2)赋能监督指系统专设侦查监督模块,突破传统数字监督依赖外部数据的局限,直接依托检察业务系统内的“自有数据”,通过预设监督规则在生成审查报告的同时开展监督;(3)赋能管理指系统嵌入案件自检、社会治理模块,辅助检察官对办结案件进行质量回溯,实现让人民群众满意的价值归宿。然而,人工智能赋能法律监督仍处于探索阶段,业务逻辑与技术逻辑的适配性仍需持续优化。正如一线研发人员所言,“从简单案件辅助逐步迭代至复杂场景应用,需要以‘钉钉子’精神攻克提示词设计、知识库构建等难关。”
2.杭州模式:精细化的大模型运用
杭州模式以“一体联动、协同推进”为核心特征,强调市级统筹与基层创新的有机结合,以数字检察“小切口”撬动法律监督大格局。首先,在技术进步的加持下,类案监督的效能进一步提升。例如,临安区检察院牵头建设的音视频智能审查辅助应用,依托多模态大模型与大语言模型技术,对音视频资料开展智能化分析,自动识别其中的异常行为与违规线索。上线2个月以来,已分析音视频200余次,时长超2500小时,挖掘产出线索70余条,并已移送相关职能部门制发纠正违法通知书、检察建议等。该应用实现了从“被动应对”向“主动治理”的转变,真正做到数据驱动监督、智能赋能履职、机制保障长效。再如,杭州市检察院建设数字检察情报研判协同应用,构建了“检察官+数据分析师”的轻量化实战模式。通过大数据碰撞与画像技术,全市检察官可直接向市级指挥中心研判组发起监督规则或业务需求委托,由专家团队负责建模分析并将线索反馈。这一机制打破了传统单兵作战的局限,形成了“需求提出—建模分析—线索反馈—核实办理”的闭环工作流程。2025年该平台共受理完成254个分析任务,筛查出监督线索约20万条。同时2025年重点迭代了分析任务工作流程,实现了复杂任务多次研判流程,该应用实现了让一线检察官数字办案从单兵作战向团队协同作战模式转型,提升了响应速度和实战效能,激发了业务侧的数字检察应用活力。
随着人工智能与检察业务的深度融合,“人机协同”办案模式得以确立。这标志着学术界对人工智能辅助司法的相关构想,已从理论探讨走向实践探索。在杭州市检察院的统筹下,余杭区检察院牵头,联合上城、拱墅、西湖等多家基层院协同建设,构建起集合多个场景的检察智能应用平台,包括文证智能审查、视听证据智能审查、多模型智能问答、检察数字人等功能。杭州检察机关紧扣刑事办案全流程,在模型中构建了案情速览、证据审查、量刑建议、文书生成、类案推送、案卡回填等核心模块,覆盖从收案、审查、起诉至出庭的各个环节,实现了三大突破:(1)审查模式智能化,即证据审查从“人工筛查”转向“智能穿透”,单案全卷宗要素提取仅需20分钟,并自动生成案情思维导图,实现证据高效归集与矛盾点预警。(2)证据架构标准化,即创新规范“一事一证一分析”模式,按“被害人—事实节段”解构案件,自动关联分类证据,支持结构化摘录与逻辑重构。(3)庭审指控高效化,即大模型赋能庭审举证,自动生成出庭预案并支持多媒体证据可视化展示,显著提升了指控效能。该应用已被最高检作为全国检察机关第一批优秀智能化试点成果向全国推广。
(二)检察大模型的运行机理
检察大模型在实践中呈现出双向发展的态势:一方面,它推动了数字检察1.0版本的智能化升级;另一方面,也拓展了数字检察的外延与范畴。传统的数字检察1.0,即类案监督,主要遵循一套四步技术逻辑:首先,从个案中提炼检察业务规则;其次,将规则转化为数据模型;再次,将模型置于数据池中运行,以发现监督线索;最后,对线索进行调查核实,最终通过“办案”形式履行监督职能。这一模式本质上是“规则驱动型”(Rule-based)的法律监督范式,其核心在于将检察官的经验知识编码为可计算的监督规则。
在数字检察2.0阶段,大数据法律监督依然承袭这一底层逻辑,但在技术应用上实现质的飞跃。具体而言,该阶段通过引入多模态识别与大语言模型等技术,能够同时处理文本、图像、音视频等异构数据,突破了传统模型仅能处理结构化文本的局限,显著提升了模型能力与运行效能。例如,杭州市临安区检察院研发出“天目明鉴”音视频智能化审查模型,采用“文意转写+智能分析+安全准确”的核心架构,可对监管场所的音视频资料开展智能化分析,自动识别异常行为与违规线索,线索筛查效率较人工巡查提高50%,识别准确率超90%。变被动巡查为主动精准监督,有效破解监督难题。值得注意的是,尽管数字检察2.0阶段在技术手段上实现了显著突破,检察大模型的运行机理在本质上并未脱离数字检察的基本构建逻辑,只是在具体构建方式存在一定的差异。从认识论视角来看,无论是数字检察1.0还是数字检察2.0,其核心都是将法律监督中的“隐性知识”转化为“显性知识”,进而实现知识的规模化应用。大语言模型的引入,本质上是提升了这一知识转化过程的效率与精度,而非改变知识转化的底层逻辑。
除上述智能化升级外,数字检察2.0还衍生出一个全新的应用范畴——全流程刑事智能辅助系统。该系统覆盖从案件受理到出庭公诉的各个环节,堪称“数字检察官助理”。从功能设计而言,该系统以检察官办案所需的四大核心能力(证据审查分析、证据体系构建、监督履职与出庭公诉能力)为依托,开发出八大功能模块:案情速览、卷宗自审、文书生成、量刑辅助、出庭示证支持、监督履职辅助、类案推送及AI智能助手,实现了对检察办案全过程的技术赋能。全流程智能辅助系统的出现,标志着人工智能在检察领域的应用从“点状赋能”走向“系统集成”。传统的司法人工智能应用往往聚焦于单一环节(如类案推送、文书生成),而全流程系统则尝试构建覆盖“受理—审查—起诉—出庭”全链条的智能化工作流。其实,大语言模型在司法决策中的真正价值,不仅在于提升单一任务的效率,更在于其能够辅助司法人员进行“全景式”的案件审视。
(三)检察大模型的潜在问题
其一,技术上的潜在问题。根据绍兴市检察院一线工作人员反馈,检察大模型的运用主要存在如下技术方面的问题:一是知识库更新不及时。大模型系统的核心是知识库,其更新速度直接决定系统输出的准确性。但大模型本地化部署后,外挂知识库常处于静止或暂停状态,无法及时跟进刑事检察业务的动态变化,导致系统“用旧知识处理新案件”。尤其在刑事检察领域,司法解释、指导性案例、规范性文件的更新频率较高,知识库的“静态化”与业务规则的“动态化”之间形成了结构性张力。二是预设规则覆盖有限。大模型系统需通过预设规则弥补大模型自身局限性,以精准实现业务功能。但由于技术团队对业务规则往往理解不透彻,在归纳总结提示词进行规则预设方面,有效性欠缺,覆盖面也有限。例如,要通过预设规则的方式,用技术手段对多人多节多罪名案件事实实现精准抽取,以及对“转化型抢劫罪”“牵连犯处断”等复杂业务规则转化成技术命令,光靠技术团队远远不够。法律领域知识具有高度的“语境依赖性”,将检察官的经验判断编码为可计算的规则,是一项极具挑战性的认知任务。三是人工智能识别技术存在短板。大模型系统对刑事检察业务的支撑,依赖数据分析、材料识别、语义理解等核心技术。但当前对各类证据材料的解析技术尚不成熟,导致生成内容时也会存在无法识别或者识别错漏的问题。
其二,制度上的潜在问题。检察大模型的配套适配机制不健全。大模型系统在业务向技术转化过程中之所以存在技术依赖的担忧,本质是配套适配机制建设滞后。例如,以人主导的机制建设为例,人工核验机制尚处空白;而对于人机协同中办案人所应当承担的义务内容等具体问题,目前也均尚无明确规定,导致检察官在使用大模型时缺乏操作指引,部分检察官过度依赖大模型结果。然而,大语言模型存在输出“幻觉”,可能生成看似合理但实际上不准确的信息,这对于依赖精确事实和证据的检察工作而言是不可接受的。另一方面,过度依赖智能辅助系统可能导致检察官主体性的弱化。因此,未来对于“哪些智能生成内容必须人工核查”“核查节点如何设置”等议题,都值得研究。
其三,法律上的潜在问题。全流程刑事智能辅助系统的开发与应用,在显著提升检察官办案效率的同时,也对部分传统法学理论与现行法律规范构成了冲击。首当其冲的是检察官的亲历性原则。亲历性原则要求司法人员直接接触案件材料形成“内心确信”,这是司法正当性的重要理由。但系统介入后,检察官在案件审查、证据分析、文书生成等环节的亲身体验与直接判断,如何在人机协同中得以保障与体现,成为必须面对的现实议题。这进一步引出检察官与智能系统之间关系定位的追问——是“辅助”“协作”抑或某种程度的“代理”?更深层次的挑战则涉及司法责任制的重构。智能系统的深度参与,不仅可能引发责任主体的认定难题,即责任应在检察官与系统开发者、使用者之间如何划分;更可能触及责任性质的变化。具体而言,当部分判断或决策源于算法生成时,相应的过失或错误应归属于“技术缺陷”“操作失误”,还是传统的“司法责任”,已非简单的责任转移,而是有可能动摇司法责任理论的基础框架。有研究指出,司法责任由裁判者承担是传统原则,然而当人工智能系统参与司法决策时,传统的因果链条被打断,是否应将算法技术人员纳入责任主体范畴,目前尚无明确答案。
四、
数字法院中的大模型运用考察
在各级法院、科研机构和科技企业的共同努力下,经过为期数月的预训练、优化训练、监督微调和多轮测评,审判系统的大模型研发成果最终得以问世——“法信法律基座大模型”。
(一)法院大模型的典型案例
基于构建主体和技术路径两大维度,可将2025年度数字法院领域的大模型应用案例分为国家顶层设计推动型、地方自主创新试点型、平台化整合型三类,前两者在构建的过程中分别体现了自上而下与自下而上的驱动模式,第三种则同时监督前两者特点,集中体现为对基层试点的系统协同与整合。
1.国家顶层设计推动型案例
该类型以最高人民法院主导构建的“法信法律基座大模型”为典型代表,其构建较多体现了自上而下的顶层设计驱动样态。该模型于2024年11月15日发布,并于稍后正式投入应用。在模型构建的背景动机层面,研发该模型是为贯彻中央关于人工智能与司法深度融合的部署,旨在提供基座模型以解决政法数字化建设中的安全与标准问题。在构建模式上,该模型定位为国家级法律人工智能基础设施,以清华大学研发的千亿参数通用大模型为基础,融入“法信大纲”的18万条法律知识体系编码,同时集成3.2亿篇总量达3.67万亿字的经过高质量专业标注的案例、裁判、法律文献等数据语料。总体上看,构建过程强调在顶层设计推动下的自主可供,通过预训练、微调和多轮测评确保较高的合规性,为系统内其他大模型提供基准。在成效层面,法信大模型的核心能力维度包括权威数据集成和基础能力输出,前者指的是其数据来源覆盖人民法院案例库、法答网等权威数据仓库,后者指的是其突出的法律语义理解、逻辑推理能力。据悉,该模型已经作为底层支撑,用于由深圳法院主导构建的全国首个人工智能裁判辅助系统和“库网融合”智能检索系统。从当前应用的实践来看,该模型开发的核心目的还包括法律适用上的全国统一。
2.地方自主创新试点型案例
该类型案例展现出鲜明的自下而上的创新活力,往往以解决当地司法痛点问题为导向,迭代速度较快,以精准赋能具体实践。代表性案例包括深圳中院审判系统、深圳法院“龙藤”执行系统和贵州法院庭审平台。其中,深圳中院的人工智能辅助审判系统于2024年6月上线。据悉,该大模型运用的核心动因是,解决深圳法院系统年均案件量超72万件引发的“案多人少”矛盾。在构建模式层面,该类型可以被归纳为自下而上的业务牵引型模式,设计思路由审判人员根据办案需求主导、把控。深圳法院系统组建了15个业务研发小组和11个基层应用小组,以期打破系统内部门壁垒;在技术层面则依托政法专网部署专属大模型,实现物理隔离,并引入58个省级政务接口平衡安全和效能。该模型基于前文述及的最高法“法信法律基座大模型”进行垂直领域训练,具有全流程覆盖的特点,囊括立案、阅卷、庭审、文书四大环节85项流程。应该说,这是地方自主创新试点中具备较强综合性的范例。该系统的成效明显,截至2025年9月30日,用户达3445人,大模型调用超1650万次,辅助生成文书40万份,结案周期缩短57天。深圳法院的“龙藤”人工智能辅助执行系统于2024年12月2日试运行,该系统在深圳中院模型基础上研发,免费新建模型,体现了基层创新的特点。数据层面融合包括全国执行系统、鹰眼系统在内的21个平台,实现了数据的高度集约化;在流程覆盖方面,该系统贯通执行立案、财产查控等54个节点,利用人工智能技术分析人员行踪轨迹和隐匿财产。在成效层面,试运行至2025年4月,处理案件7847件,平均办理时长缩短28.9天,信访量减少20%。
3.平台化整合型案例
该类型案例强调系统协同和流程再造,通过平台化解决应用碎片化的问题,兼有自上而下和自下而上两种驱动模式的特点。以浙江高院的数字法院系统建设为例,其特征可以归纳为四化——平台化、无纸化、智能化、制度化,而四化的核心正是基于平台的整合,将全省80多个办案系统整合为一个统一平台,在此基础上以全流程电子卷宗等形式夯实无纸化基础,为智能化赋能提供前提。该平台正在开发助手小智功能,聚焦智能阅卷与文书自动生成,体现了自建模型的优势。与此同时,该平台注重与“全国一张网”衔接,避免数据与机制孤岛。而上海高院的数字法院建设则以应用场景为突破口,构建数助办案、监督、便民、治理、政务五大板块。在具体建设路径方面,采用以下六步走模式:从法官发现问题到业务规则梳理、技术建模、测试、核验直至嵌入系统。截至2025年5月,上海新增171个应用场景,嵌入系统新增119个,30项应用场景矩阵上线运行,就15类知识指引场景、7类智能管理场景、22类文书辅助生成场景开展新技术创新试点,逐步从数据分析向复杂类案辅助转变。
综合上述三类型分析,大模型在数字法院中的应用已经形成多层次探索格局,顶层设计推动型提供基准、夯实基础,地方自主创新试点型聚焦应用场景和运用实效,平台化整合型注重系统的集成与优化,发挥着“上下联动”的作用。
(二)法院大模型的运行机理
1.基于构建主体的机理分析
其一,自上而下路径。自上而下模式的核心机理在于由最高人民法院主导或高级人民法院主导,以构建统一、安全、可控的国家级数字司法基础设施为战略目标。最高法在“法信法律基座大模型”新闻发布会上强调,构建该基座模型是“落实总体国家安全观的具体措施”和“推动法律行业新质生产力发展的创新引擎”,这便是自上而下之要义的核心体现。该模式的运作逻辑体现了公共管理学中顶层设计思维,通过集中优势资源攻克基础性、共性难题,避免各地重复建设可能带来的标准不统一、数据安全风险与资源浪费问题。由于基座模型的研发成本高昂,需要海量高质量数据、强大算力支撑和持续的资源投入,这种规模效应决定了集中式路径的比较优势。其应用方式侧重于“赋能”,即通过提供底层能力支撑,为下游应用提供融合搜索、逻辑推理、法律语义理解等基础功能的技术资源。该类型模式下的司法大模型往往较少开发直接面向终端个体用户的衍生应用程序,而是更多支撑其他系统运用,也即通过提供统一、权威的基准模型与能力接口,促进整个法律适用过程的标准化与统一化,以体现其作为基础设施的特征。
其二,自下而上路径。该路径通常被总结为“从试点到推广”的模式。基层、中级两级法院直面人案矛盾、审判效率、执行难等具体的司法痛点,这些审判机关往往以解决本地化问题为首要目标,开发大模型的核心需求在于如何高效利用有限的司法资源,以期破解长期困扰法院的人案矛盾。因此,在实践中,该模式的应用往往体现出快速迭代的趋势。具言之,法院快速、敏捷开发相关模型,并在特定场景内验证技术方案的有效性。例如,深圳龙华区法院的“龙藤”执行系统,该系统基于市中院开发的审判辅助大模型,针对执行这一垂直领域的特定需求进行基层创新,体现了响应迅速、贴近问题的优势。但该模式也可能加剧应用的碎片化风险,形成数据孤岛与机制壁垒。另外,各地法院自主研发的智能系统在数据标准、接口协议、功能架构上可能存在差异,造成跨区域、跨层级的数据流通与业务协同受阻。左卫民教授指出,未来应充分发挥顶层设计与地方试点相结合的改革方法论,实现集中式与分散式路径的有机融合。因此,自下而上模式和自上而下模式并非截然对立,如何形成良好互动实现功能互补,是后续需要探索的路径。
2.基于技术路径的机理分析
其一,自建模型路径。自建模型模式指的是司法机关投入海量数据、经费、人力等类型资源,以基础模型的创建为开端,进行较具深度的定制化训练,在强调技术自主可控的同时,获得可以深度理解法律领域专业知识与逻辑并具有生成能力的司法大模型的构建模式。从技术架构而言,自建模型路径的核心在于预训练+微调,前述“法信法律基座大模型”是自建模型路径的典例之一。其基础模型是清华大学研发的千亿参数通用大模型,在定制化训练的过程中融入高达3.2亿篇、3.67万字的权威法律语料,并运用“法信大纲”的18万条法律知识体系进行编码。这种大规模、高质量的预训练过程需要耗费大量资源,其优势在于模型能够深度嵌入法律领域的专业知识体系,形成强大的法律语义理解能力、逻辑推理能力和知识生成能力。但同时,这种深度定制化训练需要海量的高质量标注数据与强大的算力支撑,其成本与周期往往超出一般地方法院的承受能力。
其二,基于既有模型路径。与自建模型路径相对,该路径的初衷就是避免深度定制化训练模型的高昂成本和长周期。因此,选取了基于已有的基座模型,通过引入特定数据和应用场景进行优化,依托参数高效微调,在冻结大部分预训练参数的前提下,仅对少量参数进行调整,以较低成本和高效率提升解决具体问题的能力。深圳中院人工智能辅助审判系统是这一路径的成功实践,其以“法信法律基座大模型”作为底层支撑,结合深圳当地审判数据进行垂直领域训练,正是一种基于特定数据和应用场景的微调优化过程。整体来看,该路径既发挥了国家级基座模型在法律语义理解、逻辑推理等方面的基础能力优势,又实现了对地方司法实践特定需求的精准适配,体现了分工协作的效率逻辑,能够有效提升司法辅助系统的实用价值。
3.具体场景下的展开方式分析
无论采用何种构建模式与技术路径,大模型的应用最终都聚焦于几个核心场景,本文分析的三个核心场景并非彼此独立的逻辑,而是呈现出场景拓展的逻辑。其一,智能决策支持。追根溯源,司法大模型运用的原始场景是信息检索和数据分析,后续基于这些场景逐步拓展至智能决策支持,即基于海量数据进行分析推理,为法官决策提供参考方案。具体而言,“法信法律基座大模型”支撑的类案推送和“龙藤”执行系统的财产情报分析,均是基于多模态数据融合和深度思考,辅助法官统一裁判制度或优化执行方案。智能决策支持的一大功能在于缓解“同案不同判”的司法困境,促进裁判尺度的统一,进而提升司法公信力。其二,全流程辅助。数字法院中的大模型运用呈现出场景拓展的趋势,其重要维度是由单一节点向司法全流程拓展。以深圳中院的审判辅助系统为例,其覆盖立案、阅卷、庭审、文书等85项流程。该系统通过卷宗电子化,进而解析电子卷宗,并生成结构化信息,最后将材料载体统一转入线上,成为流程自动化的起点。同时,系统在流程自动化的基础上还可实现全流程的智能辅助,将司法人员从耗时较多的烦琐事务中解放出来。其三,平台化集成。浙江和上海的法院系统有较多的基层创新试点,其高院系统的实践则突出了平台化集成的场景聚焦。在这种模式下,法院通过构建相对统一的中台架构,将地方试点中各种大模型能力封装为标准化服务组件集成到同一平台中,从根本上解决大模型应用碎片化问题。以浙江法院为例,2018年以来,陆续整合了84个业务系统,建成统一的“浙江法院一体化办案办公平台”,全省106家法院、1.5万名干警在同一平台上办公,效率提升14.1%,每年为群众提供在线服务近5亿次。
(三)法院大模型的潜在问题
承前所述,大模型在数字法院中的应用在提升司法效能的同时,正以前所未有的深度和广度重塑司法流程。然而,流程重塑伴随着多样的风险,而这些风险也与大模型的构建模式、技术路径等相互交织。基于这种考虑,本文认为,对风险的分析需从技术可靠性、制度适配性以及权利保障三个维度切入,并通过由前端至后端的风险全面梳理,覆盖大模型在数字法院应用的全生命周期。
1.技术固有风险
大模型的底层逻辑为统计学逻辑,其本质是基于概率分布的模式识别与内容生成,而非基于规则推演的逻辑推理。这一技术特性使得输出内容常常看似合理实则失真,此即大模型固有的“幻觉问题”。如在深圳法院的实践中,核心难题即如何解决法律的查找和引用、文书的生成中的幻觉问题;而二审法官对大模型的评价尤高,其背后的原因为,二审主要是在一审查明事实的基础上解决法律适用问题,在这种场景下,大模型的运用已存在一个较为明确和限缩的前提,因此其风险相对可控。申言之,大模型在适用前提较为明确和圈定的条件下表现更优,从侧面说明其底层逻辑面对开放性环境的幻觉风险。而在人案矛盾的巨大压力下,法官可能难以逐一甄别大模型生成的海量信息,大大提高了信息过载产生错误裁判的可能性。此外,大模型的输出质量高度依赖训练数据,训练数据中的偏见可能在司法适用中被系统性放大。相较于既有模型路径,自建模型路径更为强调数据权威性,如前文所述“法信大模型”的优化训练数据为“经过高质量专业标注的案例、裁判、法律文献等数据语料”,可见该路径力图避免训练数据低质问题。然而,上述数据虽然能够保证来源权威,却无法确保不含偏见,如既往裁判中对特定群体、案件类型的倾向性等系统性偏见。自建模型路径无法切断数据偏见与运行偏差之间的链条,基于既有模型构建路径的司法大模型更是如此。
毋庸讳言,大模型的决策过程缺乏透明度和可解释性,这与司法程序公开、说理透明的原则性要求相悖。无论是前文所述的执行系统中推荐某项执行方案的具体功能,抑或审判辅助系统中推送类案乃至裁判思路的应用模块,当事人都无从知晓,也无从推断大模型的推理逻辑,法官也难以就大模型的所谓思考过程进行解释说明。至于大模型给出的所谓推导过程、理由说明,在某种程度上属于基于统计学逻辑的概率性拟制,不同于人类推理流程的表达。
2.制度适配风险
理论界与实务界均强调大模型的辅助工具定位,但在实践中仍存在角色模糊和侵害审判独立性的风险。在裁判辅助中,越强调AI辅助的减负功能,越可能侵蚀法官的主体决策权,从“辅助”转变为“替代”。例如,在平台化整合型案例中,上海法院的“六步走”路径将业务规则嵌入大模型;在此基础上,法官的决策在何种程度上是自主判断,何种程度上是对大模型建议的确认,难以得到清晰的界定。而在大模型嵌入审判的条件下,判断究竟是法官的审核失职还是模型开发者的过失导致裁判出错,或者在二者皆有的情况下辨别何种因素更为主要,变得非常困难和模糊。而在自上而下模式中,最高院通过基座模型推广统一的裁判标准和知识体系,在推动法律适用统一的同时,可能在另一方面压缩下级法院和法官的自由裁量空间,产生一种常态化又较为隐性化的“上级指导”问题。如此,技术的赋能便有可能异化为上级法院通过技术途径变相控制下级审判法院,进而削弱审判的独立性。此外,研发和维护大模型需要强大的技术能力和富足的各方面资源,由此可能导致司法体系内的权力隐性地向技术优势较为显著的法院和地区集中。特别是,在自下而上路径的创新尝试过程中,审判机关在探索数字法院实践路径的同时,可能加剧地方发展与区域司法资源的不平衡现象。对此,需要通过顶层设计明确创新边界,并促进资源共享。此外,技术供应商在数字法院建设中的深度参与也会带来一定风险。在模型的研发、设计与建设过程中,技术供应商的职能定位可能由产品研发者、平台运营者、系统维护者等纯粹技术角色,外溢至数据处理者、程序控制者乃至裁判参与者等实际司法角色,这就是广为学者诟病的技术权力介入司法权力问题。然而,技术与司法的相互交织,在重塑诉讼模式的同时,也会引发一系列风险。对此,需要明晰技术供应商在数字法院建设中的应然定位,以厘清公私界限。
3.权利保障风险
数字法院建设的基础之一是全流程电子卷宗,这意味着海量数据信息需被数字化并集中处理,其中包括当事人个人信息、商业秘密和国家机密等。无论是自建模型所需的大数据预训练,还是既有模型的微调训练,都可能涉及敏感数据的频繁调用。尽管在多数案例中,司法人员均强调“政法专网”“物理隔离”,但仅凭内外隔离机制显然无法避免内部滥用的风险。申言之,内外隔离机制一旦发生安全漏洞,将可能导致更为普遍且严重的后果。在数据要素的高效运用层面,自下而上路径中,各地法院出于满足本地化需求所构建的系统,如浙江、上海等平台化系统,若标准不统一则可能阻碍全国范围内的数据协同与司法协作,加剧待以解决的数据孤岛问题。对于自上而下的构建模式,则需要辩证审视和省思。具体而言,在总结自上而下模式优势的同时,也应警惕该模式下数据集中可能引发的数据管辖权与访问权限等争议性法律问题。此外,大模型在数字法院中的广泛应用,可能加剧个体享有司法资源的不平等。能够熟练理解和掌握数字化流程与人工智能工具的一方当事人,可能在诉讼中获得更大优势,反之则处于不利地位。然而,司法活动的伦理基础是尊严保障与人性互动,因此理想的司法活动首先应当合理、平等对待作为个体存在的双方当事人。但是,大模型的算法理性可能会消解司法作为人际对话的本质属性,致使裁量的天平更偏向于熟练掌握技术能力并善于运用技术优势的一方,悖离司法活动的初衷。
五、
结语:司法大模型运用之展望
实际上,我国的数字司法改革已俨然走出一条具有鲜明中国特色的本土道路,学界对次虽有介绍,但尚缺少基于科学定性方法的理论研究。以扎根理论为代表的定性研究方法,或可为突破当前困境提供方法论工具:通过深度访谈、参与式观察等手段,真实揭示改革主体的需求表达与价值抉择;通过多案例扎根分析,从实践素材中抽象出具有理论解释力的核心范畴,生成真正扎根于本土的数字司法理论。因此,运用科学的定性方法提炼中国数字司法改革的经典模式,揭示数字司法改革主体所面临的真问题,构建具有本土解释力的理论体系,是未来探讨中国数字司法改革问题的应然面向。唯有如此,才能真正实现理论研究与实践探索的良性互动,这既是学术研究范式转型的内在要求,也是回应时代命题、服务改革实践的使命担当。

END

相关阅读


微信号 : DigitalLaw_ECUPL
探寻数字法治逻辑
展望数字正义图景
战略合作伙伴:上海中联律师事务所


