人工智能辅助办案引发深刻的裁判结构性变革,可能会引起庭审虚置化、判决同质化、司法碎片化和算法模型代替法官裁判等溢出效应。司法裁判是一个复杂的判断和决策过程,融合了法官技术理性和经验理性,人工智能无法替代法官自由裁量权,也没办法实现实质正义。未来,应当明确法律AI是辅助性而非替代性的司法实践工具,法官在具体运用时要校验智能司法逻辑与法律论证的吻合度、智能裁判过程与个案具体情境的紧密度、智能裁判结果与司法政策的契合度,确保裁判结果妥当性。另外,需要从技术理性和经验理性两个维度提炼法律专家经验,提升数据全面性和精准性,促进算法规制公平透明,培养“法律+科技”的跨界人才。
借助互联网和云计算迅猛发展的东风,人工智能再次掀起复兴热潮,在司法领域运用也呈现高歌猛进的态势。2015年最高法院提出建设“智慧法院”,2017年印发《关于加快建设智慧法院的意见》,要求法院全业务、全方位和全流程实现网络化、阳光化和智能化。在“智慧法院”框架下,人工智能主要使用在于服务人民群众、服务审判执行和服务司法管理。其中,为法官办案提供智能辅助是“智慧法院”建设的核心目标之一。AI在法官裁判领域运用效果如何,面临怎样的实践障碍,引发什么样的结构性变革,以及未来怎么样发展,本文对此提出初步的思考和解决方案。
人工智能在司法裁判领域运用范围相当广泛,基本上涵盖法官决策的全过程。以法官裁判过程的推进顺序来看,主要运用于以下五大场景中。
依托电子卷宗随案同步生成系统,通过OCR技术,使电子卷宗转变为可复制、结构化、数据化的电子文件,实现案件信息自动回填,方便法官快速定位、检索相应内容及复制引用文字。通过构建法律知识图谱,运用自然语言处理、语义分析等技术自动提取和比对公诉意见书、起诉书、答辩状等材料中的诉辩意见和事实理由,自动归纳案件情节和争议焦点,自动生成庭审提纲,为法官提供庭审智能辅助。
类案推荐是通过对情节、证据、争议焦点、法律适用等关键信息的自然语义识别,形成案件知识库,当出现目标案件时,通过提取类型案件的关键要素,与系统内的历史案件进行匹配,自动推送类似的案例。类案智推有主动检索和自动推送两种实现方式:一是支持用户以关键字、短文本等方式检索,二是自动为用户推送同类案件、法律知识等辅助参考信息。
系统通过对海量裁判文书进行情节特征的自动提取和判决结果的智能学习,建立案件裁判模型,当案件导入系统后,通过提取案件事实、情节,自动统计、实时展示同类案件裁判情况,推导量刑结果。从目前来看,部分系统能根据起诉书、庭审笔录等自动提取情节,匹配案件并进行量刑推荐。
运用法律语义分析等技术,对起诉书、答辩状、证据等前置数据和庭审笔录内容做智能判断分析后,按照法律文书格式要求,依托各类文书底层要素框架,一键式自动生成裁判文书。自动生成裁判文书初稿内容有文书首部、当事人、案件由来、诉讼请求及理由、审理查明、本院认为等大部分内容。
裁判偏离预警是在裁判文书完成后,对文书质量进行检测验证和控制。法官完成文书撰写后,系统自动抓取文书内容做智能分析,比较依据算法推测的量刑幅度与法官裁判的量刑幅度,计算二者偏离情况,自动预警偏离度较高的案件,并实时推送至院庭长管理平台以便定向化行使审判管理监督权。
以上五大场景运用中所引的事例都是在相关领域做得较好的法院。同时,也能够正常的看到各地法院各自研发、重复建设,各系统数据库、算法、模型、分析技术标准不一。另外,系统区域性特征明显,基本上采用区域内案件数据,且案件体量小,导致推广困难。总之,法律人工智能发展不平衡、水平参差不齐,仍属于一种统计型、经验型、材料准备型、文字模板型的弱人工智能。
电子卷宗随案同步生成是法院信息化一切数据的来源和基础。目前,电子卷宗生成运用方面存在诸多问题:一是电子卷宗同步生成推进进度不一,地域发展差异明显。
二是电子卷宗运用方面,囿于自然语义识别、图文识别等技术的局限性,导致卷宗识别率不高、精确度不够,影响数据应用。
三是电子卷宗汇聚案件总量较少、比例较低,地方三级法院汇聚案件数量和比例呈递减状态。
相关法规和类案检索对于辅助法官正确适用法律,减少裁判主观性和不确定具有积极意义。但目前多数法院的类案、法条推送功能仍在低水平运转,推送法条过于泛滥、推送案例匹配不精确的现象普遍存在。
人工智能提供精准量刑预测的前提首先是能够准确提取案件量刑情节,但目前这项功能实现情况并不是很理想,同时也导致量刑预测结果精确度不够,参考价值不大。从三级法院来看,高院上述功能实现情况明显高于中院和基层法院。
虽然大部分法院智能系统具备文书自动生成功能,但生成的项目不多,关键事项辅助生成功能不健全。裁判文书自动生成大多分布在于简单案件,特别是要素式、表格式、令状式裁判文书,且只能生成当事人情况、诉称等少数部分,能自动提取事实和理由,生成“事实认定”和“本院认为”比例不高,效果也不理想。
人工智能在裁判领域遭遇低频率、低水平运用的窘境,不禁要问是何种因素制约法律AI发展。人工智能发展有三大核心要素:算力、数据和算法。目前法律AI在这三个方面均存在局限性,同时复合型人才短缺也影响人工智能发展。
从技术路径来看,上述五大应用场景依次按照“知识图谱构建-情节提取-类案识别-模型训练-量刑预测-文书生成-偏离预警”技术路线展开。这些步骤之间具有很强的逻辑和技术关联,其中知识图谱构建和情节提取技术是最底层技术,其水平高低直接影响后续阶段的推进效果。目前存在两个问题。
法律知识图谱是AI在裁判领域运用的开端。由法律专家对法律和法规、司法观点、案件数据等法律知识进行模块化处理,建立结构化法律知识库,用可视化的图谱方式描绘法律主体、客体、法律关系以及各种主观、客观要件、裁判规则的概念层次和逻辑推理关系。当前知识图谱构建存在两大制约因素:
知识图谱完成后,人工智能依照知识图谱确定的框架体系来识别案件,对案件要素进行提取、比对和分析。情节提取实际上就是运用自然语义识别技术,将裁判文书中半结构化、非结构化的数据来进行提取整合,形成结构化的标签,然后提取与裁判结果相关的情节要素。对于机器而言,识别自然语言已属不易,而法律文本具有专业性,加上自然语言处理技术不成熟,这给机器学习带来非常大困难。现阶段主要是采用纯人工的方式对案件的情节“贴标签”,需要大量人力投入。同时,现有人工“贴标签”技术过于粗糙,很多细节未被标签化或未被准确地标签化,这也极大制约后续量刑预测、文书生成等运用效果。
大数据是AI发展的巨大“燃料”。2013年最高法院上线中国裁判文书网,大量裁判文书上网公开,为法律AI研究和运用插上了翅膀。但这些法律数据存在结构性缺失、系统性偏差等问题。
裁判者真实意思与裁判文书表达有时候呈现二元化、背离化,裁判文书上的说理有时候并不是法官真正的裁判理由。法官都会存在不愿说理、不能说理、不敢说理等问题,导致裁判文书上裁判理由被简单化处理,或者通过所谓“标准化”统一范式的表达方式粉饰裁判理由,真实裁判依据往往隐藏于内心深处或者其他如审结报告等内部材料之中。
裁判文书网上的裁判文书质量参差不齐,有些甚至是悖离法律规则的错误判决。同时,当前法律和法规更新迭代速度很快,新法颁布前后的裁判文书之间多有龃龉,而且有些案件裁判结果与当时司法政策紧密关联。因此,需要对数据做大量清洗工作。但现在大多数系统对数据不作质量筛选,而是不加选择将所有符合粗糙条件的数据全部纳入数据库。基于这些质量堪忧的数据训练产生的模型与算法就可能遭遇精确性的质问。
算法是AI发展的强劲“引擎”。法律AI算法相当于法官司法判断和决策的推理模型。当前算法处于“云山雾罩”状态,无法知悉智能系统采用何种算法以及算法运用实效。
法律人工智能并未形成一套高效、成熟的算法,实践中基于裁判文书做深度的文本挖掘,用机器学习的方法做回归分析,或者基于深度神经网络去做分析,发现隐藏在裁判文书下司法趋势的大数据分析并不多见。
与传统决策系统不同,基于深度学习的算法并不遵循数据输入、逻辑推理、结果预测的过程,而是由机器直接从事物原始特征出发,自动学习和生成认知结果。在输入数据和输出答案之间有“隐层”或“黑箱”,我们只可以获知答案,却无法了解机器“自由心证”的过程。另外,司法机关对这些技术不甚了解,无法从技术层面对技术公司、电脑工程师的工作进行相对有效监督,这给算法的暗箱操作留下空间。
算法往往暗藏歧视,如有犯罪前科的主体在不符合累犯情况下,仍会在量刑预测中陷入不利境地。算法歧视有两方面原因:
法律人工智能发展还需要“技术+法律”复合型人才作为智力保障。但目前面临人才短缺问题,全国法院现有信息化人才7253人,高院、中院和基层法院信息化人才平均为9.8、3.5和1.9名,这与智能司法需求严重不匹配。同时,法律人参与深度不足,不了解人工智能技术,不能准确表达自身需求,研发人员又普遍不了解法院业务,没办法掌握技术应用中的痛点,导致技术与业务无法深度融合。
人工智能深度应用将冲击现有诉讼架构和流程,重塑法官行为决策模式,甚至影响法院在国家治理体系中的地位和功能。
按照哈贝马斯的“程序性模式”司法裁判理论,司法裁判不是独白式的裁判,而是对话式的裁判。法庭是法官和当事人展开充分对话和辩论的最重要舞台。通过充分举证、质证和辩论,让“案件事实从诉辩双方的证明向裁判者心证位移”。法官在各种信息的积累与感官的刺激之下,基于对庭审的直接感知,运用逻辑推理和经验法则,形成心证进行裁判。法官心证运用和裁判结果都是建立在从庭审获取有效信息的基础上。但在人工智能模式下,所作判决是基于对过往类似判决群的影响裁判结果要素提取的基础上,通过智能模型,与现有案件进行配对后,提供裁判方案。显然,人工智能得出的结论不是基于庭审与直接言辞,其相对封闭的数据分析模式与“卷宗主义”类似,取代程序正义要求的亲历性,庭审可能沦为一场过程秀。
人工智能为法官裁判提供类案推送、量刑预测和裁判文书等仅具有参考价值,法官还需要审阅校订。但在案件量激增的压力下,会造成法官说理懈怠,从而过度依赖人工智能,最后导致同类裁判文书说理同质化。同时,还应注意到类案判断是一个极为复杂的过程,要综合考量案件事实要素以及要素权重等,有时要素数量相同,但要素权重不一致,不应认定为同案。在新类型案件中,人工智能根据以往案件推送案例,并不符合当前新类型案件审判的需要,这时需要法官发挥自由裁量权,创制规则并妥善裁判。但在人工智能已提供裁判方案的背景下,法官进行偏离裁判需要负担更多的论证成本,而且可能引发相应的追责。这就导致法官在对个案异质性的关注及具体正义的实现上趋于保守,久而久之使既有判决中存在的失误、质量上的问题被固化扩大,从而压抑通过个案发现合法权利、创新规范的动态机制。
法律人工智能开发和运用都会存在模型数据地方化问题,部分研发主体采用分省域构建数据本地化模型,对不同省份的数据来进行分别训练,形成本地化的分析模型,导致司法区域化和碎片化。法官作为理性经济人会在既定制度约束下采取自我利益最优的行为方式,在裁判过程中追求的最直接目的是审理的案件不被上一级法院发回重审或改判,至于更高层级法院或别的地方法院如何判决未给予足够关注。通过数据本地化模型所预测的判决结果,对法官具有很强的心理约束力,可能形成唯系统论的裁判惯性。同时,系统是以上级法院案件为样本,上级法院法官同样以该系统作为分析模型,这就导致案件上诉后,相当于一个案件按照同一标准做两次系统评判,长久以往二审法院指导一审法院的裁判功能将逐步淡化。
由于算法具有非透明性和不可解释性,同时司法机关对算法知之甚少,无法对算法运行和实际效果进行相对有效监督,导致算法处于失控状态。目前,核心算法主要交由外包处理,造成技术公司、电脑工程师对AI的影响远超司法机关。如前所述,在裁判过程中法官迫于内外各种压力,容易以系统预判结果直接代替自己的思考。可见,算法无论在开发还是在应用过程中,法官都始终处于“缺席”状态,这势必导致审判主体多元化,甚至衍化为由电脑工程师、技术公司等法官之外的主体支配裁判的局面。
第一,法官裁判是一个复杂的判断和决策过程。法律人工智能决策是效仿法官裁判的过程,因此有必要对法官的裁判活动进行细致观察和整体描述。 法律适用是“逻辑三段论的演绎推理方式”在司法中的一种应用。首先将散落在法律体系中的相关法律规范进行重组,通过法律解释等方式阐释法条,形成大前提;其次过滤当事人评价因素,形成“原始案件事实”,以拟适用法律规范为导向剪除无规范意义的部分,形成“具有规范评价意义的法律事实”,最终利用证据规则形成“加以证实的法律事实”;最后经由涵摄得出结论。可见,法律适用是一个复杂的判断和决策过程,蕴涵裁判者的利益衡量和价值判断。如果认为法律适用是简单的三段论逻辑,是AI可以轻易突破的领域,不仅是一种技术的傲慢,更是对法律的无知。
第二,法官裁判兼具技术理性和经验理性。法官裁判行为表面上看起来只是一个专业化且近乎封闭的一系列行动,但实际上它又是在开放的社会结构中运行,裁判者所处的社会文化情境系统的整体逻辑会对其产生潜移默化的影响。在司法过程中,不仅要求裁判的专业性,同时也强调法官能动地司法,充分运用各种生活经验和地方性知识,结合个案具体情境,通盘考虑、权衡利弊、灵活取舍,在此基础上形成裁判结果。前者强调的是运用显性规则进行司法推理和裁判的技术理性,后者强调的是建立在个体自我品格、思维模式、知识背景、审判经验等基础上的经验理性。裁判行为同时具有规范性和经验性,是技术理性和经验理性的有机整体,只有两者结合,才能实现法律效果和社会效果统一。
与围棋封闭的规则不同,法官裁判是开放性场域。法律适用固应依循法律规范的共识,但关于某项问题,法律未予规制的情形常有发生。即使有明文规定,但法条还存在很多不确定的规范性概念和法律原则,不确定法律概念尤其是法律原则,其主要机能在于使法律运用灵活,兜底特殊个案,为适应变迁中的伦理观念留下空间,使法律与时俱进。这里的预留空间,就是立法赋予法官的自由裁量权。最高院《关于民事诉讼证据的若干规定》明确,裁判者要运用逻辑推理和日常生活经验进行裁判。自由裁判量是在保证一般规则导向下“框架秩序”的同时,赋予法官在框架内的个别化考量的权力。因此,AI可以规范和限制,但无法消除或取代法官自由裁量权。
法官要在遵循法律规范的前提下,综合考量案件的具体社会结构包括个体特性、案情特征以及纠纷所镶嵌的特定社会文化情境系统中各类因素,运用裁判经验,作出符合案件个性特征的判决,实现个别正义,达到形式正义和实质正义的统一。而AI数据化的均值判断是类似案件法官的平均理解,优点是整体描述,但忽视个性化因素和单体价值。数据算法、模型只关注最大相关性,其计算的过程与个案背后的因果逻辑、价值伦理、文化背景等案件结构完全隔离,它以过往法官对类案的集体经验作为判断规则,无视当前个案的特殊性,因此形成的判定结果也是千篇一律。
未来人工智能应当以什么样的方式嵌入到中国司法实践,这是一个宏大的命题。从目前而言,不仅应从认知层面明晰智能司法下法官的职责使命,还需要在技术等层面采取一定的措施予以完善。
法律AI是辅助法官判断和决策的助手或参谋,是辅助性而非替代性的司法实践工具。这是由两个因素决定:一是法律职业特性。法官是行使审判权的合法主体,裁判领域引入人工智能,目的是缓解人案矛盾、协助办案,最终决策者是法官而不是机器;二是技术局限性。由于神经网络、机器学习、自然语言处理等核心技术还存在很大瓶颈,尚不具备完全介入法官裁判过程的能力。也就是说,目前法律人工智能技术,还不能像法官一样思考。
智能司法逻辑过程具有隐秘性,存在大数据分析模式忽略个案具体情境性,代码运算脱离价值判断等问题,这些都决定法官在面对智能司法裁判结果不能消极作为,而应以司法理性为引导对技术理性在社会合意性和有效性上进行融合,主动承担权衡、调适和确认裁判结果的义务。
现以“天津赵春华非法持有案”为例,展示智能司法背景下法官裁判的路径。在该案中,一审法官简单套用法律适用三段论逻辑,对法条内容做、孤立、僵化的理解,没考虑法条背后的实质性价值判断因素,导致裁判结果悖离公众的基本认知和法感情。这与智能司法运用过往案例大数据形成的集体审判经验,无视个案具体社会情境,机械适用法律的逻辑演进过程如出一辙。面对智能裁判结果,法官需要从三个维度进行检验。
法律适用不是单纯涵摄过程,而是同时涉及价值判断与解释技术有机整合的过程。法官需要灵活掌握各种解释技术,运用解释技术在合理的价值判断与立法文本之间建立起内在的联系,通过解释赋予法律体系以必要的开放性。这些都是智能司法所欠缺的。在“赵春华案”中,法官可以行使自由裁量权,对非法持有罪中“”“持有”等要素作限缩解释,通过周密法律论证,寻求去罪化的出路。
气球射击摊在中国大街小巷司空见惯,普通公众很难将这种行为与持有犯罪行为进行法律上的勾联。一审法官如同AI法官一样,忽视该案具体社会情境,以一种脱离个案具体环境的纯文本推演方式得出判决结果。法官裁判此类案件时,需要采取司法三段论和裁判结果导向相结合的方法,回溯个案所处的社会情境,综合评估依据个案情境裁判可能引发社会公众反应,并据此判断个案因素对裁判结果重要性与影响力,确保结论妥当性。
法律制度背后都有一项或多项司法政策作为支撑。“赵春华案”二审法官最终判决认定其有罪,同时酌情从宽判处缓刑,使判决符合罪责刑相适应的法律原则和宽严相济的刑事政策,不仅体现管理政策,也展示司法人文关怀,实现法理与情理的平衡。法官在校验智能裁判结果时,要追溯具体制度背后的司法政策,在判断和决策过程中紧扣政策精神,经由合乎法律规范的推理论证,确保裁判结果与司法政策保持一致性。
法官依照上述三个标准校验智能裁判结果的合法性和合理性时,需要将修改的原因和依据以备注形式记录在智能系统的评估结果中,一方面有利于判断理由的公开和监督,另一方面及时将结果反馈给系统,有助于提高系统纠错能力和预测准确性。
针对当前名目繁多的系统引发数据库、算法、模型设计、分析技术标准混乱等问题,应改变各法院闭门造车、各自为战局面。从现阶段而言,取得重大突破的试点法院,应开放端口,允许别的地方的法院同步运用系统,实现资源共享。从长远来看,应在全国范围内建立统一的AI系统,统一数据来源、算法模型和操作标准,让智能辅助更加标准化和规范化。
同时,系统模块设计和运用更多考虑法官的使用者真实的体验,根据法官实际个性化需求,构建用户模型,帮助获得与法官偏好更贴切的个性化信息,并引入反馈机制,通过重复修正用户偏好,逐渐完备用户模型,让服务供给更加契合法官实际需求。
当前人工智能尚处于初级阶段。未来在技术成熟的基础上,通过构建更加科学有效的法律知识图谱,推进法律知识的体系化和精细化。
从技术理性层面,在显性法律规则框架下,不断总结和提炼审判实践对法律规则的修正、发展和创新,扩充法律规则的子类型,让法律规则更加精细,更加贴近流动的社会实际。这就需要更加多经验比较丰富的法律工作者加入基础性的数据标签工作中,需要更多具备深厚法律素养的一流法学专家为纷繁复杂的法律知识和法律事实界定更为清晰明确的法律标签。法律数据“标签化”“结构化”后,作为训练集,交给机器判断,再由法律人反馈,深度学习才能成为可能。
从经验理性层面,不同法官在长期审判工作过程中积累了很多行之有效的审判经验,但这些经验带有浓厚的法官个体烙印,难以复制推广。另外,法官在裁判过程中运用大量非正式制度或隐性知识,这为暗箱操作提供空间。人工智能应当利用大样本经验挤压法定条件以外其他因素的介入和影响,减少或者消除裁判中的模糊性以及标准的不确定性,增强裁判统一性和可预见性。同时,提炼实践中有效的经验性、实践性司法知识,通过可视化方式,让隐性知识显性化、确定化,使隐性经验变成具有内部关联性的数据,成为大数据的重要组成。当然,要实现这个目的,还有一段很长的路要走。
法官在不同场景对业务需求具有差异性。智能系统根据案由、案件标的、法律关系等要素,自动识别案件的难易复杂程度,并进行分类。针对不同案件类型,提供不同程度的智能辅助:
对处理大量常见简单案件的法官,给予提高效率的工具支持。由智能系统依托各类文书底层要素框架,运用语义识别等技术,基于庭审笔录和合议笔录进行信息点的智能抽取与回填,智能生成裁判文书全部内容,提高审判效率。
对于处理复杂案件的法官,推送参考案例、裁判经验和辅助判决的观点。在类案智推方面,建立类案质量评测系统,对类案来源、法院层级、被引用次数等情况加以标识,在类案推送时,优先推送质量高、具有权威性的案件类型;同时,建立一套类案类判机制的记录和监督机制,法官所判案件与多数类案裁判结果相佐时,系统自动提醒、记录并跟踪。在裁判自动生成方面,囿于人工智能技术局限性,自动生成除审理查明和本院认为等部分内容。
对于处理重大疑难案件的法官,则需要提示办案思路和学理支持。基于智能知识库,依托法律知识图谱,为法官办案提供专业裁判思路和法律学者观点,供法官比对、权衡、吸收采纳,确保裁判文书在个性化说理下保持相对的标准化,提升裁判规则的稳定性。
数据库是人工智能的“源泉”。只有在全面、准确、无瑕疵大数据基础上建模,提供的智能辅助才可能精准可靠。
司法裁判之要义不仅在于结论,更是以符合公正程序得出结论的过程,而深度学习算法“黑箱性”与法律决策“透明性”相冲突。对此,需要完善规制举措,让模型、算法具有可审查性。
人工智能首先是人工,智能系统开发与运用在根本上仍然依赖于人的作用。第一,培养“法律+人工智能”跨界人才。开启法学专业和AI专业互通的“深度学习”模式,着重培养既懂人工智能又懂法律知识的综合人才,使法律人明晰人工智能的基本技术构造,技术人员知晓法律的基础原理。第二,建立“法律人—法律工程师—技术公司”三元主体模式。法律人才是法律人工智能真正的“导师”,系统开发和运用应以法官为核心,法官负责从业务需求角度确定功能、制定客户端操作规范。作为“术语翻译师”的法律工程师执行法官需求,负责与外部技术公司沟通对接。技术公司依据法官需求开发系统。
我们仍然处在法律AI时代薄雾弥漫的清晨。尽管还未见到那一时代的清晰轮廓,但我们大家可以预见未来法官裁判领域将迎来巨大变革。在这样一个伟大的时代,法律人应当如何作为,以上的思考才刚刚开始。
《上海法学研究》集刊2019年第5卷——上海市法学会案例法学研究会文集目录
从一起侵犯商业机密刑事案件的公诉审查浅析排除合理怀疑在司法实践中的展开
来源:《上海法学研究》集刊2019年第5卷(案例法学研究会卷)。转引转载请注明出处。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。