Day Vision

Reading Everyday,Extending Vision

清华大学计算机系刘奕群教授:人工智能在司法审判中的渗透需要有边界

2022-09-16 07:09:21


图片来源:https://zhuanlan.zhihu.com/p/2714629204交叉学科研究:新天地,新挑战,新经验互联网司法是典型的交叉学科领域,它在司法智能化与人工智能发展两方面都很有魅力。


点击上方“ 图灵人工智能 ”,选择“星标”公众号

您想知道的人工智能干货,第一时间送达

Image


Image



导读

2017年8月18日,最高人民法院院长周强在杭州互联网法院挂牌仪式上首次提出“互联网司法”的概念,强调“要积极探索互联网司法新模式、新经验,为全球互联网治理作出积极贡献”。在互联网科技飞速发展和司法改革日益推进的当下,互联网司法是提升法治实践效率和质量的重要手段,也是法治建设走向现代化的必然趋势。本文将根据对清华大学计算机系教授、互联网司法研究院院长刘奕群的专访,梳理互联网司法领域的发展背景以及我国当前互联网法院建设现状,并对互联网司法的伦理问题以及人工智能交叉学科的研究范式进行探讨。


01

概述:国内互联网法院

的建设现况


现阶段国内在北京、广州、杭州共有三所互联网法院,其中最早成立的杭州互联网法院距今已成立满5年。 互联网法院建立的初衷是向全社会提供一个窗口来证明互联网审判的可行性。 如今很多法院已经设立了自己的互联网法庭并成功实现了互联网审判,人们对互联网法院的期望也开始逐渐发生变化。


最高人民法院院长周强一直强调 司法改革与司法信息化是鸟之双翼、车之两轮,不能偏废任何一方。 在司法改革与司法信息化的进程中,互联网法院、司法信息化以及智慧司法等一系列新概念应运而生,但我们绝不能将其混为一谈。总体而言, 智慧司法代表研究的大方向和追求的目标,司法信息化则代表信息技术在司法领域的应用,而互联网法院以及互联网法庭则是其中具体的呈现形式。


目前 我国的司法信息化和网络化已经相对成熟且普及, 就互联网司法的 实体应用层面 而言,互联网审判已在互联网法庭得到普遍应用并深入基层。互联网法庭在近年的疫情形势下为司法系统的正常运转提供了重要保障,并为法官、律师、检察官以及当事人带来便利。


就互联网司法的 技术应用层面 而言,庭审中也有很多工作得到了计算机技术的助益,例如语音识别辅助的庭审记录。由于法庭的音场相对确定,庭审记录可以通过语音转文字的方式自动完成,口音等实际问题也已经得到了有效解决。这一定程度上解放了书记员,让他们可以把更多的精力集中到后续对庭审记录更精细化、结构化的整理之中。此外,计算机技术在司法信息智能公开方面也发挥了重要作用。此前很长一段时间内,我国面向全球最大规模地公开了庭审记录,包括完整的司法文书,它们具有非常宝贵的法学价值,人民群众也对此有着强烈需求。


当然, 我们依旧有着巨大的发展空间。 首先在技术方面我们还有很多期望尚未实现;此外,在市场方面,美国司法信息化的市场规模是百亿美元级别,而中国的头部企业目前仅有几亿市值,存在较大差距。总的来说,信息技术在司法领域的应用已经提供了一个很好的载体与平台,并让大家享受到了司法网络化和信息化的便利,但距离实现智慧司法的目标我们还有很长的路要走。

Image

北京互联网法院 [1]

02

互联网司法:大势所趋


近年来,在司法和计算机技术研究两个领域的共同推动下,互联网司法的发展已成为大势所趋。


2014年,司法系统进行了法官员额制改革, 这使得法官队伍专业化程度逐步提升,但与此同时也加剧了“案多人少”的现象,给法院带来了明显增大的判案压力。 加之人民群众对于公平正义的要求越来越高,这就要求法官们办理的每个案子都要尽可能是“精品”,其中的压力可想而知。互联网司法研究目的之一是通过信息技术手段去提升法官们的判案效率。简单来说是利用计算机来完成大量重复、低效的工作,进而帮助法官们把宝贵的认知和判断能力集中到最需要的地方。

Image

2018-2020年我国互联网法院办案数量 [2]


另一方面, 近年来随着科技发展和网络普及,网络空间中的新现象层出不穷,如何从法律层面对其进行有效规制成了亟待解决的问题。 例如针对网络黑灰产业中一些人通过非正规途径赚取大量利益的情况,当我们尝试寻找与之相对应的法律条文时,常常发现比较困难。因此,我们需要对网络空间中大量事件的性质进行判断,并在此基础上进一步推动法制化进程。


提升现有法律事务效率并对网络空间进行更完善的法律规制的需求,为互联网司法发展提供了重要动力。 2018年前后,人民法院与科技部合作推出了一系列重点研发项目的课题,集中反映了人民法院对于信息科技的想法与需求。清华大学计算机技术及人工智能领域的相关研究始终处于全球领先的位置,我们也一直在思考如何能面向国家的重大需求解决一些实际问题,加之其中的部分课题与我们的研究较为匹配,因此我们选择参与到互联网司法的研究之中。


除了法律方面的客观需求,互联网司法也是人工智能发展中具有重要意义的前沿性实践,是应运而生的交叉学科领域。 按照张钹老师的观点,人工智能的发展路径可以划分为三个阶段:第一阶段的人工智能是规则式的人工智能,典型应用成果为专家系统,如针对特定疾病的诊断;第二阶段的人工智能是数据驱动的人工智能,也即从输入的数据中自动学习其范式并应用于实际问题的解决,如当前蓬勃发展的机器学习技术;第三代人工智能是符号计算与数据计算相结合的人工智能,在享有使用数据计算解决实际问题的便利的同时,通过符号计算更好地解释模型背后的机理。

Image

三代人工智能的变迁示意图


前两代人工智能已经发展得相对成熟并得到了越来越广泛的应用。针对第三代人工智能,许多学者提出了通用智能的概念。但是基于现有的数学基础与算力资源,直接提出针对万事万物的通用解决方案是一件困难的事情。因此, 在特定的垂直领域内率先发展第三代人工智能或许不失为一个更可行的策略。


司法领域的诸多特点恰恰为第三代人工智能的发展提供了便利。 一方面,司法数据数量丰富且司法审判本身的对抗性以及我国法律工作者普遍良好的职业素养确保了司法数据的质量可靠;另一方面,作为成文法国家,我国法律体系逻辑严明,此种逻辑性为使用计算机解决相关问题奠定了基础。基于此,互联网司法很有可能成为率先应用第三代人工智能产品的突破口。

Image

《中国法院的互联网司法》白皮书 [3]

03

焦点:人工智能参与审判

的边界在哪里?


毋庸置疑,在司法审判中人的主观能动性发挥着很大作用。尤其是面对层出不穷的社会新现象,如何将其与已有的法律条文和法律逻辑建立起对应关系,并在审判中体现出法律的核心精神,是一件非常困难的事情。在这方面,法官的主观能动性难以替代。


作为互联网司法领域的研究者,我们 希望信息技术能帮助法官们更好地发挥主观能动性的作用。 具体而言有两种途径,一是 “解放人” ,二是 “增强人” ,它们分别对应着 “自主智能” “增强智能” 两个概念。


从自主智能的角度来讲,我们希望在诸如案件繁简分流,或者 面对已经有明确判据的重复性案件时让机器尽量多地介入, 自动化地完成要素提取、事实收集等工作,并给出审判建议。当然,最后的判断一定还是由人做出。


从增强智能的角度来讲,我们希望能够让所有人都具备比较高级别的认知和判断能力。不同人的判案水平可能有所差异,但我们希望通过计算机的手段, 协助人们尽可能的建立起对于案件的正确认知并作出尽量公平的判断, 例如通过技术手段帮助法官理清证据链的逻辑关系并在恰当的位置提供相关判例等。


我们认为“自主智能”和“增强智能”的介入可以提高司法审判的效率与准确性。不过在这其中 所有的司法判断都应该依然由人来完成,机器只能是辅助,而不能代替人进行决策, 这是应当明确的界限。


现阶段最高人民法院也在制定关于人工智能司法应用的规制。制定过程中有两方面内容可供参考:一是联合国教科文组织于2021年11月推出的《人工智能伦理问题建议书》,其中明确了人工智能技术的诸多原则,包括世界各国在此方面达成的共识;二是我国学者,如清华大学人工智能国际治理研究院的薛澜老师、梁正老师等人在人工智能伦理方面的研究。他们提出了许多非常有价值的原则可以供人工智能司法领域的规则制定者来参考。

Image

图片来源:https://zhuanlan.zhihu.com/p/27146292

04

交叉学科研究:新天地,

新挑战,新经验


互联网司法是典型的交叉学科领域,它在司法智能化与人工智能发展两方面都很有魅力。我们可以发现在AI + Science/Computer + X的范式下产生了大量类似的研究领域,其中每一个都十分激动人心,例如计算科学与生物学、医学、社会学等领域的交叉融合。这些 交叉学科的研究不仅一定能够改变传统学科,同时也必然可以给计算机科学、人工智能和信息科学带来新的发展机遇。


姚期智先生在10年前领导成立了交叉信息研究院,这一举措非常具有前瞻性,信息科学与其他学科的交叉互动无疑是非常重要的发展方向。


值得注意的是,交叉学科的研究也需要克服不少挑战。以互联网司法研究为例, 其中很重要的一点是解决信息科学研究者与法学科学研究者之间词汇不匹配的问题。 简单来讲,对于同样的概念双方可能有不同的表述方式,而对于不同的概念,双方可能反而使用了相同的表述方式,这就会造成交流上的极大困难。比如,一个简单的概念:知识图谱。计算机领域认为的知识图谱是人工智能和知识工程的一个关键要素,其中包括了很多的知识节点以及知识节点间的相互关系,并且知识图谱是实现自动推理的重要工具;但是在法学领域,至少在计算机领域研究者介入之前的很长一段时间内,所谓的知识图谱其实只是一些规则的提炼,把自然语言的内容进行了相对结构化的整理,它和人工智能研究中的知识图谱是两个不同的概念。双方都在讲建立知识图谱,但最后得到的东西很不一样,同时也难以彼此认可,这就是词汇不匹配。它的本质是双方在知识结构和价值观上的差异,而协调这种差异其实是非常困难的。


面对交叉学科研究的挑战以及不同领域研究者间的差异,需要注意 两点: 一是双方要进行 密切的交流和沟通, 而且这种交流沟通需要是结果导向的。大家只有目标一致地希望协力做成一件事情,在此基础之上密切讨论,才能碰撞出火花。二是做交叉学科研究一定要 “换脑子” ,即去读对方领域的书,例如基本的教材以及现阶段核心问题的案例。只有如此才能真正解决对方面临的问题。切忌把一个领域的研究成果简单地拿到另一个领域直接去应用。 简单的“平移”或许在短期内可以取得些许成果,但从长远来看,所做的研究必然是不伦不类的。



数据及图片来源:

[1]图片来源:北京互联网法院出台意见,完善互联网司法在线诉讼机制|北京|意见_新浪新闻https://k.sina.com.cn/article_1893892941_70e2834d02000u8yo.html?sudaref=bossnew.jinse.com&display=0&retcode=0

[2] 数据来源:https://new.qq.com/rain/a/20200923A0EEFX00

[3]图片来源:我国法院首部互联网司法白皮书在浙江乌镇发布-中国网http://zjnews.china.com.cn/yuanchuan/2019-12-04/202072.html



图文 | 史永淇 洪  烨 邓咏珊

林  琳 胡思源 张世超

排版 | 王昕阳

审核 | 傅宇杰 陈星安 许鹤麟 王嘉清 程泽堃

版权声明
转自探臻科技评论,版权属于原作者,仅用于学术分享
Image
Image
往期精彩必读文章(单击就可查看):
1. 看了 72 位图灵奖得主成就,才发现我对计算机一无所知
2. 图灵奖得主Geoffrey Hinton:我的五十年深度学习生涯与研究心法
3. 图灵奖得主姚期智院士:数据、算法、算力为何是数字经济核心技术?
4. CAAI名誉理事长李德毅院士:薛定谔+图灵 +维纳 = ?
5. 图灵奖得主Jack Dongarra:高性能计算与AI大融合,如何颠覆科学计算