内容简介
《人工智能在法庭科学的应用》由Z.杰拉茨(Zeno Geradts)与K.弗兰克(Katrin Franke)联合主编。《人工智能在法庭科学的应用》聚焦数字调查、生物识别等实务领域,深入探讨机器学习、自然语言处理等AI技术带来的机遇与挑战,着重分析人工智能技术与欧盟《人工智能法案》《通用数据保护条例》等法律框架的衔接路径,强调跨学科协作与实验验证对于技术规范化应用的重要意义。
目录
目录
第1章 概述 1
第2章 法庭中的人工智能取证评估:解释的可取性和验证的必要性 3
2.1 简介 3
2.2 解释的可取性和验证的必要性 7
2.3 可解释性及有效性 8
2.4 验证及解释 11
2.5 结论 16
参考文献 17
第3章 刑事诉讼中证据的机器学习:可靠性保障面临的技术-法律挑战 20
3.1 概述:人工智能在刑事诉讼和法庭科学交叉领域的应用 20
3.2 法律框架 25
3.3 机器学习各阶段的技术-法律挑战 43
3.4 人工智能在调查中的应用:系统设计+数据保护=公正审判? 62
3.5 结论 64
参考文献 65
第4章 电子数据表示与解释的形式化:强化推理和自动化分析 74
4.1 引言 74
4.2 背景和相关工作 76
4.3 方法 77
4.4 数字痕迹的表示 79
4.5 计算相似度的表示 85
4.6 机器学习分类的表示 88
4.7 假设检验结果的表示(推论) 91
4.8 高效/可靠/负责任的自动化分析 99
4.9 结论 101
参考文献 101
第5章 利用人工智能开展电子数据调查 103
5.1 简介 103
5.2 Hansken简介 104
5.3 人工智能技术的大规模应用 109
5.4 结论与延伸阅读 121
参考文献 122
第6章 社交网络分析方法在调查大规模犯罪网络中的可行性研究 125
6.1 引言 125
6.2 既往研究 127
6.3 材料与方法 129
6.4 实验设计 133
6.5 实验结果与讨论 139
6.6 结论 149
参考文献 150
第7章 将自然语言处理技术应用于侦查及侦查讯问 153
7.1 概述 153
7.2 刑事侦查 154
7.3 在自然语言处理背景下评估调查人员的需求 155
7.4 自动语音识别 157
7.5 自然语言处理基础 159
7.6 文本提取 162
7.7 文本分类 167
7.8 文本精简 170
7.9 讨论与结论 173
参考文献 175
第8章 压缩对深度伪造视频检测的影响 181
8.1 引言 181
8.2 方法 185
8.3 结果 190
8.4 讨论 196
8.5 结论 199
参考文献 200
第9章 电子数据取证视角:事件日志分析和关联 202
9.1 引言 202
9.2 日志来源 204
9.3 关联的必要性 215
9.4 关联技术 217
9.5 结论 221
参考文献 221
第10章 (超)图分析及其在取证中的应用 223
10.1 概述 223
10.2 方法综述 225
10.3 可解释性与可视化 230
10.4 结论 233
参考文献 234
第11章 结论 236
试读
第1章概述
Zeno Geradts1 ,Katrin Franke21荷兰法庭科学研究所,荷兰海牙伊彭堡巷6号
2挪威科技大学,**学院,挪威特隆赫姆
本书收录于美国法庭科学学会(AAFS)系列参考文库,旨在为人工智能(AI)在法庭科学领域的应用提供系统性指导。在Zeno担任AAFS主席期间,人工智能及其对法庭科学的影响成为热议话题之一。许多司法鉴定产品中已悄然融入人工智能和深度学习技术,例如,人脸和语音比对软件。许多电子数据取证软件都能实现枪支等特定图像的搜索。此外,人工智能在化学计量学等众多领域的应用也日益广泛。然而,人工智能的使用也可能对司法鉴定产生冲击,例如,深度伪造技术使得生成具有欺骗性的伪造证据变得更加容易。不同的司法管辖区根据其法律体系对于人工智能使用所采取的处理方式也大相径庭。
本书列举了人工智能的成功应用案例,强调专家参与的重要性。同时,除专家外,司法裁判机构也需要明晰人工智能技术的局限性。
本书各章节可作为讲座参考资料,以图神经网络开发方法的*新研究进展结尾。本书开门见山地介绍了人工智能领域,随后深入探讨了人工智能相关的法律问题,以及制定标准的必要性。书中还讨论并展示了智慧城市、汉斯肯的物联网等诸多人工智能应用实例。*后,探讨人工智能在深度伪造领域的应用及检测方法。
随着人工智能领域的迅速发展,欧盟委员会也越发重视对人工智能在实际应用中的监管。美国国家标准与技术研究院(NIST)正在积极制定人工智能使用标准。各州也在加快立法进程,例如科罗拉多州已就面部识别服务的使用制定了法规,佛蒙特州则颁布了规范人工智能伦理使用的法规。
人工智能在司法鉴定中*重要的应用之一是对DNA证据的分析。近年来,DNA测序技术的飞速发展使科学家能够快速准确地分析海量基因数据。然而,这些技术所生成的数据储量极为庞大,已超出人工分析在效率和准确性方面的处理能力。人工智能算法可以用于快速、准确地识别与特定个体或群体相关的基因标记,使司法鉴定专家更容易识别嫌疑人或从调查中排除嫌疑人。
人工智能也被应用于指纹分析领域。指纹分析是法庭科学的一个重要组成部分,因为每个人指纹的*特性,指纹分析常被用于嫌疑人身份识别。然而,人工分析指纹耗时又容易出错。而人工智能算法可以快速、精准地完成指纹分析,大幅减少了时间和人力成本。
人工智能在音视频证据分析中的作用同样不可忽视。在刑事侦查中,视频和音频资料经常被作为重要证据,但分析此类证据既烦琐又耗时。人工智能算法可快速识别并分析其中的关键特征,比如人脸、声音等重要细节,使司法鉴定人员更容易识别嫌疑人和收集重要证据。
总之,人工智能正迅速成为司法鉴定领域不可或缺的工具。它使司法鉴定人员能够快速准确地分析海量数据,在刑事案件中辅助锁定嫌疑人、还原事实并收集证据。随着技术迭代(如ChatGPT带来的变革),预计未来或将涌现更多创新应用。
此外,人工智能在电子数据取证领域也发挥着重要作用。电子数据取证是指在刑事和民事案件中识别、收集、分析和保存电子证据的过程。面对爆发式增长的电子数据与快速迭代的技术更新,人工分析难以应对海量复杂的电子数据。人工智能算法可以用来快速、精准地识别和分析电子数据,如电子邮件、短信和其他形式的电子通信。
本书旨在为在司法鉴定中使用人工智能提供理论基础,同时剖析存在的问题和风险,并给出应对之策。
第2章法庭中的人工智能取证评估:解释的可取性和验证的必要性
Rolf J.F.Ypma,Daniel Ramos,Didier Meuwly
1 荷兰法庭科学研究所,荷兰;
2 AUDIAS实验室,西班牙马德里自治大学,西班牙;
3 特文特大学,恩斯赫德,荷兰
2.1简介
人工智能(AI)是基于复杂算法,运用算法的方法及系统构建的体系。在本章中,我们将“算法”理解为核心技术[例如深度神经网络(DNN)],将“方法”看作是把核心技术应用于特定问题(例如利用深度神经网络评估指纹证据),而“系统”则是实现该方法和算法的软件工具(例如商业化图形界面软件包或者应用程序编程接口)。核心技术通常包括模式识别和机器学习算法,近年来,这些算法的复杂性和性能都有了显著提升。这些算法的输入和输出往往是可解释的,但支配其内部机制的原理却很难解释清楚。深度神经网络就是一个典型的例子,它是构成所谓深度学习领域的一类算法(LeCun et al.2015)。深度神经网络是被称为神经元的单元之间构建的密集且高度复杂的连接网格,这些连接可以是循环的,或者通过过滤器将输入特征中的不同区域相互关联起来。*初,神经网络旨在模拟人类大脑的拓扑结构,故而得名。深度神经网络的输入通常是一组代表文本或感官原始数据的数字(例如指纹图像或音频文件)。其输出根据任务的不同,分为连续值或离散值(例如在分类任务中,输出为每个类别的概率;在回归任务中,输出为某个预测值)。因此,输入和输出都是明确定义的,甚至在很多情况下是可解释的。然而,要了解或解释单个神经元或一组神经元的激活的含义却非常困难。尽管存在一些直观的理解,但一般来说,解释这些中间结果极其困难。事实上,机器学习算法的可解释性本身就是一个研究领域,被称为可解释人工智能(explainable AI,XAI)(DoshiVelez and Kim 2017;Guidotti et al.2018;LeCun et al.2015;Molnar 2020)。该领域涵盖了机器学习和人工智能的可解释算法。可解释人工智能与伦理学、公平性以及人工智能在实际问题应用中的风险等更具哲学性的领域密切相关。
在使用算法进行司法鉴定评估时,我们认为“解释/解读”意味着为计算结果(例如从证据中获得或提取的一组特征或得分)赋予法律层面的证明力,并以似然比的形式对其进行概率建模。似然比是司法语境下量化证据价值的数值表达,在庭审中控辩双方观点存在争议时具有重要意义(Evett et al.2000;Jackson et al.2013)。然而,人类对深度神经网络等“黑箱”机器学习算法内部组件的可理解性解释仍然存在问题,尤其是在司法鉴定这类对决策影响重大的领域。值得强调的是,我们要区分对人工智能算法内部组件和工作原理的解释,和对其结果的解释[例如,以算法计算的似然比(LR)表示的证据强度或分类器产生的类别概率等输出]。在可解释人工智能的文献中,这些通常分别被称为“全局”解释和“局部”解释。在贝叶斯决策情景下,似然比框架被视为对证据评估结果进行法庭科学解释的一种逻辑方法。但我们也需要思考方法本身的解释逻辑,即其在内部如何运作。
机器学习算法在训练完成后具有完全确定性,因此具有可重复性和可再现性。在特定的实验设置中,想要描述给定算法的性能和行为时,这无疑是个好消息。事实上,正如下文所述,这种可重复性和可再现性使得系统具有可测试性,而这正是严格的实证验证过程的基础。然而,近年来随着深度神经网络的规模和复杂性的增长,深入理解算法原理而创建解释变得更具挑战性。因此,我们可以断言,人工智能系统中的机器学习和模式识别算法是可以验证的,但其原理仍然难以解释。
在法庭科学领域,使用复杂的分析化学方法进行司法鉴定是很常见的。例如,利用激光剥蚀电感耦合等离子体质谱仪(LA-ICP-MS)进行玻璃比对分析。但是在法庭上要解释使用激光剥蚀电感耦合等离子体质谱仪从玻璃中提取信息的过程是极其困难的。因此,解释该方法的技术细节并无帮助,因为律师通常都缺乏理解这些解释的能力。然而,该方法的结果通常被采信并认为是可靠的:法院通常认为基于这些化学特征的司法鉴定是有价值的证据,我们也认为理应如此。我们认为一个重要原因是,使用激光剥蚀电感耦合等离子体质谱仪进行司法鉴定时,生成和比较分析结果的过程已根据国际质量标准进行了测试和验证,并获得了国家认可机构的认可。这证明了该方法在法庭上的可靠性,比司法鉴定人员向法官或陪审团提出的任何解释更有说服力。在这种情况下,如果解释能使整个过程更加透明易懂,那固然是好的,但并非必不可少。
如果考虑一个典型的操作场景——数据是前所未见的,并且可能在用于训练算法的受控数据集中没有得到充分体现,那么可解释性问题会更加突出。很难预测在受控数据集上训练的系统在所有情况下的行为。这不仅是因为算法的复杂性,还因为可能出现的场景具有多样性和可变性。即使在受控条件下,现代机器学习算法的特征和参数空间的复杂性也是巨大的。如果机器学习算法运行的场景描述不够准确、目标不够明确,其结果可能难以预测。坏消息是,当性能下降时,很难通过研究算法的内部行为解决甚至解释这种性能不足的问题。
近期一个问题有助于理解这种情况,即深度神经网络对对抗性噪声的敏感性。*近发现,尽管深度神经网络在各种任务中表现出色,但它们对所谓的对抗性样本非常敏感。Goodfellow等(2014)在一项图像分类任务中提出了一个简单的场景,即使用深度神经网络对输入图像进行分类(例如,手写数字或图像中物体类型)。在训练和测试数据集条件相似的任务中,深度神经网络表现非常出色。然而,通过添加对抗性噪声,即对输入图像进行可控的降级处理,深度神经网络的性能急剧下降。这个实验中*引人关注的事实是,对抗性噪声无法被人类观察者察觉,原始图像和有噪声的图像在人眼看来完全相同。此外,对抗性噪声欺骗深度神经网络的能力似乎在不同的数据集和深度神经网络架构中都有所体现,这揭示了深度神经网络在图像分类方面普遍存在的脆弱性。当然,在司法鉴定中很难通过操纵数据来添加这种干扰。不过,对抗性噪声是一个很好的例子,说明潜在的未知因素会导致基于人工智能的系统产生意外的结果,这也表明我们对此类系统缺乏了解。这对司法鉴定人来说是一个重要信息:即使像深度神经网络这样在受控条件下经过测试的算法,当数据集条件不同时,它仍可能以意想不到的方式失效。
不幸的是,司法鉴定条件总是非常多变、不受控且充满不确定性。对于任何机器学习算法来说,这都是非常具有挑战性且不利的情况,尤其是对深度神经网络等复杂人工智能算法的可靠性构成威胁。在这种情况下,机器学习领域必须不断改进,以便为各种可能与训练数据差异很大的实际数据场景提供解决方案。这包括将不确定性纳入模型、概率校准、域适应或迁移学习等策略。所有这些方法旨在使系统对不同数据集之间的差异以及数据稀缺更具鲁棒性。然而,在操作层面还需采取保障措施,例如由知识渊博的鉴定人员来操作该方法,并对每个案件进行单*验证。
正如世上没有永远不会失败的事物,我们必须认识到机器学习算法存在失败的可能性。声称系统永不失效既不现实也无助于建立信任。历史上令人痛心的失败案例如声纹鉴定错误(Gruber and Poza 1995)、Brandon Mayfield或Shirley McKie指纹误判案(Campbell 2011;the Inspector General 2006)等,都表明宣称“零错误”的司法鉴定方法将导致灾难性后果。相反,我们应明确说明一种方法在何种条件下可能失效及其失效程度。只有通过透明测试和性能量化报告才能建立可信度。这正是我们在司法鉴定中对机器学习和人工智能进行验证想要达成的目标。
一旦完成验证,*终需要决定的就是我们是否在特定法庭案件中使用该技术。此时的决策基于对算法性能的充分认知。正如生活中其他领域的决策逻辑一样,我们会在了解量化性能的前提下,承担使用该技术的风险。
2.1.1人工智能用于司法鉴定评估
我们将讨论范围限定在司法鉴定中机器学习的应用,深度神经网络是典型的黑箱复杂算法。而且,在所有的机器学习算法中,深度神经网络的改进速度*快,且在越来越多任务中表现出卓越的性能(LeCun et al.2015)。在司法鉴定的调查和评估环节中,机器学习的应用越来越广泛。例如,通过自动指纹识别系统(AFIS)对指纹和标记




















