美国使用COMPAS的一些州已经对COMPAS进行了验证研究,认为它是一个足够准确的风险评估工具。纽约州刑事司法服务局进行了一项研究,审查了COMPAS评估的重新犯罪量值的有效性和预测准确性,并得出结论认为:重新犯罪量值实用有效,并且预测准确性取得了令人满意的结果。与纽约州和其他州不同,威斯康星州尚未针对威斯康星州人口完成COMPAS统计验证研究。
另一方面,被告也找到了对风险评估工具的其他研究所提出的准确性方面的质疑。例如,他援引了2007年加利福尼亚管教和康复局的研究,结论是虽然COMPAS似乎在可以评估犯罪成因需求和再犯风险,但“几乎没有证据表明这是COMPAS实际评估的内容”。
加利福尼亚研究报告进一步得出结论,“没有明确的证据表明COMPAS可以由不同的评估者给出一致的评分,也没有明确的证据表明它可以评估其旨在评估的犯罪成因需求或者(非常重要的是)可以预测加利福尼亚管教和康复局囚犯的再次犯罪风险。”最终,该研究的作者没有推荐加利福尼亚管教和康复局针对个人使用COMPAS工具。
然而,随后加利福尼亚管教和康复局又发表了2010年关于加利福尼亚COMPAS验证研究的最终报告。2010年的研究得出结论,尽管并不完美,但“COMPAS是一个可靠的工具”。
除了这些问题之外,还有一些人担心风险评估工具可能会将少数群体犯罪者的比例过高地归类为更高的风险,包括家庭背景、教育和种族等各种不可控制的因素。
所以,威斯康辛州最高法院要求,使用风险评估工具的法域必须确保他们有资源、有能力维护这些工具并监控其持续准确性。
针对法院在量刑中使用所涉及的准确性问题,威斯康辛州最高法院决定使用COMPAS风险评估除了前文所述的限制之外,还必须遵守一些注意事项。具体来说,任何含有COMPAS风险评估的量刑报告都必须告知量刑法庭关于COMPAS风险评估准确性的以下注意事项:
COMPAS的专有保密性质导致无法公开披露风险评分到底如何确定以及评估因素的权重信息;
风险评估将被告与全国范围的样本进行比较,但对威斯康星州人口的交叉验证研究尚未完成;
对COMPAS风险评估分值进行的一些研究提出问题,质询是否存在少数群体犯罪者被不均衡地认定为重新犯罪高风险的情况;
随着人口结构的不断变化,风险评估工具必须不断监测和调整以维护准确性。这样,量刑法院才能够更好地判断风险评估的准确性并赋予风险分值适当的权重。
尽管如此,威斯康辛州最高法院明确认可了COMPAS风险评估的作用,并且援引了印第安纳州最高法院观点:这些工具有助于法院衡量所有量刑因素。与此同时,COMPAS风险评估依据群体数据判断高风险罪犯群体,而不是特定高风险的个人;所以,量刑法院针对每一个被告个体在考虑所有量刑因素时都应当注意这一点,而且COMPAS风险评估不能构成量刑的决定性因素。
算法=正义?元芳,你怎么看?
科技的进步在挑战社会的每一个细胞,包括经济、政治和生活方式等方方面面,就连司法体系这些维系社会公平和正义的社会机制也不例外。当算法工具这样的科技成果逐渐浸入司法实践中甚至影响量刑这样重要的国家行为中时,难免让人开始担忧是否真的在不远的未来,AI驱动的智能机器等技术工具不仅仅是协助性介入司法机关对法律的解释和执行,甚至逐步发挥更加重要的主导作用。
换句话说,人类会将同类的命运或者公平正义等核心价值的落实交给人类发明创造的算法等技术工具吗?
美国联邦最高法院大法官罗伯茨听起来保持着开放的态度,而且越来越多的法院也在拥抱技术的进步,威斯康辛州最高法院在这个案子中就这样乐观且务实地评论:
在量刑过程中分析使用以证据为基础的风险评估工具,务必考虑到诸如COMPAS等技术工具的变化和演进。我们今天面临的担忧,今后可能会随着工具的完善得到缓解。刑事司法系统应该认识到,在未来时间里,可供使用的研究数据会越来越多,各种各样更好的工具将会被开发出来。随着数据的变化,司法部门使用的工具也必须随之改变。司法部门必须跟上研究的步伐,必须不断评估这些工具在司法实践中的使用。
最后,无论你愿意或是不愿意,司法拥抱科技进步的明天已经到来,至于公平、正义、效率等社会价值目标在司法拥抱技术之后最终究竟会茁壮成长还是黯然失宠?我们拭目以待。
元芳,你怎么看?