为什么人类可以犯错，但机器不行？

在人工智能（AI）技术还没火之前，计算机科学家亨利·利伯曼（Henry Lieberman）曾邀请我去麻省理工学院参观他的实验室。亨利痴迷于“AI缺乏常识”这个观点。为此，他与同事凯瑟琳·豪沃希（Catherine Havasi）和罗宾·斯皮尔（Robyn Speer）一直在网络上收集常识性内容，来分析人类对常识的理解和推理过程，期望找到增强AI通识能力的方法。

诸如“水（和雨都）是湿的”或“爱（和恨都）是一种感觉”之类的常识，对人类来说显而易见，但机器却难以掌握。这也是人工智能的一个难点，学者们仍在试图理解，为什么理解常识对机器而言如此困难。那天，亨利激动地向我展示了一张图表。

他们通过主成分分析（PCA）的方法，将收集的常识性词语集进行多维度的分析和压缩，将最终得出两个最能差异化区分所有词语的维度，设置为了横轴和纵轴，“爱”、“水”和“感觉”之类的词就散布在这张图上。

亨利说：“用PCA来分析常识性的认知，就像是用数学方法试图回答一个古老的哲学问题：人类的知识到底是什么？”我问他这些轴都代表什么含义，卖完关子后，亨利揭晓了答案：最能区分常识性概念的第一个维度，是好与坏。

事后看来，这个规律似乎显而易见。我们每天都会在认知事物和交流沟通中进行无数的好坏评判。我们说天气有“好”和“坏”。我们要寻找更“好”的工作。我们喜欢“好”的音乐，不喝“坏”的酒。然而，人们尚能理性地看待某人袜子上有个洞无伤大雅，跟他的道德无关，但我们却常常在语言中忍不住滥用道德批判。亨利的图表证明了人类语言中普遍存在着好坏评判，这种道德评判也隐含在常识性知识的理解和推理中。

如今，AI和开发它的人会遭受很多批评。人们愤怒往往是有道理的。AI曾经陷入多起科技丑闻，比如给照片分类时出错，面部识别出错导致无辜的人被捕，或者在评估再次犯罪时具有明显的偏见，以及翻译中存在与性别相关的刻板语句。在大多数情况下，AI界的研究人员都会倾听群众的意见。时至今日，研究人员已经很清楚AI的这些问题，并在积极努力地解决。

随着激烈的争论渐渐过去，值得思考的不仅是AI是“好”还是“坏”，还有批判AI失误时人们展现出来的道德。毕竟，AI伦理也是人类制定的，我们才能做出判断。

在过去的一段时间里，我和我的团队一起做了几十个实验。在这些，我们招募了几千名受试者，要求他们在实验中对人类和AI的行为做出反应。这些实验包括一些场景，如人类或机器使用挖掘机不小心挖开了一个坟墓，或者监视着海啸预警系统，却未能及时向沿海城镇发出警报。

这样的比较使我们能够超越单纯由人评判AI的局限，去观察人们在判断机器和人类行为时有什么区别。这种差异看似微妙，但它迫使我们用一个更现实的参照标准来评判机器行为。过去，我们倾向于用一个完美的标准来衡量AI，而没有对比过如果人类发生同样行为，造成相同的后果后，大家是如何反应的。

早期的数据已经清晰地表明，人类对人和机器行为的反应并不相同。

例如，在发生意外时，人们对AI的宽容度要低于人类，尤其是当AI造成实质性伤害时。基于几千个数据点，我们可以更深入地研究这些问题，通过建立一个统计模型来解释人们是如何评判人类和机器的。该模型成功预测了人们如何根据造成的伤害以及错误方的“故意程度”打分。令我们惊讶的是，该模型表明，人们对人类的道德批判并不比对AI更轻，只不过我们使用了不同类型的道德要求来评判二者。

下面的这张图总结了这一发现，蓝色和红色平面分别显示了人们如何评判其他人和机器的行为（平均值）。你可以清楚地看到，平面是不平行的，红色和蓝色平面之间存在偏移。这是因为，在评判机器时，人们似乎更关心事件的结果，即事件带来的伤害程度。这就是为什么红色平面几乎完全沿着伤害维度增长的原因。但是当人们评判他人时，我们在蓝色平面发现了一个曲率。这一次，增长是沿着伤害和意图（故意程度）平面的对角线上升的。

这就解释了为什么在发生意外的情况下，人们对机器的评判更加严厉；人们采用结果主义的方法来评判机器，意图无关紧要，但评判人类时则不是这样。

这个简单的模型让我们得出了一个有趣的结论，人们会基于一个经验原则来评判机器与人类的行为，简而言之就是：“人们根据动机评判人类，根据结果评判机器。”但这些实验对我们认识人们的道德直觉有什么启示呢？首先，这些实验告诉我们，人们的道德理念并非固定不变。

我们可能会告诉自己，我们是有原则的人，但事实是，我们的判断常会根据判断的人或事物而发生变化（简称双标）。这种摇摆不定的道德标准，并不仅局限于评判人类和机器行为时。我们在道德上摇摆不定，或并非因为偏袒某一群体那么简单。如果人们只支持人类而不是机器，那么红色和蓝色平面就会平行，但结果却并非如此。这意味着人们不是只喜欢人类而不喜欢机器，只是我们对人和机器的判断不同。

相比于用结果主义道德评判机器，我们对人类同胞有着讲道义或更康德式的道德评判标准。但最重要的一点可能是，我们能通过训练机器的技术来了解人类的道德。在我的研究中，我们通过建立一个简单的，多维度的道德评判模型来了解人类道德的好恶。在亨利等人的研究中，他们通过流行的“降维技术”分析和了解了人类常识中的道德。在告诉我第一个维度是“好与坏”之后，亨利让我猜第二个轴代表了什么。

“易与难，”他说，“简单地说，所有的常识知识都是关于什么是‘好’的或者‘坏’的，以及什么是‘容易’的或‘困难’的。其余的都不重要。”