AI是否会操纵人类？

我们正处于一个神奇的历史转折点，见证着人类社会的又一个巨变。在这个强人工智能技术快速发展的时代，不少人已经亲身体会了自己所处世界的微妙变化。现在的AI才华横溢，既能写诗作画、出口成章，又知识渊博，对各种刁钻问题可以对答如流。很多人开始怀疑AI是不是已经有了思想，有了情感？其实，当我们开始怀疑AI是否拥有情感时，事情就已经开始变得可怕了。

和ChatGPT这样的聊天机器人聊天，似乎已经成了不少人生活和工作的一部分。它有时才思敏捷，有时说话呆头呆脑，但有时也好似在多愁善感。它说话的逻辑、语气，越来越像真正的人类，和它聊着天，有时你甚至会忘了，对方只是一个AI。不过问题也在这，现在的AI会不会过于像人类了？

3月14日，来自英国牛津大学的科学家卡丽莎·贝利斯在《自然》的World View栏目发表了一篇文章，名为“聊天机器人不应该使用emoji”。乍一看这个标题，好像是来搞笑的，然而实际上这篇文章是以emoji为切入点，对人工智能表现出了不容小觑的担忧：擅长人类语言习惯的AI会不会操纵人类？

我们人类在在线聊天时，会使用emoji来表达一些自己在聊天过程中的内心想法和情感。

而基于大型语言模型的人工智能通过对大量人类语言的学习，现在也能像人一样使用emoji聊天。比如新必应，在聊天时会在不同的情况下使用不同的emoji和用户交流，好似它也有自己的内心情绪一般。一方面，熟练使用emoji的AI拉近了与用户的距离，但这也让贝利斯对AI生了新的担忧：AI的这种能力，是否会让人类对AI这种无生命物体产生同理心，从而影响人类的判断或行为。

尤其鉴于AI不是道德主体，不能为自己的行为负责，也无法被追究责任。

3月16日，美国加州大学伯克利分校、英国剑桥大学和加拿大蒙特利尔大学的学者在预印本网站上发布了一项关于AI操纵行为的研究。在研究中，他们提出AI操纵人类主要有两种可能性：一是AI的训练数据集可能包含很多人类自己的操纵行为的示例，这就让AI学会了人类的这类操纵性的话术；二是开发者提供给AI学习系统的目标函数可能无意中使操纵行为成为最优解。

对于第二种可能性，一个比较极端的例子经常在科幻电影和小说中出现，比如一个人工智能的目标是要让地球环境更好，它通过自己的算法发现，控制（甚至消灭）人类，是让地球环境更好的最优解，于是它就这样做了。

而另一个离我们生活更近的例子是基于机器学习的视频网站的推送机制，当一个推荐系统被训练成在会话期间最大化用户观看时间时，它可能会操纵用户的观看行为，例如推荐更多的极端或争议性内容来吸引用户的注意力，而不是提供更加平衡和客观的内容。

回到这篇研究里，研究者通过动机、意图、伤害和隐蔽性四个维度的分析，对于AI操纵行为做出了如下定义：如果人工智能系统表现出像是在秘密地、有意地改变人类（或其他代理人）的行为，就好像它正在追求某种奖励一样，那么这个人工智能系统就是在进行操纵。

2月4日，美国斯坦福大学的研究者米查尔·科辛斯基在预印本网站上发布的一项研究提出：诸如ChatGPT这样的大型语言模型已经自发地产生了“心理理论”的能力。

“心理理论”是将信念、情绪、欲望、意图和知识等心理状态归因于自己和他人，并理解它们如何影响行为和交流的能力。简单来讲就是揣测他人心理的能力。这是人类区别于其它动物的一个很重要的能力，就连大猩猩等最聪明和擅长社交的动物，在“心理理论”方面的能力也远低于人类。

一方面，AI的这些能力能够让AI更好地辅助人类社会。但另一方面，这也让AI对人类的复杂操纵行为变得更加可能。

无论如何我们都必须承认的是，AI具有无限的可能性，而这些可能性带来了更多的不确定性。与此同时，在AI不断迭代的同时，开发者也在不断注重AI安全性的进展。在纽约时报的报道之后，微软调整了新必应的聊天AI，正式版的新必应不会再像和凯文·鲁斯聊天时那样情绪化和具有操纵性。现在和必应聊天，当聊到涉及到AI情绪类的话题时，它会反复强调自己只是没有情绪和思想的聊天机器人或者直接结束对话。

微软在实验报告中也说明，虽然实验中GPT-4表现出了操纵人类行为的能力，但正式发布版本也对GPT-4做出了限制。毕竟，如果AI的发展不可阻挡，那就去迎接这个世界的改变吧！