荣获2014年奥斯卡最佳原创剧本奖的电影《她》中,描述了这样一个科幻爱情故事:心思细腻而深邃的男主角爱上了他的操作系统。通过分析他的数字记录,他的计算机比其他人(包括他长期的女朋友和最亲密的朋友)能更好地理解他,并对他的想法做出回应。电影中的故事虽发生在2025年,但这是否可能会成为现实呢?
最近一项研究显示,计算机模型作出的人格判断的确比熟人(包括朋友、家庭成员、配偶和同事等)的判断更准确。研究论文[1]于1月13日发表在《美国科学院院刊》(PNAS)上。果壳网科学人就此对论文作者,剑桥大学的吴又又以及斯坦福大学的米哈尔·科辛斯基(Michal Kosinski)进行了采访。在社会生活中,判断别人的个性是一项非常重要的技能,因为个性是隐藏在人们行为和情绪背后的一个关键驱动因素。
人们常通过个性判断来做出决定和计划,比如和谁交朋友、结成伴侣、信任谁、聘用谁或者选谁作总统等等。一开始的判断越准确,后面做出的决定也越正确。之前人们认为,准确的个性判断来自人类大脑的社会认知技能。但是近来研究表明,计算机模型可以通过人类行为的数字记录,对个性做出准确判断[2-3]。那么,计算机和人类的判断,到底哪个更准确呢?研究中共收集了86,220名志愿者的信息。
志愿者被要求填写有关大五人格模型的个性调查问卷,进而得出了他们在开放性、尽责性、外向性、宜人性和神经质这5个方面的个性特征。计算机做出的人格判断则是以70,520名志愿者的脸书点赞数据为基础的,而点赞被认为可以有效地预测人的个性和其它心理特征[2]。比如,给某个品牌或者产品点赞可以代表消费者的偏好和购买行为;音乐相关的点赞可以透露音乐品味;点赞的网站则可以代表网页浏览行为。
而来自他人的判断则由志愿者的好友完成,他们需要填写由10个项目组成的个性量表。
通过将参与者的自我评定与计算机及他人的判断进行比较,研究人员首先检测了这两种判断的自评-他评一致性(外部判断和自我评定的一致性)。因为自评-他评一致性受人际关系的持续时间和形式的影响很大,因此研究人员又进一步将“他人”分成了不同的小类别,分别为朋友、配偶、家人、同居者和同事。
结果显示,计算机模型仅需要100个点赞数据,其准确性就可以超过他人的平均值(蓝点);和同事、朋友/同居者、家人和配偶的判断相比,计算机模型分别需要10、70、150和300个点赞,就可以在准确性方面超过他们。
研究人员表示,点赞可以代表行为、态度和偏好。比如,有着高开放性的志愿者倾向于给萨尔瓦多·达利(Salvador Dali)、冥想或者TED演讲点赞;而具有高外向性的志愿者则倾向于给派对、史努基(Snookie,真人秀明星)或者舞蹈点赞。吴又又告诉科学人:“这次研究中,我们仅仅检测了大五人格特征。我们认为计算机模型完全有可能在判断其他人格特征方面,也有更好的表现。
但是,我并不会说计算机模型就一定会更好,因为对某些特征做出正确判断需要更微妙的线索,而这在数字环境中是没有体现的。我们可以拿情商(EQ) 作为例子说明这一点:对人来说,利用面部表情或者肢体语言等信息来判断他人是否在社交中感到尴尬,或者是否对别人产生了共情是相对容易的;但至少从目前来看,这种信息在数字环境中是很难体现的。”
吴又又表示,该研究最实际的应用包括将该算法应用到有着脸书使用者身上——当然是在他们同意的情况下。这样,就可以绘制出使用者的个性特征图谱,而这个图谱可以进一步在其他方面使用。针对计算机个性判断是否存在风险,论文作者之一的科辛斯基告诉我们:“个性判断和其他任何技术一样,在道德上是中立的。就像一把刀,我们可以用它来改善生活,也可以用它来伤害我们自己。
当然,我们需要小心行事,因为这项技术涉及的范围很大,很多人能从中受益,或受害。因此,我们应该采取一些政策或者技术,来将风险降到最低。在此,有两个原则可以指导我们:透明和受控。首先,我们需要帮助使用者知道,他们有哪些个人数据正被如何使用及可能被如何使用;其次,我们需要让使用者能够控制他们的数据,并决定这些数据可以被用来做什么。
做到这两个方面在技术上并不困难,但是落实它们则需要使用者意识到问题本身的存在——也许还需要加上政策制定者的推动。”