在社交网络上,患有抑郁的人会大量使用第一人称代词我(I、me)或是我的(mine),这说明抑郁症病人的思想常被他们自己的痛苦占据;而有过心理创伤的人,常会使用表达因果关系的词汇(因为、所以、但是),因为他们试图理解创伤,把它们纳入到一个更有条理的叙述中。利用这些信息,科学家可以预测社群健康,甚至预测个人疾病的诊断信息。
2010年谷歌时代精神论坛当晚,积极心理学之父马丁·塞利格曼(Martin Seligman)出现在了一群技术巨头之中,他是论坛演讲嘉宾之一。此时,谷歌刚刚开创了用搜索引擎追踪美国流感传播的新方法,谷歌地图也正风靡世界。这些技术广阔的应用前景让塞利格曼和谷歌创始人拉里·佩奇(Larry Page)凑到了一起,讨论更多的可能性。他们在思考,谷歌监测流感趋势的工具能否用来描绘美国人的心理健康状态?
通过分析人们在社交媒体上所使用的语言,电脑算法是不是也可以预测人们的快乐和幸福感在时间和空间上的变化?
在那之后的几个月,我与塞利格曼,还有他在宾夕法尼亚大学的同事们一起,联合谷歌公司的慈善部门Google.org启动了世界幸福计划(WWBP)。自此,这个由心理学家、计算机科学家、统计学家和应用开发人员组成的跨学科团队很快就发展起来了。迄今为止,这个团队的13名科学家已与全世界的政府和组织机构开展了45项合作。
2015年1月,我的团队发表了第一项研究成果,证实了之前提出的想法。通过对全美1300个县、1亿条推特(Twitter)信息的分析,我们发现,一个地区的负面信息——特别是那些表达愤怒和仇恨的信息——能预测该地区的心脏病死亡率。接下来的一系列研究也表明,在推特或脸书(Facebook)上发表的内容与人们的年龄、性别、性格、收入水平、精神疾病还有生理疾病都密切相关。
这些结果表明,社交媒体数据对心理学家、社会学家和流行病学家来说,都是一项丰富的资源。他们可以从中挖掘出有价值的信息,预测社群健康,甚至预测个人疾病的诊断信息。然而在巨大机遇的背后,这一飞速发展的领域也有自己的阴暗面。在分析人们在社交媒体上所说的话时,只依靠统计学方法,但统计分析的结果会揭露很多东西,以至于其他情报机构、政客和商人(例如市场营销和保险公司)也会像科学家一样,对这些数据产生浓厚兴趣。
然而,很少人了解,在应用计算机算法后,这些机构能从脸书和推特上人们的日常行为中,挖掘出多少信息。
推文透露的机密。在WWBP团队开始分析推特,预测健康趋势之前,谷歌已经迈出了第一步。2008年,谷歌的健康策略官罗尼·泽戈尔(Roni Zeiger)和同事合作发起了谷歌流感趋势(Google Flu Trends)项目。
这个项目主要关注人们如何在谷歌上搜索流感的症状与治疗方法,以及搜索时他们所在的地理位置,从而实时追踪流感的传播趋势。值得注意的是,泽戈尔团队对于流感季节性的判断和美国疾病控制与预防中心(CDC)的统计数据吻合。不过谷歌的信息更及时,因为他们不像CDC那样,需要医生和医院报告之后,才知道流感何时在何处爆发。
去年谷歌暂停了流感趋势项目,但这个项目展示了通过搜索结果监测疾病传播的可能性,并开创了数字流行病学(digital epidemiology)。最近,一些新的研究也开始探索如何利用搜索结果追踪其他疾病,比如登革热、疟疾和性传播疾病。
用推特预测心脏病。图1中的数据来自CDC,它真实地反映了动脉粥样硬化的死亡率,图2中的数据来自推特,在分析过1300个县市的样本数据后,预测数据与CDC数据非常一致。通过分析推文中情绪激愤的文字(比如咒骂或者使用“仇恨”)后,我们预测了全美因心脏病引发的死亡率(如大图所示)。
理解整个人群的心理状态比追踪疾病更复杂,因为很少有人会在网上像搜索如何治感冒一样搜索“我很快乐”。因此,我们只能侧面分析人们在社交媒体上发表的内容。数十年的研究已经揭示了人们日常对话与心理状态之间的密切关系,而心理状态又与身体健康密不可分。压力、负面情绪、焦虑和抑郁都会损害我们的免疫系统和心血管系统,正面和乐观的情绪则会保护我们远离冠心病等疾病,提高预期寿命。
20世纪90年代开始,任教于得克萨斯大学奥斯汀分校的社会心理学家詹姆斯·潘纳贝克(James Pennebaker)和同事就开始探寻人类语言和身心健康之间的关系。他们想知道,为什么在受到创伤后采用表达性写作(expressive writing),记录下事实的人,会比那些保守创伤秘密的人恢复得更好。为了记录下受试者写了什么,他们使用了一种计算机程序,快速标记文章中包含的词汇和概念。
潘纳贝克意外地发现,无论是正面还是负面的词汇和想法,写作内容本身和受试者的精神健康没有太大的关系,一些功能性的语汇在其中扮演了重要角色。比如,患有抑郁的人并不会写很多悲伤的事情,却会大量使用第一人称代词:我(I、me)或是我的(mine)。这说明,抑郁症病人的思想常被他们自己的痛苦占据。他们还发现,创伤症状常常随着表达因果关系的词汇(因为、所以、但是)和复杂词汇的增加而改善。
这些模式表明,病人试图理解创伤,把它们纳入到一个更有条理的叙述中。
在过去10年中,脸书、推特兴起,能够用于语言分析的数据也在飞速增长,这为心理学家了解社交媒体用户的心理健康状况打开了一扇新的窗口(一般来说,我们的工作都会征得脸书用户的同意,并且将数据匿名化)。
当然,人们在网上往往会展示一个举止行为良好、生活丰富的自我,研究者们称这种现象为社会赞许性偏差(social desirability bias )。不过这种偏差并没有我们想象的大,脸书上只与真实好友交流的用户,在网上也能保持较为真实的自我,而真实世界的熟人朋友也知道他们的生活并不是只有野餐和派对。此外,由于每个人都会受到这种偏差的影响,所以借助算法可以区分人群间的真实差异。
为了支持这种观点,我们可以对比两种预测结果,一种来自社交媒体,一种来自传统方法收集的数据(电话调查、医院报告等更有代表性的群体)。令人吃惊的是,这两种方法的结果相差无几。
把握核心原则。充斥了俚语和表情符号的社交媒体语言给数据分析带来了许多挑战。如今,多亏过去30年间自然语言处理技术的发展,我们才能从中提取出有意义的信息。随着计算机运算能力呈指数级提升,使用统计模式识别算法或机器学习分析语言也成为了可能。这些工具在近年来飞速发展,支撑了苹果公司的Siri和谷歌公司的分析软件,也能让你在邮件中收到的广告,更符合你的需求。
在这些技术发展之前,心理学的语言分析更多基于简单的词典方法(dictionary-based approaches)。在这种方法中,人的情绪状态由一系列相关的词汇来定义。如果一段话中出现了“高兴”,就意味着写作者处于积极的情绪。但由于语言本身的模糊性,这种方法有时会带来令人困惑的结果。
早期的一些研究就曾将心理学家编制的“积极情绪”词典应用于社交媒体信息,结果基于人们在元旦时相互祝贺“新年快乐”的祝词,而做出了人们元旦当天更快乐的错误判断。
现代的机器学习方法就避免了这种错误。他们不对词语和情绪、个性的关系做任何先验假设,而是根据聚合、统计、打分、区隔词语的方法从头“学习”词语与情绪的关系。这种方法的缺点在于,分析所需要的数据量至少要在5000到10 000个用户。当然,数据越多,就能越好地从充满噪音的日常内容中挖掘微弱的信号。好在现在大多数社交媒体网站都拥有百万级的用户量供我们分析。
2013年,我和塞利格曼、任教于石溪大学的安德鲁·施瓦茨(Andrew Schwartz)等人一起发表了一项研究报告。我们用机器学习方法分析了75 000名脸书用户发布的7亿条词语,同时让他们接受了一项性格量表测试。迄今为止,这是史上规模最大的一项关于语言和人格关系的研究。通过人们在脸书上发表的大量文字和性格量表的测量结果,机器学习算法可以计算出语言和性格特质之间的关系。
通过这项研究,我们得到了与外向型和内向型人格、神经质和稳定型人格相关的词汇集。我们发现,有些很少被人使用的词汇能够准确预测人们的性格特质,例如“抑郁”就是神经质人格的一项显著指标。虽然我们得到的关联结果大部分比较合理,但其中也有例外。也许你觉得,和外向性格有关的词包括“派对”,和内向性格有关的词包括“电脑”,这并不奇怪,但是,你或许会惊讶,为什么在神经质上得分较高的人会经常使用“显然地”?
为什么情绪更稳定的人会发表更多与运动有关的信息?内向的人为什么对动漫和表情符号等日本文化元素更感兴趣?在后续的一项研究中,我们的同事格雷戈里格·帕克(Gregory Park)根据脸书上用户的发帖,利用算法预测了他们的性格。这项算法的准确性甚至比受试者的朋友对前者的推测更精准!通过这项研究,可以更自信地说,我们已经很好地解决了“社会赞许性偏差”的问题了。
我和同事一起,采用上述方法,在没有敲开受试者房门的情况下,分析了美国1300名推特用户的“心理档案”。结合美国CDC的死亡原因和死亡数量统计,我们发现,在推特上表达更多愤怒、敌意等负性情绪的地区,心脏病的致死率更高,而在“乐观”地区,心脏病的致死率更低。进一步的分析发现,这项结论对冠心病的预测特别准确。冠心病是美国人的头号杀手,它的发病率和心理因素密切相关。
推特如何反映心脏病风险。在一项对美国不同县市的分析中,我们发现,负面信息(由红字显示)和心脏病发病率有正相关。经常讨论乐观话题(由绿字显示)的社区心脏病发病率更低。我们还发现,感情强烈的词汇与冠心病相关。冠心病是美国致死率最高的疾病之一,常被被认为和心理因素有关。
有趣的是,发推特的人往往没有生命危险。
目前,这种方法无法预测个人患冠心病的风险,关注重点也是整个推特呈现出的趋势——往往是年轻人发表的信息——与整个社区心理健康状况的关系。这些信息很有可能预测了社区社会学家所称的社会凝聚力(social cohesion),也就是社区成员是否愿意互助协作的意愿。研究表明,社区凝聚力和社区居民的心理及生理健康息息相关。
在现有的研究中,我们将继续使用这种方法摸索词语的使用和其他致死性因素(如癌症和中风)之间的关系,也期待能看到更积极的结果:富有凝聚力的社区也会幸福。
建立健康数据平台。此前,很多政府试图通过统计数字预测疾病(例如肥胖、糖尿病、吸烟和高血压)的死亡风险。和这些研究相比,我们通过分析推特,预测社区心脏病致死率的正确率更高。即便在控制了一些重要的预测因素(如教育和贫困率)后,这项基于语言模式的预测模型,仍然有出色的表现。
此外,我们的预测还会随着社交媒体用户的增加变得更加精准。10年前,只有很少人使用脸书,大部分用户还是青少年。
然而,在2015年10月,皮尤研究中心发布的一项调查显示,65%的美国成年人经常使用社交媒体,这一比例是2005年的10多倍。该调查还显示,90%的年轻人会使用社交媒体,而65岁以上成人的使用率从2010年以来翻了3倍。现在,推特用户的平均年龄是32岁——比美国全国人口年龄的中位数只年轻6岁。
在获取样本时,CDC的行为风险检测系统和盖洛普调查会面临各种问题,基于推特和脸书的健康监测却可以为社区的健康水平提供更便宜、更快速的预测。现在,我和同事正在做一项有趣的工作,为英国高校、澳大利亚南部和西班牙联邦政府提供基于推特的健康趋势追踪咨询服务。在下一次人口普查当中,这些地区很可能就会询问人们的社交媒体账号了。
对于很多国家来说,通过电话网络做问卷调查越来越难,社交媒体自然而然地成了新的解决方案。
分析社交媒体的文本,或许可以帮助临床心理学家对病人做有针对性的治疗。我们研究团队中的丽莉·安格(Lyle Ungar)、莱纳·曼彻特(Raina Merchant)和宾夕法尼亚大学医学院的同事一起,在宾大校医院的急诊室里通过iPad做了一项研究。
自愿参与研究的急诊室病人登陆他们的脸书账号,并提供帐号上的文本给研究者使用。这样一来,我们就可以使用机器学习的方法,在他们的语言习惯和医疗纪录之间建立关系,从中挑出很多疾病(例如抑郁症)的语言征兆。在不久的未来,医生或许就可以根据人们在社交媒体发布的内容,判断对方是否出现了疾病的“预警信号”,从而适当对病人进行跟踪诊疗。
通过手机应用分析日常语言,提高医疗水平,这种想法并不遥远。
设想一下,一位心理治疗师可以自动接受抑郁症病患的每日情绪报告,并给他发送关键提醒、提示或者紧急建议。医生也可以通过社交媒体检测到心脏病患者的抑郁前兆,从而防止心脏病复发。2013年,微软研究员就用推特预测了376名新妈妈的产后抑郁症。通过分析这些女性在生产前发布的文字,这项预测的准确率达到了71%,再加上产后几周的数据,预测的准确率更是高达80%。
然而,保险公司和借贷公司可能也会偷偷使用类似的社交媒体分析法,用作拒绝服务或是提高贷款利率的借口。但在我们的研究中,已事先征得了受试者的同意,并严格遵循着隐私原则。不过,只有很少有脸书用户意识到,通过他们发布的文字,甚至是“点赞”行为,任何公司都能用相关技术,分析出他们详尽的性格特征。
社会的进程必须和新科技一起前进,而这需要科学、政策和工业界的共同努力,才能把技术引导到正确的方向。我们会继续发掘社交媒体分析在健康和身心健康方面的应用,通过努力共同建设一个更自觉,更道德,对人类生命更有意义的未来。