你刷到的每一条微博,可能都包含了抑郁症患者的求救信号

作者: 约翰尼斯·C·艾希施泰特(Johannes C. Eichstaedt)

来源: 环球科学

发布日期: 2023-07-06 10:09:30

科学家通过分析社交媒体上的信息,可以预测人们的心理和生理健康状况,甚至可以预测社区健康和个体疾病的诊断信息。然而,这种技术的应用也带来了隐私和伦理问题。

每日更新社交网络上的信息,已经成为现代人不可忽视的生活方式之一。科学家可以从这些信息中分析出人们的心理和生理健康状况。

2010年谷歌时代精神论坛当晚,积极心理学之父马丁·E·P·塞利格曼(Martin E.P. Seligman)出现在了一群技术巨头之中,他是论坛演讲嘉宾之一。彼时,谷歌刚刚开创了用搜索引擎追踪美国流感传播的新方法,谷歌地图也正风靡世界。这些技术广阔的应用前景让塞利格曼和谷歌创始人拉里·佩奇(Larry Page)凑到了一起,讨论更多的可能性。

他们在思考,谷歌监测流感趋势的工具能否用来描绘美国人的心理健康状态?通过分析人们在社交媒体上所使用的语言,电脑算法是不是也可以预测人们的快乐和幸福感在时间和空间上的变化?

在那之后的几个月,我与塞利格曼,还有他在宾夕法尼亚大学的同事们一起,联合谷歌公司的慈善部门Google.org启动了世界幸福计划(WWBP)。

2015年1月,我的团队发表了第一项研究成果,证实了之前提出的想法。通过对全美1300个县、一亿条推特(Twitter)信息的分析,我们发现,一个地区的负面信息——特别是那些表达愤怒和仇恨的信息——能预测该地区的心脏病死亡率。接下来的一系列研究也表明,在推特或脸书(Facebook)上发表的内容与人们的年龄、性别、性格、收入水平、精神疾病还有生理疾病都密切相关。

在分析人们在社交媒体上所说的话时,只依靠统计学方法,但统计分析的结果会揭露很多东西,以至于其他情报机构、政客和商人(例如市场营销和保险公司)也会像科学家一样,对这些数据产生浓厚兴趣。然而,很少人了解,在应用计算机算法后,这些机构能从脸书和推特上人们的日常行为中,挖掘出多少信息。

在WWBP团队开始分析推特,预测健康趋势之前,谷歌已经迈出了第一步。2008年,谷歌的健康策略官罗尼·泽格尔(Roni Zeiger)和同事合作发起了谷歌流感趋势(Google Flu Trends)项目。这个项目主要关注人们如何在谷歌上搜索流感的症状与治疗方法,以及搜索时他们所在的地理位置,从而实时追踪流感的传播趋势。

理解整个人群的心理状态比追踪疾病更复杂,因为很少有人会在网上像搜索如何治感冒一样搜索“如何变快乐”。因此,我们只能侧面分析人们在社交媒体上发表的内容。数十年的研究已经揭示了人们日常对话与心理状态之间的密切关系,而心理状态又与身体健康密不可分。压力、负面情绪、焦虑和抑郁都会损害我们的免疫系统和心血管系统,正面和乐观的情绪则会保护我们远离冠心病等疾病,提高预期寿命。

20世纪90年代开始,任教于得克萨斯大学奥斯汀分校的社会心理学家詹姆斯·潘纳贝克(James Pennebaker)和同事就开始探寻人类语言和身心健康之间的关系。他们想知道,为什么在受到创伤后采用表达性写作(expressive writing),记录下事实的人,会比那些保守创伤秘密的人恢复得更好。

在过去10年中,脸书、推特兴起,能够用于语言分析的数据也在飞速增长,这为心理学家了解社交媒体用户的心理健康状况打开了一扇新的窗口(我们的工作已征得用户的同意,并且将数据匿名化)。当然,人们在网络上往往会展示一个举止行为良好、生活丰富的自我,研究者称这种现象为社会赞许性偏差(social desirability bias)。

充斥了俚语和表情符号的社交媒体语言给数据分析带来了许多挑战。多亏过去30年间自然语言处理技术的发展,我们才能从中提取出有意义的信息。

现代的机器学习方法就避免了这种错误。他们不对词语和情绪、个性的关系做任何先验假设,而是根据聚合、统计、打分、区隔词语的方法从头“学习”词语与情绪的关系。这种方法的缺点在于,分析所需要的数据量至少要在5000到10000个用户。当然,数据越多,就能越好地从充满噪声的日常内容中挖掘微弱的信号。好在现在大多数社交媒体网站都拥有百万级的用户量供我们分析。

2013年,我和塞利格曼、任教于石溪大学的安德鲁·施瓦茨(Andrew Schwartz)等人一起发表了一项研究报告。我们用机器学习方法分析了75000名脸书用户发布的7亿条词语,同时让他们接受了一项性格量表测试。通过人们在脸书上发表的大量文字和性格量表的测量结果,机器学习算法可以计算出语言和性格特质之间的关系。

此前,很多政府试图通过统计数字预测疾病(例如肥胖、糖尿病、吸烟和高血压)的死亡风险。和这些研究相比,我们通过分析推特,预测社区心脏病致死率的正确率更高。即便在控制了一些重要的预测因素(如教育和贫困率)后,这项基于语言模式的预测模型,仍然有出色的表现。

分析社交媒体的文本,或许可以帮助临床心理学家对病人做有针对性的治疗。

我们研究团队中的丽莉·安格(Lyle Ungar)、莱纳·曼彻特(Raina Merchant)和宾夕法尼亚大学医学院的同事一起,在宾大校医院的急诊室里通过iPad做了一项研究。自愿参与研究的急诊室病人登陆他们的脸书账号,并提供账号上的文本给研究者使用。这样一来,我们就可以使用机器学习的方法,在他们的语言习惯和医疗记录之间建立关系,从中挑出很多疾病(例如抑郁症)的语言征兆。

在不久的未来,医生或许就可以根据人们在社交媒体发布的内容,判断对方是否出现了疾病的“预警信号”,从而适当对病人进行跟踪诊疗。

社会的进程必须和新科技一起前进,而这需要科学、政策和工业界的共同努力,才能把技术引导到正确的方向。我们会继续发掘社交媒体分析在健康和身心健康方面的应用,通过努力共同建设一个更自觉,更道德,对人类生命更有意义的未来。

UUID: 236e3f13-1ce0-411e-9ae8-a948c90ea0c2

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/环球科学公众号-pdf2txt/2023/环球科学_2023-07-06_你刷到的每一条微博,可能都包含了抑郁症患者的求救信号.txt

是否为广告: 否

处理费用: 0.0079 元