患有抑郁症的人易于出现适应不良的思维模式,即认知扭曲,从而以一种过度消极和不确切的方式思考自己、世界和未来。这些扭曲现象与个人情绪、行为和语言的显著变化息息相关。近日发表在《美国科学院院报》的一篇论文中,一支研究团队假设,社会集体心理也会发生类似的变化,这些变化反映在语言使用的历史记录中。
他们调查了过去125年里超过1400多万本书中认知扭曲的文本标记的普遍性,观察到自20世纪80年代以来,认知扭曲的文本激增,甚至超过了大萧条和两次世界大战期间的水平。研究结果表明,近年的社会经济变化、新技术和社交媒体可能与认知扭曲的激增有关。抑郁症是世界范围内造成残疾负担的主因之一。一些证据表明,在过去几十年里,由抑郁症致使的残疾病例呈现上升趋势,尤其在青年群体中。
社会中的人们面临着如战争、政治动荡、经济崩溃、粮食不安全、不平等和疾病等诸多压力源,随着时间的不断推移,整个社会是否会变得或多或少的抑郁呢?考虑到正式的诊断标准是在40年前引入的,这些标准很可能早已发生了变化,所以此问题在较长时间的跨度上很难回答。抑郁症与明显的、可识别的不良思维模式有关,导致人类处理信息过程的困难,即认知扭曲,个体用不准确和过度消极的方式来思考自己、未来和世界。
例如,当人们用消极的、绝对的术语给自己贴上标签时,抑郁症中的认知扭曲就会很容易出现。他们难以接受“灰色地带”,可能会用极端的二分法谈论未来的事件,或者对别人的心理状态做出毫无根据的假设。
认知扭曲的类型通常会进行一些细化的表现,比如“灾难化”、“二分法推理”、“否定积极因素”、“情感推理”、“算命”、“贴标签和贴错标签”、“放大和最小化”、“心理过滤”、“读心术”、“过度概括”、“个性化”和“应该陈述”。认知行为疗法是治疗抑郁症和其他内化行为障碍的黄金标准,其秉持的观点是,认知扭曲与内化障碍相关,并且有力地映射出环境压力下的消极情感和回避行为模式。而语言与此动态紧密交织。
在本文中,类似于调查患有抑郁症的个体一样,团队利用抑郁症和语言之间的联系来洞察整个社会,观察在集体语言中是否会发生与认知扭曲相关的变化。这支研究团队分析了在过去125年里以英语、西班牙语和德语出版的1400多万本书(谷歌图书)中认知扭曲的文本标记的普遍性。具体来说,团队成员正在研究数百个n-grams(n=1到5)序列的纵向流行度,以标注认知扭曲图式。
这些图式是由一组CBT专家、计算语言学家和母语为双语的人设计的,并由一组CBT专家进行外部验证,以捕捉12种认知扭曲的表现。CDS n-grams被设计成简短、明确、独立的语句,使用高频术语来表达特定认知扭曲类型的核心。早期的研究表明,与随机样本相比,这些类似的n-grams在抑郁症患者的语言中更为普遍。
为了解释出版物数量的变化,对于每个CDS n-gram而言,团队将其在给定年份的普遍性定义为该年份在谷歌图书数据中出现的次数除以出版总量。所有产生的时间序列都被转换为标准分数,以提供不同CDS n-grams之间相同规模的比较,并与随机选取的相同年份和同一套图书的n-grams的零模型进行比较。
团队对三个独特的地理和语言领域进行了分析,分别是:(1)美利坚合众国(美式英语)、(2)德语国家和(3)所有西班牙语国家。鉴于英语、西班牙语和德语既有共同之处又存在明显差异,因此研究团队选择上述三者作为分析的焦点。研究将分析的时间节点限制在1855至2019年,因为在这125年里,所有三种语言都持续保持着高出版量,语法、正字法以及拼写变化对分析的影响几乎可以忽略不计。
虽然在特定区域用特定语言发表的书籍并非是整个社会的代表性象征,但可以从数千万本书籍中发现几十年甚至几个世纪以来持续存在的语言趋势。先前的研究表明,这反映出文化、语言和心理上的变化。研究团队首先研究了1855年至2019年的英语(美国)书籍中一整套英语认知扭曲图式的中位数流行率的历史。由于这些数据是只适用于在美国出版的书籍,团队成员记录了美国历史上值得注意的事件或时间序列上的显著变化。
在20世纪的大部分时间里,CDS流行的总体趋势明显地指向1978年的历史最低点,只有少数几个显著的峰值。从1978年开始,CDS的普遍性呈现加速增长趋势。这种加速似乎可以分为三个时期:从1978年到1999年的加速增长,1999年到2007年之后实现更快增长,接着是2007年之后的加速增长,以及2010年可能稳定下来。
这项分析也将西班牙语视为一种控制语言与英语和德语进行对照,因为它并不局限于特定的地理区域;即,这些数据包括所有西班牙语出版的书籍,包括西班牙(欧洲)和大部分拉丁美洲。在整个20世纪,西班牙CDS标记的普遍性保持相当稳定,在第一次世界大战开始前后略有上升,1929年出现了一个非常短暂的峰值,之后的近30年呈现降低趋势,1953年作为转折点出现上升态势,之后直到1984年水平似乎趋于稳定。
然而,从1984年开始,团队观察到与英语相同的曲棍球棒模式:从1984年开始,上升趋势急剧加速,导致目前的CDS普遍性超过历史基线一个以上的标准差。这一趋势似乎在2008年加速了。如图所示,德语书籍的普遍性为CDS标记捕捉人群中重要压力时刻的能力提供了表面有效性,因为它们与德语国家特有的重大历史和地缘政治事件相匹配。
区别于英语和西班牙的CDS,其流行水平在20世纪左右相对较低,但自第一次世界大战开始以来急剧上升,在1920年和1923年达到顶峰,与一战德国的战败和1923年的毁灭性经济衰退相一致。在魏玛共和国的整个存续过程中,可以观察到CDS标记水平的下降。然而,这一趋势在1932年被打断,此时认知扭曲水平急剧上升。
这一时期面临着重大的社会动荡,经济斗争,魏玛共和国的结束,纳粹政权的出现,以及第二次世界大战的开始。在二战期间,CDS的普遍性迅速上升,在德国战败后的1946年达到顶峰。随后,CDS普遍性急剧下降,并在20世纪50年代至2007年期间出现了平稳期,仅在1962年达到一个较小的峰值。而在20世纪70年代或80年代,没有任何迹象表明CDS普遍性加速,正如观察到的英语和西班牙语。
值得注意的是,在2007年全球大衰退开始之际,很明显观察到CDS普遍性几乎立即上升到比历史均值还高出近两个标准差的水平。团队根据英语、西班牙语和德语CDS普遍性的95%置信区间,将这三种语言的变化模式与一个由10,000组241个随机选择的n-grams组成的空模型进行比较。
这些随机n-grams集合是从相应的英语、西班牙语和德语的谷歌语料库中的所有n-grams中采样得到的,使得它们具有与相应的CDS集相同的n-grams,并且由于时间的推移、出版量的不断增加,最新出版的书籍也具有相同的偏好。图中标注了影响这三个群体的重大历史事件,如1929年的金融危机、两次世界大战和始于2007年的大衰退。
近几十年来,英语(美国)、西班牙语和德语的CDS普遍性显著超过了这个零模型的水平。如图所示,团队成员依据英语、西班牙语、和德语所划分的12种常见认知扭曲类型,绘制了年平均CDS普遍性的时间序列。对于所有三种语言和大多数认知扭曲类型,呈现了典型的曲棍球棒效应,即前期CDS普遍性水平呈稳定或下降趋势,随后在1980年至2010年期间飙升至高于历史最高水平,远远高于历史平均值。
唯一的例外是should语句,由于其语法结构,很难翻译成与特定认知扭曲相关的独特的n-grams序列。对于英语而言,图中可以明显的看到“倾斜的曲棍球棒”模式,某些认知扭曲类型的CDS n-grams在20世纪下降,然后自1978年以来迅速飙升。
在算命、过度概括、放大和最小化、读心术、贴标签和贴错标签等方面都是如此,最显著的可能是二分法推理,这深刻的反映出这些扭曲类型可能是导致整个20世纪CDS普遍性程度下降的原因。除此之外,在美国卷入二战期间,灾难化、情感推理和读心术的程度达到了轻微的峰值。
然而,对于德语来说,围绕两次世界大战期间的峰值主要表现在二分法推理、算命、贴标签和贴错标签、心理过滤、读心术、过度概括、个性化和应该声明等方面,这可能暗示出两次世界大战对德语使用的广泛影响。虽然这三种语言之间的差异很有趣,但最重要的一点也许是,在近30年来,三种语言的认知扭曲表达都在增加,导致了一种明显的曲棍球棒效应,充分表明了CDS普遍性的激增。
对已出版语言的大规模历史记录的可用性可以追溯到几个世纪前,这可能为定量研究重要的文化和语言动态提供了一个独特的机会;同时承认在验证假设和测试基于这些数据的任何观察的因果机制方面存在一定的局限性。未来的工作可能有助于更好地理解随着时间的推移,社会集体心理的变化是如何被观察到的,以及这些变化是如何通过语言表现出来以应对各种文化和社会经济挑战的,例如从语义词义变化的量化指标来看。