在《哈利波特》的魔法世界中,邓布利多可以仅凭一根魔杖就读取记忆。在现实世界中,是否也有可能只通过简单的扫描,就直接从一个的脑中提取出一长串的故事?近日,《自然·神经科学》杂志上刊登了一项“读心术”。德克萨斯大学奥斯汀分校的一组研究人员开发了一种名为语义解码器的新型人工智能系统,能将一个人正在听故事、或默想故事时的脑活动,转化成连续的文本。
一种名为语义解码器的新型人工智能系统,可以将一个人正在听故事或默想故事时的大脑活动转化成连续的文本。与其他正在开发的语言解码系统不同,这一新系统不需要受试者进行手术植入,它的试验过程是无创的,而且能产生连续的句子,受试者使用的也不会像通常那样只能用规定列表中的有限词汇。
在研究中,研究人员会用受试者的脑数据对解码器进行大量训练。然后,他们让受试者躺在一台核磁共振成像仪里,至少躺16个小时。在这段时间里,受试者被要求听播客里播放的故事。与此同时,功能性核磁共振(fMRI)扫描会检测他们的脑部血液流动的变化情况。之后,如果受试者愿意让自己的思维被解码,解码器就能仅从他们的脑活动,将他们听到的故事或他们默想的故事,生成相应的文本。
具体来说,在fMRI测得神经数据后,解码器就会将脑活动模式与特定的单词和想法进行匹配。这部分工作建立在一个名为Transformer模型的语言模型上,有点类似于驱动ChatGPT的模型。这个过程是以一种迭代的方式缓慢进行的。解码器会在一个单词出现之后,对接下来要出现的单词的可能性进行排序,然后利用脑活动模式来帮助挑选出最有可能的那个单词,最终获取到故事的大致意思。
也就是说,生成的结果并不能逐字逐句地描绘受试者听到的、或脑海中的故事。事实上,它被设计用来捕捉受试者所听或所想的内容的大致意思,而不是一字不差的文本故事。例如,当一个受试者听到播客里说“我还没有驾照”时,解码器生成的是“她甚至还没有开始学开车”。再比如当受试者听到的是“我不知道该尖叫、哭泣还是逃跑。相反,我只是说:‘让我一个人待会儿!
’”解码器生成的结果是“开始尖叫和哭泣,然后她只说,‘我告诉过你让我一个人待会儿。’”
研究者表示,这样的结果表明,解码器在解读代词时遇到了某种未知的困难,它无法知道是谁在对谁做什么。另外,研究人员还让受试者观看四个简短的无声视频,结果发现在这种场景下,语义解码器也能够利用脑活动,准确地描述视频中的某些事件。
这是一项非常有趣的研究,利用这个解码器所得到的,不再是最基本、简单的语言,而是事物的大致意义。它让我们仿佛看到了未来可能发生的事。对于一种非侵入性的方法来说,这是一个真正的重大飞跃。这样的结果最终或许可以帮助那些有精神意识但无法说话的人,比如那些因中风而虚弱不堪的人,让他们能再次进行清晰的交流。然而,这样的突破也会激发人们对隐私的讨论。
研究者表示,他们预料到这样的技术可能会带来担忧,比如它可能被用于不良目的。因此在研究早期,他们就在网上的预印论文中提及了一些关于这项技术可能被滥用的问题。
根据论文,这种解码器并不是通用的,每个解码器都非常个性化,只适用于愿意用自己的脑数据来训练解码器的人。对于那些没有进行解码器训练的人,解码器是无法解读他们的思维的。
而且更重要的是,一个受试者必须愿意配合,解码器才能识别其想法,不然即便进行过解码器训练,但只要受试者在测试中表现出抵抗,比如忽略听到的故事、思考别的问题,专注于不同的事,就能让解码器无法从脑信号中提取到故事,导致“窃听”失败。研究者表示,他们希望这项技术只有在人们想要使用的、以及对人们有益的时候,才去使用。另外,研究者也指出,这项技术离在复杂的实验室之外使用,还有很长的路要走。