假如你在公车上遇见了一位集美貌与气质于一身的小姐姐,她戴着耳机凝望窗外,画面“明媚而忧伤”,正中你的少男之心!你不禁想知道——她在听什么?一定是很优美的旋律,于是你脑补了一段悠扬轻快的钢琴曲作为BGM……就在这时,你突然具有了“读心”的特异功能。于是怀揣着一颗悸动的心,听听她在听些什么——结果,你的耳边响起了嘹亮的“套马的汉子……”这种画风的突变还真带劲呢!
这样看来,人类没有“读心”这一技能似乎是件好事,不然多少“恶趣味”会变得无处遁形啊!可是喜欢搞事情的科学家似乎并不在乎唯美的画面可能遭到破坏。
就在最近,来自巴西、德国、芬兰和印度四国的研究人员在《科学报告》上发表了一篇新的论文,表示他们已经可以通过让计算机“读取”你大脑中的信息,了解你都听了哪些音乐。这操作听上去有点科幻,但其实这种“读心”设备或许将以比我们想象中快很多的速度成为现实。
论文中报道了这样一个实验:研究人员选择了40首类型各异的音乐作品,其中包括古典、摇滚、流行、爵士、民谣等等,然后从每首作品中节选一段长46秒的音乐片段。接着他们邀请了6名受试者来参与这项实验,其中5名参与者受过专业的音乐训练(例如长时间的学过某种乐器或声乐)。研究人员在受试者在聆听音乐的过程中对他们的大脑进行功能性磁共振成像(fMRI),以检测大脑中的血流和活动。
在实验正式开始之前,研究人员先给每位受试者听四段旋律,要求他们感受旋律中的情感,或者鉴别出旋律中那些阻碍他们感受情感的和声变化。在fMRI扫描前进行的这一步骤,是为了能让受试者熟悉这些音乐。fMRI的数据收集会在不同的日子多次进行。与fMRI扫描仪相连的计算机程序经过训练,可以测量大脑对音调、律动、节奏和音色等音乐特征产生的活动,从而对特定歌曲引起的大脑活动模式进行监测。
在分析过程中,科学家运用了一种对大脑的编码技术。编码模型曾多次被用于研究视觉和语义领域的神经表征,但是科学家并不太了解当这种模型被用于分析在音乐刺激下产生的听觉皮层上的信息分布时会如何表现。这种技术的前提是假设大脑可以对特定的刺激作出独特的反应。在这种假设情况下,每首歌的不同音乐特征以及它所带来的刺激应与大脑反应相匹配并形成一个代码。科学家试图让计算机从得到的fMRI数据中识别出正确的歌曲。
一开始,他们让计算机先做简单的二选一,只需要从两个选项中选出正确答案即可。发现准确率可达85%。接着他们加大实验难度,让计算机在仅依据大脑扫描数据的情况下,从10个选项中选出正确的歌曲。这一次,计算机的准确率为74%。计算机对一个片段的识别能力很可能与该片段中所含有的音乐特征变化(即信息内容)的丰富性有关,因而在随后的分析中,研究人员使用熵作为度量来解释识别的准确性。
他们计算了每个片段的特征空间的香农熵。发现对于熵很高的音乐相应产生的听觉皮层中的分布信息,总体识别准确率能高达95%。这并不是科学家第一次让计算机根据听众的大脑模式来识别歌曲,但相比之前,这次的研究更加深入,音乐的选择范围比之前的更多,而编码-解码技术的运用大大的提高了实验结果的准确性。而这项研究的意义是什么呢?
首先它的重点并不在于音乐本身,科学家们无所谓你爱听的是《命运交响曲》还是《最炫民族风》。他们希望的是通过这些研究,来帮助我们理解大脑会对音乐做出怎样的反应,从而研发出能帮助那些无法用正常听、说方式交流的人(例如闭锁综合症患者)的脑机接口。论文作者之一的Sebastian Hoefle博士表示,大脑解码研究为理解神经功能提供了新的方案。
这项研究的结果为存储于人类听觉皮层中的听觉表征提供了新的见解,并为将来的临床应用开辟了可能性,例如为患有幻听的病人做幻觉神经调节。他们希望在之后的研究中,能找到为何一部分人认为动听的音乐可能在另一部分人听来却倍觉刺耳的原因,是否我们的大脑具有某种特定的适应音乐?未来,这些针对大脑解码和机器学习方面的研究还可能创造各种不同的沟通方式。