如果说 AI 能读懂出你脑子里在想的事,你敢信吗?听起来是不是痴心妄想?过去可能是,但已有四名来自日本京都大学的科学家将其化为可能。就在2017年12月下旬,Guohua Shen, Tomoyasu Horikawa, Kei Majima 和 Yukiyasu Kamitani 四位学者,在 BioRxiv 平台上公布了最新的研究结果:AI 读心术。
要将“读心术”变为现实,遇到的第一个难点是电脑无法“从零开始”理解人脑中的图像。其实自 2011 年以来,就有研究人员将大脑活动与观看图像时的记录建立联系,重现了电影片段,照片甚至是迷幻的意象。但是都有其局限性:有些只处理脸部区域,另外一些则必须从预先设定的“人”或“鸟”等类别中进行选择。也就是说当时的“读心术”必须在预先设好的基础上才能发挥作用。
而京都大学的这项工作,则能立即生成可识别的图片,甚至能产生各种从没见过的形状。为了弄清人们眼中究竟看到了什么,学者转而使用 fMRI(功能性磁共振成像)来观察大脑的神经活动情况。实验的目标就是挖掘人脑对图像的反应,并最终让电脑能产生一幅几乎相同的图像。但很快发现了又一个难点:光用 fMRI 是远远不够的,必须采用深度神经网络,来实现“解码”的思想。
这一技术使得学者能够分解更复杂的“分层”图像,比如鸟类图像或者带着帽子的牛仔,放大放大再放大,每一根毛都能看得清清楚楚。京都大学的学者在过去十周的研究过程中,让三名受试者不断观看各种自然图像(鸟或者人类的图片)、几何形状和字母。实验可分为两个部分:第一种在受试者看图的过程中,记录大脑的活动情况,直接分析出人们眼中看到了什么;第二种则让受试者努力回忆刚看过的东西,再对他们此时的活动情况做记录。
大脑活动情况经扫描得出后,计算机就会反向解读其中的信息,将受试者脑海里的东西生成出来。结果在鸟和人等自然图像上的表现不好,但对于几何形状和字母,神经网络有 83% 的概率能生成可识别的图像。为了使最终成品更为接近原图,学者加入“深度生成网络”(DGN),该算法已经过预先训练,能基于输入条件生成更逼真、更自然的图像。
学者在论文中指出,99%的情况下,人类观察者能一眼辨识哪张图就是自己脑海里出现的那张。随着测量方法和算法的不断改进,或许有一天,我们真的会通过脑海中的图片进行交流。