AI读心术：计算机如何解读人脑中的图像

如果说 AI 能读懂出你脑子里在想的事，你敢信吗？听起来是不是痴心妄想？过去可能是，但已有四名来自日本京都大学的科学家将其化为可能。就在2017年12月下旬，Guohua Shen, Tomoyasu Horikawa, Kei Majima 和 Yukiyasu Kamitani 四位学者，在 BioRxiv 平台上公布了最新的研究结果：AI 读心术。

要将“读心术”变为现实，遇到的第一个难点是电脑无法“从零开始”理解人脑中的图像。其实自 2011 年以来，就有研究人员将大脑活动与观看图像时的记录建立联系，重现了电影片段，照片甚至是迷幻的意象。但是都有其局限性：有些只处理脸部区域，另外一些则必须从预先设定的“人”或“鸟”等类别中进行选择。也就是说当时的“读心术”必须在预先设好的基础上才能发挥作用。

而京都大学的这项工作，则能立即生成可识别的图片，甚至能产生各种从没见过的形状。为了弄清人们眼中究竟看到了什么，学者转而使用 fMRI（功能性磁共振成像）来观察大脑的神经活动情况。实验的目标就是挖掘人脑对图像的反应，并最终让电脑能产生一幅几乎相同的图像。但很快发现了又一个难点：光用 fMRI 是远远不够的，必须采用深度神经网络，来实现“解码”的思想。

这一技术使得学者能够分解更复杂的“分层”图像，比如鸟类图像或者带着帽子的牛仔，放大放大再放大，每一根毛都能看得清清楚楚。京都大学的学者在过去十周的研究过程中，让三名受试者不断观看各种自然图像（鸟或者人类的图片）、几何形状和字母。实验可分为两个部分：第一种在受试者看图的过程中，记录大脑的活动情况，直接分析出人们眼中看到了什么；第二种则让受试者努力回忆刚看过的东西，再对他们此时的活动情况做记录。

大脑活动情况经扫描得出后，计算机就会反向解读其中的信息，将受试者脑海里的东西生成出来。结果在鸟和人等自然图像上的表现不好，但对于几何形状和字母，神经网络有 83% 的概率能生成可识别的图像。为了使最终成品更为接近原图，学者加入“深度生成网络”（DGN）,该算法已经过预先训练，能基于输入条件生成更逼真、更自然的图像。

学者在论文中指出，99%的情况下，人类观察者能一眼辨识哪张图就是自己脑海里出现的那张。随着测量方法和算法的不断改进，或许有一天，我们真的会通过脑海中的图片进行交流。