AI读心术:计算机如何解读人脑中的图像

来源: 果壳

发布日期: 2018-02-09

日本京都大学的科学家们通过使用功能性磁共振成像(fMRI)和深度神经网络,成功地让计算机能够解读并重现人脑中的图像,这一技术被称为“AI读心术”。该研究展示了计算机如何通过分析大脑活动来生成与原始图像相似的图像,尤其是在几何形状和字母的重现上表现出色。随着技术的进步,未来可能实现通过脑海中的图像进行交流。

如果说 AI 能读懂出你脑子里在想的事,你敢信吗?听起来是不是痴心妄想?过去可能是,但已有四名来自日本京都大学的科学家将其化为可能。就在2017年12月下旬,Guohua Shen, Tomoyasu Horikawa, Kei Majima 和 Yukiyasu Kamitani 四位学者,在 BioRxiv 平台上公布了最新的研究结果:AI 读心术。

要将“读心术”变为现实,遇到的第一个难点是电脑无法“从零开始”理解人脑中的图像。其实自 2011 年以来,就有研究人员将大脑活动与观看图像时的记录建立联系,重现了电影片段,照片甚至是迷幻的意象。但是都有其局限性:有些只处理脸部区域,另外一些则必须从预先设定的“人”或“鸟”等类别中进行选择。也就是说当时的“读心术”必须在预先设好的基础上才能发挥作用。

而京都大学的这项工作,则能立即生成可识别的图片,甚至能产生各种从没见过的形状。为了弄清人们眼中究竟看到了什么,学者转而使用 fMRI(功能性磁共振成像)来观察大脑的神经活动情况。实验的目标就是挖掘人脑对图像的反应,并最终让电脑能产生一幅几乎相同的图像。但很快发现了又一个难点:光用 fMRI 是远远不够的,必须采用深度神经网络,来实现“解码”的思想。

这一技术使得学者能够分解更复杂的“分层”图像,比如鸟类图像或者带着帽子的牛仔,放大放大再放大,每一根毛都能看得清清楚楚。京都大学的学者在过去十周的研究过程中,让三名受试者不断观看各种自然图像(鸟或者人类的图片)、几何形状和字母。实验可分为两个部分:第一种在受试者看图的过程中,记录大脑的活动情况,直接分析出人们眼中看到了什么;第二种则让受试者努力回忆刚看过的东西,再对他们此时的活动情况做记录。

大脑活动情况经扫描得出后,计算机就会反向解读其中的信息,将受试者脑海里的东西生成出来。结果在鸟和人等自然图像上的表现不好,但对于几何形状和字母,神经网络有 83% 的概率能生成可识别的图像。为了使最终成品更为接近原图,学者加入“深度生成网络”(DGN),该算法已经过预先训练,能基于输入条件生成更逼真、更自然的图像。

学者在论文中指出,99%的情况下,人类观察者能一眼辨识哪张图就是自己脑海里出现的那张。随着测量方法和算法的不断改进,或许有一天,我们真的会通过脑海中的图片进行交流。

UUID: 1153ce8c-ed77-4fb6-a9bf-5a924a24499f

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2018/2018-02-09_别装了,本AI知道你在想什么!让我来读读你的脑子…….txt

是否为广告: 否

处理费用: 0.0038 元