脑机接口将大脑信号转换为语音和面部动作,并在动画人物身上表现出来。图片来源:Noah Berger
在实验室里,67岁的Pat Bennett正在尝试用包含12.5万个单词的词汇表和包含50个单词的词汇表说出各种短语;与此同时,深度学习算法则会识别大脑中的独特信号以解码单词。对Bennett来说,这带来了希望,因为她患有肌萎缩侧索硬化症,也叫运动神经元病,这种疾病会使肌肉逐渐失去控制,从而导致行动和说话困难。
在8月23日发表于《自然》的一项研究中,美国斯坦福大学神经科学家Francis Willett及其同事开发了一种脑机接口,可以在细胞水平解析神经活动并将其翻译成文本。该脑机接口能够将神经信号转换为合成语音说出的文本或单词。脑机接口可以分别以每分钟62个单词和每分钟78个单词的速度解码语音。尽管自然对话的速度约为每分钟160个单词,但新技术的速度已比之前的任何尝试都要快。
研究人员与Bennett合作,通过手术,将小型硅基电极阵列植入其大脑皮层下几毫米处与语言能力有关的区域,然后Bennett试着说出各种短语,并训练深度学习算法识别大脑中的独特信号。人工智能则通过最小的语音单位——音素解码单词。
对于包含50个单词的词汇表的解析,新的脑机接口的工作速度是该团队早期开发的脑机接口的3.4倍,单词错误率为9.1%,而对于包含12.5个单词的大词汇集的解析,错误率则上升到23.8%。
在同期发表于《自然》的另一项研究中,美国加利福尼亚大学旧金山分校神经外科医生Edward Chang团队则采用与Willett团队不同的方法,帮助失去语言能力的患者。Chang团队在Ann的大脑皮层表面放置了一个包含253个电极的薄如纸张的矩形植入物。这种被称为脑皮层电图(ECoG)的技术侵入性较小,可以同时记录数千个神经元的联合活动。
尽管上述两项研究利用人工智能增强的大脑阅读植入物使两名瘫痪患者能够以前所未有的准确性和速度进行交流,但在脑机接口应用于临床前,还有许多地方需要改进。比如,适合日常使用的脑机接口必须采用完全植入式的系统,不能有可见的连接器或电缆。此外,两个团队都希望通过更强大的解码算法继续提高设备的速度和准确性。