人工智能环保吗?

作者: Charmaine Lai, Subutai Ahmad, Donna Dubinsky & Christy Maver

来源: 神经现实

发布日期: 2023-03-09 11:52:20

本文探讨了人工智能在能源消耗上的巨大成本,并提出了通过借鉴大脑工作原理来提高人工智能效率的解决方案。文章详细介绍了深度学习模型的高能耗原因,并提出了稀疏性、结构化数据、持续学习以及优化的硬件等策略来减少人工智能的碳足迹。

人工智能的成本正在以惊人的速度流失,这不仅体现在真金白银上,更在能源消耗上。在过去十年,人工智能(特别是深度学习)取得了显著成效。当Siri读懂你说的话、脸书认出了你的表亲、谷歌地图为你重新规划路线时,都大概率涉及到了深度学习系统。鲜为人知的是,这些模型正消耗着惊人的成本,不仅体现在真金白银上,也体现在能源消耗上。照目前的迹象来看,人工智能只会给气候危机火上浇油。

可相比之下,我们的大脑(功耗小于40瓦)可就高效多了。如果我们把基于神经科学的技术应用到人工智能中,那么用于计算的能耗将有可能大大降低,从而减少温室气体排放。这篇博文旨在解释到底是什么导致了人工智能过大的能源消耗,以及如何用基于大脑(工作原理)的技术解决这种过高的能源成本问题。

首先,我们有必要简单了解一下深度学习模型的工作原理。深度学习模型的“智能”之处和你的大脑并不一样。

它们不以结构化的方式学习信息。与你不同,它们不懂什么是因果关系、上下文或类比。深度学习模型是用“蛮力”的统计技术。例如,你要是想训练一个深度学习模型来辨认一张猫的照片,你需要向它展示上千张由人类标记过的猫的图像。该模型并不知道猫比狗更有可能爬树、玩羽毛。因此除非我们拿包含树和羽毛的猫的图像来训练它,否则它不会知道这些物体的存在可以帮助对猫的识别。

而为了做出这些推断,我们需要用所有可能的物体组合图片对模型进行“蛮力”训练。

这些运用“蛮力”的统计模型所产生的巨大能源需求是由于以下几个特点:需要成百万上千万的训练样本。在猫的例子中,训练好一个模型需要正面、背面、侧面、不同品种、不同颜色、不同阴影以及不同姿势的猫的图片。一只猫的形态有无数种可能性,因此为了成功识别一只猫,模型必须在众多版本的猫(的图片)上进行训练。需要很多的训练周期。

从错误中学习是训练模型这一过程中的部分。如果模型错误地把猫标记为浣熊,该模型需要重新调整它的参数以将图像分类为猫,再重新进行训练。它从一次次错误中慢慢学习,这也需要一遍遍的训练。当遇到新的信息时得从头训练。如果这个模型现在要去识别它从未见过的卡通猫,我们得将蓝色卡通猫和红色卡通猫添加到训练集中,从头对它进行训练。该模型无法循序渐进地学习。需要很多的权重和乘法。

一个典型的神经网络包含很多由矩阵表示的连接或权重,其中一个或多个矩阵构成一层。为了计算一个输出,神经网络的后续层需要执行大量的矩阵乘法,直至最后得到一个结果。事实上,计算单个层的输出就需要数百万次浮点运算,而一个典型的神经网络可能包含数十到数百层,这使得其计算极其耗能。

一篇来自麻萨诸塞大学阿默斯特分校的论文称,“训练一个人工智能模型可以产生的碳排放量,相当于五辆轿车在整个使用期中的排放量。”然而,这项分析仅仅只针对一次训练而已。当模型经过反复训练而改进时,其能耗会激增。许多大公司每天都在训练成千上万个这样的模型,它们对此问题都十分重视。Meta就是这样一家公司,其最近发表的论文探索了人工智能对环境的影响、研究了解决问题的方法、并呼吁有所行动。

为了解决这个具有挑战性的问题,我们的建议是:向大脑学习。人脑是一个真正的智能系统最好的例子,然而它只消耗很少的能量(基本上与点亮一盏灯泡的能量相同)。与深度学习的低效率相比,人脑的效率极其显著。那么人脑是如何高效运作的呢?我们根植于神经科学的研究指出了让人工智能更加高效的路线。以下是大脑在不过多使用能量的情况下却能出色地处理数据的背后的几个原因:

1/稀疏性

大脑中的信息编码是非常稀疏的,这就像在一长串主要为零的字符串中零星掺杂着一些非零值。这与计算机的表示方法不同,后者通常是密集的。由于稀疏表征有很多零元素,因此它们在和其他数字相乘时可以被消掉而只剩下非零值。而大脑中的表征非常稀疏,其中多达98%的数字都是零。如果我们可以通过具有类似稀疏度的人工智能系统表示信息,那么就可以消除大量的计算。

我们已经证明,在深度学习的推断任务(inference tasks,例如在视觉系统中识别猫)中使用稀疏表征可以将功率性能在不损失任何准确度的前提下提高到三至一百倍以上(具体取决于网络、硬件平台和数据类型)。

2/结构化数据你的大脑通过感官信息流和不断移动来对这个世界进行建模。这些模型具有三维结构,所以你的大脑能理解猫的左视图和右视图,而不必单独去学习它们。

这些模型基于我们所谓的“参照系”,它让学习变得结构化,使我们能够建立包含各种对象之间关系的模型。我们可以纳入猫和大树、羽毛都有关联的概念,而不必去看数百万只猫与大树的实例。与深度学习相比,使用参照系构建模型所需的样本要少得多。只需猫的几个视图,模型就能通过变换数据来理解猫的其他视图,而无需专门针对这些视图进行训练。这种方法可以将训练集减小好几个数量级。

3/持续学习

你的大脑在学习新事物的同时不会忘却之前所学的东西。当你首次见到一种动物时(比如说土狼),你的大脑不需要重新学习一切关于哺乳动物的知识。大脑把一个针对土狼的参照系添加到记忆中,然后标注其与其他参照系(例如狗)的异同,并共享那些相通的子结构(例如尾巴和耳朵)。这种递增式的学习只需要很少的能量。

4/优化的硬件

如今的半导体架构都是为深度学习优化的,这其中,神经网络密集而不具备结构化学习的能力。但我们如果想创造更可持续的人工智能,就需要让硬件也能包含上述三个属性:稀疏性、参照系和持续学习。我们已经创造了一些支持稀疏性的技术。这些技术将稀疏表示映射到密集的计算环境中,从而提高推断和训练性能。长远来看,我们不难想象这些基于大脑原则优化的架构将有潜力提供更多的性能提升。

继续构建更大型、计算量更密集的深度学习网络不是通向创造智能机器的可持续途径。Numenta(原作者)认同的是通过一种基于大脑的方法来构建高效且可持续的人工智能。我们必须开发更聪明的、而不是工作更勤快的人工智能。更少的计算量、更少的训练样本、更少的训练次数与优化的硬件相结合,可以显着改善能源使用。

如果我们的计算量减少十倍、训练样本减少十倍、训练次数减少十倍、硬件效率提高十倍,那么系统的整体效率将提高一万倍。短期内,Numenta希望能大幅降低推断(inference)中的能耗。Numenta的中期目标是将这些技术应用到训练中,并随着训练次数的减少,预计可以节省更多的能源。从长远来看,随着硬件的逐渐增强,Numenta看到了将性能改进上千倍的潜力。

从大脑中提取抽象的原理然后应用到如今的深度学习架构中会把我们推向可持续的人工智能。如果读者想详细了解Numenta在创建节能的人工智能方面的工作,请查看原文以了解更多。

UUID: 6d5f95c7-e097-48cc-9081-d23ea2857f35

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/返朴公众号-pdf2txt/2023/返朴_2023-03-09「转」_人工智能环保吗?.txt

是否为广告: 否

处理费用: 0.0100 元