诺奖数千年来,算法一直在帮助数学家进行基本运算。古埃及人发明了一种不需要乘法表就能得出两个数字的乘积的算法;欧几里得描述了一种沿用至今的计算最大公约数的算法;在伊斯兰的黄金时代,花拉子米设计出了求解线性方程和二次方程的新算法。尽管现如今我们对算法已经非常熟悉,但发现新算法的过程仍是非常困难的。
在一片于近期发表在《自然》杂志上的论文中,DeepMind团队介绍了第一个用于发现新的、高效的、可证明正确的基本算法(如矩阵乘法)的人工智能系统——AlphaTensor。它打破了一个保持了50多年的记录,发现了一种能更快地计算两个矩阵之间的乘法的算法。
矩阵乘法是我们非常熟悉,也是代数中最基本的运算之一。这个看似简单的数学运算,对当代数字世界有着巨大的影响。矩阵乘法是许多不同应用程序的核心计算类型,从处理智能手机中的图像到识别语音指令,从为电脑游戏生成图像到模拟复杂的物理学……可以说,在我们的日常生活中,矩阵乘法无处不在。加快这种运算的计算速度可以对无数日常生活中的计算任务产生重大影响。
在长达几个世纪的时间里,数学家们都认为,矩阵乘法的这种标准算法有着最优效率。但在1969年,德国数学家沃尔克·施特拉森(Volker Strassen)证明,还有更好的算法存在。通过研究2x2矩阵,他发现了一种只需要7次就能将2x2矩阵相乘的方法。
在新研究中,DeepMind团队探索了现代人工智能技术如何推动新的矩阵相乘算法的自动发现,并发现了一种可以在当前硬件上完美运作的更快的算法。
总的来说,AlphaTensor在超过70种大小各异的矩阵上击败了现有的最佳算法。不仅如此,AlphaTensor还在有限域内改进了施特拉森的二阶算法,这是施特拉森算法自50年前发现以来迎来的首个改进。这些用于小矩阵相乘的算法,可作为用来乘任意大小的更大矩阵的原语。
从数学的角度来看,新的结果可以指导复杂性理论(旨在确定解决计算问题的最快算法)的进一步研究。
可以说,AlphaTensor提升了我们对矩阵乘法算法的丰富性的理解,而这种理解或许会为我们带来新的惊喜,比如帮助我们确定计算机科学中最基本的开放问题之一——矩阵乘法的渐近复杂性。正如前文所提到的,矩阵乘法是计算机图形学、数字通信、神经网络训练和科学计算等许多计算任务的核心组成部分,因此AlphaTenor的发现可以大大提高这些领域的计算效率。