被GPT4震撼的同时,我们应如何看待⼈⼯智能的强⼤

作者: David Weinberger

来源: 中科院物理所

发布日期: 2023-03-28 11:51:54

本文探讨了机器学习如何揭示日常世界更多由偶然性而非规则支配的本质,以及机器学习模型的有效性如何可能改变我们对世界的理解。文章还讨论了机器学习与传统编程的不同,以及机器学习模型在医疗、交通、气候控制等领域的应用。

在认真阅读下⾯的⽂章,并思考⽂末互动提出的问题,严格按照互动:你的答案格式在评论区留⾔,就有机会获得由机械⼯业出版社提供的优质科普书籍《经典算法的起源》。

平⽇,世界看起来像⼀条管理良好的铁路:事情是按照我们⼈类所理解并能具体应⽤的法则运⾏。我们能接受偶尔的晚点,它们代表了这些法则的例外。但有时我们会把这个世界所经历的事看作是公路上的多⻋相撞。这种情况下虽然也遵循与平⽇相同的物理规律或社会法则,但是变化的单元过多,我们⽆法预测或解释每⼀次碰撞的细节——这些细节可以让⼀辆⻋只受到轻微损伤,⽽另⼀辆⻋则爆炸变成⽕球。

沿轨道有序⾏驶的列⻋⼀场⻋祸中所表现出的特点,也同样适⽤于平凡秋⽇⾥在铺满落叶的⼩路上散步。它们都是这样的事件,其中⽆数细节之间的相互依存关系优于决定它们的规则的解释能⼒。我们能做的似乎只是在⼀种结果出现后为之愤懑或惊叹。

现在,我们最新的范式技术——机器学习,可能会揭示出⽇常世界更多由偶然性⽽⾮规则⽀配。如果是这样,那是因为机器学习可以跳出⼈类认知的模式,⽽总结出我们所⽆法理解或者应⽤的规律。

机器学习概念图机器学习系统的不透明性引起了⼈们对它们的可信度和偏⻅倾向的严重担忧。但是它们确实能够⼯作的事实,可能会让我们对世界是什么以及我们在其中扮演什么⻆⾊有了全新的理解。

机器学习与传统编程有着根本不同的⼯作⽅式。事实上,传统编程是我们基于规则去理解世界的集⼤成者。

举个机器学习中最具代表性的例⼦:如果要编写识别⼿写数字的软件,程序员在传统⽅式上会告诉计算机,“1”是由⼀条竖直的线组成的,“8”是由⼀个较⼤的圆圈和位于其上⽅的⼀个较⼩的圆圈组成的,等等。这种⽅法可能会有很好的效果,但它对⼿写数字的柏拉图式理想的依赖,意味着该程序将会误判相当⽐例的⼿写数字。因为实际的数字出⾃凡⼈之⼿,不可能如此“完美”。

机器学习全新的运作模式机器学习模型则懂得从样例中学习。为了创建⼀个能够识别⼿写数字的机器学习模型,开发者们不会告诉计算机任何我们⼈类对数字形状的了解。相反,开发者们给它提供了数千个⼿写数字的样例图像,每个数字都不同,并且被正确地标记为所代表的数字。系统通过算法去发现具有相同标签图像的像素之间的统计关系。在某种垂直线上的⼀系列像素将增加图像为“1”的统计权重,降低它为“3”的概率,以此类推。

不可知,却有效在现实⽣活中的机器学习应⽤中,可能的答案数量要数以亿计,需要考虑的数据量⾮常庞⼤,数据点之间的相关性⾮常复杂,以⾄于我们⼈类通常⽆法理解。例如,⼈类的新陈代谢是⼀系列极其复杂的相互作⽤和相互依存的效应。于是,⼈们创建了⼀个能够预测⼈体系统对复杂因素反应的机器学习系统,称之为DeepMetab。它成为医⽣、研究⼈员、⾮专业⼈⼠和疑病症患者提出关于⼈体器官的问题、探索相关想法的地⽅。

尽管我们⽆法理解它如何产⽣输出结果,DeepMetab仍然成为有关⼈体知识的最重要的来源。

AI与医疗的结合随着我们越来越依赖于像DeepMetab这样我们⽆法理解的机器学习模型(MLMs),我们可能会逐步接受下⾯两种观点:第⼀种观点表示,为了获得由机器学习模型⽣成的有⽤的概率输出,我们必须经常容忍⽆法解释这⼀缺点。第⼆种观点认为,难以解释并不是⼀种缺点,⽽是⼀种真实情况。

机器学习模型之所以有效,是因为它们⽐我们更擅⻓阅读世界:它们通过统计相互关联的海量数据⽽产⽣超越⼈类等的认知,⽆需向⼈类解释⾃⼰如何得到这样的认知。每当⼀个公⺠或监管者因⽆法理解机器学习的⼯作原理⽽发出绝望呼声时,我们都能感受到这些模型确实有效。

⼤数据时代概念图如果机器学习模型的⼯作原理是放弃⽤可以被理解的规则来简化并解释复杂性,那么在“它有效!”的呼声中,我们可以感受到所有微⼩事物在它们的相互依存中彼此互动。⽽这些微⼩事物才是真正的本质,它们在和谐规律的宇宙⾳中发出嘎嘎声。我们技术的成功正在告诉我们,世界就是⼀个真正的⿊匣⼦。

⼈机对弈从⼿表到汽⻋,从相机到恒温器,机器学习已经深深嵌⼊了我们的⽇常⽣活。

它被⽤来推荐视频、尝试识别仇恨⾔论、引导⻋辆的⾏驶、控制疾病的传播,并对缓解⽓候危机⾄关重要。它并不完美,可能会放⼤社会偏⻅,但我们仍然继续使⽤它,因为它有效。机器学习在不对特定事物应⽤规则的情况下完成所有这些⼯作是令⼈惊讶甚⾄不安的。我们太过于偏爱规则⽽⾮个例,以⾄于我们认为让⼀个机器学习系统在不知晓规则的情况下单纯通过分析⼤量棋局和⾛法⽽玩围棋是疯狂的。

但这就是机器学习成为史上最优秀的围棋选⼿的⽅式。实际上,当开发者为系统提供与⼀个领域相关的数据时,他们通常会故意向它隐瞒我们已经了解的数据之间的相互关系。

过于具体的概括?现在,即使是稍微了解机器学习的⼈,也会感到⽑⻣悚然,因为机器学习模型是通过从数据中进⾏泛化⽽创建的。例如,如果⼀个⼿写数字识别的机器学习模型没有从它所学习的样本中进⾏泛化,就会因过度拟合⽽成为失败的模型。

但是,机器学习模型的泛化描述不同于我们⽤于解释特定情况的传统概括。我们喜欢传统的概括,因为(a)我们可以理解它们;(b)它们经常能够导出演绎结论;(c)我们可以将它们应⽤于具体情况。但是,(a)机器学习模型的泛化描述并不总是易于理解;(b)它们是统计的、概率上的且主要是归纳的;(c)除⾮运⾏相应的机器学习模型,我们通常⽆法应⽤这些描述。

统计学此外,多层次机器学习模型的泛化描述可能会⾮常具体:例如,视⽹膜扫描中的⾎管模式可能预示关节炎的发作,但前提是满⾜50个数值指标,⽽这50个指标⼜可能是相互关联影响的。这就像你想知道⼀辆汽⻋在多⻋相撞中是如何避免严重损坏的⼀样:⻋辆必然要克服很多具体条件,但是这种事件不能归纳为⼀个可理解的规则,这种复杂规则也⽆法迁移⽽应⽤于其他事件。

或者,这就像在⼀场谋杀案中的线索,虽然能指示凶⼿,但只对这⼀场案件有效。

线索墙机器学习模型并不会否认规则或者定律的存在。它只是强调仅有这些规则不⾜以理解我们这个复杂的宇宙中发⽣的⼀切。偶然的细节相互影响,使规则的解释能⼒变得不⾜,即使假设我们可以知道世间所有的规则。例如,如果你知道引⼒和空⽓阻⼒的法则,以及硬币和地球的质量,并且你知道硬币从多⾼的⾼度掉落,你就可以计算出硬币落地需要多⻓时间。

这通常已⾜以满⾜你的实⽤⽬的。但传统的⻄⽅科学框架过分强调了规则。要完全应⽤这些规则,我们必须知道每⼀个影响落下的因素,包括哪些鸽⼦会扰动硬币周围的⽓流以及远处星体对它的万有引⼒同时施加的影响。(你记得加上遥远的彗星的影响了吗?)要完全准确地应⽤这些定律,我们必须拥有像拉普拉斯妖那样的全⾯⽽不可及的宇宙知识。

抛硬币事件这并不是对追求科学定律或实践科学的批评。科学通常是以经验为基础的,并且⾜以满⾜我们的需求——虽然实际可实现的精度会让我们做出⼀定让步。但这应该让我们想到:为什么⻄⽅世界把难以解释的混沌现象视为纯粹的表象,认为其下有可以解释这种现象的法则呢?为什么我们本体论上更喜欢永恒不变的东⻄⽽不是不断流转的⽔或尘⼟呢?

改写对知识的定义这些是⻄⽅哲学和宗教历史上常⻅的话题,远超出了本⽂的范围。

但不可否认,我们被永恒法则所简化的世界所吸引,因此我们能够理解世界,从⽽预测和控制它。同时,这些简单⽽美妙的法则向我们隐藏了特定情况的混乱,这些混乱不仅由法则本身决定,⽽且还受到每个其他特定情况的状态的影响。但是现在,我们有了⼀种预测和控制技术,它直接源⾃整体同时存在并相互影响的诸多微⼩因素。这种技术给我们带来了更强的控制⼒,但并没有增进我们的理解⼒。它的成功使我们关注那些超出我们理解的事物。

物理学定律同时,出于同样的原因,机器学习可能会打破将确定性作为知识的标志的迷恋,因为机器学习的结果是概率。事实上,从机器学习模型得出完全确定的结果会引起⼈们对该模型的怀疑。机器学习的输出的概率具有内禀的不准确性;对于概率的真正陈述是能够正确预测其错误⼏率。

蝴蝶效应现在,我们拥有了⼀种震撼我们的机制,⼀些从不可理解、精妙的⽹络中相互连接的诸多细节中汲取信息⽽运作的模型。也许,我们⽆需将那些混沌的漩涡视为仅仅是还未了解透彻的表象。也许,所有因素之间相互影响的复杂性与认知难度将撼动⻄⽅科学的认知基础,即最真实的是最固定、最普遍和最可知的。

三体问题的混沌解示意也许,我们终将接受简单事件难以想象的复杂关联、各种意外与巧合才是世界的真实⾯貌。我们亦会接受1.4公⽄重的大脑不⾜以建⽴对于世界完备的认知。世界残酷的不可知性正在模糊我们理解的边界。如果这正在发⽣,那是因为我们通过诸如机器学习模型听到了更多特殊的、微⼩的、喧嚣的信号。这些信号正在产⽣基于难以理解的万物之间联系的有⽤的、惊⼈的、概率性的知识。

作者:David Weinberger翻译:云开叶落审校:圆周π⼩姐原⽂链接:Learn from machine learning fu li shi jian今天我们将送出由机械⼯业出版社提供的《经典算法的起源》。算法不是⼀⾏⾏神秘的代码,⽽是你我都应具备的⼀种思维模式。在计算机出现之前,算法就已经存在了。

了解经典算法的起源,不仅是因为我们⾝处信息时代,更是因为算法的底层逻辑和应⽤可以为我们的⼯作、⽣活提供解决问题的新思路。《经典算法的起源》是⼀本计算机算法⽅⾯的科普性书籍,作者以通俗易懂、引⼈⼊胜的叙述⽅式介绍各种算法思想,避免使⽤⼀些过于严谨的专业术语。

本书从最基础的“什么是算法”开始讨论,⾸先介绍如何评价算法的性能,然后展开讨论与图、搜索和排序相关的经典算法,解释“算法是怎么运作的”,最后介绍PageRank和深度学习两个⼤型算法应⽤。本书⽤通俗易懂的语⾔来描绘算法世界,穿插有趣的⽂化历史故事和简单易懂的例⼦,不涉及艰深的数学知识,即使⾮专业⼈⼠也能轻松读懂。

【互动问题:你觉得未来AI还可能有什么新的应⽤?

】请⼤家严格按照互动:问题答案的格式在评论区留⾔参与互动,格式不符合要求者⽆效。截⽌到本周四中午12:00,参与互动的留⾔中点赞数排名第⼆、三、五的朋友将获得我们送出的图书⼀本(点赞数相同的留⾔记为并列,下⼀名次序加⼀,如并列第⼆之后的读者记为第三名,以此类推)。

为了保证更多的朋友能够参与获奖,过往四期内获过奖的朋友不能再获得奖品,名次会依次顺延*本活动仅限于微信平台翻译内容仅代表作者观点不代表中科院物理所⽴场编辑:藏痴近期热⻔⽂章Top10↓点击标题即可查看↓1.封杀这个公式,ChatGPT智商将为零2.有⼈说ChatGPT有物理学博⼠⽔平?我们的测试结果令⼈……3.为什么你⼀⼯作就想睡觉,想睡觉时却睡不着?4.为什么我们吃不上国宴菜?

⼤抵是因为⻝材过于“变态”|科到了5.地球内核正在反向旋转!对我们的⽇常会有影响吗?6.地壳会毁灭?流浪地球不可⾏?地质学告诉你答案!7.《较低端⿏⿏求⽣图鉴》8.明明中⼼是氮原⼦,为何不叫氮酸叫硝酸?|科到了9.脑洞狂飙!当物理博⼠,扛着显微镜穿越到明朝…10.最近实验总做不出来,坏了,不会三体⼈已经在路上了吧?|科到了点此查看以往全部热⻔⽂章

UUID: aafc2bb6-5de9-4e4d-8f0a-52308f89f4bc

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院物理所公众号-pdf2txt/2023/中科院物理所_2023-03-28_被GPT4震撼的同时,我们应如何看待人工智能的强大.txt

是否为广告: 否

处理费用: 0.0121 元