图灵测试,时至今日还有意义吗?

作者: 学术头条

来源: Dark Matter Articles/medium

发布日期: 2022-03-07 16:00:00

本文讨论了图灵测试在现代人工智能发展中的意义。文章指出,尽管图灵测试在1950年提出时具有开创性,但随着人工智能技术的进步,这种测试方法已经不再适应现代人工智能的复杂性和多样性。现代AI在视觉、自然语言处理等领域的表现远超人类,图灵测试作为一种衡量标准显得过于单一和局限。此外,人工智能的应用已经深入到手机、汽车和家用电器等领域,人们更关心的是AI带来的实际交互体验和技术进步,而非机器是否能通过图灵测试。因此,建立新的人工智能衡量标准成为必要。

我们必须承认,机器运行时的很多中间状态,是在设计初始指令时无法预见的。机器自己也会感悟出很多知识。在这种情况下,我们有必要将机器视为智能的。图灵测试由人工智能之父艾伦·图灵提出,指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能。

然而,自1950年以来,人工智能已经发生了巨大的变化。那么,今天的人工智能要如何应对图灵测试?这种测试方法还能发挥它的价值吗?艾伦·图灵是一位杰出的科学家,他的一生,将科学置于一切之上。他对新技术很感兴趣,并希望计算机变得越来越智能。他还花了很多时间研究算法、复杂的计算机系统和人工智能。就人工智能而言,图灵仔细研究了人工智能机器的发展以及其他科学家向智能机器提出的问题。

正是通过这种方式,他提出了“机器会思考吗?”的疑问。为了找到解决这个问题的办法,图灵尝试寻找一种方法,来查看计算机是否真的可以说自然语言,从而变得像真人一样,并且无法被人类发现差异。1950年,他在一篇题为《计算机与智能(Computing Machinery and Intelligence)》的论文中描述了这一想法。其中,他还描述了一项需要三方参与的实验:一名法官、一名女人和一名男人。

游戏规则是,法官需要确定谁是男人,谁是女人。在这种情况下,男人的目标是欺骗法官,而女人可以试图帮助法官。为了公平起见,不能使用语言提示,而只能来回发送打印的问题和答案。问题就变成了:审问者如何知道该信任谁?紧接着,图灵开始思考,如果把其中一个人变成一台电脑,会发生什么?法官如何分辨谁是人类,谁是电脑?

如果一个测试者对无法确认身份的两个对象(一人、一机器)提出相同的一系列问题,得到的答案无法区分究竟谁是机器、谁是人,那么则认定机器通过测试。图灵还认为,计算机有望在2000年左右通过这项测试。然而,图灵当年的预测没有应验。直到2014年,一个名为尤金·古斯曼的聊天机器人项目模拟了一名13岁的乌克兰男孩,在阅读大学组织的一次活动中,通过了都灵测试。

聊天机器人虽然说服了伦敦皇家学会33%的法官相信这是人类,但批评者很快也指出了测试的不足之处。正如我们上面所写的,今天机器人成功通过图灵测试并不完全容易。另一方面,也有一群科学家认为这对机器是不公平的。主要是因为,现在的很多AI,即使没有说话的能力也可以是智能的。很多情况下,我们会把智能机器和机器人联系在一起。但事实并非如此,不像人类一样的机器,并不意味着他们不智能。

近年来,人工智能的诸多成就可以证明这一点,例如,第一种无需人类协助的腹腔镜手术系统。毕竟图灵测试仅考虑了文本交流的情况,而没有考虑到现在的人工智能已经能够使用各种传感器,能够从视觉、听觉、触觉等多角度来感受外部世界。比如,亚马逊副总裁兼语音助手Alexa首席科学家罗希特·普拉萨德曾发表文章表示,图灵测试已经失去了意义,是时候建立新的人工智能衡量标准了。

普拉萨德认为,图灵测试的目标和当前人工智能研究方向不完全一致,人工智能研究者对通过图灵测试的兴趣不大。人工智能派上更大用场的地方是植入到手机、汽车和家用电器,人们更关心的是AI能够带来哪些更新的交互体验和技术进步,而不是机器能否像人一样进行思考。比如,在现代人工智能的视觉、自然语言处理等领域,最强的算法已经取得远超人类的结果。

以AlphaGo击败顶级人类围棋选手为例,这种成就则很难在一成不变的图灵测试中得到体现。也正因此,从应用的角度来看,让计算机放弃自己的计算优势,而刻意去模拟人类,以通过图灵测试,确实没有太大的必要。我们还必须考虑到,图灵在70多年前的1950年发表了他的想法。而在这段时间里,机器世界发生了很大的变化。如果图灵还活着,他估计会有完全不同的见解。

然而,这并不能改变这样一个事实:人工智能对人类社会的影响已超越了图灵测试的范畴,人工智能研究的目标早已不再局限于AI与人类的区别,而是如何发挥机器的速度和信息搜索优势,代替人类完成工作或改善人们的日常生活。

UUID: 9fc532b1-1bfc-42c2-8a56-fc5d2621d1d8

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2022年/学术头条_2022-03-07_图灵测试,时至今日还有意义吗?.txt

是否为广告: 否

处理费用: 0.0043 元