科学家用《GTA5》训练AI图像识别

作者: 别瞎玩

来源: 果壳

发布日期: 2016-09-21

人工智能研究人员利用《GTA5》等游戏来训练AI图像识别,因为游戏图像的逼真度和标记的便利性,使得训练过程比使用真实世界数据更为高效和经济。这种方法可能改变机器学习的研究方式,但也需要游戏开发者与研究人员的合作。

现代游戏工业发展到现在,我们已经能够整晚整晚地游荡在几乎真实的游戏世界了——无论是GTA5里影射的美国某大城市,还是虚构的天际省、废土和克苏鲁的黑魂世界。游戏已经越来越真实(或者至少说一部分游戏),它们真实到,一帮人工智能的研究人员已经开始用游戏来教他们的AI来辨认真实世界里的物体了……

人工智能研究人员表示,这些商业游戏确实能帮助训练他们AI,而且要比在真实的世界里做实验省钱省力的多。

比如,就有德国的人工智能专家用GTA5来教AI图像识别了……额……这位专家你确定AI学的不是偷车?不过这位研究者马克·施密特表示,机器学习这项研究需要用大量的数据——比如街道的景象——来训练计算机,让计算机学会如何识别或者推断它们到底“看到”了什么。而马克和他的学生就使用了游戏《侠盗猎车手5》,让一个能够自我学习的软件从游戏图像来判断自己到底“看”到了什么。

马克是不列颠哥伦比亚大学的计算机教授、机器学习专家,他说:“如果你再回去玩原版的DOOM,从数据上看那里面每一面墙都一样,AI就能很容易分辨出来。

但如果你放到真实世界里,那就大大不同了,每面墙都不太一样……”据马克表示,目前计算机还“玩”得不错……在某些情况下,这个软件表现的比用真实街景训练出来的还要好:“游戏的图像已经很好了,你可以直接用原始数据训练AI,并且它得到的结果几乎和使用真实世界的数据一样优秀。”

当然,游戏仍然还是游戏,你还是能很容易地把游戏和现实图像区分开来,所以现实世界的的图像仍然是首选。但你仍然可以选出游戏中做好标记的图像,然后用庞大的数量弥补单个游戏图像细节的缺失。目前流行的机器学习数据库,比如 Cityscapes和CamVid,它们只包含欧洲的城市图像,所以游戏中逼真地描绘出北美城市街景的图像会相当有用。

“例如,欧洲的街道比北美洲的街道要狭窄,”德国一位研究计算机视觉的博士生史蒂文·里希特说道,“如果你在德国的街道上训练人工智能,然后在北美的街道上使用它,那就有可能出bug。”和使用真实的照片相比,游戏能让研究人员能够更迅速地创建带有标记的图像来训练计算机。当使用真正的街景照片时,研究人员必须手动标记屏幕上的每一个对象,所以计算机才能根据标记“对答案”——来学习它在看到的是什么。

这是个很花时间的过程,时间就是金钱那。

游戏代码就不一样了。它们总是“知道”屏幕上那坨东西里有些啥,相当于帮助研究人员标签好了。接着把这些信息发送给特定的软件就可以进行研究了。“我们意识到,游戏中已经给车加上了‘标签’,所以当它再次出现在另一个框架里面的时候,我们就可以简化这个注释过程。”里希特说。

里希特的研究小组和因特尔实验室最近就发表了一篇有关这个方法的论文,他们发现平均只需要七秒就能标记好一张从GTA5中裁剪下来的图像。而手动标记真实图像则需要90分钟——又浪费时间又浪费人力。

GTA、杀手47,看门狗等等著名的3A大作都是这个团队发表的文章中的例子,它们提供了足够的真实度和细节,也许游戏真的能够改变机器学习的研究。很多研究团队可能没有时间或金钱来手动标记真实世界的图像,或者制作逼真的3D模型,游戏也许可以填补这种资源的差距。但为了使游戏真正能够在研究中更方便地使用,游戏开发者需要开放与研究人员的合作,来帮助机器学习研究者的工作。

“游戏在视觉质量方面已经相当真实了,如果能够开放游戏引擎给机器学习的研究者,那将会相当有意思。”李希特说。想象一下,在一个人工智能饱和的未来,如果一个新出的游戏能够达到更高的逼真度,说不定会有AI会自主地去挖掘它。不知道它们“玩”到的游戏,和我们有什么差别呢?

UUID: 43f7494d-cdc6-486c-a4bd-22a18d4e6c04

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2016/2016-09-21_科学家又带着AI去作妖了!这次的习题是《GTA5》!.txt

是否为广告: 否

处理费用: 0.0036 元