今天,谷歌发布了一款叫做“猜画小歌“的微信小程序,转眼就在朋友圈里刷屏了!这款游戏的玩法是这样的:由用户和谷歌AI组队,用户来画、AI来猜;如果20秒内画被AI猜中了,你就能进入下一轮,积累连胜次数;游戏过程中还伴随着销魂的谷歌女声。虽然这款小程序今天才登陆微信,但它的前身,隶属于谷歌AI实验室的快速涂鸦(quickdraw)早就出现了。每画一笔,AI都在猜你画的是啥。比方说,你能认出这是个芦笋?
反正谷歌AI认出来了!不过特别烦人的是,一旦AI猜出来了,游戏就结束了,根本不给人画完!玩了几轮下来,所有人都在问:为什么谷歌AI能猜中我画的是啥?偷偷教你怎么坑AI:从局部开始,不要一下子画好轮廓;加一些没屁用的细节上去。在这个精神的指导下,诞生了如下画作:恭喜你成功唬过了AI,游戏失败退出!等下!为什么胡逼简笔画就能被AI猜中,认真画了充满细节的作品却失败了?这就说到AI的运作方式了。
“猜画小歌“对你画作的辨识,利用的是神经网络技术,是基于对大量涂鸦样本的学习。涂鸦是人们对事物的抽象表达,只不过,这个抽象对AI来说有点困难。谷歌的研究人员正在朝这个方向努力,训练机器像人类一样学习绘画和生成抽象的概念。这里利用到的技术有一个高大上的名字:RNN,也就是递归神经网络。不过你不用管这个名字,你只需要知道,你们费力怼出来的灵魂作品,最后都跑去丰富了人家庞大的人类涂鸦数据集。
研究人员在人类涂鸦数据集中训练神经网络,让AI来理解人们在绘制涂鸦时是在何时起笔、走笔方向、何时停笔的。当经过训练的RNN模型接收到人类绘制的涂鸦后,会生成一张类似的新涂鸦:有样学样哈?不过照着描毕竟还是简单。如果人类提供的涂鸦本身有瑕疵,AI“知道”要纠正吗?答案是肯定的。
在RNN模型中,当研究者输入参与者创作出的灵魂涂鸦,例如没眼睛猫、没鼻子猫和没胡子猫,AI仍然能够重构(强扭)出“正常”的图像来。甚至到了下图的最后一排,那明显是一把刷子啊,但是模型仍然执着于生成有猫耳朵、猫胡须、猫脚的图像。还真把刷子当猫……我们再用猪来试试。第三排的猪猪,8条腿被修正成了4条腿。
然而可能是为了遵守原来的笔画数,猪身上乱入了奇怪的东西:不可名状的眼睛、翅膀和犄角什么的……再输入一张卡车图:猪就很像卡车了……可是,一千个人会画出一千种不同的小猪,同一个抽象概念可能被表达成不同的样子,模型要怎么理解这些差异?还是用小猪举例子(强势出镜):一开始只有头,再后来各部位尺寸被不断调整,然后身子出现了,最后,我们得到了一只完整的小猪。
科研人员还发现,RNN模型的确对不同的涂鸦进行了类比。比如上图,模型将“身体”部分进行了类比,选择给猫头涂鸦加上身体,或是将“完整小猪”中的身体去掉,只剩下猪头。除了你画我猜,这个研究还能用来做什么?研究人员表示:能用到的地方还是很多的,提出绘画建议啦、扩展艺术家想象力啦、让AI帮学生学绘画啦……以上就是一身艺术细菌的该模型提出的指导意见(。
说回到“猜画小歌”的小游戏,掌声迎接一下果壳评论区各位网友大作:@希瑙:我画的这么形象,猜不出?@ 鹏Ray:@达芬奇 蒙娜丽莎她是谁@knux光子郎:蒙娜丽莎(前面那位怕是要哭死)@岩鸣杨子:@熔融蓉zzzz:这么明显为什么猜不出!@独孤子丹:画得这么抽象也能猜出来@元气少女阿萌酱:龙大家是怎么画的啊!(对不起我真的不会@阿猎栖于木星之洞:我不服,这就是羊啊@美味且易燃:???