2019年5月16日下午,微软(亚洲)互联网工程院在北京召开了“微软小冰-人工智能创造媒体说明会”。在本次说明会上,微软(亚洲)互联网工程院发布了多项艺术领域的人工智能研究成果,包括人工智能小冰的绘画模型、纺织面料设计平台、演唱模型与自动生成有声读物的技术进展。自从2016年阿尔法狗在围棋比赛中战胜李世石,人工智能产业化拉开了时代大幕。
这一产业的繁荣与发展,不但需要学术界的探索,更需要企业界的实践。这一伟大的历史进程被称为“第四次产业革命”。
微软无疑是学术界与企业界的翘楚,微软小冰正是这样一款极富代表性的产品。微软小冰最早由微软(亚洲)互联网工程院于2014年5月推出,这是一个融合了自然语言处理、计算机语音和计算机视觉等人工智能技术的底层框架。该框架注重人工智能在拟合人类情商维度的发展,强调人工智能情商在人机交互中的重要作用。
在本次媒体说明会现场,微软(亚洲)互联网工程院副院长李笛介绍了人工智能小冰演唱模型的五个版本。其中最新发布的第五个版本拥有十余个高质量声音,通过在呼吸、不同的演唱技法、充沛的中气、不同的音色、唱腔过渡等一系训练、学习和优化,提升了人工智能在歌声演绎中的预测参数能力,大幅度提高了人工智能演绎歌曲的水平与自然度。在现场演示中,微软小冰演唱了三段歌曲——《少年弦》《新贵妃醉酒》以及一段日语歌曲。
这三首歌曲丝毫没有任何“电子音”的感觉,在现场的观众无法分辨出到底是真人在唱歌,还是人工智能机器人在唱歌。
微软小冰的人工智能演唱模型一直保持着全球领先的技术地位。2019年4月3日,微软小冰在日本宣布与AVEX唱片公司合作,将其日本版本的人工智能歌手身份纳入AVEX旗下。除小冰外,微软还拥有或为第三方提供了十余个高质量的虚拟歌手模型。
随后,李笛公布了人工智能自动生成有声读物的技术进展,并披露了一个由微软小冰人工智能框架生成的河南交通广播电台节目主持人的信息。这种会播报交通新闻的人工智能主播,其实集成了微软在人工智能领域极强的情感计算算法能力。
一开始,可能是受到阿尔法狗在围棋上的成功的影响,整个行业都在追求建立一个一个不同领域IQ(智商)的能力。但是微软在比较早的时候就开始布局EQ(情商)领域。
EQ和IQ并不是相互排斥的,并不是说人工智能要去发展情商就不应该去发展智商,反过来也是一样,它们是一种相互融合的过程。李笛强调:“当人工智能在学习人类IQ的时候,EQ其实起到了非常大的作用。”具体来说微软小冰的情感计算框架其实包括了很多内容,但其在中间的部分有一个核心,这个核心就是以对话式的人工智能作为基础的,所以微软小冰有着很好的长程对话的能力,而且对话表现出来的情商很高,可以做电台的女主播。
在电视和广播内容方向,微软小冰截至目前在为63家电台和电视台持续地提供人工智能辅助生成和人工智能直接生成的电视、电视台节目,这其中有59家是在中国。随后,微软(亚洲)互联网工程院微软小冰人工智能创造及商业事业部总经理徐元春介绍了微软小冰在“琴棋书画”领域的进展。总得来说,谷歌的阿尔法狗已经把棋做完了,微软小冰作为一个18岁少女的人工智能形象,则把剩下的三个做完了。
微软小冰写诗在几年前就已经发布过了,2017年微软小冰就出版了诗集《阳光失了玻璃窗》。
微软小冰的绘画模型是这次发布的重要组成部分。该模型通过对过往四百年艺术史上236位人类画家画作的学习,实现了原生绘画创作能力。现在微软小冰的绘画水平,已经达到了中央美术学院研究生的水平。发布会披露了微软小冰在中央美院、中国美院和杭州万科大屋顶文化等院校机构的参展信息。
另外,在纺织服装面料设计领域,微软小冰为许多中国服装企业提供了基于人工智能的纺织面料设计平台,改善了服装企业在面料纹样设计方面的短缺。由微软小冰设计的第一批丝绸产品,已经被中国丝绸博物馆永久收藏。在发布会最后,与会者体验了“少女画家小冰”绘画创作小程序。
微软强调人工智能在创造领域的探索。在微软的世界观中,人工智能创造并不是以击败人类为目标,而且是要参与一个“高度定制化”内容时代的来临,无论是唱歌还是主持,是设计还是绘画,这些创造性的活动都可以由人工智能来完成。