撒贝宁与百度智能搜索“PK”是一种怎样的体验?作为著名节目主持人,当小撒用快语速、长句子、中英混杂去刁难百度APP的时候,人工智能加持下的搜索技术真的能读懂小撒吗?这场大战就发生在8月18日百度世界大会现场。
一改主持人的端庄形象,小撒用超快语速说出“众里寻她千百度,蓦然回首,那人却在灯火阑珊处的作者是哪个朝代的?”百度APP马上给出答案:“南宋”。
紧接着挑战升级,再问“你知道You need cry dear啥意思吗?”百度App回答:“有你的快递。”其实这是一个被智能搜索成功识别的陷阱,“You need cry dear”是中式英语的玩笑话,多用来安慰人,其实表达的就是“快递(购物)是最好的疗伤手段”。
智能搜索挑战成功,撒老师给出“后悔没早用百度APP”的认证。
在智能搜索领域,百度对语音识别的准确率已经高达98%,达到了比人耳都要灵敏的程度。其强大之处已经不在于对字正腔圆、发音清晰的声音进行识别,而已经涵盖了对多轮对话、长句、中英文混杂和方言的识别。此外,百度还拥有强大的TTS技术能力,TTS是“Text To Speech”缩写,意思是“从文本到语音”,通俗的讲,就是一种把文字信息转化为听得懂的、流利的口语的技术。
在今年的百度世界大会现场,百度使用AI技术“数字化”了百度APP代言人龚俊,称呼“俊俊”。AI数字人俊俊在XR区域唱跳了周杰伦的《夜曲》,听起来是龚俊本人在唱,其实是AI在唱,模拟的相似度如此之高,这离不开百度多年的TTS技术积累。
百度世界大会一直被誉为“黑科技show场”。今年的主题“AI这时代,星辰大海”恰如其分的描绘了搜索技术的发展趋势:搜索智能化。要知道,在从前,搜索是一项专业技能,是需要训练和学习的。为了提高搜索效率,用户需要学会如何把一个复杂问题提炼出关键词,让系统更容易识别。那个时代,直接搜索长问题和复杂句子只能是梦想,而现在,百度每天要响应60亿次这样的搜索请求。
在本届百度世界大会上,沈抖介绍了一个看起来“很简单”的功能:百度APP已经能实现20句话就能模拟一个人的声音,这意味着用户可以用定制化声音来导航、读书、播报新闻。这项变革得益于百度的黑科技:Meitron(千人千面)个性化语音合成技术。通俗的讲,Meitron对TTS行业的变革是颠覆性的:录音场地从录音棚到了手机端;录音数据也从万句压缩到20句话;制作周期从几个月缩减到10分钟以内。
在很多人看来,轻声就是比大声小一些,轻声说话时,距离话筒近一点,周边环境安静一点就能识别出来了,这种理解是错误的。“轻声”不是“小声”,要准确识别“轻声”这需要彻底改变背后的建模逻辑。传统的语音识别,其建模单元叫“音素”,大致相当于拼音中的元音和辅音,如“a、o、u,b、p、m、f”。大声说话的时候,人可以把每个音素表达的很清楚,此时模型识别效率很高。然而,一旦轻声说话,整个发音模式就变了。
经常使用语音搜索的人,一定对下面这段对话不陌生。问:“北大是什么时候创建的”?答:“1891年”。问:“清华呢”?答:“对不起,我没有听清你的问题”。这时候用户只能重新问一遍:“清华是什么时候创建的?”为什么会出现这种情况,因为绝大多数的语音搜索功能都无法实现连续提问。系统不知道第二个问题“清华呢”依然和上文有关。
智能搜索的核心能力是什么?概括的说,所有和AI相关的技术都是智能搜索的底层技术。搜索技术的进化方向,要求它越来越像一个无所不能的人,这恰恰是人工智能要追求的。展开来说,包括基于NLP的人与计算机对话的技术,识别文字、图片、实物的多模态技术以及语音识别技术。
那么搜索技术的进步是来自于天才的想法还是一步一个脚印的提高?答案是二者兼而有之。
天才的想法诞生于实验室,从实验室到大规模应用,需要一次次调试,一行行代码敲出来。早在2019年,百度就获得MRQA2019阅读理解国际评测竞赛冠军,公开数据集超越谷歌和微软。
MRQA是语义理解领域的重磅竞赛,但百度却对此有更深的认识:“一个人可以把英语阅读理解做到满分,这固然能体现他部分的英语能力,但是这和熟练使用英语进行无障碍交流之间还有很大的差距,阅读理解100分,放到现实应用中只有60分,这便是“学术界”和“工业界”的差别”。
在国内,百度是最早投入人工智能技术研发的科技公司,早在2010年就成立了单独的NLP部门。有人会问,一家做搜索的公司,莫非要转型做AI?其实这是个伪问题。不是搜索转AI,而是为了做好搜索,必须要做AI,AI是智能搜索的基础。
现在,智能搜索已经嵌入到生活的方方面面。智能家居、无人驾驶汽车、智能手表,乃至VR设备。只要发生交互,就一定伴随搜索存在。那么,搜索有它的最终形态吗,它的终局是怎样的?
在百度的工程师们看来,搜索没有完美形态,它是不断进化的,因为人的需求是不断进化的。从前搜索文字,再后来搜索图片,现在越来越多的搜索指向视频。畅想一下未来,还记得科幻电影《头号玩家》吗?带上VR眼镜就进入了另一个虚拟世界,在那个世界同样需要搜索。