科大讯飞胡郁在世界人工智能大会上表示,等下一次交互革命到来的时候,语音会取代触摸成为核心的交互手段。届时,不仅双手会被解放出来,连与设备的距离,也变得更自由了。胡郁认为,这个未来不会太远,物联网的契机一定会推动语音交互快速爆发。
胡郁指出,语言本身是有壁垒的,使用习惯和表达方式都有很强的本土性,这个特性给很多本土企业留下了发展的空间。比如在电脑和手机上使用的输入法,就是很好的例子。胡郁刚刚坐下,又开始谈起了业务,语音识别、语意理解和语音合成哪一项都跟使用者的表达习惯直接相关,要做得实用、有亲和力,除了强大的技术,还要对使用者的背景和习惯有清晰的了解,用词的方式、语音、语调都是不能忽略的重点。
今年9月,科大讯飞在国际多通道语音分离和识别大赛中获得了三个项目的最好成绩。项目测试的核心内容是在复杂环境下语音分离和识别的能力,这个比赛从侧面证明讯飞在嘈杂环境中的识别能力,已经走到了世界顶级。
胡郁表示,讯飞不能等物联网的爆发来拉动用户活跃度,在此之前,他们得主动扩展智能语音的应用场景,提高智能语音使用的满意度。教育、医疗、智慧城市、智慧交通,这些都是非常重要的领域,智能语音能够介入的空间也很大。他们尝试着做个性化的智能教育,让智能系统收集学生的学习情况,综合分析后,再给出具有针对性的练习方案。在合肥一中做的测试反馈还不错,一些排名中等的学生冲到了年级前列。
胡郁还提到,最近电话诈骗非常猖獗,而安徽省的诈骗次数却下降了60%。这是因为讯飞和当地电信系统合作,做了一个监控系统,对有诈骗性行为通话进行自动提醒。整个提醒工作都由智能系统自动完成,不会增加额外的人力。
1999年,科大讯飞刚在安徽合肥成立时,林林总总跟语音处理相关的公司在北京和上海等创新中心冒出了一批。
相比而言,科大讯飞所处的地理位置和投资环境都不占优,除了背靠中国科技大学以外,几乎很难找到显眼的优势。要知道,“人工智能”的概念提出以来,也随着行业技术的发展经历了巨大的起伏。即使中科大从这个专业毕业的学生,也有好些年都难以找到合适的工作。胡郁说,“当时能坚持不转行的人,现在很多都已经成了行业中重要的研发或者管理人员。2000年后,很多语音处理公司陆续倒闭,但讯飞坚持了下来。
”不仅如此,当时的讯飞吸纳了大批从中科大毕业的研究人员,还凭借积累的技术优势,获得了2003年的“国家科技进步奖”。
随后,这个远离创新中心的技术型企业在内陆地快速发展,陆续获得了更多国家级和国际级的奖项,业务范围也开始逐渐扩展。近几年,互联网的快速发展和巨大的网民基数,给人工智能的发展提供了良好的土壤。计算性能大幅提升后,深度神经网络技术又在2006年左右以全新的方式回归。
大数据让人工智能成为了可能,它和深度神经网络技术结合后,在语音识别方面,表现出了巨大的优势。以前食之无味弃之可惜的语音识别技术,迅速提升到个位数的错误率,有了极高的商业应用前景。凭借在前期积累的技术经验,讯飞借助这次的机会占领了中文智能语音市场的绝大部分份额,一跃成为BAT外,非常重要的一家人工智能企业。
胡郁表示,目前讯飞有上千人的技术团队在研究AI技术,在应用方面,国内研究人工智能的团队已经能和美国这些在人工智能技术领域领先的国家相比了。20世纪60年代的时候,我们技术积累薄弱,没办法和世界上最先进的国家竞争。在这一波人工智能的潮流中,国内或许能成长出一批国际性的科技公司。
但是,要成为国际性的公司,按现在的市场规模和用户活跃度还有些距离,无论是技术爬坡还是市场规模的开拓,预设曲线都很陡。
胡郁反复强调,“我们是平台型公司”,每年申请上百件的专利,就是为了能给应用型的公司提供核心的技术。目前讯飞也会投资一些创业公司,加速推送物联网的发展,但并不代表着他们会做特别垂直的产品,自己去抢占这个市场。胡郁相信机器人或者说人工智能的应用市场很难被几家大公司垄断,因为用户的需求变化太大,需要有很多公司来分别满足他们不同的需求。
讯飞希望的,是这些公司在整合产品时,使用讯飞的核心技术,做出体验更好的产品,从而扩展讯飞的市场占额。
胡郁陪着讯飞经历过行业的低谷,这一次,他们想趁胜追击。十几年积累的技术优势和平台优势,都像有待爆发野兽。胡郁说,“5年内,在医学、教育、车载和智能家居等领域中,我们会把语音交互的使用次数提高10倍,达到40%的比例。到时候,就是一场新的交互革命。”