2020年9月25日-9月26日,“2020中国科技峰会系列活动青年科学家沙龙—人工智能学术生态与产业创新”圆满召开。
本次活动由中国科学技术协会主办,清华大学计算机系、AI TIME、智谱·AI承办;活动围绕认知智能、自动驾驶、自然语言处理、计算机视觉、知识图谱、智慧人才等AI领域最前沿的学术发展和产业前沿,邀请了中科院、清华大学、北京大学、浙江大学、中国人民大学、哈尔滨工业大学等院校的青年科学家,以及来自阿里巴巴、百度等企业的青年企业家们共同参与讨论。
自然语言处理是人工智能的关键问题,深度学习技术在自然语言处理中对于数据的依赖性很高,目前的算法还存在着无法让机器人来理解自然语言这样一些问题。在9月26日上午的圆桌论坛环节中,以“论道自然语言处理的瓶颈与曙光”为主题,邀请何中军、徐剑军、刘知远、兰艳艳四位专家学者,围绕“算法研究、人才培养、产业落地、未来发展”这四个大方向的诸多问题进行了思辩。
算法研究的三个问题:一、结合知识与常识来发展NLP,是否是有价值的研究方向?二、GPT-3将给NLP带来哪些影响,是开启未来的钥匙,还是“误入歧途”?三、未来着重于哪些方法,有助于让机器从“感知”语言到“理解”语言?第一个问题,几位专家都觉得把知识融合到自然语言处理的过程中来,还是有挺大的意义或者价值的。
徐剑军认为,问题的答案是很明显的:要结合知识和NLP共同促进,现在工业落地的做法都是两边互相促进,把知识图谱建设起来的过程中,要用大量NLP的方法,建完之后又可以仿造NLP,让NLP在特定领域变得更加准确。
关于第二个问题,兰艳艳肯定了GPT-3产生的好效果,同时也一针见血的指出来目前还存在的难题:没有常识,无法解读“言外之意”;刘知远认为:GPT-3是一个里程碑,但不是终点,在更多去利用现实世界数据的基础上,还是要能够尝试给机器构建出一个世界模型,让它具备抽象学习的能力,只有这样才能出现未来更智能的机器。
第三个问题,蓝艳艳认为:要实现从感知语言到临界语言,从NLP到NLU,除了知识和常识之外,未来要达到认知语言的状态还要结合多模态,还有结合人的整个活动的过程跟环境的标注,才能做好理解语言这件事情。