38年前,天文学家在美国宇航局(NASA)火星探测器“维京1号”拍摄的火星照片上发现:火星表面矗立着一个“人脸雕像”,眼睛、鼻子和嘴都清晰可辨,眼神似乎还在死死地盯着正在拍照的“维京1号”。这张照片一经公开就引起了轰动。人们开始猜测那是不是外星文明留下的杰作。图1 海盗1号拍摄的形似人脸的火星丘陵(图片来源:NASA)直到2001年,另一架探测器“火星全球勘探者号”再次造访该地。
大量网民焦急地等待着NASA公布更为细致的照片。然而,重新拍摄的照片彻底否定了之前各种疯狂的猜想。那个“人脸雕像”只不过是地形和光影造成的错觉,“脸”是完全不存在的。面孔,俗称脸,或许是一个人出生之后最早赋予视觉意义并加以重视的物体。两个半月大的婴儿就已经会对母亲的笑脸报以微笑。这是婴儿与母亲互动的一种方式,也是其社会化的开端。识别面孔对于人类这样一种高度社会性的动物来说简直太重要了。
在中国科学院自动化研究所,凝聚着这样一群人,我们专注于各类“脸”的研究,车脸、人脸、声音的“脸”、眼睛的“脸”、大脑的“脸”……这类研究统称为“模式识别”,主要包括图像识别、声音识别、文字识别、指纹识别等。科研成果大量应用于国防、社会安全和国民经济主战场。这个凝聚尖端科研成果、汇聚高端人才的学术殿堂就是模式识别国家重点实验室。
模式识别国家重点实验室于1987年正式成立,经过三十余年不懈努力,已经发展成为拥有固定人员100多人,其中包括中科院院士1人,国家杰出青年基金获得者7人,形成了一支以年轻学术骨干为主体和以高素质研究生为主力的研究梯队。模式识别国家重点实验室在模式识别基础理论、视觉信息处理、语音语言信息处理等方面取得了许多前沿的研究成果和行业领先的关键技术。模块之一:如何证明你是你自己?
生物特征识别与安全技术,研发生物特征识别与安全技术,在虹膜和人脸识别领域建立了系统的理论和技术体系,孵化了中科虹霸等安防领域的领军企业,相关技术在边境安检、公安司法、银行支付以及北京奥运等重要场所得到广泛应用,并牵头制定了多项国家或行业标准。
图2 生物特征识别与安全技术在多种重要场合得以应用模块之二:照片,不再“照骗”大规模图像与视频语义理解技术:研发了大规模图像与视频语义理解计算模型和描述体系,有效实现了图像视频语义的精准理解;开发的多种场合下图像理解与视频分析关键技术及应用系统,在视频监控、反恐维稳、边境安防、轨道交通等领域得到了规模化应用。
图3 对图像视频语义的理解让照片不再照骗模块之三:突破语言壁垒,我们是专业的高性能机器翻译系统:研发了高性能的机器翻译系统,在国际上率先实现了汉语和蒙藏维等少数民族语言之间的自动翻译,翻译的准确率和速度均已达到国际先进水平,该系统广泛应用于大型跨国公司、军队和国安等部门,在保障国家信息安全方面发挥了重要作用。
图4 高性能机器翻译系统实现汉语与少数民族语言间的自动翻译模块之四:头脑特工队:画出一副你大脑的地图在研究计算机感知外部世界的同时,我们也特别研究人脑处理信息的机理和方式。实验室引入了脑连接信息对脑区进行精细划分,成功绘制出全新的人类脑图谱:脑网络组图谱,包括246个精细脑区和亚区,比传统的脑图谱精细4-5倍。该项成果已入选2016年“中国十大科技进展新闻”和“中国十大医学进展”。
图5 实验室绘制的人类精细脑网络组图谱在模式识别领域其他多个方向,我们形成了国际认可的理论框架和推动应用的关键技术。成果之一:字丑没事,我有火眼金睛中文手写文档识别技术:针对各类文档图像提出了有效的版面分析、文本行提取和识别方法,获得了领先的性能,在金融和安全等领域实现了规模化应用。图5 中文手写文档识别技术实现书写文字的精确提取成果之二:陪你把寂寞聊走,可好?
高鲁棒性多表现力智能语音交互平台:研发的高性能多模态人机交互平台,具有远场语音识别和情感识别能力,以及个性化的语音合成系统,向众多企业授权使用。图7 多模态人机交互平台成果之三:在三维空间与你相遇基于图像的室内外大规模场景三维建模与快速定位:实验室构建了基于图像的大规模场景三维建模和定位的方法与技术,在数字城市、测绘导航、文物保护等领域得到了系统性应用。成果之四:世界那么大,我有千里眼!
遥感图像处理:研究时空大数据分析的理论与方法,实现了海量遥感数据上的多源配准与融合,以及目标检测与识别的新技术,并成功应用于国家空间信息处理。成果之五:和谐社会,我们维护社交多媒体计算:研究互联网社交多媒体的信息理解和处理,提出一系列有效的方法和技术,并成功应用于公共安全、旅游等领域。图8 社会媒体大数据分析成果之六:我来负责你的貌美如花?
内容相关的图像合成:研发的图像合成和人像美化技术,应用于社交网络的“天天P图”、“美容美妆”和“动效自拍”等产品。图9 人像美化技术让照片变得“照骗”实验室经过长期积累,已经发展成为包括基础数据库建设、理论研究、核心技术研发、标准制定,以及技术转移转化等多元型、一体化的综合实验室。实验室的多个数据库被学术界和工业界广泛使用。研制的技术多次获得国际学术竞赛冠军,并实现了规模化商业应用。
模式识别国家重点实验室始终坚持面向国家战略需求和国际学科前沿,开展基础性、前瞻性、战略性和系统性的创新研究,产出了一系列重大科技成果,成为引领模式识别领域科学研究、人才培养、开放交流的重要基地。面向模式识别和人工智能领域的未来发展,模式识别国家重点实验室将不断开拓创新,奋力前行。