小心,你的参赛对手是“数字人”。流利给出答案的同时,“灵”的目光流转,很自然地做出了一个欢迎的手势。这位名叫“灵”的“女孩”,扎着高马尾辫,穿着白衬衫、灰裙。不特别留意,你很难发现她的“小秘密”——就在3月19日结束的第十三届“挑战杯”中国大学生创业计划竞赛上,她作为001号参赛选手参与项目演示,一举拿下了“挑战杯”大赛金奖。这位“挑战杯”办赛史上的第一位数字人——“灵”是怎么诞生的?
带着这份好奇,《中国科学报》记者来到了北京理工大学教授翁冬冬的实验室。一间光线幽暗的实验室,一旁的摄像头星罗棋布包裹成一个“大球”,让人感觉来到了一个星际空间。这里就是数字人“灵”的诞生地。“大球”里共有80个三角面、42个顶点和120条边,边的中点和顶点上安装光源,实际光源数量为156个。球形灯光舞台围绕其中心均匀排布36台佳能850D相机,用来采集各视角下的人脸图像、极限表情和人脸材质。
与以往数字人的诞生有所不同,此次北京理工大学团队开发的“灵”完全由数字生成,并没有真人原型。她由800多块骨骼协同控制其面部的表情,同时由82个材质参数的变化进行面部材质的动态调整,成为一个栩栩如生的数字人。早期的数字人多基于二维体系构建而成,由于解耦程度比较低,换衣服、换发型、换光线等效果都难以实现。如今,技术已发展到在三维体系中制作数字人。
“二维与三维有点像电影与游戏的区别——电影拍完不能改,而游戏由玩家控制。三维数字人,其表情、服装、头发甚至动作都可以实时变换,二维体系下的数字人却很难做到。”翁冬冬说。在元宇宙中,数字人是不可或缺的角色。7年前,北京电影学院与北京理工大学等高校合作成立了北京市未来影像高精尖中心。当时,翁冬冬接到的任务是做“沉浸式叙事”。简单来说,就是在虚拟现实空间中把故事重新呈现出来。
研究之初,他发现了一个重要问题——没有“演员”。为此,团队决定做高逼真数字人。数字人去打一场比赛。美国传播学家艾伯特·梅拉比安曾提出过一个公式——沟通时信息的全部表达=7%语调+38%声音+55%肢体语言。看到这个比例,你也许会很吃惊,原来大部分信息是通过肢体语言和表情传达的。但语言、表情和动作等通道间的不协调,却会使数字人产生错误的表达。
比如,一个人嘴上说“很有道理”,眼神却流露出轻蔑,你会相信这句话是真的吗?翁冬冬一直在想“要不要给数字人赋予需求,因为有了需求的智能体才会像人一样主动探索世界”。比如让数字人会饿、有社交焦虑等。他把这一想法放在“灵”身上实现,便是给予她参赛选手的身份,让她有“竞争”的需求。
站在元宇宙的舞台中央,“灵”作为北理工“元宇宙时代下超逼真智能数字人行业引领者”团队的参赛选手,落落大方地为台下“观众”介绍这款专门对抗老年人智力流失的VR游戏。他们还引入由清华大学团队开发的、类似ChatGPT功能的聆心智能。