中国电信用人工智能守护方言

作者: 孟凌霄

来源: 中国科学报

发布日期: 2024-05-27 12:02:19

中国电信人工智能研究院发布支持30种方言的语音识别大模型,旨在解决老年人和偏远地区人群使用智能服务的难题,并推动方言文化的保护和传承。该模型通过数据、算法和算力三方面的创新,实现了高精准的方言识别,并在多个应用场景中展示了其技术能力。

“唔该查吓电话费吖”“侬帮阿拉查下话费好伐?”“帮看哈⼉搜机还有好多钱嘛?”过去,当不会说普通话的⽼年⼈在中国电信万号智能客服查话费时,“听得懂”是解决问题的第⼀步。在中国电信CTO、⼈⼯智能研究院院⻓李学⻰的带领下,中国电信⼈⼯智能研究院(TeleAI)于5⽉25⽇发布业内⾸个⽀持30种⽅⾔⾃由混说的语⾳识别⼤模型——星⾠超多⽅⾔语⾳识别⼤模型。

该⼤模型的最⼤亮点是摆脱了单⼀模型只能识别特定单⼀⽅⾔的困境,解译了包括上海⽅⾔、粤语、四川⽅⾔,以及有“中国最难懂的语⾔”之称的客家话、温州⽅⾔在内的30种⽅⾔,⼀跃成为国内⽀持最多⽅⾔语⾳识别的⼤模型。

“作为央企,我们有责任和担当解决⽼年⼈及⽼少边穷地区⼈群跟不上⼈⼯智能时代的难题,让所有⼈都能享受⼈⼯智能带来的便利。”中国电信⼈⼯智能研究院语⾳⼤模型负责⼈李杰表示。

发起“守护⽅⾔计划”普通话语⾳识别已⾮常成熟,⽽因为难度⼤,⽅⾔识别发展较为缓慢,中国电信却持续在这⼀领域发⼒。李杰介绍,中国电信作为头部运营商,万号智能客服每天会接到⼏百万通电话,其中很⼤⽐例是⽅⾔。⽬前中国约20%的⼈⼝尚未普及普通话,⾯临着信息服务难以触及的困境。与此同时,语⾔⽂化保护⾯临严峻挑战。

教育部国家语⾔⽂字⼯作委员会发布的《国家中⻓期语⾔⽂字事业改⾰和发展规划纲要(2012—2020年)》明确提出,要“建⽴和完善语⾔资源库,探索⽅⾔使⽤和保护的科学途径”。

在市场导向、业务需求和使命感驱动下,中国电信⼈⼯智能研究院致⼒于使⽤前沿语⾳识别技术,让⽅⾔沟通更加⾃然流畅,极⼤解决⽼年⼈及⽼少边穷地区⼈群⽆法触及信息服务的问题,为⼈们搭建⼀条通往⼈⼯智能时代的沟通桥梁。

在解决现实需求的同时,⼈⼯智能正为传承语⾔⽂化注⼊全新⽣命⼒。传统⽅⾔研究⼈⼒⼯程量巨⼤且难以系统标注,⽽中国电信⼈⼯智能研究院构建的⾼质量⽅⾔数据库,将更⾼效、系统地对⽅⾔进⾏整理归纳,对⽅⾔保护和传承意义重⼤。这是⼀场与时间赛跑的“守护⽅⾔计划”。

“超多⽅⾔语⾳识别⼤模型只是我们规划设想中的第⼀步,接下来我们会持续拓展⽅⾔种类、提⾼识别精确度,争取早⽇覆盖全国333个地市和主要少数⺠族语⾔。”李杰介绍。

“三驾马车”实现⾼精准识别如何实现单个语⾳⼤模型同时识别多种⽅⾔?李杰介绍,数据、算法、算⼒是星⾠超多⽅⾔语⾳识别⼤模型实现⽅⾔识别的“三驾⻢⻋”。

“关于⽅⾔的数据较少,数据标注后的⾼质量数据更少,标注成本也更加⾼昂。”李杰介绍,构建⾼质量⽅⾔数据库是⽅⾔保护和研究的基础。当前,中国电信⼈⼯智能研究院已构建超30种、超30万⼩时的⾼质量⽅⾔数据库,⽅⾔数据库在丰富性和⾼质量等⽅⾯均居于业内前列。

算法层⾯,研究团队⾸创了“蒸馏+膨胀”联合训练算法,解决了超⼤规模、多场景数据集和⼤规模参数条件下预训练坍缩问题,实现80层模型稳定训练。通过“从语⾳到token再到⽂本”的建模新范式,⼤⼤降低推理时语⾳传输⽐特率。

此外,在算⼒基础设施⽅⾯,中国电信具有得天独厚的优势。作为国内最早进⼊云计算领域的运营商,中国电信积累了⼤量算⼒建设和算⼒调度的核⼼技术。今年,中国电信陆续投产了京津冀智算中⼼、中南智算中⼼等多个满⾜⼤模型训练需求的公共智算中⼼。⽬前,星⾠超多⽅⾔语⾳识别⼤模型以绝对领先的性能,斩获多个国际权威赛事冠军,并不断刷新⽅⾔语⾳识别准确率纪录。

进⼀步探索新兴应⽤场景⽬前,星⾠超多⽅⾔语⾳识别⼤模型已⼴泛落地,并深⼊推动⼈⼯智能与各⾏各业的融合,积极探索新兴应⽤场景。借助该⼤模型,中国电信万号智能客服“秒懂”30种⽅⾔,⾃然流畅地服务⽤户,实现⽇均处理约200万通电话;智能客服翼声平台接⼊该⼤模型的语⾳理解和分析能⼒,实现31个省份全覆盖,每天处理125万通客服电话。

如今,该⼤模型已在福建、江⻄、⼴⻄、北京、内蒙古等地的中国电信万号智能客服系统试点应⽤。

在中国国际⼤数据产业博览会上,中国电信数字⼈“数数”“C位”亮相,成为主持⼈康辉的新搭档。星⾠超多⽅⾔语⾳识别⼤模型已赋予诸多数字⼈“能听会说”的能⼒,后者不仅能⾃然流畅地对话,还能中英⽂随意切换。据悉,该⼤模型已赋能多地市的12345市⺠服务平台,使每位客服⼈员“秒懂”30种⽅⾔,更了解市⺠需求,提⾼沟通效率,助⼒政务⼯作智能化升级,更⾼效、便捷地为市⺠提供服务。

不仅如此,能⽤⽅⾔沟通的星⾠超多⽅⾔语⾳识别⼤模型,未来将通过⼴泛的场景应⽤满⾜更多群体的情感需求。如有⼤模型“加持”的智能座驾助⼿,能与全国各地的司机⽤他们家乡的⽅⾔流畅沟通。该⼤模型为⽼年⼈提供⽅⾔版语⾳交流、智能看护、亲情互动等服务,从精神层⾯给予慰藉。

“我们已将语⾳识别⼤模型全⾯开源,希望联合开发者共建覆盖更多⽅⾔的⼤模型,打破沟通壁垒。”李杰表示,团队呼吁更多专家、⽅⾔爱好者及⼤众⽤户⼀起加⼊“守护⽅⾔计划”,共同传承语⾔⽂化,推动⼈⼯智能普惠。

UUID: a91305fb-1de4-4c8a-ab93-bc861fb140af

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中国科学报公众号-pdf2txt/2024/中国科学报_2024-05-27_“秒懂”30种方言,中国电信用人工智能守护方言.txt

是否为广告: 否

处理费用: 0.0074 元