解开声音密码,让老年人不必奔波千里领退休金

作者: 邬晓钧

来源: 果壳

发布日期: 2019-11-10

邬晓钧老师介绍了声纹识别技术在养老保险认证中的应用,旨在解决老年人领取养老金的认证难题,减少冒领现象,提高认证效率和安全性。

每个人的声音都和指纹一样,有自己独特的“元素”,会受到先天和后天环境的影响。那么,声音是否也可以像指纹一样被用作密码,让生活更便利?清华—得意音通声纹处理联合实验室副主任、清华大学计算机系高级工程师邬晓钧老师带来演讲《解开声音密码,让老年人不必奔波千里领退休金》。

大家好,我是邬晓钧。养老保险是我国社会保障的重要组成部分。根据规定,到了法定退休年龄的老人,如果已经缴纳了足够年限的养老保险,退休后每月就可以领取养老金。养老金是老人晚年的生活保障,有利于社会稳定。

随着我国经济发展,医疗服务水平和健康水平都得到提高,人们越来越长寿了。2000年11月份,我国第五次人口普查数据表明,60岁以上的老年人口在总人口中的比例已经超过了10%,说明我国已经进入了老龄社会。几年过去,我国老龄化的程度越来越高。到去年年底,全国老年人口总数已经占总人口的17.9%。根据预测,2050年可能每三个人中间就会有一个老年人。

老年人增多了,领取养老金的人数也会增加,好多地方都出现了养老保险入不敷出的现象。人社部报告显示,2014年全国有三个省养老金入不敷出,2015年有六个省,2016年有七个省。但同时,各地也都出现了冒领养老金的现象。老人去世后,由于种种原因,他的帐户没有及时注销,还有人在继续冒领他的养老金,其中普遍是直系亲属。

理论上,老人去世后的第二个月就应该停止发放养老金了,但是如果每个月都去核查所有老年人的生存状态,显然任务太困难艰巨。所以国家规定,退休人员每年要到现场认证一次,保证健在。虽然每年只需要认证一次,可是对于那些路途遥远、行动不便以及和子女住在外地的老人,年审还是非常麻烦的一件事情。

为了方便群众,有些地方的社保局提供上门服务,派出工作人员到交通不便的地方去做上门认证,或者去探望卧床住院的那些老人。但是由于人员所限,能服务的老人还是极少数的。有些地方规定,跟子女居住在外地的老人可以到居住地的社保机构去做认证,然后把认证材料寄回去。但是在实施过程中发现,有很多人伪造认证材料。

声纹,到底是什么?大家对指纹、掌纹、人脸、虹膜很熟悉,它们都属于生物特征,其实声纹也是一种生物特征。

我们说话的时候,从胸肺开始,然后声带振动,通过咽喉,然后到口腔、鼻腔发出声来,其中还会用到舌头、牙齿、嘴唇。这些发音器官的形态、尺寸,其实大家都不一样,这也是声纹有唯一性的先天生理基础。另外说话有发声习惯,韵律、口音和说话速度也决定了语音中间的一些特定信息。这样,发声器官和发声过程结合起来,就决定了语音包含了能够表征和辨识特定说话人的一些语音特征——声纹。

识别前,计算机要先去了解声纹,这个过程叫做注册。一般来说,就是要采集用户的一段语音,然后提取其中的声纹特征,建立声纹模型,存储在数据库里。认证或识别的时候,同样需要采集一段语音(一般会比注册短很多),从这段语音里也去抽取声纹特征,然后从数据库里拿出声纹模型进行某种计算,最后得到识别结果。

实际上,社保生存认证里用到的技术也不完全是声纹。语音本身是一种声波,麦克风能够记录下每一个时刻声波振动的强度,其中包含了非常丰富的信息(男女性别、年龄、语言类型、方言口音等,当然还有内容)。此外,声纹还能听出情绪(高兴还是悲伤)。我们把声音的这种特点总结成四个字,“形简意丰”。由此,我们设计了远程的声纹身份认证方案,在很多地方都有应用。

我们近几年研究的一个重要课题就是录音重放。我们参加了2019年国际自动说话人验证欺骗和对策挑战赛,其中就有录音重放的检测项目。在全世界156支队伍里头,我们清华-得意团队以挺大的优势拿到了第一名,等错误率只有0.39%(每一千个语音里有四个识别错误)。

目前,声纹身份认证已经在国家好几个省进行试点应用。我们也在研究扩大应用范围,试图解决青少年沉迷网络、视障老人使用智能设备等一些问题。

当然声纹识别技术目前还有很多问题解决得不够好,我们还在不断研究。但是我们相信,随着技术的发展,特别是5G即将普及,万物互联已经离我们非常近了。未来作为最方便自然的交互手段,语音一定会成为我们日常使用的技术。在无处不在的智能交互时代,我们相信声纹的身份认证一定会是其中重要的组成部分。

UUID: 4241c71b-1580-4d75-a75b-b67466097745

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2019/2019-11-10_抬着90岁老人去领退休金,这样尴尬的事,我们不想再看到了.txt

是否为广告: 否

处理费用: 0.0055 元