2022年9月1日至3日,2022世界人工智能大会在上海世博中心举办。在3日下午举办的“数据要素流通技术前沿探索论坛”上,由清华大学深圳国际研究生院知识工程研究中心、北京智谱华章科技有限公司、开放群岛开源社区联合编写的《2022联邦学习全球研究与应用趋势报告》重磅发布。
数字经济时代,隐私计算已然成为全球新兴的一大产业。随着《数据安全法》、《关键信息基础设施安全保护条例》、《个人信息保护法》等政策的陆续发布实施,安全行业界对信息安全与隐私数据的重视程度不断升级。
联邦学习(Federated Learning)作为一种隐私保护的重要解决方案之一,自2016年首次由Google提出、2018年由微众银行引入国内并率先在B端进行创新应用以来,逐渐成为一种解决合作中数据隐私与数据共享矛盾的新路径,被大量应用于金融、安防、医疗、在线推荐系统等领域。
《2022联邦学习全球研究与应用趋势报告》主要从技术论文发表情况、专利申请、学者地图与画像、主流框架、行业应用,以及发展趋势等几大方面做了系统的阐述,较为全面深入地介绍了联邦学习自2016年诞生以来到2021年的技术研究和应用进展,并展望该技术的未来发展方向与前景。
主要核心要点如下:
“中美双雄”引领全球联邦学习发展。中国和美国的联邦学习论文发布量遥遥领先于其他国家。联邦学习全球高被引论文领先的机构是谷歌、卡内基·梅隆大学。
未来联邦学习研究趋势将更多与算法模型和安全隐私技术相关。目前联邦学习研究热点主要聚焦在机器学习方法、模型训练、隐私保护三方面。
全球联邦学习论文发布量增长较快。基于AMiner系统,通过关键词组在标题和摘要中检索2016年至2021年论文数据。结果显示,研究时段内联邦学习相关论文共计4576篇,自2016年被提出以来,研究论文数量逐年增多,到2021年的复合年增长率为40.78%。
联邦学习的学者人才地图与画像。报告对联邦学习的高被引论文学者人才地图与画像进行了分析,指出全球联邦学习学者主要聚集在美国和中国,明显多于其他国家的学者数量。
专利在一定程度上能够反映出某项技术的发展方向和潜在前景。报告对全球联邦学习专利申请现状进行了分析,指出全球专利申请呈现出逐年攀升的趋势,目前的专利布局主要聚焦安全与隐私保护方向,以及机器学习方法、模型训练等方面。
联邦学习应用。通过新闻事件分析挖掘和搜索系统NewsMiner数据库,从已公开的新闻数据发现,联邦学习技术的行业应用最早出现在2018年,当时被应用在金融、IT和通信领域,后来几年其应用探索逐渐扩展到智慧城市、教育、汽车等其他多个行业领域。