2021年,斯坦福大学正式发布《2021年人工智能指数报告》,全面追踪人工智能的最新发展状态和趋势。自2017年起,由斯坦福大学主导,来自MIT、OpenAI、哈佛、麦肯锡等机构的多位专家教授,组建了一个小组,每年发布AI指数年度报告。今年的报告,从学术、工业、开源、政府等方面详细介绍了人工智能发展的现状,并且记录了计算机视觉、自然语言理解等领域的技术进展。研发是AI进步的基础。
自从1950年代技术首次激发计算机科学家和数学家的想象力以来,人工智能已发展成为具有重要商业应用的主要研究学科。在过去的20年中,AI论文的数量急剧增加。人工智能会议和预印本的兴起扩大了研究和学术交流的传播。包括中国、欧盟和美国在内的主要大国都在竞相投资人工智能研究。从2019年到2020年,人工智能期刊的出版数量增长了34.5%,比2018年至2019年高出19.6%。
2020年,中国在AI期刊的全球引用量首次超过美国。但是,在过去的10年间,美国的AI会议论文引用量一直高于中国。由于新冠疫情,大多AI顶会都是线上召开,因此出席人数明显增加。2020年,九个AI顶会的参会人数都增加了将近一倍。随着时间推移,大型公司在人工智能会议中的存在率不断提高,这进一步扩大了计算鸿沟。
TensorFlow(由Google开发并于2017年公开发布)在2020年仍然是最受欢迎的AI框架。2020年第二大受欢迎的框架是Keras(也由Google开发,并基于TensorFlow 2.0构建)。在过去的6年间,发表在arXiv上的AI论文数量增长了6倍以上。在2000年至2019年期间,AI论文的总数增长了近12倍。
2019年,AI学术论文占全球所有同行评审科学出版物的3.8%,与2011年相比增加了1.3%,在2000年这一比例为0.82%。尽管技术的进步使AI系统的部署比以往任何时候都更加广泛和轻松,但对AI使用的关注也在增长,尤其是在算法偏差等问题上。AI系统现在可以合成非常高质量的文本、音频和图像,人类甚至无法分辨出合成输出与非合成输出之间的区别。
在过去两年里,生成模型在STL-10数据集中生成令人信服的合成图像方面进展迅速,图像真实性越来越高。CV模型的性能在一些大型基准上开始趋于平缓,这表明社区需要开发并就更难的标准达成共识,以对性能进行进一步测试。企业正在投入越来越多的计算资源,以前所未有的速度训练CV系统。在部署系统中使用的技术(例如用于分析视频中静止帧的目标检测框架)正在迅速成熟,表明将进一步部署AI。
NLP的进展如此之快,以至于技术进步已经超过了基准测试。这一点可以从在SuperGLUE上获得人类水平性能的系统的快速兴起看出。AI推理取得显著进步,大多数技术问题的度量标准都以固定的基准显示了每个时间点上最佳系统的性能。针对AI指数开发的新分析提供了指标,这些指标可以用在不断更新的基准测试上,也可以用在获得一段时间内一组系统整体性能表现的单个信用系统上。
这些分析适用于两个符号推理问题:自动定理证明和布尔公式的可满足性。DeepMind的AlphaFold2应用了深度学习技术,在长达数十年的蛋白质折叠生物学挑战中取得了重大突破。科学家使用ML模型来学习化学分子的表示形式,以进行更高效的化学合成规划。AI创业公司PostEra使用基于ML的技术,在新冠疫情期间快速找到了相关的药物。
人工智能(AI)的兴起不可避免地提出了一个问题,即技术将在多大程度上影响企业、劳动力和经济。考虑到AI的最新进展和众多突破,该领域为企业带来了巨大的利益和机遇,从自动化的生产率提高到使用算法为消费者量身定制产品、大规模分析数据等等。但是,人工智能所承诺的效率和生产率的提高也带来了巨大的挑战:公司必须努力寻找并留住熟练的人才来满足他们的生产需求,同时要牢记实施措施以减轻使用人工智能的风险。
此外,COVID-19大流行给全球经济造成混乱和持续的不确定性。私营公司如何依靠并扩展AI技术来帮助其企业度过最困难的时期?AI生物在2020年获得了最大的私人AI投资,总额超过138亿美元,是2019年的4.5倍。2016年至2020年,巴西、印度、加拿大、新加坡和南非是AI招聘人数增长最快的国家。尽管新冠疫情爆发,但2020年,所有采样国家的AI招聘人数都还在继续增长。
2015年至2020年的汇总数据显示,印度(全球平均水平的2.83倍)的AI技术相对普及率最高,其次是美国(全球平均水平的1.99倍),中国(全球平均值的1.40倍),德国(全球平均值的1.27倍)和加拿大(全球平均值的1.13倍)。越来越多AI私人投资集中到少数的初创公司中。
尽管出现疫情,但2020年的私人AI投资金额比2019年增加了9.3%,比2018年至2019年的增长率(5.7%)更高,尽管新成立公司的数量连续三年都在下降。麦肯锡的一项调查显示,尽管越来越多人呼吁解决AI使用相关的道德问题,但业界在解决这些问题的努力上非常少。例如,AI的平等和公平问题受到公司的关注相对较少。
此外,与2019年相比,2020年,越来越少公司将个人隐私视为相关风险,并且受访者中,正在采取措施来减轻这些特殊风险的企业百分比没有发生变化。尽管疫情造成了经济衰退,但在麦肯锡的一项调查中,有一半的受访者表示,新冠疫情对他们在AI方面的投资没有影响,27%的受访者甚至表示AI投资有所增加。只有不到四分之一的企业减少了对AI的投资。
自2019年到2020年,美国的AI岗位发布比例有所下降,这也是6年以来的首次下降。从2019年到2020年,美国的AI岗位发布总数下降了8.2%,从2019年的325,724个岗位减少到2020年的300,999个职位。随着AI成为经济活动的越来越重要驱动力,想要了解它并获得从事该领域工作的必要资格的人们对之越来越感兴趣。
同时,工业界对AI的需求不断增长,正吸引着更多的教授离开学术界进入私营部门。本章重点介绍AI人才的流动趋势。2020年的一项AI指数调查显示,过去4年间,世界顶级大学均提高了在AI教育上的投资。在过去的4个学年里,向本科生与研究生传授AI应用技能的课程数量分别增加了102.9%和41.7%。
根据计算机研究协会(CRA)的年度调查,过去的10年里,在北美地区,选择进入工业界的AI博士生更多,而选择进入学术界工作的较少。具体而言,过去10年选择进入业界工作的AI博士毕业生的比例增加了48%,从2010年的44.4%增至2019年的65.7%,如下图蓝线所示。相比之下,进入学术界的AI博士毕业生的比例下降了44%,从2010年的42.1%下降至2019年的23.7%,如下图红线所示。
根据CRA的调查,在过去的10年里,美国AI博士毕业生数量占比可真谓是一冲再冲、独占鳌头,从占CS博士毕业生总数的14.2%,上升到了2019年的约23%,而排名二三位的理论&算法、机器人/视觉占比都是不到10%。同时,其他以前热门的CS博士学位专业的人气则是有所下降,比如网络、软件工程和编程语言。
相对于2010年,所有编译器专业都减少了博士学位的授予数量,而AI和机器人/视觉专业领域则有了大幅增长。经过两年的发展,在北美地区,从大学AI教职人员转到业界发展的人数从2018年的42人下降至2019年的33人。2019年,北美地区AI博士毕业生的国际学生比例继续上升,达到64.3%,相比2018年增长了4.3%。
调查数据显示,大约81.8%的国际毕业生会留在美国工作,而8.6%的毕业生则在其他地区任职。这大概能说明美国对AI博士国际毕业生的吸引力很强,人才留存率很高。另外在欧盟国家中,绝大多数专业的AI学术课程都只是面向硕士生授课。目前,机器人技术和自动化是本科生和硕士生最常学习的课程,而机器学习在短期课程专业中占最大比例。
随着以人工智能为基础的创新在我们的生活中变得越来越普遍,人工智能应用的道德挑战越来越明显,并且受到了严格审查。如前几章所述,各种AI技术的使用会导致意想不到但有害的后果,例如侵犯隐私、基于性别、种族/民族、性取向或性别认同的歧视和不透明的决策等问题。应对现有的道德挑战,并在部署之前构建负责任的、公平的AI创新,这一点正从未如此重要过。
本章介绍了为解决随着AI应用程序的兴起而出现的道德问题所做的努力。自2015年起,尽管在主流AI会议上,论文标题与道德关键字相匹配的论文平均数量仍处于较低水平,但这一数量已经多少有所增加,每年增长大概1到2个百分点。自2015年以来,政府,私人公司,政府组织和研究/专业组织一直在编写规范性原则文件,以应对AI应用道德挑战的方法。AI原则的发布表明组织正在注意并建立AI治理的愿景。
即便如此,所谓伦理原则的泛滥也遭到了伦理研究者和人权从业者的批评,他们反对与伦理有关的术语的不精确使用以及缺乏制度框架,在大多数情况下不具有约束力。这些原则的模糊和抽象无法为如何具体实施与AI相关的道德准则提供指导。下图显示了在2015年至2020年期间,共发布了117篇与AI原则有关的文件。
数据显示,截至2020年,欧洲和中亚地区的发布数量最多(52),其次是北美(41)、东亚和太平洋地区(14)。而就推行道德原则而言,在2018年对于包括IBM,Google和Facebook在内的科技公司以及英国,欧盟和澳大利亚政府机构在内的高科技公司来说无疑是一波小高潮。而推行之后的效果如何就得另说了。
从下图可以看出,排在前四位的分别是:1、指导咨询,框架;2、研究,教育;3、人脸识别;4、算法偏差。2020年有关AI伦理的话题真可谓是一波未平,一波又起,其中最受关注的5个AI伦理新闻话题分别是:1、欧盟委员会发布AI白皮书;2、谷歌解雇AI伦理学研究员Timnit Gebru;3、联合国成立AI伦理委员会;4、梵蒂冈发布AI伦理计划;5、IBM退出人脸识别业务。
尽管人工智能具有极大地影响社会的潜力,但构建AI系统的人员并不能代表那些系统所服务的人员。尽管多年来人民一直在强调AI带来的不利因素和风险,但AI劳动力在学术界和行业中仍然主要是男性为主,并且缺乏多样性。种族、性别认同和性取向方面缺乏多样性,不仅有可能在劳动力中造成权力分配不均的风险,而且同样重要的是,加剧了人工智能系统产生的不平等现象,并导致不公正的结果。
十多年来,女性AI博士毕业生和计算机科学终身制教师的比例一直很低。根据计算机研究协会(CRA)的年度调查,北美AI博士女毕业生平均不到所有博士毕业生的18%。另一项AI指数调查显示,在全球很多所大学中,女教师仅占所有终身制CS教职员工的16%。CRA调查显示,2019年美国居民AI博士新毕业生中,白人占45%,亚洲人占22.4%,西班牙裔占3.2%,非裔美国人占2.4%。
在过去的十年中,白人(非西班牙裔)新计算机博士学位的百分比变化不大,平均占62.7%。同期黑人或非裔美国人(非西班牙裔)和西班牙裔计算机博士学位的比例明显较低,平均分别为3.1%和3.3%。从下图可以看出,近年来与NeurIPS共同举办的A黑人研讨会中,2019年的与会者和提交的论文数量是2017年的2.6倍,而被接受论文的数量是2.1倍。
在Queer在2020年对AI成员的调查中,几乎一半的受访者表示,他们认为该领域缺乏包容性是他们成为AI/ML领域从业者所面临的障碍。接受调查的成员中,有40%以上表示他们在工作或学校中遭受过歧视或骚扰(以及被歧视的次数)。人工智能将在未来几十年内塑造全球竞争力,并有望为早期实践应用者赋予重要的经济和战略优势。
迄今为止,各国政府以及地区和政府间组织已竞相制定以AI为目标的政策,以最大程度地利用该技术,同时解决其社会和道德影响。自加拿大于2017年发布全球首个国家人工智能战略以来,截至2020年12月,其他30多个国家和地区也都积极发布了类似的文件。2020年启动了全球AI伙伴关系(GPAI)和经济合作与发展组织(OECD)AI政策观察站以及AI专家网络,促进了政府间共同努力以支持所有人的AI发展。
在美国,第116届国会是历史上最关注AI的国会会议。本届国会在立法、委员会报告和国会研究服务(CRS)报告中提及AI的次数是第115届国会的三倍多。2019年和2020年的综合数据表明,创新和技术,国际事务和国际安全,行业和法规等主题是美国AI政策文件的主要重点。中国是人工智能大国,中国选择参加了一系列科技双边协议,这些协议强调在“一带一路”倡议的框架下,开展作为数字丝绸之路一部分的人工智能合作。
例如,在“一带一路”倡议下与阿拉伯联合酋长国的中国经济合作中提到了人工智能。这是一份完整详尽的全球AI指数报告,在新的一年为大家从各个方面展示了AI全球图景,这或许能为各个国家、企业、组织、个人等做下一步的AI规划参考。