2022年11月30日,OpenAI公司发布了由大型语言模型驱动的自然语言处理工具ChatGPT。该工具通过学习和理解人类语言,能够与用户进行高质量对话,甚至还能撰写邮件、视频脚本、文案、代码、论文和小说等。由于在同行中具有较卓越的性能,ChatGPT推出仅2个多月的时间即引爆全球。
除了关注ChatGPT性能本身外,业内人士更关注该AI“梦之队”成员到底具有哪些特征,才促使他们在全球大型语言模型创新技术领域如此独领风骚。根据OpenAI官网显示,为ChatGPT项目做出贡献的人员共87人。现就该团队成员职务构成、年龄分布、教育背景、人员流动、华人成员、成员贡献等数据进行统计分析,并总结归纳其特征。ChatGPT团队规模不足百人(共87人)。
分析发现,其显著特征是“年纪很轻”“背景豪华”“聚焦技术”“积累深厚”和“崇尚创业”。该团队平均年龄为32岁,“90后”是主力军。他们引领的这一波大型语言模型技术风潮,充分说明了那些经常被认为研发经验不足的年轻人,完全有可能在前沿科技领域取得重大突破。团队成员绝大多数拥有名校学历,且具有全球知名企业工作经历。
从成员毕业高校分布看,校友最多的前5大高校是斯坦福大学(14人)、加州大学伯克利分校(10人)、麻省理工学院(7人)、剑桥大学(5人)、哈佛大学(4人)和佐治亚理工学院(4人)。此外,ChatGPT不一味强调高学历,其成员并非“清一色”的研究生学历,而是本、硕、博人数相对均衡。
团队成员有10人从谷歌跳槽加入,其他成员大多来自Facebook、Stripe、Uber、Quora、NVIDIA、Microsoft、Dropbox、DeepMind、Apple、Intel等顶尖或知名科技公司。另外,该团队有5人被评为2023年度“AI 2000全球人工智能学者”,其中2人为OpenAI联合创始人,2人分别被评为全球机器人和机器学习领域最具影响力学者。
可见,技术型顶尖学者对创新型团队的引领作用至关重要。从成员职位构成看,该团队成员近9成为技术人员,未配备技术与产品之外的职能人员(如公共关系、市场营销等人员),而是高度聚焦于技术研发。由此可见,在数字化传播时代,一款人工智能产品只要性能足够优异,即使未配置专人做推广营销,也能在短短的一两个月时间内在全球引爆。ChatGPT是OpenAI在大型语言模型领域多年技术积累的结果。
统计发现,在与ChatGPT相关的先前7大技术项目研发中,ChatGPT团队成员参与人数最多的是Codex项目,共有22人参与,占总团队人员总数的25%;其次是WebGPT和InstructGPT,共有9人参与;第三是GPT-3,共有6人参与;第四是RLHF,共有3人参与。
由此可见,ChatGPT团队成员在生成式预训练语言模型领域有较深厚的技术积累,特别是1/4团队成员曾参与过同样基于GPT-3的Codex项目的研发经验,对后续成功研发ChatGPT打下了坚实的基础。分析发现,该团队成员不再把进入“大厂”作为首选,而是更倾向于选择更加创新潜力的创业机构。团队成员大多是从“大厂”跳槽,以及作为应届生加入,其次就是从相对“稳定”的科研机构和高校教职岗位离职后加入。
即使从ChatGPT团队离职的4位成员,也仍然选择加入创业公司或机构。此外,ChatGPT团队中也有华人的身影。团队共有华人9人,占团队总人数10%。其中5人本科就读于中国内陆高校,3人大学教育经历均在美国高校完成。华人学者欧阳龙参与了与ChatGPT相关的7大技术项目中的4大项目的研发,是InstructGPT等关键技术项目的核心人员。
根据以上分析所获相关启示,就国内人工智能前沿技术发展提出以下建议:(一)注重科技兴趣和信仰培育,鼓励优秀年轻人投身于前沿技术创新浪潮。(二)“大厂”前沿科技创新疲态显现,鼓励年轻人将目光投向创业公司。(三)海外华人学者是全球科技创新的重要力量,鼓励加强对外学术交流。