6月1日,由北京智源人工智能研究院主办的2021北京智源大会在北京中关村国家自主创新示范区会议中心成功开幕。北京智源大会是智源研究院主办的年度国际性人工智能高端学术交流活动,定位于“AI内行顶级盛会”,2019年举办了首届大会,今年为第三届,6月1日至3日线上线下同步召开,超过3万多名人工智能领域专业人士注册参会。
在大会开幕式上,智源研究院发布了全球最大的超大规模智能模型“悟道2.0”。在为期三天的会议中,智源研究院还将发布支持AI创业的“源创计划”,以及为海内外青年AI科研人员提供学术交流平台的“青源会”等工作计划或建设成果。
本次大会邀请到200余位国内外人工智能领域的顶尖专家参会,包括2018年图灵奖得主Yoshua Bengio,2017年图灵奖得主David Patterson,2017年欧洲大脑奖得主Peter Dayan,清华大学国家金融研究院院长朱民博士,北京大学鄂维南院士,加州大学伯克利分校人工智能统计中心创始人Stuart Russell,自动驾驶之父Sebastian Thrun,计算可持续性领域开创者Carla Gomes,艾伦人工智能研究所首席执行官Oren Etzioni,微软亚洲研究院副院长刘铁岩,清华智能产业研究院首席科学家马维英等。
参会专家将围绕人工智能领域的前沿研究进展及趋势开展深入研讨。
大会围绕国际人工智能学术前沿和产业热点设置了“预训练模型”“机器学习”“群体智能”“人工智能的数理基础”“智能体系架构与芯片”“精准智能”“智能信息检索与挖掘”“青源学术年会”“AI创业”“AI制药”“AI系统”“AI开放与共享”“AI科技女性”等29个专题论坛。议题范围非常丰富,从AI基础研究、跨界融合到产业应用,给学者、工程师、技术人员提供了一个交换和活跃想法的平台。
开幕式上,智源研究院理事长张宏江介绍了“悟道”模型研发的背景。他认为,目前,“大模型+大算力”是迈向通用人工智能的一条可行路径。大模型对于人工智能发展具有重大意义,未来将基于大模型形成类似电网的变革性AI产业基础设施。AI大模型相当于“发电厂”,将数据,也就是“燃料”,转换为智能能力,驱动各种AI应用。
如果将大模型和所有的AI应用相连接,为用户提供统一的智能能力,全社会将形成一个智能能力生产和使用的网络,即“智网”。大模型就是下一个AI的基础平台,是未来AI发展的战略基础设施。
目前,国际主流的大模型主要基于英文语料研发,智源研究院作为AI基础建设的先行者,成立了由智源研究院学术副院长唐杰教授领衔,100多位科研骨干共同参与的“悟道”团队,启动面向中文的大规模智能模型研发工作。
“悟道”模型系统将构建“大模型、大平台、大生态”,持续研发超大规模智能模型,围绕大模型研发,构建大规模算力平台,同时对外开放模型能力,“赋智”各行业发展,构建大模型生态。今年3月20日,智源研究院发布了中国首个超大规模智能模型“悟道1.0”,训练出中文、多模态、认知、蛋白质预测等系列模型。经过不到3个月的持续更新迭代,“悟道2.0”实现了更高层面的跨越。
开幕式上,智源研究院学术副院长唐杰教授介绍了“悟道2.0”模型的具体情况。他提到,“悟道”超大模型智能模型旨在打造数据和知识双轮驱动的认知智能,让机器能够像人一样思考,实现超越图灵测试的机器认知能力。“悟道”团队在大规模预训练模型研发上做了很多基础性工作,形成了自主的超大规模智能模型技术创新体系,拥有从预训练理论技术到预训练工具,再到预训练模型构建和最终模型测评的完整链条,从技术上是完整成熟的。
通过一系列原始创新和技术突破,本次发布的“悟道2.0”实现了“大而聪明”,具备大规模、高精度、高效率的特点。
“悟道2.0”模型的参数规模达到1.75万亿,是GPT-3的10倍,打破了之前由Google Switch Transformer预训练模型创造的1.6万亿参数记录,是目前中国首个、全球最大的万亿级模型。开创性的研发FastMoE技术,是打破国外技术瓶颈,实现“万亿模型”基石的关键。
以往,由于Google万亿模型的核心技术MoE(Mixture of Experts)与其分布式训练框架和其定制硬件强绑定,绝大多数人无法得到使用与研究的机会。“悟道”团队研究并开源的FastMoE是首个支持PyTorch框架的MoE系统,具有简单易用、灵活、高性能等特点,并且支持大规模并行训练。
新一代FastMoE,支持Switch、GShard等复杂均衡策略,支持不同专家不同模型,为万亿模型实现方案补上了最后一块短板,让梦想终成现实。
“悟道2.0”模型在中英双语共4.9T的高质量大规模清洗数据上进行的训练。训练数据包含WuDaoCorpora中的1.2TB中文文本数据、2.5TB中文图文数据,以及Pile数据集的1.2TB英文文本数据。
另外,“悟道2.0”模型一统文本与视觉两大阵地,支撑更多任务,更加通用化。9项顶尖智能能力,创新性的通用精准智能“悟道2.0”在世界公认的9项Benchmark基准测试任务上取得优异成绩,达到了精准智能。
大规模预训练模型的参数规模通常远超传统的专用人工智能模型,在算力资源、训练时间等方面消耗巨大。为了提升大规模预训练模型的产业普适性和易用性,悟道团队搭建高效预训练框架,在高效编码、高效模型、高效训练、高效微调和高效推理等方面进行全链路的原创突破或迭代优化,实现效率的大幅提升。
智源研究院推动开展“悟道”超大规模智能模型产业生态建设,将面向个人开发者、中小创新企业、行业应用企业、IT领军企业等不同主体,分别提供模型开源、API调用、“专业版”大模型开发、大模型开发许可授权等多种形态的模型能力服务,赋能AI技术研发。
本次大会开幕式上,智源研究院与新华社、美团、小米、快手、搜狗、360、寒武纪、第四范式、好未来、智谱华章等22家“悟道”大模型产业生态战略合作企业进行了签约,签约企业涵盖行业应用企业、IT龙头企业、中小创新企业等。同时发出组建“悟道”大模型技术创新生态联盟的倡议,吸引更多企业加入,将以联盟为枢纽,以企业需求为导向推动模型研发,共同开发基于“悟道”大模型的智能应用,以模型研发和应用促进产业集聚。
开幕式上,智源研究院院长黄铁军教授从创新研究、学术生态、产业发展与AI治理四个方面介绍了智源研究院的工作规划和建设进展。据黄院长介绍,智源研究院已经确定将打造智能模型作为源头创新的核心任务,在组织架构、资源保障和机制体制上进行了系统部署,全力构建信息模型、生命模型和物理模型“智能三剑客”。
首先是“悟道”信息模型,数据是智能的素材,通过“大数据+大算力+强算法”,训练超大规模信息模型,为各行各业智能化提供切实可用的共性基础智能模型,是当前及未来一段时间人工智能全面赋智经济社会发展的中心任务。然后是“天演”生命模型:生命是智能的第一载体,模拟仿真亿万年进化而成的生物神经系统和身体,构建生命智能模型,挖掘生物智能机制机理,是发展新一代人工智能的不竭源泉。
最后是“天道”物理模型:自然是生命的摇篮,地球是人类的摇篮,构建地球环境物理模型,是实现类人智能和人机共处共融的必要条件。建立宇宙物理模型,推动智能走出地球、穿越时空。
智源研究院持续推动智源社区建设,着力构建人工智能学者社交网络。今年智源社区将紧密联系3000名以上的人工智能顶尖学者,辐射10万以上人工智能科研和技术人员。
特别面向青年科研人员,智源研究院今年成立了AI青年科学家学术组织“青源会”,为海内外的AI青年科学家和技术人员建立的宽松、活跃的学术交流平台,促进学科交叉,支持青年科学家提出具有引领作用的原创思想,开创新的科学前沿,建立活跃的人工智能学术和技术创新生态。
智源研究院加快推进人工智能深度应用,孵化AI创新企业,推动人工智能产业发展。
当前,健康医疗已成为人工智能最热门的研究和应用领域之一,北京在发展智能医疗方面,有着得天独厚的优势。为推进AI原创成果在医疗行业落地,智源研究院成立了“健康医疗研究中心”,构建医疗大数据和高质量小数据等基础数据,支持智能医疗核心技术突破,加快人工智能在健康医疗领域的深度应用。智源研究院与清华智能产业研究院(AIR)开展深度合作,推动以“个人”为核心的、AI驱动的主动健康管理。
当前,AI伦理和治理成全球共识,国际社会正探索建立广泛认可的AI伦理原则,推进敏捷灵活的AI治理。智源研究院在2019年成立人工智能伦理与可持续发展研究中心,率先在国内开展AI伦理安全研究,并积极参与国际AI治理。AI伦理规范方面,2019年5月,发布了我国首个AI发展与治理准则——《人工智能北京共识》。去年9月,又发布了我国首个《面向儿童的人工智能北京共识》。
另外,智源研究院建设了我国首个“人工智能治理公共服务平台”,针对人工智能技术研发及应用中存在的潜在伦理问题提供检测服务,帮助AI研发机构研发更符合AI伦理规范的技术和产品。