说起“嬛嬛”这个名字,我们的第一反应可能是经典影视剧《甄嬛传》中聪慧机敏,多才多艺的女主角。但今天故事的主角“寰寰”则是位硬核的“理科生”,虽然不会琴棋书画,却有着其他令人称赞的“十八般技艺”。2020年1月10日,中国科学院院士曾庆存获2019年度国家最高科学技术奖。
曾院士对我国气象事业的多个领域都有杰出贡献,除了与日常生活息息相关的天气预报,他还与其他科学家共同推动了一个“解读地球计划”,这就是我们今天的主人公寰寰的诞生之源。近百年来,全球气候正经历一次以变暖为主要特征的显著变化,对生态和环境产生了严重影响。为了预测未来的气候状态并应对其可能带来的灾难,深入研究全球变化的机制和原因就变得十分必要。
由于地球只有一个,人类无法对其直接开展各种情景实验,那么如何知道地球气候的未来变化以及人类活动在其中的影响呢?为了解决这个问题,科学家们殚精竭虑,研制出了秘密武器:用计算机模拟一个地球,改变各种变量来看会造成怎样的结果,这就是地球系统模式。地球上的大气运动、海洋运动以及各项生物活动等等都遵循物理、化学、生物等规律。
地球系统模拟就是利用多种变量、等式以及数学运算等数学符号和公式将这些规律表达出来,从而描述地球系统的特征、内在联系、运动规律等等,通过数值模拟方法在高性能计算机上定量推演大气圈、水圈、生物圈等各个圈层的性状、演变规律和它们之间的相互作用,预测地球系统未来演变的规律。其实我们对“建模”的概念并不陌生,在多个行业中都有应用。
对地球科学而言,已经有许多单个学科的数值模型,比如大气模式、海洋模式、陆面模式等,它们像各具特色、功能不同的飞机,帮助该专业的科学家不断进行更加前沿、更加深入的研究。但是在预测全球气候与环境变化时不能仅考虑单个圈层的影响,要知道,地球系统可是各个圈层相互作用的有机整体。因此地球系统模式就像航空母舰,它提供了一个平台供各个子模式发挥自己的作用,还将不同单元的子模型耦合在一起,使之发挥更大的能量。
地球系统模式的研制是一个巨大的系统工程,不仅涉及地球科学领域的发展,还与计算科学的进步密切相关。因此其发展水平已成为衡量一个国家科技综合水平的重要标志之一,不可能是一个人、一个课题组甚至一个研究所能够完成的。目前国际上发展地球系统模式都是由国家出面甚至多个国家联合(如欧盟) 支持一个庞大的研究计划发展地球系统模式。
以美国、欧洲和日本为代表的发达国家和地区在气候系统模式的研发上投入了大量的人力和财力,并提出了围绕气候系统模式发展的各种研究计划。他们以高性能计算技术为基础,建立了高效的气候系统模式。这使得他们在地球模拟特别是在全球气候变化学术领域具有主导权,同时也掌握了在全球气候变化特别是全球变暖的减缓、适应措施等方面的话语权。因为没有这种大科学装置,中国在很多方面还处于被动的地位。
我国科学家已经在地球系统模式领域做了大量工作,特别是通过近40年的努力,在大气环流模式、海洋环流模式、陆面过程模式的发展及其耦合等领域取得了令人瞩目的成绩,参与了政府间气候变化委员会(IPCC)历次气候评估报告的情景预测实验和各种国际模式比较计划。我国已成为近20年来唯一有能力发展自己的地球系统模式的发展中国家。
在此基础上,“地球系统数值模拟器”这一国家重大科技基础设施建设已是“千呼万唤”:在2012年中科院大气物理所召开的“地球系统模拟科学和技术”发展战略研讨会上,包括17位院士在内的国内40多个单位的100多位专家达成共识,呼吁国家尽快启动“地球系统数值模拟器”的建设。
2017年5月,大气所举办了“地球系统数值模拟装置”征名活动,经过面向社会的征集和筛选,大装置最终命名为“寰”,昵称“寰寰”,英文名“Earthlab”。“寰”字涵盖了以人类为中心的地球上各个领域:寰海,整个海洋;寰球,整个地球;寰宇,整个宇宙,也充分体现了大装置的特点。
“寰”的主体由三部分组成,分别是数值模式、数据库和资料同化、以及专用的超级计算机,其中数值模式(CAS-ESM)是装置的“灵魂”。CAS-ESM包含多个分系统模式:除了传统的大气、海洋、陆面等用于描述气候系统(温度、降水、海温、极端天气等)演变的分量模式,还加入了用于描述生态和环境的变化的模式,如植被演替,全球碳循环,气溶胶的排放、生成和传输,海洋上层生态系统生长消亡等。
此外,CAS-ESM还在传统的地球系统模式上进行完善,拓展具有我国自己独创特色的模块如日地空间环境模式,固体地球模式,大陆冰盖模式。发展更加全面完善的数值模式有利于解读地球过去、了解地球现在并预测地球未来,最终达到用实验给地球做一个“CT”的目标。“寰”不仅有大局观念,可以预测全球的气候变化,关注全人类的命运,同样也注重“细节”。
大装置的区域高精度环境模拟系统直接面向我国天气预报、大气污染预报预警、农业干旱预测以及气候风险预估等关键区域环境问题,形成对我国主要环境要素(气候、天气、大气污染、农业旱灾)的高精度模拟能力,水平分辨率可达1-3公里。也许你有疑问,提高分辨率有什么用呢?举个小例子吧。夏季来临,全国强对流天气多发。强对流是个急性子来去匆匆,经常看到“局部地区”几分钟前太阳当空,几分钟后瓢泼大雨让人直呼“伤不起”。
强对流天气发生突然、破坏力极大,生命周期短、影响范围小(大约只有几十公里,甚至几百米如龙卷风),这些特点导致强对流天气总是行踪不定。云分辨尺度数值模式能够比较准确地描述雷暴等强对流天气的发展变化过程。前面提到,地球系统模式的本质就是一组非常复杂庞大的数学物理和生物化学方程组。我们知道解方程时已知数据是必不可少的,这就是“寰”第二个重要组成部分:数据库和资料同化。数据对于解方程的作用有多大呢?
同一个方程,给的数据不同最后求解的结果很可能天差地别。因此想要使得最终预测的结果准确,就需要数值模式和数据库“强强联手”了。“寰”的数据库系统将分类收集、整编、融合和贮存全球和我国的有关地球系统的多源观测数据,有望成为世界上最大的地球科学数据库之一。
数据库提供了高分辨率东亚区域和全球的大气、海洋和陆地多要素再分析与多源数据融合资料,一定程度上弥补了我国在格点再分析资料方面的不足,改变了国内大量科学研究强烈依赖国外再分析资料的局面(目前常用的格点再分析资料由美国、欧洲、日本提供)。
数据库管理了30 PB (1 PB = 1,024 TB = 1,048,576 GB) 磁盘在线数据,50 PB 带库离线归档数据;实现了对百亿级条元数据的管理,并支持元数据项的任意扩展;实现了可扩展的预处理插件库,支持路径发现、变量抽取、网格插值、格式转换等功能。为研究大气、海洋和陆地的科学事实和规律,提供了数据支撑,也为我国干旱、洪涝、地质灾害监测和后续评估提供了基础数据。
由于模式的方程组太过复杂,用到的资料数据太过庞大,单纯用人力计算无法实现的,所以天气与气候的数值模拟一直受计算机发展水平的限制。1922年,Richardson进行了气象动力学方程数值解的第一次尝试,由于对大气动力过程多尺度性的认知缺陷,未能成功;1950年Charney, Von Neumann等人利用电子计算机成功实现了对高度简化的二维正压涡度方程的数值积分,取得了初步成功。
1961年,曾庆存利用当时前苏联最先进的计算机,在国际上首次成功求解了大气斜压原始方程组,并立即在莫斯科世界气象中心应用于数值预报业务。如果模拟空间范围大、时间尺度长、空间分辨率小,对计算机的计算能力要求就会更高。因此 “寰”不仅要具备扎实的数理化理论基础(数值模式)和超强的记忆力(数据库),还要有超强的运算能力。毕竟算不出来的话,之前再多的准备都是纸上谈兵。
大装置的支撑硬件是专用的超级计算机,计算机硬件平台峰值计算能力不低于15 PF(每秒所执行的浮点运算次数。1PF = 10^15次/秒的浮点运算),存储不低于80 PB,每分钟的计算能力相当于全球72亿人同时用计算器不间断计算4年。寰专属的超级计算机在体系结构、计算密度、存储架构、能效比等各方面均处于目前国内领先水平。
有人认为,地球系统数值模拟装置就是一堆代码加数据,随便在某个超级计算机上运行就可以,毕竟我国已经有了很优秀的超级计算机,为什么还要建立一个专门的装置来进行这项工作呢?确实,超级计算机是世界公认的高新技术制高点和21世纪最重要的科学领域之一。目前我国的计算机产业规模已经位居世界前列,“天河”系列超级计算机甚至站在了世界首位。与之相比,“寰”的计算能力并不是最强的。
那么,我们为什么在拥有了“天河”系列之后还要投入大量精力建设地球系统数值模拟装置呢?原因很简单,“寰”是我国地球系统科学领域培养的专业“特种兵”。“天河”系列超级计算机是为多种学科提供计算平台的,如生物医药、工业设计制造、智慧城市等多个方面。
而“寰”专门服务于我国地球系统科学,为国家防灾减灾、应对气候变化、大气环境治理等重大问题提供科学支撑,拟建成中国首个具有自主知识产权,以地球系统各圈层数值模拟软件为核心,软、硬件指标相适应,规模及综合技术水平位于世界前列的专用地球系统数值模拟装置,促进我国地球系统科学整体向国际一流水平跨越。
“寰”还具有可视化系统负责数据处理与可视化分析,开发不同类型、不同交互方式的展区,不仅为科学研究提供可视化分析、交互探索平台,还能够依托先进新颖的展示环境,为社会公众提供寓教于乐的科普体验。如今人类社会正在面临的地球环境变化的压力越来越大,但是人们关于地球环境变化机制的认识还十分有限。地球系统数值模拟装置能帮助我们认识地球环境变化的机理,更好地应对地球环境变化。
目前,“寰”尚未发展成熟,还有很大的成长进步空间。受疫情影响,大装置基建较原计划延迟 3 个月,但项目建设仍在紧锣密鼓地进行中,仍然按照原计划2021年6月底完成装置总体联调联试、同时开始试运行,2022年完成验收。我们期待着“寰”不断学习新的技能,全面提高我国地球科学的研究水平。