在“云”上做科研,是种什么体验?
如今,做研究的人需要什么?试管?文献?电脑?如果再来一朵 “云”会怎样?别误会,并不是让科研人员上天做科研,而是——给他们一朵“中国科技云”。
大数据时代呼唤科技云。以“数据密集型”和“大数据”驱动的科学研究范式带来了科研方法论的变革,正成为科学发现的新引擎。数据与计算平台已经成为当代科学研究重要的信息基础设施,并且将融汇贯穿于整个科学研究活动的全过程。近年来,几乎在任何一项的重大科学发现和重大科技计划中,数据与计算平台都在扮演着无可替代的角色。
2013年诺贝尔化学奖授予了三位美国科学家,获奖理由是"为复杂化学系统创立了多尺度模型",对于化学家而言,多尺度计算化学模型的建立使计算机变得像试管一样重要。从应用的角度而言,大规模的计算资源和大量的"黑箱"计算程序的出现使得越来越多的研究可以应用理论和计算的方法研究自然科学问题。
2017年诺贝尔物理学奖授予了“首次探测到引力波”的三位美国科学家,在引力波的这一发现过程中,激光干涉仪前四个月的观测数据量达500TB,总共消耗了17亿CPU核小时的计算资源对数据进行处理。
2019年4月,200多名科研人员通过8个分布于全球的事件视界望远镜观测点“捕获”了黑洞的视觉证据。此项研究历时10余年,加州理工学院使用Blue Waters超级计算机超过1000个CPU核对3.5PB的原始数据进行近900个黑洞合并的模拟,总共花费了2万小时的计算时间。
然而,现在许多研究人员所面临的最大问题,不是缺少数据,而是面对太多的数据无从下手。
人类社会从宏观到微观、从自然到社会的观察、计算、传播等活动,正在加速产生出海量且多样的数据,数据呈现爆炸性增长。比如各种网络社交信息数据,通过望远镜获得的天文学图片数据、各种各样的基因序列数据、通过大型对撞机、光源等大型物理装置产生的实验数据等。这些数据类型复杂、数据量大、产生速度快、蕴含较大价值,同时已经超出了普通人的理解和认知能力。
要从这些大数据中得到科学发现,需要适应大数据管理与处理的理论、技术和方法的产生,涉及对数据的整合、海量数据的处理、算法的优化、研究结论呈现等多个方面。在这种大的背景下,数据资源成为了世界各国争夺的新战略资源,计算则成为了衡量一个国家综合国力和国际竞争力的重要标志。数据与计算在科技领域的整体能力和应用,将集中体现一个国家的科技综合实力。
世界各国正加快建设以数据与计算为主要特征的信息化基础设施,这必将深刻影响世界科技格局。幸运的是,我们有了中国科技云。
科学家自己的云。阿里云、腾讯云、百度云……在云计算厂商遍地开花的时代,无论是阿里云还是百度云,都主要服务于商业活动。作为一项专业性极强的研究活动,科研工作也需要一朵自己的“云”。中国科技云是网络、数据与计算融合的新型国家信息化基础设施,为全国科技工作者提供科技资源及服务的发现、访问、使用、交易与交付一体化云服务,全面支撑多学科交叉的开放科学研究。
通俗地讲,中国科技云就是把科学家要在各个网站上寻找的数据和计算工具整合在一个网站上,分门别类地提供给科学家,供科学家按需使用;同时,科学家也可以把自己的服务上传到中国科技云,供他人使用。简而言之,这是“科学家自己的云”。
我们来看看这朵科技云有什么独到之处?“专有”:中国科技云以科研活动为中心,以科研人员的使用习惯为根本导向,在科学数据的存储、传输、计算、分析、应用等各环节提供高效一体化的云计算解决方案,不论是科研大数据快速共享发布、科研专用的云计算/超算服务还是可视化云服务,都为科学家基于大数据与大计算与科学研究提供了有力的支撑。可以说,这是为科学家量身打造的专有科技云。
“开放”:这里是海量资源汇聚的一站式服务平台。中国科技云持续开放,汇聚国内外优秀信息化基础设施和服务,目前已实现350P的计算资源,150P的存储资源,以及PB级的科学数据资源的汇聚与服务。集成综合平台52个,各类科研软件409款,可提供网络服务、计算服务、存储服务、数据信息等9大类典型的云服务。门户系统实现了资源服务的注册管理与动态发布,为用户提供在线申请、即开即用、按需扩展的柔性云服务。
“全球合作”:我国科学家基于中国科技云前期工作基础,开创性提出建立全球开放科技云的倡议,得到了多区域的科学云平台的广泛支持。目前,中国科技云正在积极推进与欧洲网络基础设施、欧洲科研网等代表着欧开放科学云核心基础设施的机构,及美国全球科研交换中心的深化合作,启动多边先导计划,共同开展技术、运行及政策研究,积极推进全球开放科学云的建设。中国科技云正在逐步成为全球科技合作的重要纽带和媒介。
谁在用这朵云?中国科技云用户群体可覆盖前沿与交通、能源、海洋、生命与健康等多个学科领域,科技工作者、服务提供者、资源提供者都可以在这朵云上找到自己的位置。
中国科技云已经服务于“地球大数据科学工程”“空间科学”等先导专项,以及“中国天眼”FAST望远镜、高海拔宇宙线观测站(LHAASO)等重大科技基础设施,支持了一系列超级计算、科学技术和人工智能和跨洲际的科学数据传输工作,正逐步成为支撑科技创新发展的战略性设施。
正如中国科学院院士于贵瑞介绍中国科技云在生态系统观测中的应用时所说:“以前我们每做一个项目,都自己设计一个数据库,项目结题后,这个数据库也就废弃了,资源浪费比较严重;现在把数据库嫁接在中国科技云上,就能够不断完善,逐渐形成一个庞大的系统。
”他期待,未来能够在中国科技云上,构建面向生态科学研究的“生态科学云”,实现生态科学研究各要素的有机融合,充分利用大数据、智能计算和可视化分析等新手段,加速科学发现的进程。
怎么加入(使用)科技云?目前, “中国科技云2020应用推进计划”也启动了,该计划将通过公开征集与择优遴选等方式,为有重大产出的科研项目免费提供计算资源等,提供的资源包括840万CPU计算机时、160万GPU计算机时、1000台云服务器和10PB的云备份,总价值 2800万元。
首批入选的科研项目包括FAST仙女座大型漩涡星系中的脉冲星搜寻、人工智能深度挖掘宏基因组功能信息、高精度环境大气感知与智慧云预测系统、聚变等离子体物理与工程数据库、国家冰川冻土沙漠科学数据中心、国家基础学科公共科学数据中心等。科学家们~现在就进入中国科技云来体验吧!
未来,“六点”值得期待。为了给科学家提供更好的服务,中国科技云也在不断地更新升级中,2019年12月26日,中国科技云迎来了上线后的第一次升级,中国科技云2.0正式发布。中国科技云项目负责人黎建辉研究员说:“未来一年里,我们会面向科研需求,争取至少每个月提供一款,为科研、科学家定制的新服务。”
未来,中国科技云将通过技术创新和软硬件设备持续升级,实现让网络再快一点、让数据再多一点、计算力再强一点、存储再大一点、应用面再广一点,能够为更多领域的科研人员提供再好一点的服务,真正成为支撑科技创新、驱动科学发展的加速器和倍增器。