为了帮科学家省钱省力,我们建了一个全球只有6所,中国只有1所的“银行”

作者: 姜璐璐

来源: 格致论道讲坛

发布日期: 2023-06-15 08:03:24

本文介绍了由中国科学院计算机网络信息中心建设的科学数据银行,旨在帮助科学家省钱省力,促进科学数据的开放共享。文章详细阐述了科学数据银行的建设背景、功能、以及未来的发展方向,强调了科学数据在科学研究中的重要性及其开放共享的必要性。

为了帮科学家省钱省力,我们建了一个全球只有6所,中国只有1所的“银行”。如果把已有的科学数据开放共享出来,就可以让后面的科学家站在巨人的肩膀上,站在一个更高的起点上开展研究。大家好,我是来自中国科学院计算机网络信息中心的姜璐璐。我从事的工作是科学数据管理和科学数据共享,简单来讲,我和我的团队的工作就是为科学家建立一所“银行”。事实上,当前很多科学研究是围绕科学数据展开的。

科学数据十分重要,而科学数据的开放共享是更重要的。如果把这些数据开放共享出来,就可以让后面的科学家站在巨人的肩膀上,站在一个更高的起点上开展研究。在科学研究过程中,会产生一些成功的科学数据,这当然非常宝贵。那也有实验失败的情况,产生的所谓的失败的科学数据,它也同样非常重要。被誉为“中国天眼”的FAST科学数据它可以非常大。

贵州的FAST(500米口径球面射电望远镜)一天的观测可以产生50个TB的数据。相当于我们手边1TB的移动硬盘,它一天就能用掉50个,那么一年就可以用掉18250个。科学数据也可以非常非常小,甚至于说非常金贵。它可能产生于科学家电脑里的一个计算数据、显微镜下的一张图片,可能只有几KB、几MB这么小。一些科学家穷其一生只为了精确某一个科学数据小数点的后几位。

事实上,在完成这些工作之后,离科学家真正在我们的银行上存数据、用数据,还是有一段距离的。遇到的第一个困难,就是怎么让我们银行里的数据被大家用起来。这就要求数据它本身需要是可用、可被理解的。现在科学数据银行里主要是一些自然科学的数据,我们希望后面的数据可以覆盖更多的学科领域。科学家可以在我们的平台里面进行一些交叉学科的交流和融合,这是服务全领域科学家的一个畅想。

我们的另外一个畅想是,希望有一天数据可以不用走出科学数据银行,直接就连通我们的超算环境,帮助科学家对海量数据进行计算。科学家可以直接拿走他们想要的一些计算结果和数据产品。事实上这个畅想也不是凭空的,我们中心也有国家级的“东方”超级计算系统,我们也会努力实现这个梦想。

UUID: f2346bde-e750-4c89-87ed-79ca58e01084

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/返朴公众号-pdf2txt/2023/返朴_2023-06-15「转」_为了帮科学家省钱省力,我们建了一个全球只有6所,中国只有1所的“银行”.txt

是否为广告: 否

处理费用: 0.0072 元