最近,超算领域学术界和产业界人士围绕“中国超算服务创新”展开了一场热烈的讨论。起因是,北京并行科技股份有限公司总经理陈健从超算建设投入产出比的角度提出,虽然中国超算近年来取得了瞩目的成就,但超算服务的模式还很落后,特别是一些自建院系、单位级和用户组级超算集群,投入产出比远不及大型超算,且年平均利用率低,这种“小农经济式”超算服务形态,急需改进、创新。
如何为科研提供更好的超算服务,是中国超算的一大命题。陈健提出的解决方案是“超算上云”。作为超算云服务提供商,陈健认为,超算的使用者大都要经历“国内外大超算平台排队上机——自建超算集群——租用超算——超算云服务”的过程,这是一个“从落后的生产力逐渐过渡到更先进的生产力形式”。
以此为发端,超算领域学术界、产业界人士从各个角度给出了他们的理解和思考。虚拟化和云计算专家麻清刚提出,从技术上来讲,限制超算“上云”的条件是网络带宽。北京大学高性能计算平台主任工程师樊春也指出,带宽费用是阻碍我们去内蒙古建超算的最主要原因。
中科院计算所研究员张云泉认为,目前超算云服务只能支持一些中低端计算需求,那些更快、更大规模的需求,超算云服务的形式还提供不了。樊春还提出一个问题:“超算云技术管理上无法降低成本,从而无法降低对最终用户的价格,这是超算云发展的最大障碍。”
陈健认为,并行科技依托各大超算中心资源提供的超算云服务,现在已经有近1.5万个客户,并行科技给用户提供的超算价格,经核算比自建超算低一半。此外,2018年并行科技超算云服务合同额已达2亿元,预计2019年会达到3亿元。
国家超级计算天津中心一位要求匿名的专家认为,并非只有超算云才能解决现在的超算服务问题。阿里云高性能计算负责人何万青也持类似观点,他认为超算是个大生态系统,中国是个超算大国,必然有各种模式的超算集群。
在超算平台建设方面,陈健提出,事实上目前我国的国家级超算一直是不核算建设成本的,对重大应用采取免费或者低价支持的措施。对此,中科京云总经理贺建海提出一个大胆的想法,“我认为国家级超算应该向基础研究提供免费计算资源。”
樊春结合他们在北大高性能计算平台提供超算服务的经验提出,面向那些小规模短时长、纳入教学任务的超算使用需求,可以且应该免费,以降低学生学习的门槛;而面向基础科研,比较耗费资源的高性能计算任务是不能免费的,但是应该以极低的价格提供给科学工作者使用。