在数据和智能技术驱动的“大科学时代”,高校需要什么样的科研算力平台?刚刚,复旦大学率先打了个样。6月27日,由复旦大学与阿里云等共同打造的云上科研智能计算平台“CFFF”宣告正式上线。CFFF是“Computing for the Future at Fudan”的缩写,剑指复旦大学未来科研算力池。
记者了解到,以复旦大学“博学而笃志,切问而近思”的校训为灵感来源,CFFF平台由智能计算集群“切问一号”和高性能计算集群“近思一号”两部分组成,以公共云模式提供超千块卡并行智能计算,支持千亿参数级的大模型训练,在国内高校中尚属首例,走在了斯坦福大学等国际知名高校的前面,也缔造了中国高校最大的云上科研智算平台。
“CFFF平台是全国高校算力第一的异构智算集群。”复旦大学校长、中国科学院院士金力在接受采访时表示:“CFFF是为发现和解决复杂科学问题而建,是为科研服务的必要基础设施。”
作为智超融合的第一高校科研算力平台,CFFF既有面向多学科融合创新的AI for Science智能计算集群“切问一号”,又有面向高精尖研究的专用高性能计算集群“近思一号”。
其中,“近思一号”部署在复旦大学校内,“切问一号”则托管在远在1500公里外的阿里云乌兰察布数据中心。两大集群身处两地,它们是怎样协同响应、互相支撑的?“两地之间建有一条百G通路的高速数据传输网络。
”复旦大学“浩清教授”、人工智能创新与产业研究院院长漆远介绍说,基于百G高速数据传输网和阿里云领先的大规模异构算力融合调度技术、分级存储技术、AI与大数据一体化技术,“近思一号”和1500公里外的“切问一号”被连成了一台“超级计算机”。
这是一台跑在云上的“超级计算机”。漆远介绍说,CFFF不仅算力规模大,“存力”规模也不小。“CFFF拥有国内高校最大规模的多级数据冷热分层存储集群,解决了海量科研数据无法长期备份的痛点,并支持云上高速传输——以往PB级科研数据从复旦校内传到西部数据中心需要两周,如今当天就能完成,真正实现了‘东数西算’。”
算力足、传得快、存得多,让CFFF成为一台真正意义上的科研“超级计算机”。漆远表示,在CFFF上,复旦四个校区的所有实验设备都能高速接入,并且做到异构算力统一管理、计算任务统一调度,能满足不同应用场景下的科学智能研究与应用需求。
目前,CFFF平台上的第一个科研成果已经诞生。复旦大学人工智能创新与产业研究院研究员李昊团队,近期发布了45亿参数量的中短期天气预报大模型“伏羲”。“伏羲”首次将基于AI的天气预报时长提升到15天,且预测效果表现亮眼——在公开数据集上,“伏羲”的成绩达到了长期在该领域领先的欧洲中期天气预报中心的集合平均水平,同时将预测速度从原来的小时级缩短到了3秒内。