5月3日下午,寒武纪科技在上海发布了中国第一款云端智能芯片——Cambricon MLU100芯片和板卡产品、寒武纪1M终端智能处理器IP产品。联想、曙光和科大讯飞作为寒武纪的合作伙伴同时发布了基于寒武纪芯片的应用产品。
作为一家国际智能芯片领域的先行者,在人工智能大爆发的前夜,寒武纪科技又一次带来了新突破,也在它“引领人类社会从信息时代迈向智能时代,做支撑智能时代的伟大芯片公司”的理想之路上迈进了一步。值得一提的是,MLU100云端智能芯片是上海寒武纪百名科研人员历时近2年的研发成果。
这场发布会的焦点是首次正式亮相的Cambricon MLU100云端智能芯片。MLU100采用寒武纪最新的MLUv01架构和TSMC 16nm的先进工艺,可工作在平衡模式(1GHz主频)和高性能模式(1.3GHz主频)下,平衡模式下的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4万亿次定点运算,但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。
与寒武纪系列终端处理器一样,MLU100云端芯片仍然延续了寒武纪产品一贯出色的通用性,可支持各类深度学习和经典机器学习算法,充分满足视觉、语音、自然语言处理、经典数据挖掘等领域复杂场景下(如大数据量、多任务、多模态、低延时、高通量)的云端智能处理需求。
值得一提的是,MLU100云端智能芯片是上海寒武纪历时近2年研发的成果,是上海智慧的结晶。寒武纪于2016年4月在上海临港落地,专注于云端智能芯片的研发和销售。目前,上海寒武纪的芯片研发人员已达百人规模,在临港和张江分别设有办公室,并依托上海脑智工程设立了院士工作站开展前瞻学术研究。
这次最新发布的寒武纪1M,则是该公司的第三代IP产品,在TSMC 7nm工艺下8位运算的效能比达5Tops/watt(每瓦5万亿次运算),提供三种规模的处理器核(2Tops/4Tops/8Tops)以满足不同应用场景下不同量级的智能处理需求,并可通过多核互联进一步提高性能。
寒武纪在技术上贯彻“端云协作”的理念,这次发布的MLU100云端芯片,不仅可独立完成各种复杂的云端智能任务,更可以与寒武纪1A/1H/1M系列终端处理器完美适配,让终端和云端在统一的智能生态基础上协同完成复杂的智能处理任务。
在陈天石博士的主旨演讲之后,寒武纪的部分产业伙伴公开展示了基于寒武纪芯片的应用方案。联想集团于今日的发布会上推出了基于Cambricon MLU100智能处理卡的ThinkSystem SR650,打破了37项服务器基准测试的世界记录。该产品为2U2路机架式规格,支持2个MLU100智能处理卡。
中科曙光也在今日的发布会上同步推出了基于Cambricon MLU100智能处理卡的服务器产品系列“PHANERON”。PHANERON系列于2017年11月面世,基于寒武纪此前公布的一款原型测试芯片。而此次发布的“PHANERON”新品跟随MLU100智能加速卡的发布进行了同步升级,性能更为强劲,可以支持2-10块寒武纪MLU处理卡,灵活应对不同的智能应用负载。
智能语音应用的领头羊科大讯飞公司也在今日的发布会上披露了与寒武纪芯片的深度合作研发项目。根据介绍,一小时的语音数据在一个传统处理器上进行智能应用处理,需要一万小时才能完成,因此科大讯飞一直在跟踪人工智能专用芯片的前沿进展。早在2014年,科大讯飞就开始与寒武纪的早期研究团队开始沟通相关语音算法在处理器上的实现,并于2016年的天使轮注资寒武纪,2017年开始在寒武纪芯片上进行应用测试。