当危险逼近时,善于抓住机会迎头痛击它,要比犹豫躲闪更有利。因为犹豫的结果恰恰是错过了克服它的机会。——弗兰西斯·培根
2018年9月28日晚,由科技部政策法规与监督司、中国科学院科学传播局、北京科学技术委员会支持,中国科学院物理研究所承办的第30期科学咖啡馆活动在物理所M楼咖啡厅举行。龙芯首席科学家、中科院计算机研究所胡伟武研究员以《核心技术需要在试错中发展》为题,介绍了研发通用处理器的战略意义、取得的成果以及目前面临的机遇与挑战,并与大家进行了深度交流。科技部政策法规与监督司邱成利处长担任本次活动主持人。
胡伟武1991年毕业于中国科学技术大学,免试进入中科院计算机研究所攻读博士学位,师从著名计算机专家夏培肃院士。2001年,他开始投身龙芯处理器的研制工作,先后主持完成了我国第一个通用处理器龙芯1号、第一个64位通用处理器龙芯2号、第一个四核处理器龙芯3号的研制。目前,龙芯处理器已形成系列产品,应用于桌面、服务器、嵌入式等领域,为国家安全和自主信息产业发展作出了突出贡献。
CPU(Central Processing Unit)又称中央处理器,是一块超大规模集成电路,是计算机的运算核心和控制核心,其功能主要是解释计算机指令以及处理数据并执行指令。CPU无处不在,大到超级计算机,小到笔记本电脑、智能手机,甚至智能电表、水表都离不开这枚小小的芯片。CPU的研制是一项繁杂的系统工程——结构设计在所有集成电路中最为复杂,加工制造工艺也非常复杂。
目前,CPU的主流制程已经达到14—32 nm(英特尔I7处理器采用14 nm制造工艺),更高的研发制程甚至已达7 nm,也就是说一根头发的宽度可以走几千根线。除此之外,CPU的软件生态更为复杂。IT产业本质上是“解决方案为王”的产业,而通用CPU的“解决方案”除了CPU芯片本身外,操作系统、编译器、数据库、办公软件等都发挥着极其重要的作用。因此CPU不仅要造得出、造得起,还要用得上、用得好。
2016年是红军长征胜利80周年,是年10月以此命名为CZ80的龙芯3A3000研制成功,这对自主CPU来说具有里程碑意义——通用处理性能跨过了国际通用处理器性能的第一个门槛,单核SPECCPU2006性能不低于ARM、Intel的低端系列(凌动系列)处理器以及威盛处理器,且3A3000的访存带宽已与AMD及Intel的高端系列(酷睿系列)持平。
龙芯3A3000成功跨越国际通用处理器性能的首个门槛,为之后达到AMD主流处理器的性能打下了坚实的基础。从龙芯3A1000开始,团队用时10年完成了龙芯3A1000、3B1000、3B1500、3A2000/3B2000、3A3000/3B3000五款龙芯3号系列芯片的研发,大的流片版本12个,小的流片版本6个。
回忆10年“长征路”上经历的无数坎坷,胡伟武动情地说:“除了龙芯的质量流程需要持续改进以外,究其根本原因,是因为我们坚持芯片中的核心模块自主研制。龙芯3号研制过程中遇到的困难,都是包括CPU、HT控制器、内存控制器、全定制寄存器堆、全定制锁相环等核心模块内部的问题,而不仅仅是把这些模块“攒”在一起就可以解决的。自从2001年开始研制CPU以来,我直接或间接负责了近百次流片,都是核心模块内部的问题。
”
试错中发展——复杂系统的研制无捷径可走听了胡伟武的介绍,大家在感慨钦佩之余,也提出了很多疑问。为什么不购买国外先进的技术?又或者,在购买技术或以市场换技术的前提下再进行创新,实现“弯道超车”?现场主持人邱成利、主讲人胡伟武就各种提问与大家进行了热烈的讨论。胡伟武解释说:“国外的同类产品也是在长期的应用中经历了多轮试错,逐渐完善发展起来的。”核心技术产品的难点不在科学原理,而在于工程细节的完善。
以汽车发动机为例,科学原理在教科书上写得一清二楚,但制造出来的发动机要经受长年累月的验证,即使通过了高海拔、高纬度、高温高湿的“三高”考验,也不意味着不会再出现问题。所有的复杂系统都需要在不断试错中发展,不可能一蹴而就,往往在多轮试错改进才能初见成效。这一过程需要时间和人力、物力、财力的投入,但唯有时间无法超越。
胡伟武坦言,龙芯一直在“爬楼梯”。
第一阶“楼梯”即在“十二五”期间,在装备类应用中试错。彼时,龙芯主要面向嵌入式操作系统的单一应用及Linux通用操作系统的简单应用。自主CPU开始和OS结合,出现了如CPU成熟度不够,VxWorks的BSP和图形包缺乏等大量问题。通过建立质量体系和服务体系,加之产业链合作伙伴的支持,初步解决了上述问题,使自主基础软硬件达到“基本可用”水平。第二阶“楼梯”即在“十三五”前期,在办公类应用中试错。
主要面向以党政办公为代表的复杂固定应用,每个应用场景有上千台计算机。当时遇到了CPU性能不足、部分软件功能(如Flash视频)缺乏、IO设备适配不够等诸多困难,直到CPU升级到第二代产品,OS升级到64位,产品的综合性能提升了一个数量级,完美解决了这些问题,应用方面达到“可用”水平。第三阶“楼梯”即在“十三五”后期,在批量应用中试错。
龙芯在此过程中要在将CPU通用处理性能再提高1—2倍的同时,增强用户体验,达到“好用”水平。“经过上述三轮试错,以CPU和操作系统为代表的自主基础软硬件将从青涩走向成熟,自主基础软硬件产业链从组合发散到组合收敛,自主基础软硬件的应用系统从基本可用到可用再到好用,为构建独立于Wintel体系和ARM+Android体系外的自主技术体系将打下坚实基础。”胡伟武所言充满自信。
发展核心技术要抛弃幻想面对“国外封锁国内技术时就进行自主研发,国外放开技术封锁后就停止自主研发”的现状与困境,胡伟武说:“做任何事情,依靠别人总是轻松一些,吃过一些亏后就会明白最终还是要靠自己。我们已经在‘以安全可控为主题、以产业发展为主线、以生态建设为目标’的新长征路上前行,我们的目的一定要达到,也一定能够达到!
”谈到如何避免受到技术封锁时,胡伟武认为:“打铁还需自身硬,只有我们做出了同类的产品,才能从根本上打破垄断。”“如果国家以法律的形式规定,凡是对我国进行封锁的产品和技术,即使解禁后十年内也不准进口的话,相信很多人就会三思而后行了。”胡伟武最后强调:“发展自主CPU,构建自主可控的信息技术体系是国家的需要、时代的需要,我们也已初步具备了条件。
只要克服急躁情绪,以实事求是的作风和愚公移山的精神,脚踏实地、积极进取,必将实现我们的目标!”
在洋溢着智慧与思考的热议空间里,中科院科学传播局局长周德进、中科院物理研究所所长助理魏红祥、中国空间技术研究院副部长韩增尧、中国科学技术出版社副总编辑杨虚杰、国家行政学院程萍教授、中科院科学传播局马强、上海高通集团董事长程儒萍等40余人与会交流,活动同时吸引了中央电视台、北京电视台、湖南卫视芒果TV等多家媒体的现场关注。
中国科学院物理研究所
李淼 成蒙 魏红祥
供稿
本文选自《物理》2018年第10期