智能时代的操作系统,这次能否不卡脖子?

作者: 赵广立

来源: 中国科学报

发布日期: 2019-11-29 10:56:23

本文讨论了中国在智能时代面临的“缺芯少魂”问题,特别是在AI芯片和深度学习框架方面依赖外国技术的情况。文章介绍了中国科学院计算技术研究所研究员陈云霁的观点,以及百度飞桨深度学习平台的努力和发展,强调了自主研发和生态系统构建的重要性。

在IT时代,中国“缺芯少魂”,被人“卡脖子”,大部分互联网应用都只能建基于Wintel体系、Android-Arm体系之上,成了中国IT事业的难言之隐。来到AI时代,列强依旧野心勃勃。中国会不会再次陷入“缺芯少魂”的境地?这不是杞人忧天。

中国虽坐拥世界最大市场,但在AI最基础的芯片和“操作系统”方面,仍然是最薄弱环节——底层的AI芯片,英伟达GPU一家独大;而作为“操作系统”的深度学习开发平台,谷歌TensorFlow和脸书PyTorch上网罗了近90%的国内开发者。

中国科学院计算技术研究所研究员陈云霁今年发表在《中国计算机学会通讯》上的《智能计算系统——一门人工智能专业的系统课程》一文中指出,越是人工智能上层(算法层、应用层)的研究,我国研究者对世界作出的贡献越多;越是底层(系统层、芯片层),我国研究者的贡献越少。

陈云霁表示很担忧:“底层研究能力的缺失不仅给我国人工智能基础研究拖后腿,更重要的是,将使得我国智能产业成为‘空中楼阁’,走上信息产业受核心芯片和操作系统制约的老路。”人工智能芯片,我们看到了寒武纪科技、华为海思等的努力;“操作系统”呢?称深度学习框架平台为“智能时代的操作系统”,是因为其向上是对接图像分割、文本分类等各种应用的入口,向下可以用于定义AI芯片等硬件的功能和角色,发挥着承上启下的作用。

IDC《中国深度学习平台市场份额调研》显示,在AI技术使用方面,接受调研的企业和开发者中,86.2%选择使用开源深度学习框架。对掀起此轮AI浪潮功不可没的谷歌,以及热衷于前沿领域的脸书,在开源深度学习框架方面抢跑在前,市场占有率很高。在科研领域,TensorFlow、PyTorch等已经占据垄断地位;在产业应用方面,多数中国开发者都在使用国外开源平台,其中半数以上聚集在TensorFlow。

更值得警惕的是,这些平台有演化成Wintel式生态的趋势——如谷歌正将TensorFlow与其自研的机器学习芯片TPU深度融合,设置起越来越高的生态门槛。用户开发习惯一旦养成,很难迁移。如果说深度学习是一道AI时代最重要的一道“食谱”,数据就是“蔬菜和肉”等原材料,而深度学习框架就是“锅和铲子”。如果“锅和铲子”被人拿走,再高明的厨师也无法做出一道像样的菜。

反观国内,具备完全自主知识产权的开源深度学习平台,目前只有一棵独苗——百度飞桨深度学习平台。只是,百度飞桨成色几何?

最近,百度公司宣布飞桨深度学习开源开放平台完成20多项功能发布和技术升级,这些发布和升级包括:提升核心框架性能和易用性、新增产业级模型库、发布端侧推理引擎Paddle Lite、发布面向产业应用场景的端到端开发套件(自然语言处理领域的ERNIE语义理解、计算机视觉方向的PaddleDetection目标检测和PaddleSeg图像分割、智能推荐方向的ElasticCTR点击率预估)等等。

百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰介绍说,所有这些升级,都围绕着一个出发点:让飞桨比国外开源平台更好用。“功能发布和技术升级后,飞桨平台的深度学习模型开发能力、训练能力、预测和部署能力进一步提升,可比肩TensorFlow、PyTorch等国际主流框架,还在多项技术上有优于后者的表现。”王海峰说。

飞桨是我国目前唯一具有完全自主知识产权的全功能性产业级深度学习平台,包括核心框架、模型库、开发套件、工具组件和服务平台五大部分。百度技术团队自2018年以来对飞桨进行了全面升级,并进行大规模推广。可以说,百度飞桨的开源开放及不断突破升级,打破了国内的AI开发者过度依赖国外开源深度学习框架这一局限。我国人工智能技术开发者和使用者将不必依赖于国外平台,同时还可进一步培育自主可控的AI开发应用生态。

统计数字显示,飞桨当前拥有超过6.5万企业用户,在定制化训练平台上发布了16.9万个模型,且模型数量呈现显著增长趋势,在工业、农业、服务业等各行各业中广泛应用。同时,飞桨已经累计服务150万开发者,这一数字约占中国软件从业平均人数的1/4。“飞桨”一词,取自宋代文豪朱熹《即事有怀寄彦辅仲宗二兄》中的“闻说双飞桨,翩然下广津”。寄寓于在“飞桨”助力下,推动中国AI事业走得更快、更远。

不过,与TensorFlow等相比,飞桨在生态构建上仍然有较大发展空间。并且,生态系统的培育,单凭一家企业之力几乎难为。“生态体系不是一朝一夕培育起来的,国外框架几年前就开始在中国大规模推广了,目前渗透很深。”王海峰说,“我们希望有关多方围绕深度学习框架和平台这个核心,形成合力,下大力气培育自主的生态体系。”IT时代的前车之鉴提醒我们,中国智能产业要在底层核心技术方面构建自己的生态。

王海峰认为,国产智能芯片和深度学习框架都是构建我国自主AI生态的关键,智能时代深度学习平台一定要和AI芯片对接,不仅要做软件的优化,还要软硬一体,跟芯片一起联合优化。在最近一轮升级中,飞桨专门在对华为、寒武纪等国产AI芯片的适配方面做了大量工作,使得在飞桨开发的模型,能够在这些国产芯片上无论推理速度还是能效比都有大幅提升。

当下,各行各业正在应用AI进行产业智能化升级,开源开放的深度学习平台能够有效降低深度学习技术应用门槛,避免重复“造轮子”。更重要的是,如果不发展自主芯片、不维护自主的框架平台,国内也就培养不出相应的人才。“维护好自己的社区,跟在别人构建的社区中修修补补是完全不一样的。”王海峰认为,无论是推动AI技术从实验室走向产业,还是自主AI生态构建,飞桨深度学习框架在未来将继续发挥重要作用。

“我国在智能时代不能再让受制于人的历史重演。”他表态:“这也是百度下大力气做飞桨平台的意义所在。”

UUID: 91d4141a-58c5-4d34-9c69-5a601a68aa56

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中国科学报公众号-pdf2txt/2019-2020/中国科学报_2019-11-29_智能时代的操作系统,这次能否不卡脖子?.txt

是否为广告: 否

处理费用: 0.0058 元