人人都有“AI编程助手”!CodeGeeX2-6B开源,最低6GB显存

来源: 学术头条

发布日期: 2023-07-25 17:46:30

GLM技术团队发布了更强大的多语言代码生成模型CodeGeeX2,性能优于StarCoder,最低只需6GB显存,且已开源。该模型基于ChatGLM2架构,具有更强的代码能力和更优秀的模型特性,支持多种编程语言,并提供了VS Code等IDE的插件,以提升开发效率。

自ChatGPT、Midjourney、GitHub Copilot等由AI大模型驱动的工具问世以来,越来越多的人开始思考这样一个问题:在不久的将来,我们的工作机会会被AI替代吗?以创造AI模型/工具的程序员为例,来自GitHub的数据显示,目前41%的代码都是由AI生成的。Stability AI创始人兼CEO Emad Mostaque日前甚至断言,“五年内将不再有(人类)程序员”。

尽管目前的代码模型还没有达到超越所有人类优秀程序员的水平,但随着生成式AI的飞速发展,这确实是一个值得担忧的问题。既然打不过,那就选择加入——将代码模型作为我们的“AI编程助手”。

据GLM技术团队消息,继去年9月发布多语言代码生成模型一代CodeGeeX之后,更强大的多语言代码生成模型CodeGeeX2来了。据介绍,CodeGeeX2性能优于StarCoder,最低只需6GB显存,且已开源。团队在官方微信公众号上写道,“我们希望每一位程序员,都能在自己的机器上跑上一个自己的编程助手。”

据官方博客介绍,CodeGeeX2是多语言代码生成模型CodeGeeX的第二代模型,基于ChatGLM2架构注入代码实现。得益于ChatGLM2的更优性能,CodeGeeX2-6B在多项指标上取得了较大的性能提升。与150亿参数的StarCoder-15B相比,CodeGeeX2-6B凭借60亿参数便实现了近10%的优势。

此外,不仅CodeGeeX2-6B的代码能力得到了大幅提升,且获得了更优秀的模型特性,做到了更开放,是一个更全面的AI编程助手。

为了展示新一代多语言代码生成基座模型的优异性能,团队在HumanEval、HumanEval-X、DS1000基准上对CodeGeeX2进行了测评。数据显示,CodeGeeX2的代码能力较上一代实现了大幅提升。同时,CodeGeeX2与上一代相比,对部署更加友好。

得益于使用Multi-Query Attention和Flash Attention,推理速度更快,且量化后仅需6GB显存即可运行。另外,团队开发了支持VS Code、IntelliJ IDEA、PyCharm、GoLand、WebStorm、Android Studio等IDE的CodeGeeX插件。

在插件中,用户可以更直接体验到CodeGeeX2模型在提升代码生成与补全、添加注释、代码翻译及技术问答方面开发效率的能力。

UUID: 9e633d8b-6b66-4dd3-9f31-4c66408856d8

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2023年/学术头条_2023-07-25_人人都有“AI编程助手”!CodeGeeX2-6B开源,最低6GB显存.txt

是否为广告: 否

处理费用: 0.0039 元