自ChatGPT、Midjourney、GitHub Copilot等由AI大模型驱动的工具问世以来,越来越多的人开始思考这样一个问题:在不久的将来,我们的工作机会会被AI替代吗?以创造AI模型/工具的程序员为例,来自GitHub的数据显示,目前41%的代码都是由AI生成的。Stability AI创始人兼CEO Emad Mostaque日前甚至断言,“五年内将不再有(人类)程序员”。
尽管目前的代码模型还没有达到超越所有人类优秀程序员的水平,但随着生成式AI的飞速发展,这确实是一个值得担忧的问题。既然打不过,那就选择加入——将代码模型作为我们的“AI编程助手”。
据GLM技术团队消息,继去年9月发布多语言代码生成模型一代CodeGeeX之后,更强大的多语言代码生成模型CodeGeeX2来了。据介绍,CodeGeeX2性能优于StarCoder,最低只需6GB显存,且已开源。团队在官方微信公众号上写道,“我们希望每一位程序员,都能在自己的机器上跑上一个自己的编程助手。”
据官方博客介绍,CodeGeeX2是多语言代码生成模型CodeGeeX的第二代模型,基于ChatGLM2架构注入代码实现。得益于ChatGLM2的更优性能,CodeGeeX2-6B在多项指标上取得了较大的性能提升。与150亿参数的StarCoder-15B相比,CodeGeeX2-6B凭借60亿参数便实现了近10%的优势。
此外,不仅CodeGeeX2-6B的代码能力得到了大幅提升,且获得了更优秀的模型特性,做到了更开放,是一个更全面的AI编程助手。
为了展示新一代多语言代码生成基座模型的优异性能,团队在HumanEval、HumanEval-X、DS1000基准上对CodeGeeX2进行了测评。数据显示,CodeGeeX2的代码能力较上一代实现了大幅提升。同时,CodeGeeX2与上一代相比,对部署更加友好。
得益于使用Multi-Query Attention和Flash Attention,推理速度更快,且量化后仅需6GB显存即可运行。另外,团队开发了支持VS Code、IntelliJ IDEA、PyCharm、GoLand、WebStorm、Android Studio等IDE的CodeGeeX插件。
在插件中,用户可以更直接体验到CodeGeeX2模型在提升代码生成与补全、添加注释、代码翻译及技术问答方面开发效率的能力。