更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了

来源: 机器之心

发布日期: 2023-07-19 07:46:51

Meta发布了免费可商用的Llama 2模型系列,包含70亿、130亿和700亿三种参数变体,在多个基准测试中优于其他开源语言模型,并可能成为闭源模型的合适替代品。

一夜之间,大模型格局再次发生巨变。一直以来,Llama可以说是AI社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。今日,Meta终于发布了大家期待已久的免费可商用版本Llama 2。此次Meta发布的Llama 2模型系列包含70亿、130亿和700亿三种参数变体。此外还训练了340亿参数变体,但并没有发布,只在技术报告中提到了。

相⽐于Llama 1,Llama 2的训练数据多了40%,上下⽂⻓度也翻倍,并采⽤了分组查询注意⼒机制。Llama 2预训练模型是在2万亿的token上训练的,精调Chat模型是在100万人类标记数据上训练的。公布的测评结果显示,Llama 2在包括推理、编码、精通性和知识测试等许多外部基准测试中都优于其他开源语⾔模型。

总的来说,作为⼀组经过预训练和微调的⼤语⾔模型(LLM),Llama 2模型系列的参数规模从70亿到700亿不等。其中的Llama 2-Chat针对对话⽤例进⾏了专⻔优化。Llama 2模型系列除了在⼤多数基准测试中优于开源模型之外,根据Meta对有⽤性和安全性的⼈⼯评估,它或许也是闭源模型的合适替代品。

UUID: 6e649bcb-6116-49a5-87c5-02bc56d08d1c

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2023年/学术头条_2023-07-19_更强的Llama2开源,可直接商用:一夜之间,大模型格局变了.txt

是否为广告: 否

处理费用: 0.0058 元