更强的Llama 2开源，可直接商用：一夜之间，大模型格局变了

一夜之间，大模型格局再次发生巨变。一直以来，Llama可以说是AI社区内最强大的开源大模型。但因为开源协议问题，一直不可免费商用。今日，Meta终于发布了大家期待已久的免费可商用版本Llama 2。此次Meta发布的Llama 2模型系列包含70亿、130亿和700亿三种参数变体。此外还训练了340亿参数变体，但并没有发布，只在技术报告中提到了。

相⽐于Llama 1，Llama 2的训练数据多了40%，上下⽂⻓度也翻倍，并采⽤了分组查询注意⼒机制。Llama 2预训练模型是在2万亿的token上训练的，精调Chat模型是在100万人类标记数据上训练的。公布的测评结果显示，Llama 2在包括推理、编码、精通性和知识测试等许多外部基准测试中都优于其他开源语⾔模型。

总的来说，作为⼀组经过预训练和微调的⼤语⾔模型（LLM），Llama 2模型系列的参数规模从70亿到700亿不等。其中的Llama 2-Chat针对对话⽤例进⾏了专⻔优化。Llama 2模型系列除了在⼤多数基准测试中优于开源模型之外，根据Meta对有⽤性和安全性的⼈⼯评估，它或许也是闭源模型的合适替代品。