一夜之间,大模型格局再次发生巨变。一直以来,Llama可以说是AI社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。今日,Meta终于发布了大家期待已久的免费可商用版本Llama 2。此次Meta发布的Llama 2模型系列包含70亿、130亿和700亿三种参数变体。此外还训练了340亿参数变体,但并没有发布,只在技术报告中提到了。
相⽐于Llama 1,Llama 2的训练数据多了40%,上下⽂⻓度也翻倍,并采⽤了分组查询注意⼒机制。Llama 2预训练模型是在2万亿的token上训练的,精调Chat模型是在100万人类标记数据上训练的。公布的测评结果显示,Llama 2在包括推理、编码、精通性和知识测试等许多外部基准测试中都优于其他开源语⾔模型。
总的来说,作为⼀组经过预训练和微调的⼤语⾔模型(LLM),Llama 2模型系列的参数规模从70亿到700亿不等。其中的Llama 2-Chat针对对话⽤例进⾏了专⻔优化。Llama 2模型系列除了在⼤多数基准测试中优于开源模型之外,根据Meta对有⽤性和安全性的⼈⼯评估,它或许也是闭源模型的合适替代品。