总部位于巴黎的人工智能初创公司 Mistral AI 成立仅一年,就被誉为现有大模型巨头的有力挑战者。今年 2 月,Mistral AI 正式发布了旗舰级大模型 Mistral Large,直接对标 OpenAI 的 GPT-4;几周前,Mistral AI 发布了其新一代开源语言模型 Mixtral 8x22B,声称实现了最高的开源性能和效率。
该公司首席执行官兼联合创始人 Arthur Mensch 以及其他两位联合创始人 Guillaume Lample 和 Timothée Lacroix 在回到法国创办 Mistral 之前,分别任职于 Google DeepMind 和 Meta,后来因意识到生成式人工智能在欧洲的绝佳机会,辞职选择创业。
日前,Mensch 在接受麦肯锡高级主管 Eric Hazan 和 Stéphane Bout 采访时,详细介绍了 Mistral 的开源战略、欧洲如何在人工智能竞赛中竞争,以及人工智能将如何改变工作场所。
Arthur Mensch:人类在人工智能的进程中仍然非常重要,我们应该将生成式人工智能工具视为提高生产力和创造力的一种方式。大型语言模型和生成式人工智能就像一种新的编程语言,它更加抽象,也更容易被人类语言所控制。人们将专注于其他模型无法完成且永远不会被取代的工作,其中包括人际关系管理、发散思维、创造性思维和发明新想法。三五年后,我们所做的工作应该比现在的工作更有意义。
Eric Hazan:能否向我们介绍一下您创建 Mistral AI 的历程?是什么促使您创办了这家公司?Arthur Mensch:当然可以,我是科学家出身。我拥有机器学习和功能性磁共振成像专业的博士学位,之后在数学专业做了两年博士后研究。之后我加入了 Google DeepMind,我在那里从事了两年半的大型语言模型(LLMs)研究,大约一年前离开了。
Eric Hazan:在共同创办 Mistral AI 公司的过程中,有什么趣闻轶事想与我们分享?Arthur Mensch:我和联合创始人 Guillaume Lample、Timothée Lacroix 从学生时代就认识,已经有十年了。我在 DeepMind 工作,Guillaume 和 Thimothée 在 Meta 工作,我们三人在硅谷生活和工作并研究深度学习。
当我们看到生成式人工智能领域正在加速发展时,我们意识到,这是一个在法国创建公司并加快创建先进大型语言模型进程的绝佳机会。
Eric Hazan:Mistral 对开源模型有很强的承诺。你认为它们能加快价值的采用和创造吗?Arthur Mensch:当然,我认为这是一种基础设施技术,可以被转换成任何类型的应用。我们确实相信,应用制造商需要创造差异化,也需要深入掌握技术。
而做到这一点的唯一途径就是能够访问整个堆栈。发起这场运动的方法就是让人们相信,我们的开源模式可以让他们创建更便宜、更快速、更好的应用程序,这就是我们的起点。