有着“欧洲 OpenAI”之称的 Mistral AI,仅仅成立一年,估值就达到了 60 亿美元。自成立以来,Mistral AI 在开源领域频频发力,前不久更是发布了他们的新一代旗舰模型 Mistral Large 2,用不到三分之一的参数量实现了在性能上比肩 Llama 3.1 405B。
日前,Mistral AI 联合创始人兼首席执行官 Arthur Mensch 在《时代》杂志专访中,详细探讨了 Mistral AI 如何吸引稀缺人工智能(AI)人才、如何实现盈利以及欧洲 AI 生态系统的缺失等话题。
Mensch 表示,开源模型没有任何风险,他只看到了好处;开源模型是一个中立的工具,可以被用来做任何事情;人们没有因为你可以用 C 语言制作恶意软件就禁止使用 C 语言;从某种意义上说,AI 并没有改变软件的任何东西,只是定义软件的一种更抽象的方式;用于构建这些应用程序的技术并不是唯一可以被监管的东西,控制投放市场的应用程序的质量非常重要;从某种意义上说,大模型可以被看作是一种更抽象的编程语言,将改变我们未来 10 年的工作方式;Mistral AI 在开源上并没有改变,但也一直希望在开源领域拥有领先的模型,同时也有一些只有通过货币化服务才能获得的高级功能。
在过去的一年里,总部位于巴黎的 Mistral AI 迅速崛起,成为欧洲本土最具影响力的 AI 公司之一。这家初创公司已经发布了 6 款语言模型,这些模型可以回答问题、生成代码和进行基本推理。今年 6 月,Mistral AI 表示其在一轮融资中筹集了 6.45 亿美元,估值超过了 60 亿美元。2 月,他们与微软达成协议,向后者的客户提供他们的模型,从而换取微软计算资源的使用权。
Mistral AI 联合创始人兼首席执行官 Arthur Mensch 在有关具有里程碑意义的《人工智能法案》的辩论中,认为立法者与其监管像 Mistral 这样的基础模型,不如重点监管其他人如何使用这些模型。他还反对限制 AI 开发者自由分享他们的创造成果。他说:“我认为开源模型没有任何风险。我只看到了好处。”
《时代》杂志就如何吸引稀缺 AI 人才、Mistral AI 如何实现盈利以及欧洲 AI 生态系统的缺失等话题,与 Mensch 进行了深入谈话。Mensch 表示,Mistral AI 主要把钱花在了计算上;他们在过去 12 个月内烧掉了 2500 万欧元左右的资金,这才有了他们今天的成就——他们的业务遍布全球,他们的模型在性能和效率方面都处于领先地位。
他们的商业模式是建立前沿模型,并将其提供给开发者。他们正在构建一个开发者平台,让开发者能够定制 AI 模型,开发差异化的 AI 应用程序——他们可以将技术部署到他们想部署的地方,因此有可能不使用公共云服务,这让他们能够定制模型,而不是像现在那样使用封闭的不透明 API 背后的通用模型。最后,他们还非常注重模型的效率,因此能够实现一定的推理能力,使模型尽可能快、尽可能便宜。
Mistral AI 计划继续迎头赶上,最终与其他公司一样具有竞争力。但实际上,他们的业务模式是其他公司所不具备的。他们更愿意分享、定制和部署他们的技术。在这些方面,他们不再拥有控制权。他们一直希望在开源领域拥有领先的模型,同时也有一些只有通过货币化服务才能获得的高级功能。
Mensch 认为,欧洲不能依赖于美国的 AI 公司,需要一个本土的前沿模型。
Mistral AI 是欧洲最著名的 AI 公司之一,但它与微软公司建立了合作伙伴关系,从而获得所需的算力。Mistral AI 在这方面对微软的依赖是否会限制其作为前沿主权 AI 角色的能力?Mensch 表示,他们有四个云提供商,他们在设计上是独立于云的,这也是他们从第一天起就采取的策略。
他们的模型可以通过 Microsoft Azure 提供,也可以通过 Amazon Web Services 和 Google Cloud Platform 提供。他们还将这三者都用作云提供商。他们还使用不同的云提供商——尤其是 CoreWeave 来提供训练。他们建立了自己的技术堆栈和分销渠道,以建立他们认为客户需要的独立性。
Mensch 认为,欧洲应该尝试建立自己的主权计算基础设施,这将有利于生态系统。但欧洲并不是一个独立做出决定、凭空建造一些东西的行为体。这涉及到一个生态系统的问题,即如何确保欧洲能够有效地提供一些计算基础设施。这对他们的客户来说非常重要,因为其中一些客户是欧洲客户,他们确实希望对自己使用的云基础设施拥有某种形式的主权。在这方面,他们模型的一些可及性、推理和平台实际上已经部署在欧洲。
但还可以有一些改进。这不是由欧洲决定的。它是一个生态系统,需要认识到有些需求是可以解决的。他们希望在不久的将来能有一些欧洲云计算合作伙伴。
Mensch 认为,《人工智能法案》是非常可行的,因为他们所受到的限制是他们已经满足的限制。他们已经将使用模型的方式、评估模型的方式记录在案,这已成为对前沿模型的要求。因此,这样做是可以的。
关于训练数据集的透明度问题,他们还需要进行一些讨论,这是他们非常希望实现的,但这需要与商业机密进行衡量。他们的很多知识产权也体现在他们处理数据和选择数据的方式上。这也是他人的知识产权。作为一家小公司,他们对自己的知识产权非常谨慎,因为这是他们唯一拥有的东西。因此,从这个角度来看,他们有信心找到一种各方都能接受的方式。
Mensch 预测,AI 将如何改变世界?
他认为,他们构建了一种强大的技术,但有一种趋势,即假定这种强大的技术可以解决所有问题。在 Mistral AI,他们非常专注于确保他们的技术能够提高生产力,为某些垂直行业、某些领域带来推理能力,从而产生社会效益。人类创造的一切都是工具,而我们带来的新工具则带来了新的抽象能力。因此,从某种意义上说,你可以把它看作是一种更抽象的编程语言。我们使用计算机可理解的语言编程已经有 50 年了。
如今,我们只需要使用英语、法语或任何语言与系统对话,就可以创建系统。这为工人和开发者带来了一种新的抽象方法,这显然改变了我们未来 10 年的工作方式。
Mensch 认为,如果我们妥善处理,确保每个人都能掌握这一工具——这正是他们创建 Mistral 的真正原因——我们就能确保它改善全世界每个人的生活,改善不同社会经济地位的人的生活。
要做到这一点,对他们来说,首先要在医疗、教育等领域实现差异化应用。同样非常重要的是,要确保人们接受培训并有机会获得技术,而且要使人们能够获得这种技术——以比其他方式更开放的方式提供技术,是加快技术发展的一种方式。这还不够,政治决策者还必须制定扶持计划,加快世界上尚未接入互联网的地区的互联网接入速度。但我认为,我们正在开发的新工具——生成式人工智能——在帮助人们使用这种新工具方面具有积极作用。
Mensch 表示,在可预见的未来,他们不会决定最好不要将模型开源,而是将其保留在 API 后面,或者甚至不将其部署在 API 后面。他们建立的模型具有可预测的能力。他们发现,集体管理软件及其使用方式的唯一途径就是开源。网络安全就是如此。操作系统也是如此。因此,当今最安全的技术就是开源技术。从某种意义上说,AI 并没有改变软件的任何东西。它只是定义软件的一种更抽象的方式。
因此,他认为开源模型没有任何风险。我只看到了好处。这是一个中立的工具,可以被用来做任何事情。我们没有因为你可以用 C 语言制作恶意软件就禁止使用 C 语言。我们发布的模型并没有什么不同。因此,控制投放市场的应用程序的质量仍然非常重要。但是,用于构建这些应用程序的技术并不是唯一可以被监管的东西。