被投资10亿美元却濒临倒闭,ChatGPT绝境翻盘的秘籍:放弃理想,认真卖身

作者: 林亦

来源: 环球科学

发布日期: 2023-02-23 21:30:50

OpenAI成立于2015年,最初以非营利形式追求强人工智能(AGI)为目标,然而在资金和竞争压力下逐渐转型为半营利公司。尽管面临质疑,OpenAI通过与微软的合作获得了巨额投资,推出了ChatGPT等成功产品,成为全球知名的AI企业。文章探讨了OpenAI的发展历程、商业化过程及其对人工智能未来的影响。

千万不要小瞧理工科毕业生。搞技术的佬们一旦开始认真搞钱,整条华尔街都找不到几个对手。不过搞技术的,特别是搞开源技术的人去搞钱,也是个极具争议的事。这方面的一个典型,就是OpenAI这家公司。这家公司搞的聊天机器人ChatGPT坊间传得是神乎其神,技术也的确撑得起来,鲜少看到负面评价。可它的创造者OpenAI这家公司,在争议里陷了四年。

有人说它已经沦为了微软的掌中玩物,也有人痛陈它已经堕落成了CloseAI。

OpenAI到底做出来了什么成绩?它为什么又要遭到质疑?这种质疑到底有没有道理?我是林亦,今天咱们唠唠鲜衣怒马的ChatGPT和它背后负重前行的OpenAI。

AI浪潮下的OpenAI2015年12月,OpenAI成立了。这家公司成立之初,就两个字,“理想”。目标很“理想”,形式也很“理想”。

OpenAI的目标非常远大,他们要做AGI。AGI只比AI多了一个字母,但AI和AGI,它俩是“科技”和“科幻”的区别。AGI是Artificial General Intelligence,直译是通用人工智能,但更准确的译法应该是强人工智能,专指AI领域的巅峰技术,一个模型就能做所有人类能做的事,而且在每件事上不仅达到人的平均水平,还要超越。

这时候有朋友要问了:“这么厉害的AI会不会不安全啊?

”在成立宣言里,OpenAI设定了一个很“理想”的目标,他们不仅要追求实现这样一个强人工智能,还要确保它是安全的、对全人类有益的。为了实现这个目标,最初OpenAI采取了一个很“理想化”的组织形式,就是非营利公司,不谈钱,只谈理想。其实赚钱本身没什么不对的,但为了赚钱一定会出现商业竞争,而在强人工智能的研究上,竞争除了提供动力,还会带来隐患。

当商业公司纷纷加紧投入简化流程、速度最优先的时候,不能直接帮公司挣钱的安全问题就可能被忽视。而强人工智能出问题,不想着帮助人类、而是算计人类,或者是被居心叵测的个人或组织利用,绝对是人类承受不起的。

所以OpenAI选择成为一家非营利公司,有效回避了竞争的问题,但同时也给公司埋下了大坑,一会儿就会讲到。

在公司章程里,OpenAI还给出了一个放弃竞争条款,当有人比OpenAI更接近实现强人工智能的时候,OpenAI会从竞争转向合作,用自己的资源和经验帮助对方实现目标。这是什么人间大爱啊?就这样,为了避免在强人工智能的研发竞争中没人去考虑安全性的问题,OpenAI决定去做这个最后的守门员,还能进球得分的那种。

实际上进球可能还更重要一些,如果别人真的领先了,愿不愿意听别人唠叨那些安全性的问题还真不好说。

所以OpenAI在保持非营利形式的同时,还得具备竞争力,这就太理想化了。

OpenAI发展史不过成立之初的OpenAI也可以说有这个底气。

OpenAI的成立公告里,除了列出一众顶级研究人员以外,还有一份堪称全明星阵容的投资人名单,包括做汽车造火箭的Elon Musk,LinkedIn联合创始人Reid Hoffman,PayPal联合创始人Peter Thiel,还有Y Combinator当时的总裁Sam Altman。最后这家公司有的朋友可能不知道,但它在硅谷科技投资圈可是名声煊赫。

在OpenAI成立的2015年,Y Combinator带出来的公司总市值已经超过了650亿美元,比较有名的包括Airbnb、Dropbox,还有程序员朋友们比较熟的Docker。

而这家公司彼时的总裁,早年从斯坦福计算机科学专业辍学、在Y Combinator练就了一身运营融资本领的Sam Altman,在2019年正式成为了OpenAI的CEO,自此也把OpenAI带上了一段高歌猛进却又极富争议的旅程。

在这个转折点之前,OpenAI发展得四平八稳,但也有点过于稳了,相对于它的体量来说几近平庸。

OpenAI众星云集的投资人阵容,带来了10亿美元的资金支持,但回头翻看成果列表,会发现一件很让人纳闷的事。在这种貌似吃穿不愁的研究条件下,OpenAI前三年的成果不仅和后来的DALL·E、ChatGPT有明显的声量差距,和同期谷歌旗下的DeepMind(也就是AlphaGo的创造者)也没法比。2016年,AlphaGo击败顶级围棋选手李世石,在全世界范围掀起了AI热潮。

连我这么个还没走出大学校园的小老弟都感受到了冲击,把机器学习定成了研究生的方向,整个人生轨迹都受到了影响。可同一时间,同样是明星AI企业的OpenAI却名不见经传。

2018年前,OpenAI真正搞出来点知名度的,只是2017年下半年单挑打赢了刀塔顶级选手,而且仅限1v1中路父子局,两边还都只能选影魔这一种英雄,热闹了一阵就过去了。

16、17年的惨淡开局,主要原因就是前面说OpenAI给自己挖的这个大坑,也就是非营利这套模式。号称手握10亿美元,看起来吃穿不愁的OpenAI,还真就只是“看起来”。首先这10亿美元就是个虚数,2017年底李开复在给量子位的读者信里提到,这10亿美元只是个目标数字,并不是直接一整笔就打到账上了,所以说OpenAI的实际资金并没有看上去那么充裕。在这样的情况下还要搞非营利公司,那就是难上加难。

其实非营利并不是说不能赚钱,但它不以赚钱为目标,像OpenAI这种老实公司,还在章程里赫然写着“如果比不过别人就退出竞争,给对手帮忙”。翻译过来就是:“施主,为了世界和平,投给我的钱就随它去吧”,这就基本上给后续融资判了死刑了,而融资才是这类初创公司最重要的资金来源,更是士气的来源。

同样是AI初创企业,2014年被谷歌收购的DeepMind拿到了超过5亿美元,75名员工雨露均沾,而除了这种可遇不可求的机会,大公司的AI岗位砸起钱来也一点都不手软。17年初的美国,顶级AI研究员的薪酬能赶上橄榄球球星,一年500万美元往上,甚至达到千万级。而其中很大一部分是股票期权奖励,这就是OpenAI这种非营利公司给不出来的,它很难融资,股权也不值钱。

2016年三月,著名的对抗生成算法的提出者Ian Goodfellow加入了OpenAI,签约奖金加上首年九个月的工资是80万美元,这个金额不小,但对于这种级别的AI学者来说,可以说是全美最低。如果换个地方,乘个5甚至乘个10都不在话下,而其它的顶级学者来到OpenAI,也同样要面临收入骤降的问题。虽说有理想的人是可以不谈钱的,但是钱不够也同样会威胁到理想本身。

搞AI研究是很烧钱的,前面说的明星AI企业DeepMind,2016年亏损了1.54亿美元,2017年亏损了3.41亿美元,这还是扣掉了收入之后的亏损数字。2016年DeepMind已经在为谷歌和医疗卫生系统提供服务,获得了一些收入,所以实际的总开支还要更高。回到OpenAI这边,资金根本不在一个体量上。OpenAI作为非营利公司,每年要公开自己的财务信息。

同样是2016年,OpenAI的总支出是1100万美元,其中700万是员工薪酬开支,刨除场地和杂七杂八的费用,所有项目加起来经费不超过400万美元。再对比DeepMind,仅仅AlphaGo的训练这一项就得花掉差不多3500万美元。没米下锅,再怎么谈理想、也实现不出来,有理想的人可以接受钱少拿一些,但事情做不出来浪费生命,谁也受不了。

所以前两年OpenAI的很多位明星学者都是来了又走。

前面提到的Ian Goodfellow,从谷歌跳槽到OpenAI待了不到一年,就又回到了谷歌研究院。同样是在2017年,三位机器人领域的学者也离开OpenAI独立创业。最离谱的是连OpenAI的赞助人之一,Elon Musk先生,也出来添乱。

2017年6月,Andrej Karpathy,斯坦福大学李飞飞教授的博士生,在OpenAI工作了两年半之后被马斯克挖走,去特斯拉做AI负责人领导自动驾驶的研发。当然这是没法避免的,AI领域的顶尖人才就那么多,特斯拉大举投入AI研究之后,也挤进了和OpenAI相同的赛道。缺少融资渠道和股权激励的OpenAI这边研究进展缓慢,人才有意向出去寻找机会,Elon Musk自然就近水楼台先得月了。

不过这儿就出现了明显的利益冲突,OpenAI顶级人才出走,Elon Musk作为董事会成员肯定知道,不招舍不得,招了又会被骂是挖墙脚。

所以2018年2月,OpenAI宣布引入Gabe Newell等一众新赞助人的同时,也正式宣告了与Elon Musk和平分手。

紧接着,一个月之后,前面提到的OpenAI创始人之一,Y Combinator的总裁Sam Altman辞掉总裁之职,成为了OpenAI的首任CEO。在新领导人的带领下,OpenAI彻底改头换面,也迅速陷入了争议。其中的两大争议,一个是从非营利公司到“半营利”公司的转型,另一个,就是和微软勾肩搭背换来的100亿美元投资。

“钞能力”与ChatGPT的诞生

是的,你没有听错,这家在2016年所有研究项目加上运营经费不到四百万美元的小清新非营利公司,成了一家估值290亿美元的AI巨头。怎么回事?OpenAI的人设怎么突然就从普渡众生唐三藏换成了斗战胜佛孙悟空?这就还是要从OpenAI的新CEO Sam Altman说起。这位企业家从小吃素食长大,但在商业上他绝对不是吃素的。

前面说2015年OpenAI成立的时候,他担任总裁的Y Combinator培养出来的初创企业,总市值已经超过了650亿美元。到2018年他辞职那年,这些企业里最大的100家,加起来总市值已经超过了一千亿美元。Y Combinator孵化新公司的方式就是指导它们如何烧钱,首先最明显的一个变化就是,OpenAI搞研究出手变阔了。

2018年6月,OpenAI发布了关于刀塔2的新研究,这回也不缩手缩脚地1v1了,直接打5v5正式比赛,相应地就是研究成本的激增。AI的训练需要通过不断地对战来实现,而5v5 AI的训练难度明显比1v1高出一个数量级,为了加快速度,OpenAI在许多台服务器上同时运行5v5对局,对AI进行并行训练。具体来说,就是128000个CPU核心和256块GPU加速器。

在这样的设备规模上,一天就可以让AI累计相当于180年的游戏对局时间。到2019年4月,OpenAI的机器人以2比0的成绩正式击败了刀塔2顶级战队OG。不过跟后来的成果相比,这也只能算个小插曲,真正的大菜,还是OpenAI在语言模型方面的研究。

接下来就是今天最后一段的主角,大名鼎鼎的GPT。2018年6月,OpenAI发布了一篇关于通用语言模型的研究。

虽然全文都没有出现过GPT这个名词,但其实它就是GPT-1。这篇文章提出了一个叫作Generative Pre-training的概念,生成式预训练。和传统的以任务为导向的训练方法不一样,生成式预训练不需要人工标注。比如说你想训练一个可以做中英文翻译的AI,你就需要提前准备好大量的中英文对照的句子给AI去学习,如果你想训练一个AI聊天机器人,你就需要准备大量的一问一答对话,这些都需要人工制作。

生成式预训练的思想就不一样了,我直接拿着人类已有的现成的文字资料去训练AI。怎么训练呢?我让AI根据上文去续写下文。比如一句话,“张三每天都很认真地学习,老师们都夸他是好”, “好”字后面我让AI去写,如果AI写出来的是“学生”,这就和原文一样,那就判断正确了,要是不对,就继续训练它朝着对的方向去走。

这种训练方式的好处,就是研究人员不再需要花大量的资源去人工准备答案,每句话里下一个词就是上一段话的答案。理论上人类现有的所有文字资料都可以作为训练数据直接喂给AI去学习,这就远远大于现有的任何人工制作的数据集。这样就是在训练AI讲人话,让AI从浩如烟海的文本里去学习遣词造句这件事本身。

OpenAI的研究人员发现,这样训练出来的AI潜力极强。

你用中英文对照的数据集去进一步训练它,它就能做到比现有任何的翻译AI都更准确。你用问答对话数据集让它进一步学习,它就能成长为聊天AI里的顶级选手。而提高它的能力所需要的,就是“钞能力”。因为这个预训练过程不需要人工编写答案,所以人类现有的所有文字信息,小说、典籍、歌词、论坛里的回帖,甚至是软件代码,只要硬盘装得下,都可以喂给AI模型去学习。

不断地增大神经网络模型的参数量,不断地增加训练数据里的文本量,预训练模型的能力就会继续增长,用标注好的数据引导它去做各类具体任务的水平也会相应提升。这种生成式预训练,与一种叫做变形器Transformer的模型结构相结合,就成了Generative Pre-trained Transformer,取三个字母缩写,就是GPT。

此后2019年的GPT-2、2020年的GPT-3,核心迭代思路都是利用“钞能力”扩大模型规模,GPT-2的参数总量是15亿,GPT-3更是提高到了惊人的1750亿。而截至今天,这条“钞能力”路线依然没有摸到天花板,还在往下继续。由此衍生出的作画AI DALL·E、聊天机器人ChatGPT,让OpenAI真正成了全球闻名的明星AI企业。

可是这个“钞能力”是怎么说来就来的呢?

这就又要说回Elon Musk出局之后、OpenAI的首任CEO Sam Altman。虽说在Y Combinator带出来了一千亿美元的生意,但Sam Altman培养的主要都是硅谷的科技企业。他从斯坦福辍学之前,学的也是计算机科学,与其说是个生意人,更像是技术人。他在OpenAI拉起来的这条“钞能力”路线,起点也是一篇学术研究。

新CEO上任两个个月之后、GPT这篇研究成果发布一个月之前,2018年5月,OpenAI发布了一项关于AI算力需求的研究,结论是:接下来AI方面的算力需求会爆炸式增长,而且速度比摩尔定律快得多,3.4个月就会翻一倍。所以公司亟需提升“钞能力”。理论基础奠定之后,Sam Altman就开始了技术操作。

微软入局与ChatGPT的崛起

2019年3月,OpenAI成立了一家叫做OpenAI LP的有限合伙公司,受原来的非营利的OpenAI的董事会控制。新加入的投资方要签署协议,同意把OpenAI的章程放在首位,同意原来那个非营利的OpenAI董事会拥有OpenAI LP的决策权。但争议也随之而来,人们质疑大公司投资OpenAI LP之后,还是有很多办法可以吃掉大块利益、甚至直接独享研究成果。质疑很快就有了更坚实的证据。

OpenAI LP成立刚刚三个月,微软来了。从2016年起,微软就是OpenAI模型训练的云服务供应商,自然对OpenAI的研究实力和技术动向心知肚明。OpenAI LP成立之后,微软几乎是第一时间就投了10亿美元,当然其中有一部分是Azure云服务器的代金券。印度人还挺会算账的,投出去的钱还能再流回来。如果纯看接下来OpenAI的研究进展和项目转化,双方的合作绝对是有积极意义的。

OpenAI获得了“钞能力”,GPT-2、GPT-3快速迭代升级,然后在微软云服务能力的支撑下,这些实验室里的强大模型又迅速落地、转化成了人人都能用上的应用服务,快速破圈。比如GPT-3衍生出的作画AI DALL·E和DALL·E 2。不过如果和22年底爆炸式发展的ChatGPT相比,前面这些都是小巫见大巫。

ChatGPT是基于GPT-3.5,模型尺寸和GPT-3相比没有变化,但专门针对对话进行了加强、减少了不恰当回复,产生了魔法一样的效果。人类历史上从来没有出现过增长速度这么快的应用产品。达到一百万用户,推特用了两年,Facebook花了十个月,ChatGPT只用了五天。两个个月之后,ChatGPT在全球收获了一亿用户,而当年同样算得上是爆火的Tik Tok,花了九个月才达到这个里程碑。

来自各行各业的人和它聊天,用它写邮件、翻译文章,甚至是写代码、给代码查错。在这种全球性的热潮、前所未有的增长中,ChatGPT这种推导运算量不算小的AI竟然能维持相对实时的回复速度,是非常不可思议的。

微软算是结结实实地给自己的Azure云服务打了一波广告,再加上Azure近水楼台独占的Azure OpenAI Service,接下来Azure肯定会收获一大批新用户。

同时ChatGPT本身更隐含着对谷歌搜索服务的正面冲击,2月7日微软宣布ChatGPT接入Bing后,谷歌股价累计已经暴跌20%。据专家预计,微软将抢占大量搜索引擎市场份额。实际上除去这些未来的隐性收益,微软从OpenAI获得的直接收入也已经相当可观。GitHub Copilot对学生和开源项目的维护人提供免费服务,但其他普通开发者订阅要付费,按月付是每月10美元,按年付是每年100美元。

除此之外,图片生成AI DALL·E 2、被微软集成进了必应Image Creator和设计软件Microsoft Designer,未来也都会产生直接收入。至于爆火的ChatGPT,也被微软集成进了协作软件Teams月费10美元的高级会员服务,可以快速生成会议总结、自动划分任务。

同时ChatGPT本身也推出了月费20美元的ChatGPT Plus,可以优先连接服务器、优先获得回复、优先使用新特性。作为OpenAI LP的投资人,这部分收益,微软也同样可以分一杯羹。从这一点又一个营收点上来看,微软接下来的100亿美元投资也一点都不亏,但这也让前面提到的的质疑更加有理有据。

对OpenAI资本化的质疑与展望

OpenAI成立之初的目标,是确保强人工智能为全人类服务,因为一旦这种强大的智能体被任何个人或组织独占,就必然会导致贫富极化、社会动荡、最终导致灾难性后果。最初的OpenAI就是想通过非营利的模式,在紧跟研究前沿的同时,把研究成果向全社会公开,确保强人工智能这项技术不被任何一方所垄断,这也是它名字里的Open的含义。可现在强人工智能还远在天边,但GPT的收益却已经源源不断地流进了微软一家的口袋里。

从GPT-2开始,OpenAI在模型公开上明显放缓了脚步,从一次性公开、变成了按参数数量从小到大分阶段公开,OpenAI给出的理由是担心安全性问题。而到了GPT-3,模型干脆不公开发布了。OpenAI只提供一个付费API接入,想使用的话就把输入发给OpenAI,内部运算完再把结果返回来,至于里面的具体模型,无可奉告。这次OpenAI给了三个理由:第一条直接开诚布公地说需要通过商业产品赚钱。

第二条因为模型太大,即使公开了、普通开发者运行GPT-3的性价比也很低。第三条基于安全性上的考虑,API的形式可以更好地控制滥用问题。这三条理由,前两条不拐弯抹角的态度还是值得肯定的,先让大家听得明明白白,才有获得理解和认同的可能。而第三条的安全问题才是核心,也和GPT-2一脉相承。

实事求是地讲,OpenAI对安全性的顾虑并不为过,现在已经有大量证据表明互联网上存在着相当比例的机器人。

我们看的文章,读的评论,刷到的消息,甚至那些以“小花”、“大壮”为主角的电影解说,还有语音听起来并不自然的很多短视频,都是由AI批量生产的内容。这个比例到底有多大无人知晓。甚至有一种比较极端的理论认为网上机器人的比例早就超过真实人类,互联网已经死掉了。实际用过ChatGPT的朋友可以想象,假如成百万上千万的虚假账号、集体发送这种完全能以假乱真的社交内容,那会是多么恐怖的一个水军阵容。

如果这么多账号同时以千百种角度论证太阳是围着地球转的,而且互相点赞评论应和,热搜上全是支持的声音,那么再坚定的知识分子,多少也会犹豫一下。那如果不是这么非黑即白的基础客观知识呢?如果是谁声音大谁就有理的公共议题讨论呢?所以OpenAI的顾虑是很有道理的。

从实际结果来看,OpenAI把研究成果商业化,并且把大部分利益输送给了微软一家巨头。

虽然还算不上是正式违反了OpenAI自己订下的章程,但至少可以说实践中已经出现了不和谐的因素。不过目前来看,OpenAI依然举着章程,在商业与公益这条钢丝绳上竭力维持着平衡,三代GPT模型都发表了公开论文,ChatGPT、Copilot这些商业化了的服务,也依然在提供免费版本。我们今天讲了这么长的一段故事,有一件事是不言自明的。如果OpenAI不去沾染商业,那确实够纯粹,但理想也不可能有了。

如果没有微软的10亿、和接下来的100亿,那也就不会有风靡全球的ChatGPT和未来的GPT-4。所以我的结论还是,有OpenAI这样一家公司,终归是比没有好。虽然它的形象越来越不像最初那么完美,但它现在确实是那个带球冲到最前面的守门员,而且至少到目前为止,它依然在为“AI应该服务于全人类”的理想而努力。在一项既需要金钱又需要良心的事业上,能做到现在这一步,已经是一件很了不起的事了。

无论人类追求强人工智能的结局是什么,有这么一家公司曾经做过现在这些事,人类至少可以说、我们曾经努力过。

UUID: 278d2fa3-a363-4d9a-a675-5bda6e64e9c8

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/环球科学公众号-pdf2txt/2023/环球科学_2023-02-23「转」_被投资10亿美元却濒临倒闭,ChatGPT绝境翻盘的秘籍:放弃理想,认真卖身.txt

是否为广告: 否

处理费用: 0.0209 元