淘优惠

淘优惠

火鸡追上雄鹰,OpenAI 的成功为何难以复制丨TECH TUESDAY|阿尔特曼|Stripe|布罗克曼

热门文章 0
火鸡飞走了,火鸡和老鹰打架视频,火鸡 飞,火鸡袭击人

  

  

OpenAI 的成功不仅属于一家公司,也属于一个生态;这个生态对一个离奇点子的包容,让灵活商业探索成为可能。

  文丨贺乾明

  编辑丨黄俊杰

  2011 年 2 月,微软和诺基亚宣布全面合作,合力挑战 Android 系统。Google 高级副总裁维克・冈多特拉(Vic Gundotra)在社交媒体上评论这件事:“两只火鸡加一起,也变不成一只鹰。”

  冈多特拉自然是说对了,微软和诺基亚没几年就败走手机市场。弱弱联手挑战强者,一般都是这样的结局。

  ChatGPT 大热后,它的缔造者 OpenAI 被贴上 “PayPal 黑帮”“乌托邦式创业” 之类的标签。但在 2015 年,这个团队成立之初看起来也是一个妄图挑战雄鹰的 “火鸡大联盟”。

  OpenAI 的第一批投资者虽然都是硅谷响亮的名字:埃隆・马斯克(Elon Musk)、彼得・蒂尔(Peter Thiel)、山姆・阿尔特曼(Sam Altman)、里德・霍夫曼(Reid Hoffman)、杰西卡・利文斯顿(Jessica Livingston),但他们所执掌的公司和机构都不是各自领域里最专精于人工智能的那些。

  海量数据和顶级人工智能科学家一般被认为是发展人工智能的必备资源。而美国最有资源的正是四大科技巨头――Google(手机、地图、搜索、邮件)、Facebook(社交)、苹果(手机)、亚马逊(购物)。这四家公司都在几年内达到万亿美元市值,并将人工智能用在自己的产品上。它们当中,只有亚马逊参与了 OpenAI,但只是捐了一些云计算资源。

  霍夫曼掌管的 LinkedIn 在数据量层面无法和 Facebook 相提并论。阿尔特曼 接手的 Y-Combinator 虽然有名,但孵化的公司最大的也只是 Airbnb。特斯拉是其中唯一一家人工智能巨头,今天有上百万辆车每天在全世界搜集数据――但在 2015 年,它只是一个年产 5 万辆,前途未卜的创业公司。三年后,特斯拉销量激增、加大人工智能研究投入,马斯克便退出 OpenAI 董事会,说双方有 “利益冲突”。

  就是这样一个开局,七年后的 OpenAI 成为全球最受关注的人工智能公司,让 Google、Facebook 等科技巨头措手不及。

  创办 OpenAI 之前,阿尔特曼在斯坦福大学的课堂提出了公式:创业成功=想法 * 产品 * 执行 * 团队 * 运气。

  OpenAI,他唯一成功的创业项目,完美证明了这个公式。

  共同的恐惧,帮 OpenAI 招揽到一批顶级 AI 科学家

  OpenAI 故事的起点是 2015 年 7 月在加州门罗帕克的一场晚宴。召集者是刚接任硅谷著名孵化器 Y Combinator 总裁一年多的阿尔特曼。晚宴出席者们相识已久,不少在创业时代有过交集。他们还都熟悉瑞典哲学家尼克・博斯特伦(Nick Bostrom)的观点,都对人工智能的未来充满恐惧。

  那时,AlphaGo 还不是全球围棋冠军,但计算机识别人脸的准确度已超过人眼,Google 的自动驾驶汽车也早在路上行驶多年,数千万人使唤苹果、亚马逊的语音助手。机器越来越聪明,虽然还不到人的水平。

  但根据博斯特伦 2014 年出版的《超级智能》(Super Intelligence):以计算机发展规律,如果人工智能的聪明程度达到接近人类,它的智力用不了多久就会远远甩开人类――差距就像人类与老鼠那样大,但这一次,人类扮演老鼠的角色。

  马斯克和阿尔特曼多次公开引用这个观点,认为人类必须提前做好准备。阿尔特曼和马斯克没想着限制它,而是想积极推动开发造福全人类的人工智能,让每个人都用上,去对抗坏的人工智能。正是这个宏大的愿景帮他们聚拢了顶级人才。

  晚宴上,负责 Google Brain 项目的人工智能科学家伊尔亚?苏茨克维(Ilya Sutskever)当场表示有意加入。他在 2012 年参与提出 AlexNet 模型,证实了深度学习潜力。这被认为今天新一轮人工智能浪潮,包括无人驾驶技术的起点。

  另一位加入的技术天才是今天的 OpenAI 董事长、CTO 格雷格・布罗克曼 (Greg Brockman)。布罗克曼是硅谷新兴独角兽 Stripe 的第 4 位成员,任首席技术官,推动 Stripe 的估值涨到 35 亿美元,并重新塑造了美国电商的支付体验。如果他继续陪着 Stripe 长大,可以在接下来七年获得数亿美元回报――现在 Stripe 的估值已经涨到 630 亿美元。但在当时,布罗克曼认为,投身人工智能研究更重要。

  

  左侧是格雷格・布罗克曼,右侧是伊尔亚?苏茨克维。来自布罗克曼的博客。

  晚宴结束后,布罗克曼就开始四处挖人组建团队。他找的第一个人是约书亚・本吉奥 (Yoshua Bengio)。2019 年,因为对深度学习的贡献,本吉奥和杰弗里・辛顿(Geoff Hinton)、杨立昆 (Yann LeCun) 一起获得图灵奖,唯独他不在为大公司效力。

  本吉奥给布罗克曼列了深度学习领域最好的研究人员名单。接下来的几周,布罗克曼挨个联系名单上的人,尽管没有 Google 、Facebook 等公司的天价薪水,他还是靠着宏大的愿景说动了其中 9 位加入。

  2015 年底,世界顶级的人工智能学术会议 NeurIPS(当时还叫 NIPS)举办期间,OpenAI 带着 10 亿美元的投资承诺宣告成立,目标是开发 “通用人工智能” 技术,专利和研究成果全部开放。

  人们惊讶于 OpenAI 的愿景,但没多少人对这个缺少数据的联盟有信心。那一年担任 NeurIPS 大会主席的计算机科学家尼尔 ・ 劳伦斯(Neil Lawrence)说,OpenAI 的愿景令人钦佩,但 “没有数据共享,OpenAI 将无法造福人类”。

  沿着 Google 打下的基础,找到可行的技术方向

  2016 年,主流的人工智能技术路线是 “监督式的深度学习”,需要用精心标注的数据教会计算机自动完成任务。比如你想让计算机识别照片中的猫,你需要用上万张有猫的照片训练模型,而且要人去标清楚每张图片中什么是猫,然后计算机才能在新的照片里认出这种毛绒绒的动物。如果之后要识别狗,还得再来一次。

  但 OpenAI 没有大规模的数据,也没足够多的钱雇佣人手去标注数据。它选的技术路线是 “非监督的强化学习”。强化学习是指让机器不断试错学习如何做某件事。非监督代表着让机器自己学,不要人引导它。这是 DeepMind 重点研究的技术,他们用它做出了 AlphaGO。

  曾在 OpenAI 负责技术路线图的人工智能科学家达里奥・阿莫代 (Dario Amodei) 评价说,OpenAI 早期开展研究的方式类似风险投资,在一个领域设定 “投资组合”,不同的团队往不同的方向下注,最终选出最有可能做出通用人工智能的项目。

  OpenAI 早期选了三个方向:一是做机器人,他们认为 “机器智力的发展需要物理实体”,于是开发出了可以单手玩魔方机器手系统 Dactyl;另一个是最游戏人工智能,借助打游戏提升机器智力水平,一开始在雅达利复古游戏中实验,后来做了打 Dota 的人工智能;第三个是开发语言模型,让人工智能用文本语言学习理解世界,也就是 GPT 系列。

  前三年,OpenAI 的研究成果没什么特别的。“我们所做的一切都只是简单的想法,但正确吗?我们还没有搞清楚,有点茫然”,OpenAI 联合创始人布罗克曼 2018 年接受采访说。这时 Google 已经遥遥领先,它的语音机器人在发布会上伪装成人打电话给餐厅预订位置――这很快引发了商业公司滥用人工智能的讨论。

  OpenAI 的转折时刻是 2019 年 2 月 14 日发布 GPT-2 模型,主要功能是根据用户输入的内容,生成续写文本。比如输入《指环王》中的句子,它会在几次尝试当中的某一次,生成让人无法分辨真假、剧情和原著不同,但看上去符合逻辑的续文。

  GPT-2 是一个主要用 800 万篇 Reddit 论坛帖子、总计 40GB 文本训练出来的语言模型,从数据中提炼出来的规律和特征――也就是参数有 15 亿,是上一代语言模型 GPT 的十倍。

  阿尔特曼当时参加一档播客录制时说:“自然语言模型变得越来越好,是人工智能领域最令人兴奋的发展之一。” 一向言简意赅的他,把这句话说了两遍。

  大型语言模型也是许多大公司投入的方向。Google 发布了 BERT 系列模型,在阅读理解、对话等多个文本任务的表现超过人类,并刷新世界纪录。微软在 2020 年初训练出 Turing-NLG 的大模型,有 170 亿参数,是当时最大的模型。

  不过在大公司,训练大语言模型只是人工智能研究院的一个项目。而在 OpenAI,这是优先级最高的事项,研究员投入 30 多位,它招揽的顶级科学家几乎都参与其中。

  除了之前训练 GPT-2 时用到的 Reddit 上的数据(后来大幅扩充),OpenAI 的科学家还把此前 12 年从 6000 万个域名中收集的新闻报道、帖子、书籍全文以及各种网页等数千亿个单词的英文资料喂进模型,英文维基百科全部只占数据量的 3%,然后消耗数千万美元的计算资源开发出了 GPT-3。

  GPT-3 的参数是 Turing-NLG 的 10 倍,不需要针对训练就能写诗歌 / 报道、回答问题、编写代码,大多数情况下结果让人难辨真假。《纽约时报》随后发布的一篇专栏文章称,GPT-3 写散文、诗歌、代码的能力 “令人惊奇”“令人羞愧” 又 “令人毛骨悚然”。

  但这类大语言模型仍然存在一些问题,当时调用一次就需要消耗不少资源,等待几分钟甚至十几分钟才能出一个结果,想要在商业中应用基本不可能。

  GPT-3 发布后,OpenAI 朝着两个方向继续前进,一是开发 GPT-4,大概率会在今年发布。另一个是从 GPT-3 拆出参数更少、聚焦特定任务的模型,用更新的数据训练它,配合人类反馈数据强化能力,降低成本、提高能力,使其在商业应用上可行。

  ChatGPT 就是 GPT-3 大幅度强化对话能力、并用数十万人类反馈数据训练后的结果,它的基础模型被命名为 GPT-3.5。据报道,ChatGPT 是 OpenAI 在 2022 年 11 月中旬临时开发出来的,只用了 13 天时间。起因是 OpenAI 的高管担心对手先发布同类产品 “抢它风头”。结果超出预期,ChatGPT 在全球掀起风暴。

  在 Meta(Facebook 母公司)首席人工智能科学家、图灵奖得主杨立昆看来,ChatGPT“不特别具有创新性”“没有什么革命性”。

  ChatGPT 和它的基础大模型 GPT-3 的确建立在多年技术积累上,不少都出自 Google。它最核心的技术是 Google 在 2017 年提出的 Transformer 模型架构,让大规模并行处理海量数据成为可能。

  因为 ChatGPT 而备受关注的 “人类反馈强化学习”(RLHF)训练方式,也是出自 DeepMind,它能让模型从人类对机器不同的结果反馈(赞扬或批评)中,不断学习、改进输出结果。

  就像 iPhone 发布前,多点触控的技术也已诞生多年,历史上任何一个产生巨大影响力的产品出现前,它背后技术要素大都齐全。

  相比在单个方向上实现技术从 0 到 1 的拓荒创新,OpenAI 做到的不只是把各种技术融在一起,还在持续的反馈中迭代 5 年,找到一个适合给大众使用的产品形态。

  对 OpenAI 来说,2018 年以来一直坚持训练大语言模型,还需要勇气。GPT-2 发布前,OpenAI 钱已经不太够用了。根据 OpenAI 提交给美国国税局的文件,2017 年它光花在云计算上的钱都有 790 万美元。布罗克曼等人测算,训练大模型消耗的计算量,每 3、4 个月会翻一倍。这个趋势得到了验证。据多位业内人士估算,OpenAI 训练 GPT-3 一年,仅算力成本就有 2000 万美元。

  而那时,OpenAI 的投资人在 2015 年底承诺的超 10 亿美元资金,只到账了一小部分。

  与微软结盟,巧妙的利益平衡

  布罗克曼等人推动 OpenAI 完成从 0 到 1 的发展过程。之后 OpenAI 从花费巨额费用支持 GPT-3 上线到 ChatGPT 震动世界,主要靠阿尔特曼。

  阿尔特曼去年初在社交媒体上发的一个帖子,恰如其分地体现了他的世界观:“我非常感兴趣的一种大学替代方案是:找出全球最聪明、最有进取心的 18 岁年轻人,给他们 10 年以上的薪水和资源,让他们做自己想做的任何项目,配上聪明的同龄人――换他们未来收入里的几个百分点。”

  这差不多就是他曾在 YC 做的事:选拔聪明、渴望成功的年轻人,为他们提供培训,帮他们成功――用一小笔钱(1.2 万美元)换走创业项目 7% 股份。硅谷创业教父保罗・格雷厄姆(Paul Graham)创办 YC 后,孵化出了 Airbnb、Stripe、Cruise、Dropbox 等超级独角兽,今天这些公司的总价值已有数千亿美元,超过阿里巴巴或者腾讯。

  2014 年,格雷厄姆把 YC 交给阿尔特曼时,阿尔特曼除了早年有一次不太成功的创业,职业经历主要在 YC 孵化器当导师、提供融资建议。但 YC 和大部分投资机构不同,它的合伙人不雇投资经理,坚持自己理解技术。投资核聚变项目,也是阿尔特曼自己做的功课。

  阿尔特曼是阿伦・索金(Aaron Sorkin)电影里典型的聪明人形象,语速很快、回答简练。他有比师傅更大的野心、更激进的时间表。2015 年,阿尔特曼被问及 YC 在五年后会怎样,他回答 “一年投资一千家公司”。这个数字是他接手前,YC 十年孵化的公司总数。

  

  山姆・阿尔特曼,来自 YC。

  不过他没有待到那个时候。2019 年初,阿尔特曼辞去 YC 总裁的职务,接管 OpenAI。他在 OpenAI 做的第一件事,就是组建盈利公司 OpenAI LP,然后自己担任首席执行官(CEO),找融资。

  “最引人注目的人工智能系统,除了需要算法创新,还消耗最多的计算资源,”OpenAI 同期发布的一篇博文中写道,“接下来几年,我们要投资数十亿美元采购云计算资源,吸引并留住有才能的人。”

  当时硅谷有这等资源的公司基本都在投资自己的人工智能技术。阿尔特曼多次飞去西雅图,为微软 CEO 萨蒂亚・纳德拉(Satya Nadella)现场展示 OpenAI 的模型。

  微软早年为了 Windows 全力打击竞争对手,是硅谷创新者们眼中的 “恶人”。但纳德拉接手微软后不再追逐操作系统的占有率,改去资本市场讲云计算的故事。双方有了合作空间。

  2019 年 7 月,经过一个多月的谈判后,OpenAI 拿到微软的 10 亿美元投资,双方的利益也达成了微妙的平衡。

  对纳德拉来说,投资 OpenAI 是一笔划算的生意。签约后,微软成了 OpenAI 的唯一云计算供应商――


王慧文 2 亿美金撬动中国版 OpenAI 的计划,有退路吗?


出品|虎嗅科技组

作者|齐健

编辑|陈伊凡

头图|FlagStudio 生成

二级市场刚冷静了一点,ChatGPT 的风暴又开始席卷创投圈了。

2 月 10 日晚,原美团联合创始人王慧文的一条朋友圈在网络上热传,这条朋友圈的截图显示王慧文提出的 " 人工智能宣言 " 如下:5000 万美元,带资入组,不在意岗位、薪资和 title,求组队。

网传原美团联合创始人王慧文的朋友圈截图

两天后,王慧文本人在社交平台 " 即刻 " 上正式发文宣布,虽然目前还处在学习 AI 的阶段,但计划出资 5 千万美元,设立北京光年之外科技有限公司,打造中国的 OpenAI。王慧文在博文中称,目前公司估值 2 亿美元,下轮融资已有顶级 VC 认购 2.3 亿美金。

" 一石激起千层浪 ",王慧文发布 "AI 英雄榜 " 后,2 月 14 日,真格基金官方微信也发布了一则 "AI 英雄帖 ",称正在寻找有能力引领新一代创业公司的创始人。

源码资本创始合伙人曹毅在朋友圈也表示,行业也等到了老王出山。

而对于王慧文的这次 AI 创业,坊间议论最多的莫过于 2 亿多美金要撬动中国版 OpenAI 这么大的项目,可行吗?有哪些坑?又有哪些可能的商业化方向?

ChatGPT 是怎么做出来的?

要做中国版的 OpenAI,或许先要了解,OpenAI 是怎么来的?它的 " 头牌 "ChatGPT 又是如何做出来的。

从现在来看,通用大模型的研究是一个烧钱的游戏,2 亿美金可能不太够。OpenAI 成立于 2015 年,从可以查到的融资纪录看,2016 年 -2022 年,OpenAI 的融资额可能超过 30 亿美元。

与多数创业公司一样,OpenAI 在这些年中不太赚钱。甚至一开始完全是以非盈利机构的身份在开展 AI 研究。不赚钱的同时,OpenAI 在研发方面还持续烧钱。有统计显示,GPT-3 的一次模型训练费用可能超过百万美元,上线之后的 ChatGPT 每天回答问题的成本也是百万美元规模。

从研发的资金上来看,要在短时间内,用有限的资金复制 OpenAI 的成功恐怕并不容易。事实上,即便是资金量够大,AI 大模型也不是说做就能做的。" 这玩意儿不是屯点钱然后花点时间就能干成的。" 一位 AI 行业专家如是说。

通用大模型的研究需要海量数据和技术创新的积累。要做一款像 ChatGPT 一样红到爆炸的产品,起码要分四步。

第一步,数据收集,通过爬取互联网上的大量语料数据来训练模型,语料数据包括了文本、对话和问答数据等。

第二步则是模型设计和数据预处理,OpenAI 选择了 Transformer 模型作为 ChatGPT 的模型结构,并对其进行了许多改进,以提高模型的语言生成能力。对语料数据进行预处理,包括语料的清洗、分词和标注等步骤。

再之后是模型训练和模型评估,使用大量的计算资源和高性能的训练算法,对模型进行训练,使其能够生成高质量的语言文本。对模型的语言生成效果进行评估,并不断对模型进行调整和优化,以保证生成的语言文本具有足够的质量。

最后则是模型部署,将训练完成的模型部署到生产环境,供用户使用。

"如果你手里掌握着几十篇大模型领域顶会论文的技术积累,能够接受 5 年,甚至更长的时间,没有盈利,并耐心完成几百次 AI 试验。同时,有微软的 Azure 这样实力雄厚的公司提供几乎免费的云服务。" 一位 AI 大模型专家向虎嗅表示,"(如果是这样的话)要做出 ChatGPT,或者成为 OpenAI 其实并不难。"

从头做 AI 大模型道阻且长,需要耐心和长期投入。那么在资金量有限的情况下,能否先做一些能够较为快速实现商业化的产品?

不做中国 OpenAI,AI 领域创业还有几条路

如果不做 OpenAI 的话,笔者认为,以王慧文现有的资金量,5000 万美元的起步资金和未来 2.3 亿美元的投资,在 AI 领域做出点事儿来,可能另外有几条路径可以尝试。

最简单的方法就是投资已有的大模型公司。不过,在技术和模型训练方面的积累是这类公司的核心。目前,不论国内还是国外,在通用大模型研究方面技术实力较强的公司多数是隶属于互联网巨头的 AI 部门或研究实验室。在这方面,优秀的初创公司不多,处于投融资早期的好标的更是凤毛麟角。

以 5000 万美元的资金量,其实可以尝试找一找在 " 文本生成模型、方法及装置 " 技术方面专利较多的,或是在 Transformer 大模型研究方面论文较多的 AI 公司,参与他们的中后期融资。不过,要做早期投资或是自己创业的话,这种方式应该是不在考虑范围内。

第二条路就是基于 ChatGPT 类的大模型产品做上层应用,目前这种模式可以说是通用大模型或是类 ChatGPT 产品方向比较靠谱的创业路径了。毕竟在美国,已经有一些通用大模型的 SaaS 服务商,跑出了成功的商业落地模式。

成立于 2020 年的 AI 独角兽 Jasper 的业务,就是通过调用 OpenAI 的 GPT-3 模型为用户提供文生文写作服务。虽然 Jasper 成立时间不长,但估值已达 15 亿美元。

在 API 调用方面,OpenAI 最近也被爆出可能会增强这项业务,给调用 API 的用户提供更多优化和拓展空间。近期 CNBC 曾报道称,有知情人士透露,OpenAI 可能在未来针对 ChatGPT 推出类似 SDK 的服务,可以让用户自己开发基于大模型的聊天机器人,用户可以根据需要引用特定来源的信息,以改进自己的聊天机器人。

OpenAI 的官方公告中曾提到 " 正在积极探索低成本计划、业务计划和数据包的选项,以提高可用性。"

通用大模型正在逐步形成 PaaS 形式的平台能力,基于平台的 SaaS 服务,自然是一条很好的创业路径。不过目前,这条路最大的问题是,在通用大模型领域可以提供体验良好,且商业化成熟的 API 服务公司太少,且多为美国公司。而 AI 领域涉及大量创新科技和敏感数据,AI 技术方面的跨国商务合作难免会收到数据安全,技术出口等方面的限制。

不过,国内公司在这方面也一直没有落后,目前北京智源人工智能研究院的悟道大模型、百度文心大模型等在 API 服务方面均已开展了相关的实验和探索工作。

最后,还有一条比较着眼未来的路径,那就是做大模型应用的外延拓展

"ChatGPT 最好的应用场景肯定不会局限在搜索引擎,而是更个性化的智能语音助手。" 一位 NLP(自然语言识别)研发工程师告诉虎嗅,不管是 Bing 还是谷歌,在搜索领域的 AI 探索应该都处在试水阶段。而基于大模型和自然语音、语意理解的语音助手肯定是未来的大方向。

目前,亚马逊的人工智能助手 Alexa 就正在引入基于 Transformer 的大规模多语言模型 AlexaTM(Alexa Teacher Models)。百度即将推出的 " 文心一言 " 则计划与小度深度整合,打造针对智能设备场景的人工智能模型「小度灵机」。

除了生活需求,基于通用大模型的 AI 语音助手,更加适合做成专业领域的智能助理,比如给制造业、工程建设行业提供技术支持,或是在医疗专业知识方面,给医生提供参考建议。

一位工业领域专家给虎嗅举了这样一个例子:你想在家里挂一幅壁画,需要在墙上打个钉子。当施工工人拿着冲击钻,准备打眼儿的时候,他需要了解面前这堵墙的一些信息,例如墙里是否预埋了电路?是否有水管?要打眼的位置有没有钢筋?

这些信息要如何得知?要么问记得管线位置的主人,要么问装修的工长,要么看装修的图纸。这时,如果前面的三个选项都不可用,那么有一个对你家里信息了如指掌的智能 AI,提供这种信息查询服务,不就大幅简化这个过程了吗?

虽然现在市面上不乏各种类型的语音助手,且它们已经能给人类提供很多帮助了,但多数此类产品只能理解预设的问题,回答预设的答案,很难提供通用性的帮助。

"ChatGPT 还真是挺神奇的,什么都知道。" 一位航空领域的技术专家对虎嗅表示,他曾尝试向 ChatGPT 询问了一些航空领域的技术问题,比如:基于点云重构曲面的方法,飞机隐身特性和外形参数的关系。都没能难倒 ChatGPT,且得到的回答非常专业。

ChatGPT 虽然知道的多,但是要真用它给专业技术领域提供支持还有个很大的问题,就是准确性。很多人在与 ChatGPT 对话过程中都遇到过 "AI 编造事实 " 的现象,中文互联网上流传比较广泛的例子包括 " 林黛玉倒拔垂杨柳 "" 贾宝玉最应该与贾母在一起 " 等,在专业领域的应用很难容忍这种错误。

因此,类似 ChatGPT 的产品要想应用在专业领域,还需要解决稳定性和可靠性的问题,在优化 AI、增强 AI 准确性方面或许可以给新的 AI 创业公司提供方向。

给通用大模型,或是类 ChatGPT 产品提供适合 AI 训练的高质量行业知识库,以及持续的知识更新服务,或许会成为未来的一项 AI 行业服务。在强化学习、自监督学习和行业数据包(知识库)等方面做技术升级,帮助大模型公司对 AI 进行强化学习训练,从而提高 ChatGPT 的准确性和可靠性。

顺着这个方向再向下延展,在自动驾驶,生物制药等领域也有很多基于通用大模型的创新机会。目前,百度文心、毫末智行、小鹏等国内公司已经开始在自动驾驶研究方面引入大模型技术,其中包括通过图文弱监督预训练模型,利用大模型数千种物体识别能力,扩充自动驾驶语义识别数据。以及利用 ChatGPT 的 " 人类反馈强化学习(RLHF)" 技术改进自动驾驶决策等。

写在最后

AI 创业,尤其是大模型创业,从现在开始干,或许已经有些晚了。

从资本市场角度看,中国二级市场注意到 ChatGPT 的速度已经比一级市场和整个 AI 圈子晚了 2 个月。

如果技术方面看,OpenAI 在 2015 年成立,谷歌在 2017 年发布 Transformer,2018 年 OpenAI 推出了 GPT 的第一个版本,2022 年底,现在的 ChatGPT 才第一次上线。即使一家公司已经具备了 OpenAI 在 2020 年推出的大模型 GPT-3 的水平,现在开始也要 3 年的时间才能追上 ChatGPT。

目前 OpenAI 的估值达 290 亿美元,2019 年微软就对 OpenAI 投资了 10 亿美元,并为之提供了大量基于 Azure 的云服务支持。

而在今天,对于没有微软这样一棵大树可以依靠的初创公司来说,最好的情况或许是,用 2.3 亿美元给 " 中国的 OpenAI" 打开一个起步的局面,不过这个起步积累的阶段,可能会非常长。

在 ChatGPT 之前,中国整体的 AI 创业并聚焦到大模型研究方面。多数公司都是在做实际场景落地的小模型,而大模型似乎更需要在沉寂中爆发,需要技术积累到一定程度的涌现。虎嗅接触过的国内的大模型初创公司的创始人都有一个共性的特点,他们普遍倾向于在技术实现了重大突破,或是找到典型应用场景之后再去讲技术,讲产品。

" 大模型研究需要耐得住寂寞,厚积薄发。" 一位 AI 公司创始人告诉虎嗅。


王慧文OpenAI梦,是拿5000万美元扯淡?

王慧文退出真实,王慧文ab面,王慧文是谁,王慧文去哪了

雷达财经出品 文|莫恩盟 编|深海

ChatGPT的火爆持续升温,不仅让寒气侵袭的国内互联网行业迎来了久违的狂欢,就连曾和王兴在美团并肩作战但于2020年宣布退休的王慧文都按耐不住被其吸引。

近日,原美团联合创始人王慧文接连在社交媒体上发布多条动态,宣布其将要进军AI 领域,并出资5000万美元(约合人民币3.4亿元)成立公司、广招英雄,以此打造中国的OpenAI。

事实上,此番王慧文发布“AI英雄榜”,之所以能获得外界如此高的关注,并获得知名VC的下注,与其过往的光鲜履历不无关系。雷达财经了解到,王慧文此前曾带领美团打赢多场商场上的战役,其在美团的地位仅次于王兴,王兴和王慧文两人还一度被外界称为美团的“二王”。

值得一提的是,虽然王慧文已从美团前台退休,但其目前仍是美团的执行董事。与此同时,王慧文和王兴目前还一同担任北京嘟嘟同舟科技合伙企业(有限合伙)的合伙人,且二人均为该公司的最终受益人。

不过,王慧文能否打赢这场AI战役,目前已出现多种不同的看法。在海通证券分析师郑宏达看来,王慧文此次大张旗鼓地宣布重新出山是“纯扯淡”。郑宏达进一步提出自己质疑的看法,“5000万美元够干什么的?大模型训练一次就花500万美元,训练10次?”郑宏达甚至还直接炮轰“互联网的人啥都不懂,就只会营销,一点都不踏实”。

01.王慧文重新出山,欲打造中国的OpenAI

要说开年科技圈最火的是什么,那必然是于去年11月末刚刚问世的ChatGPT。ChatGPT在海内外火得一塌糊涂之际,国外已有微软、谷歌等科技巨头下场,而国内包括百度、字节、阿里、腾讯、京东、网易等在内的互联网大厂也都陆续进军该赛道,试图在第一时间抢滩。

而ChatGPT的火爆,甚至将久未出山的美团联合创始人王慧文都吸引了过来。一时间,原美团“二号人物”进军AI行业的消息,让国内的创投圈炸开了锅。王慧文再度出山,彼时那个表示“十年,我需要休息休息”的美团老将,如今已被AI行业的火苗重新点燃创业的热情。

2月13日,王慧文在个人的社交媒体账号上发布一则“AI英雄榜”,欲借此组建团队进军AI赛道。王慧文在这篇贴子中放话,其将“组队拥抱新时代,打造中国OpenAI(OpenAI系ChatGPT开发团队)”。

雷达财经了解到,近来王慧文对于AI行业的情绪十分高涨,其在某平台上的最新个性签名是“正在学习人工智能”,而前述提到的这篇文字只是王慧文近日发表的与重新创业相关的众多帖子中的其中一篇。自2月8日起,王慧文便在网络上接连不断地发布自己欲为AI新事业招兵买马的动态。

为了表达自己的决心和诚意,王慧文表态称,自己将拿出5000万美元的资金,设立北京光年之外科技有限公司(下称“光年之外”),但自己不占股份,资金占股25%,剩余的75%的股份则用于邀请顶级研发人才。

另据王慧文透露,光年之外的下轮融资目前已有顶级VC认购2.3亿美元(约合人民币15.7亿元)。不过,王慧文并未透露参与本轮融资的幕后“金主”的身份。有媒体报道称,王慧文所说的“顶级VC”阵容至少包括源码资本、真格基金等明星投资方。

值得注意的是,王慧文的此轮招聘仅限于研发方面的人才。对于“AI英雄榜”的人才,王慧文提出了三个要求,即业界公认顶级研发人才、狂热相信AI改变世界、坚定确保AI造福人类。王慧文还谦卑地表示,“各位大牛不必为资金忧心,放心施展你的才华,杂事交给我来打理”。

02.王慧文"血拼"AI,这事儿能成吗?

然而,还没等王慧文的AI事业正式开始,外界对此便已经分化出不同的声音。

在王慧文近日发表的朋友圈文字下方,水滴公司创始人兼CEO沈鹏评论称,“大佬做投资,就是这么朴实无华,且枯燥”。

梅花创投创始合伙人吴世春对此表示,创投圈很久没有这么兴奋了,很多创业老兵也都按捺不住就下场了。

浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林认为,ChatGPT是大势所趋,但王慧文投资的目标是不是大势所趋还需观察,因为AI领域关键是使用,产品出来后用户口碑是硬道理,这方面光年之外有没有能力还有待观察。

但在海通证券分析师郑宏达看来,王慧文此次大张旗鼓地宣布重新出山是“纯扯淡”。郑宏达进一步提出自己质疑的看法,“5000万美元够干什么的?大模型训练一次就花500万美元,训练10次?”郑宏达甚至还直接炮轰“互联网的人啥都不懂,就只会营销,一点都不踏实”。

此外,王慧文想要进军的AI赛道,门槛其实很高。不久前谷歌举办的旗下类ChatGPT产品的发布会上,在搜索领域深耕多年的谷歌也惨遭翻车。在演示最新产品Bard的过程中,该产品给出的回答却出现错误。受此影响,谷歌的股价也一泻千里,市值一夜蒸发7000亿元。

中银国际此前曾发表研报称,ChatGPT注册用户激增,AIGC潜力巨大,不会低估ChatGPT长远而言所带来的潜在颠覆性,但以目前的用户体验、应用场景、进入壁垒和商业化潜力来评估,未能证明其巨大投资成本是合理的。该行认为,预期拥有数据和资本优势的大型平台公司,将较AI软件企业更能受惠。

IDC中国研究总监卢言霞则认为,基于ChatGPT可能会诞生一批新创企,但单纯依赖大模型无法为创企提供持续的竞争力。垂直领域的数据、面向场景的模型优化、工程化的解决方案,才是将AI落地的根本,也是建立竞争优势的关键。

03.曾是美团“二号人物”

王慧文此番重新出山广招英雄的消息,之所以可以引发业内外的广泛关注,与其头上顶着的诸多头衔和光环有很大关系。

翻看王慧文的过往履历,他可以算得上是一个连续创业者。提到王慧文隐退前的奋斗史,就不得不提另一个关键人物――美团创始人、董事长兼首席执行官王兴。而王兴与王慧文两人的缘分,最早可以追溯至两人的大学时期。

彼时,还在读书的二人不仅是清华大学电子工程的同学,更是同一个寝室的上下铺,王慧文还曾坦言,“跟兴哥(王兴)同宿舍是我生命中另外一个巨大的运气”。两人的关系好到曾一起凑钱买电脑,甚至从清华毕业之后,两人还分别从中科院声学所、美国特拉华大学退学,并一同投身进创业的大潮之中。

2005年,王兴和王慧文等人一同创立了国内的第一个大学生社交网站校内网(后改名为人人网)。校内网创立的第二年,用户量便猛增不止。由于没有足够的资金支撑增加服务器和带宽的成本,最终校内网被转手卖给了千橡互动集团。

值得一提的是,2009年7月,千橡集团将校内网更名为人人网,此后人人网于2011年5月正式登陆美国纽约交易所。提早转手的王兴和王慧文,虽然拿到了一笔数目不小的资金,但最终却错过了这家公司的上市时刻。

在失去校内网之后,王兴和王慧文并没有就此停下创业的步伐。2007年,王兴创立了社交媒体网站饭否网,不过饭否网于2009年7月正式关闭。王慧文则于2009年创立了一家名为淘房网的网站,主打二手房交易。

等到了2010年,王兴和王慧文两人的事业再度产生交集。彼时,王兴将淘房网业务遇阻的王慧文拉来,王慧文自此便正式成为美团的一份子。加入美团的大家庭后,王兴主导战略思考,王慧文则主要负责项目的落地。

在美团任职期间,王慧文斩获了多个亮眼的战绩。王慧文不仅带领美团从“千团大战”中成功突围,还开创了美团外卖,帮助美团在本地生活赛道内攻城略地,还让美团在网约车市场抢得一席之地。

在一起相伴度过了一个又一个同甘共苦的日子后,王慧文和王兴可以称得上是忠实的合作伙伴。在提到王慧文时,王兴更是给出了这样的评价,“23年过去,从清华到校内网,再到美团,老王和我是有共同志趣的同学和室友,是携手创业的搭档和并肩战斗的战友,更是可以思想碰撞、灵魂对话的一生挚友。”

然而,眼看美团一步步做大做强之时,年仅42岁的王慧文却萌生出了退意。2020年初,身为美团高级副总裁的王慧文对外宣布了将要退休的消息。

对于为何要从与王兴一起建立的巨型商业帝国中隐退,王慧文在内部信中如是说道,“一直以来我都不能很好的处理工作与家庭、健康的关系;也处理不好业务经营所需要的专注精进与个人散乱不稳定的兴趣之间的关系;不热爱管理却又不得不做管理的痛苦也与日俱增;我也一直担心人生被惯性主导,怠于熟悉的环境而错过了不同的精彩”。

同年12月18日,在加入美团整整十个年头之际,王慧文按照计划完成交接工作正式退休。不过,王慧文从美团退休之后,并非就此切断与美团的联系。王慧文仍将继续担任美团董事,并担任美团的终身荣誉顾问、“互联网++大学”特别讲师。按王兴的话讲,王慧文将“换一种角色助力公司战略规划、组织传承和人才发展”。

值得一提的是,作为为美团发展贡献良多的元老级人物,美团此前给王慧文开出的薪酬十分可观。据美团2019年的财报显示,王慧文当年的总薪酬高达1.49亿元左右,该薪酬系美团高管中最高,大约是王兴的27倍。

相关数据显示,王慧文退休时仍持有公司超过5600万股的股份,身价约为28亿美元(折合人民币约183亿元)。不过,王慧文退休后多次减持了美团的股票。去年4月,王慧文连续两天合共减持74.88万股,以两次减持的平均价155港元/股计,套现逾1.16亿港元。

即便已从美团前台隐退,王慧文的财富仍不容小觑。2022年,王慧文以95亿元人民币的财富位列《2022年衡昌烧坊·胡润百富榜》第663位。

从美团正式退休几个月后,2021年2月,快手科技在港交所公布的董事名单中,王慧文的名字再一次现身。王慧文与原京东集团CFO黄宣德、阿那亚项目创始人马寅共同担任快手的独立非执行董事。

实际上从美团辉煌之时选择激流勇退之后,市面上关于王慧文的消息便少了许多,而其此前在社交媒体上发表的关于Web3.0和Crypto等相关的内容也没能引起外界的过多关注。直到此次打造中国版OpenAI的消息披露,王慧文的名字才重新活跃在了各家媒体的报道以及互联网的讨论之中。

04.盘点王慧文资本版图

此番再度成为全网热议的话题,王慧文的资本版图也进一步成为外界关注的焦点。

天眼查显示,王慧文曾在17家公司担任法定代表人,其中包括摩拜(北京)信息技术有限公司、摩资(上海)网络科技有限公司、厦门三快在线科技有限公司、北京乐新创展科技有限公司等与美团、摩拜、淘房网相关的企业。

不过,目前王慧文担任法定代表人的企业仅剩1家,这家公司便是王慧文此次提到的北京光年之外科技有限公司。天眼查显示,该公司成立于2018年7月,注册资本达100万人民币,经营范围包括技术服务、技术转让、技术开发、技术推广、技术咨询;销售自行开发的产品;计算机系统服务;产品设计。

值得一提的是,该公司目前由王慧文100%全资控股。王慧文不仅是该公司的大股东、实际控制人和最终受益人,还是该公司的执行董事、经理。不过,该公司曾于去年4月2日向北京市工商行政管理局海淀分局申请简易注销,公告期为2022年4月2日至4月22日。

除了北京光年之外科技有限公司外,王慧文担任股东的公司还有另外5家,其中有2家企业目前为存续的经营状态,它们分别是宁波梅山保税港区点亮生活创业投资合伙企业(有限合伙)、北京嘟嘟同舟科技合伙企业(有限合伙),王慧文于前述公司的投资比例分别为2%、28.14%。

而包括天津众城联企业管理咨询合伙企业(有限合伙)、易寻在线(北京)科技有限公司、天津餐星企业管理咨询合伙企业(有限合伙)在内的另外3家企业目前已经注销。

此外,王慧文目前担任高管的企业共有6家,其中5家为存续或正常的经营状态。除了在北京光年之外科技有限公司担任经理、执行董事外,王慧文还在北京健康之家科技有限公司、亚洲渔港股份有限公司、北京纵情向前科技有限公司担任监事、董事等职务。

雷达财经注意到,目前在美团官网最新的管理团队名单中,王慧文的名字仍赫然在列,其头衔为美团联合创始人、执行董事。

天眼查显示,除了美团外,目前王慧文与王兴明面上的交集只剩已经注销的易寻在线(北京)科技有限公司,以及北京嘟嘟同舟科技合伙企业(有限合伙)。其中,王慧文和王兴均是北京嘟嘟同舟科技合伙企业(有限合伙)的最终受益人,两人持股比例均为28.14%。

王慧文此番雄心勃勃要打造的中国版OpenAI的事业,后续能否如当年从“千团大战”中杀出的美团一般,从各家巨头下场的AI混战中脱颖而出?雷达财经将持续关注。