chatgpt是最智能的ai吗 OpenAI代码
热门文章
0
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
“云孚科技基于业内领先的自然语言处理、知识图谱、语义匹配、智能写作等技术,打造了云孚开源情报系统YFINT,并结合ChatGPT模型成果,重磅推出OpenAI调研报告。”ChatGPT简介2022年11月30日,总部位于旧金山的OpenAI推出了其最新作品:ChatGPT聊天机器人。ChatGPT推出仅两个月后,其月活跃用户估计已达1亿,成为历史上增长最快的消费者应用。目前,ChatGPT在交互过程中仍会生成不少的事实性错误,无法联网实时更新知识库,且没有标注自己的回答的事实来源。云孚科技结合搜索和知识图谱技术,增加知识来源,并对大语言模型的结果做提示和校验,有效缓解了以上问题。ChatGPT的写作能力非常突出,理解能力强,行文连贯,可全方位提升效率,使生成报告的全流程更加自动化。OpenAI全景报告包括OpenAI发展历程、投融资简介、主要产品、核心人物、竞品分析等内容。以下是报告内容节选:OpenAI是美国一个人工智能研究实验室,由营利组织OpenAI LP与母公司非营利组织OpenAI Inc所组成,目的是促进和发展友好的人工智能,使人类整体受益。OpenAI成立于2015年底,总部位于加利福尼亚州旧金山,组织目标是通过与其他机构和研究者的“自由合作”,向公众开放专利和研究成果。创始人伊隆・马斯克以及山姆・柯曼的动机是出于对强人工智能潜在风险的担忧。至2018年,OpenAI的总部坐落于旧金山的米慎区,与伊隆・马斯克的另一座公司Neuralink在同一办公室大楼。1发展历程OpenAI是2015年由一群科技领袖创办的美国人工智能研究实验室,由营利组织OpenAI LP和非营利组织OpenAI Inc组成,旨在促进友好的人工智能,使人类整体受益。OpenAI的核心宗旨是实现安全的通用人工智能,总部位于加利福尼亚州旧金山,与伊隆・马斯克的另一座公司Neuralink在同一办公室大楼。OpenAI的创始人伊隆・马斯克和山姆・柯曼出于对强人工智能潜在风险的担忧,采取“自由合作”的方式,向公众开放专利和研究成果。1.1创始OpenAI于2015年12月11日成立,总部位于加利福尼亚州旧金山,旨在通过与其他机构和研究者的“自由合作”,向公众开放专利和研究成果,旨在以最有可能造福全人类的方式推进数字智能,不受产生财务回报需求的限制。1.2发展2019年3月1日,OpenAI LP子公司成立,旨在营利。OpenAI LP是一家“封顶”的营利性公司,可为投资者和员工提供有上限的回报,超出上限的回报归母非营利实体所有。OpenAI LP雇用了OpenAI的大部分员工,原联合主席山姆奥特曼成为首席执行官。2017年3月,OpenAI开始起草一份文件,以规划通向AGI的道路,意识到继续作为非营利组织在经济上是站不住脚的。2018年4月,OpenAI章程发布,重新阐明了OpenAI的核心价值观,计划向营利性公司过渡。2人工智能系统2.1 Gym2016年OpenAI于2016年4月发布了Gym,一个用于开发和比较强化学习算法的公共平台,并于2016年12月发布了Universe,一个软件平台,用于测量和训练AI在全球范围内提供的游戏、网站和其他应用程序的通用智能。2019年2019年,OpenAI发布了Roboschool,一款用于机器人仿真的开源软件,它基于Bullet物理引擎,并已实现与OpenAI之前发行的Gym之间的整合。2.6模型2.6.1 GPT-1OpenAI于2018年提出了GPT-1,这是一个基于Transformer的大型语言模型,拥有1.1亿个参数,使用了大量的未标注的语料进行无监督的预训练,然后在各种有监督的NLP任务上进行微调,取得了不错的效果。GPT-1的创新点是使用了Transformer的解码器作为语言模型,使用了自回归的方式生成文本,即根据前面的词预测下一个词。2.6.1 GPT-2OpenAI于2019年提出了GPT-2,这是一个对GPT-1的升级版,拥有15亿个参数,使用了更大的语料进行预训练,包括了80亿个单词的WebText数据集,这是一个从互联网上爬取的文本数据集,包含了新闻、博客、维基百科等内容。GPT-2的改进点是使用了更大的模型和更多的数据,提高了语言模型的泛化能力,使其能够在多种NLP任务上取得很好的效果,甚至不需要进行微调,只需要根据任务的输入格式调整输入即可。2.6.1 GPT-3OpenAI于2020年提出了GPT-3,这是一个对GPT-2的进一步扩展,拥有1750亿个参数,使用了更加庞大的语料进行预训练,包括了45TB的文本数据,这是一个从Common Crawl数据集中筛选出的高质量的文本数据集,包含了万亿级别的单词。GPT-3的突破点是使用了更加巨大的模型和更加丰富的数据,提升了语言模型的表达能力,使其能够在多种NLP任务上取得惊人的效果,甚至只需要给出少量的示例,即可实现任务的快速适应,这被称为Few-Shot Learning。2.6.2 ChatGPTOpenAI于2022年提出了ChatGPT,这是一个基于GPT-3.5的对话机器人,GPT-3.5是GPT-3的最新版本,拥有1750亿个参数,使用了更加更新的语料进行预训练,包括了2021年的文本数据。ChatGPT的特点是在GPT-3.5的基础上,针对对话任务进行了微调,使其能够根据用户的输入生成流畅、有趣和有逻辑的回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流。ChatGPT不仅是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。在ChatGPT发布的一周之内,有超过一百万的用户尝试了这个线上工具。2023年1月,即ChatGPT推出仅两个月后,其月活跃用户估计已达1亿,成为历史上增长最快的消费者应用。对比之下,达到1亿用户,Facebook用时2.5年,Instagram用时将近2年,而ChatGPT仅用了两个月时间。根据Similarweb数据统计,2023年1月期间,ChatGPT平均每天大约有1300万独立访客,这一数据是2022年12月的两倍之多。2023年2月1日,OpenAI发布ChatGPT Plus订阅计划,每月收费20美元,订阅者可实现(1)高峰时刻使用;(2)更快的服务响应;(3)优先获得新功能和改进。该版本目前仅针对美国用户,未来有望在更多国家应用。3投融资情况3.1融资情况OpenAI从2015年成立至今,已经获得了微软10亿美元、Anthropic 1.24亿美元、5.8亿美元、3亿美元的投资,ChatGPT完成500万美元种子轮融资。OpenAI成立于2015年,得到了特斯拉CEO埃隆马斯克、亿万富翁投资人Peter Thiel、Sam Altman等人的支持,资金高达10亿美元。2016年Y Combinator又给了12万美元种子前轮投资。2017年,Altman又投资了10亿美元,成为Open AI的创始人。2019年,微软与OpenAI签署合作协议,向OpenAI投资了10亿美元。2023年,微软打算投资OpenAI 100亿美元,并占据49%的股权。3.2投资情况2021年5月,OpenAI启动了来自微软和其他投资者支持的1亿元美元基金,至少已经投资了16家公司。3.2.1 Mem LabsMem Labs于2019年在Los Altos Hills成立,主要开发能够简化任务和笔记工作流程的生产力平台。该公司的平台允许用户通过其AI的自组织工作空间快速捕获和共享信息,并使知识储存、共享和生成变得简单直观,使用户能够保持井井有条并提高他们的工作效率。其创始团队为Dennis Xu&Kevin Moody:Dennis Xu毕业于斯坦福大学计算机科学专业,前Yelp产品经理;Kevin Moody毕业于斯坦福大学计算机科学专业,前Google产品经理、Seholo创始人。OpenAI在月内收购了Mem,Mem使用Transfomer模型,OpenAI为Mem新一轮2350万美元的融资领投。Mem成为世界上第一个“自组织工作空间”,估值1.1亿美元,总投资达到2900万美元。OpenAI Startup Fund旨在投资解决重大问题的早期AI公司,Mem AI的目标是让人们专注于创意输出并记住个人记忆。3.2.2 Descript2022年11月15日,Descript宣布获得由OpenAI Startup Fund领投的5000万美元C轮融资,以支持和加速AI融入创造力。该基金由微软、OpenAI及其合作伙伴发起,用于投资早期公司。Descript成立于2017年,是一个利用AI让视频编辑变得更容易的音频和视频编辑平台,它的软件允许用户先编辑文本转录本来编辑音频和视频,面向播客和其他创作者,可将音频文件与文字记录中的文字同步,还可以生成听起来像原始创作者的新音频。3.2.3 SpeakSpeak2022年11月18日宣布,在OpenAI Startup Fund领投的B轮融资中筹集了2700万美元,Lachy Groom、Josh Buckley、Justin Mateen、Gokul Rajaram和Founders Fund跟投。OpenAI Startup Fund参与者可以提前访问Microsoft的新OpenAI系统和Azure资源。OpenAI首席运营官Brad Lightcap表示,Speak有能力提供强大的生成式AI应用程序,使语言学习变得有效和容易获得。Speak计划扩展到新的语言和市场,包括日本,并利用OpenAI的GPT-3等文本生成模型的功能。3.2.4 AnysphereAnysphere于2022年在纽约布法罗成立,是一家AI工具开发商,旨在帮助专业人士进行高效工作。该公司目前仍以隐身模式运行。其创始团队为00后同班同学小天才组合Arvid Lunnemark和Sualeh Asif。Arvid Lunnemark:2022年毕业于麻省理工数学与计算机科学专业;Sualeh Asif,2022年毕业于麻省理工数学与计算机科学专业。Anysphere于2022年完成20万美元种子轮融资,投资方为Alameda Research。3.2.5 Atomic SemiAtomic Semi于2023年在多佛成立,主要利用3D投影打印技术制造先进和简单化的半导体硅芯片,该公司专注于在几个小时内制造芯片,而不是用通常所需的长达数月的时间,通过使用彻底简化和缩小的半导体晶圆厂和原型集成电路,为用户提供简单和小型化的芯片。其主要创始团队为老司机+小天才组合:Jim Keller和Sam Zeloof:Jim Keller毕业于宾夕法尼亚大学电气工程专业,着名芯片架构师,AI芯片公司Tenstorrent CEO,曾在英特尔、AMD、苹果和特斯拉任职;Sam Zeloof毕业于卡内基梅隆大学,以在自家车库成功造出一颗1200个晶体管的芯片在网络一举成名。Atomic Semi于2023年完成1500万美元种子轮融资,投资方有OpenAI Startup Fund、Fred Ehrsam、Nat Friedman、Naval Ravikant。4重要人物4.1主要成员4.1.1 Sam AltmanSam Altman是美国企业家、天使投资人,Hydrazine Capital联合创始人,Y Combinator前总裁,Loopt创始人兼前CEO,OpenAI联合创始人兼CEO。4.1.1.1早年生活和教育4.1.1.2工作经历LooptSam Altman是Y Combinator的总裁和OpenAI的联合主席,他于2005年与他人共同创立了Loopt,这是一种基于移动位置的服务器,2012年被Green Dot收购。Sam还创立了Hydrazine Capital,曾在斯坦福大学学习计算机科学,并在AI实验室工作。2018年,Scott认识了OpenAI首席执行官Sam Altman,Altman试图聘请Scott担任OpenAI的首席技术官。Sam Altman是一位成功的企业家,他成功地为他的第一家公司Loopt筹集了超过3000万美元的风险投资,并于2012年被Green Dot收购。Y CombinatorSam Altman是Y Combinator的总裁和OpenAI的联合主席,曾担任Loopt的联合创始人兼首席执行官,2014年被Y Combinator创始人Paul Graham选中担任总裁,发表了一篇题为“多元化与创业”的博文,并在2015年参与创立OpenAI。Sam还是Boom和Reddit的董事会成员,以及Hydrazine Capital的创始人。RedditSam Altman是Y Combinator的总裁和OpenAI的联合主席,他还是Boom和Reddit的董事会成员,以及Loopt的联合创始人兼首席执行官,他还创立了Hydrazine Capital。2014年,他被Y Combinator创始人Paul Graham选中,担任Y Combinator的总裁职务,并将75%的资金投入YC公司,并领投了Reddit的B轮融资。2015年7月10日,他宣布Steve Huffman回归,担任Reddit首席执行官。Sam Altman在斯坦福大学学习计算机科学,并在AI实验室工作,之后和两个同学辍学,全职开发他们的移动应用程序Loopt。Y Combinator已成为硅谷知名的造王者,校友包括AirBnB、Dropbox、Stripe、Reddit等,Sam Altman寻找那些表现出用户喜爱的早期迹象的初创公司。他是一位企业家、投资者、程序员和博主。OpenAIOpenAI由山姆・奥特曼(Sam Altman)、马斯克、Peter Thiel等人于2015年创立,Sam Altman担任CEO,并于2018年获得微软10亿美元融资。山姆・奥特曼1985年出生,8岁时学会编程,16岁出柜,在斯坦福学习计算机,后辍学创业。2022年11月OpenAI发布了爆火聊天机器人ChatGPT,用户接近一亿,是人类有史以来用户增长最快的产品。WorldcoinWorldcoin是一种新的全球加密货币,由Sam Altman、Max Novendstern和Alex Blania共同开发,2月10日据The Block报道,正在为其最新一轮融资寻找主要投资者,以30亿美元估值筹集至多1.2亿美元,采用股权加代币认股权证的结构。Worldcoin是一个基于人格证明的隐私保护协议,Sam Altman表示是一个全球UBI实验,将在未来几个月后正式推出,融合了Crypto等新兴技术,受到众多资本的关注。Sam Altman的公司推出了ChatGPT,而区块链在调查中被交易员命名为可能最具影响力的技术中排名第三。Sam Altman担任Worldcoin的联合创始人,但他目前的工作重心依旧是OpenAI。2月10日,Worldcoin正在为其最新一轮融资寻找主要投资者,以30亿美元估值筹集至多1.2亿美元,采用股权加代币认股权证的结构,是一个基于人格证明的隐私保护协议,Sam Altman表示是一个全球UBI实验,融合了Crypto等新兴技术,受到众多资本的关注,Sam Altman的公司推出了ChatGPT,而区块链在调查中被交易员命名为可能最具影响力的技术中排名第三。4.1.1.3慈善Sam Altman是一位程序员、企业家和投资人,他共同创立了OpenAI,一个旨在开发“造福全人类”的AI技术的非营利组织,微软投资了10亿美元。2019年,他为民主党总统候选人Andrew Yang举行了筹款活动,2020年5月,他向American Bridge 21st century捐赠了25万美元。此外,他还创建并资助了Project Covalence,资助COVID-19疫苗接种和药物治疗的临床试验。2016年,由于OpenAI无法接受慈善捐款,马斯克基金会向YC.org捐赠了1000万美元,该组织由OpenAI主管、Y Combinator总裁山姆・奥尔特曼负责运营。4.1.2 Greg Brockman4.1.2.1早年生活和教育Greg Brockman出生于加拿大,在安大略省的一个小镇长大。从年轻时起,Brockman就显示出对STEM相关项目的倾向性。2006年,当他还在读高中时,他在韩国举行的国际化学奥林匹克竞赛中为美国队赢得了一枚银牌。第二年,他进入了Regeneron科学人才搜索的决赛,这是一个全国性的大学前科学竞赛。然后他进入哈佛大学,打算攻读数学和计算机科学双学位。但他很快就变得不安分起来,并转学到麻省理工学院,但在几个月内就退学了。2010年离开大学生活后,他搬到了旧金山,从此不再回头。4.1.2.2工作经历StripeGreg Brockman从小就对人工智能很感兴趣,曾在哈佛大学和麻省理工学院学习计算机科学,之后辍学创办Stripe,Brockman在加入创业公司Stripe后首次在科技界引起轰动,当时它还被称为"/dev/payments"。在为网站和移动应用开发支付处理软件和API应用编程接口的Stripe公司时,这位大学辍学生担任创始工程师,帮助公司将员工人数从4人扩大到250人。2013年,他成为Stripe的第一位首席技术官。OpenAI从2015年OpenAI成立至今的7年里,Greg Brockman都一直效力于OpenAI。他的愿景是确保通用人工智能(AGI)造福全人类,曾更新OpenAI LP法律结构,建立更为安全的AGI并利于筹集更多资金。2018年,他入选MIT全球35位35岁以下的科技创新青年榜,理由便是对预防人工智能给人类社会造成伤害的贡献。Greg Brockman是OpenAI团队的出色代表人物之一,向来受到人工智能领域的广泛关注。据介绍,Greg Brockman被选为总裁的原因是他“在OpenAI关键路径上的编码贡献与公司战略高度契合”。担任总裁后,他将负责OpenAI旗舰AI系统的训练工作。未完待续...欢迎关注“云孚科技官方”公众号,回复openai,可免费获取报告全文。账号持续分享更多ChatGP,开源情报动态^_^ 云孚开源情报系统(简称YFINT)是云孚科技自主研发的第三代开源情报系统,融合了哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)业内领先的自然语言处理和知识图谱技术,针对开源情报应用场景进行了深度优化,可从海量数据中自动挖掘高价值情报,有效解决企事业单位相关部门普遍存在的高度依赖人工分析、信息覆盖不全、响应不及时等痛点问题,全面提升情报分析效率及决策智能化水平。YFINT利用业内领先的自然语言处理和知识图谱技术,可对海量非结构化数据自动进行多维度、深层次的信息抽取。
甲小姐对话张斯成:ChatGPT过热容易导致错误判断
原标题:甲小姐对话张斯成:ChatGPT过热容易导致错误判断 图片来源@视觉中国 文 | 甲子光年,作者 | 甲小姐、刘杨楠 此时此刻,无人不为ChatGPT疯狂。 放眼全球,先是微软、谷歌两大国际巨头围着它打成一片,一众科技大佬纷纷亮出名言,比尔・盖茨公开强调,“像ChatGPT这样的人工智能,与个人电脑、互联网同等重要”;埃隆・马斯克在用过后直呼“好到吓人”,断言“我们离强大到危险的AI不远了”;英伟达CEO黄仁勋也在近日表示,ChatGPT是人工智能产业发展的“iPhone 时刻”。再看中国,百度、阿里、网易、360、字节跳动等互联网大厂均表态将围绕ChatGPT做相关布局。创投圈也已经开始出现五花八门的“中国版ChatGPT”。 好像所有人都在赌,赌ChatGPT能够撞开人类通往通用人工智能(AGI)的大门。但事实是,ChatGPT还有太多不完美:它无法回答所有问题,会一本正经地胡说八道;即使依托微软Azure强大的云能力,也没能在访问量陡增时逃过宕机的命运;此外就是钱的问题――有传言称OpenAI在GPT-3.0的训练周期内花费上千万美金,但至今仍没人能准确说出OpenAI推出GPT模型至今总共花了多少钱。 ChatGPT是否热过头了?当噪音模糊了ChatGPT的真容,张斯成对此表示,“过热容易导致错误判断”。这一期对话嘉宾张斯成曾任斑马智行联合创始人、阿里钉钉副总裁、明略首席战略官,于2001年毕业于中国科技大学,获得计算机软件和新闻传播双学位,并于2005年在香港城市大学获得模式识别博士学位。一直以来,张斯成都是位deep thinker。过去三年疫情期间居住在香港的他一直在“隔岸观火”,等待一个真正“下场”的机会。他从去年年初开始关注生成式AI,认为AIGC是一个不错的机会。当时他没想到,半年后将会有一个“怪胎”横空出世。本文,甲小姐对话张斯成,聊一聊他眼中的ChatGPT,和它背后的OpenAI,寻找一个可以真正“下场”的机会。 本文目录: 谈出圈:“动作快到不像微软,这是一个赢面很大的AB策略” 谈态势:“美国式vision,中国式mission” 谈商业:“100亿俱乐部” 谈技术:“不是非GPT不可” 谈价值:“还没到互联网寿终正寝的时候” 1.谈出圈:“动作快到不像微软,这是一个赢面很大的AB策略” 甲小姐:当年小冰不温不火,这一次ChatGPT火到出圈,除了技术水平差异,原因还有什么? 张斯成:第一,ChatGPT的交互界面极其简单,用户打开界面输入问题就能得到答案。极简化增大了出圈的可能性――过去几年互联网上所有现象级产品没有一个不是简单的。 对比一下,小冰当时推出了一个卡通形象,文质彬彬的,拉高了人们的期待,而OpenAI没有任何“人设”,反而表现超人预期。不过从产品角度来看,ChatGPT非常ugly,阿尔特曼(OpenAI CEO)自己也说这是一个糟糕的产品,也会输出一些错误的信息。 第二,它很有话题性。ChatGPT会一本正经地胡说八道,有些很好玩儿的回答,有话题性,容易通过社交媒体传播,自媒体就会炒作,再加上比尔・盖茨、马斯克等大佬助推,无形之中加快了它的出圈。 第三,ChatGPT非常拟人化。它会像人一样和你互动,比如会告诉你这个问题我不能回答,或者不知道答案,这样它在犯错时会让人有很高的容忍度。 普通人对“智能”的感受和专业人士对智能的定义不一样,大众对智能的定义是“要像个人”,就是能够“像人一样表达”。和养宠物一样,我们觉得宠物聪明会说宠物“通人性”,而不是它一定要知道1+1=2才叫智能,现在看机器也一样。这是一种上帝视角,我们觉得人类自己是聪明的,所以只要宠物或机器具备某些“像人”的特征,我们就认为它聪明、可爱,就愿意和它交往。但这不是OpenAI刻意设计的,只是ChatGPT能够达到这样的效果。 最后,OpenAI选择在去年11月底推出ChatGPT也是个很聪明的选择。我相信阿尔特曼跟和萨蒂亚(微软CEO)两个人肯定讨论过什么时候推出来。据报道,其实去年夏天阿尔特曼就给萨蒂亚和比尔・盖茨都演示过这个产品了,所以他们这么有信心推动100亿美元投资,估计是看到了ChatGPT和GPT将对整个微软的商业体系产生巨大加成,以及在竞争战略上的重大机会。 甲小姐:假设ChatGPT在去年7月份亮相,它不会像现在这么火吗? 张斯成:有可能不会。首先技术准备不足,最近它在微软Azure云上也因请求过多而停服了。估计去年演示的时候还是GPT-3.0,年底推出的是GPT-3.5,3.0到3.5还是有不少改进的,特别是CoT(思维链,Chain of Thought)能力。一般来讲,千亿参数规模以上的大模型,才可能涌现出“CoT”等强大的能力,而CoT的出现,可能正是ChatGPT产生类似“推理”效果的关键。因此,如果去年7月就推出的话,交互效果可能没有这么好。 我不确定他们是如何考量这个时间点的,但肯定设计过――ChatGPT大火以后,微软投资100亿美元的新闻跟着出来,而且几乎是以“光速”把ChatGPT接入各个产品线,包括Office、Teams、Dynamics、Bing等等,这都是微软的重要产品――动作快到不像微软。 甲小姐:展开说说“动作快到不像微软”。 张斯成:一个成熟的大厂做一个项目,从立项到最后落成,没两三个月根本干不出来。举个例子,Office 365在微软收入中是举足轻重的。它要接入GPT这样的外部模型并不只是对接一个API这么简单,因此不仅要保证两个产品之间的无缝对接,还要保证向前兼容已有的客户和服务。中间必须经过大量的测试和调试,两三个月在工程上已经是极限了,所以我推算微软可能已经秘密准备了好几个月。 甲小姐:微软这么果断all in ChatGPT的深层次原因,是不是和CEO萨蒂亚这个人有关? 张斯成:皮柴(谷歌CEO)和萨蒂亚是两种完全不同的风格。皮柴相对保守,但萨蒂亚是革新派。 萨蒂亚上台的时候比尔・盖茨就要求他要做变革,他后来写了一本书,叫《Refresh》(中文版译名为《刷新:重新发现商业与未来》),讲了怎么把微软这家几十年的老IT公司变成一个有战斗力的新公司。 上任以来,他接受了Windows mobile的失利,承认收购诺基亚是一笔失败的交易,并开始积极参与开源社区的建设。同时,为了在内部树立敢于创新的作风,也在公开场合表明自己喜欢苹果的iPhone,因为上面有所有微软的App。 他在微软最大的成就是把Azure给救活了。微软的基本盘就是Windows和Office,Azure在微软其实一直不温不火,但云时代前两个东西已经不行了,所以他把所有东西都云化,全部转向Azure。现在Windows操作系统已经几乎没怎么赚钱了,主要是Azure上的Office 365和Dynamics 365。Dynamics 365在中国市场并不常见,因为主要还是服务国际客户,但它的定位,是要帮助微软深耕企业服务领域,逐步渗透和占据客户的业务场景。 所以深层次原因还是人。我认为硅谷有三个差不多同一量级的人:马斯克、阿尔特曼和萨蒂亚。马斯克不用说了,是我偶像;阿尔特曼是有机会追赶马斯克的人;萨蒂亚可能跟他们不在同一量级,但他还是很牛的,能够让大象跳舞,让微软有这么大的变革,这很不容易。 甲小姐:这三位都极有魄力。 张斯成:有勇气,有想法,有谋略。 萨蒂亚这一次的谋略太明显了。我是做战略的,这件事你说没有计划过我是不相信的。我猜测他不仅计划过,背后肯定还模拟演练过好多次,因为这是一个赢面很大的AB策略―― 从A面看,微软通过控制OpenAI和ChatGPT直接占领了AGI路途中的一个战略制高点,对搜索引擎的长期范式发起挑战,充分利用了谷歌过去几年保守怠战的弱点,如果能一气呵成,那么就打破了谷歌在搜索领域长期的垄断地位,让Bing重获新生; 从B面看,微软直接冲击对方的顶梁柱业务,釜底抽薪,逼着整个搜索行业重整成本结构,大家一起耗着。而谷歌财务结构的耐抗性要明显差于微软,股价持续大跌,资本和人才的虹吸效应加剧,最后导致谷歌内部的剧变,这种惨胜也能改变双方的军备格局,长期战争胜利的天平就会发生倾斜。 另外,从微软角度出发,他们把GPT接入了Office,是因为GPT模型本质上相当于一种AI的能力输出,对Office的加持效果是最明显的。新版Office出来以后,我估计很多在线文档都会处于竞争劣势。 2.谈态势:“美国式vision,中国式mission” 甲小姐:对大部分人而言,如何抓住ChatGPT这一波机会? 张斯成:目前看就是三条路径:留在大厂、自己创业做垂直场景,或加入王慧文这样的团队。 甲小姐:大家首先在问,谁最有机会成为“中国的OpenAI”? 张斯成:关于谁能成为“中国版的OpenAI”,前几天李志飞(出门问问创始人)说过可以分成七大门派(包括他的“自成派”)。我个人的看法是,无法得出一个简单的论断:大厂队是最有可能在商业化层面接近微软加持下的OpenAI的,国家队和准国家队是最有可能赢得政策性支持并获得最终清场权的,而民间队是最有可能在创新层面上突破的,特别是今日之前至少已经投入LLMs研发12个月以上的团队。 总的来看,要做出“中国的OpenAI”需要三种能力:资金、人才、场景。 大厂不缺场景,也不缺钱,再卡住人才,民间力量很难做起来,因为做这个需要有一定人才密度,你看OpenAI虽然人不多,但里面每一个拿出来都是大牛,一群大牛才有可能做出一个OpenAI,否则到最后只能follow别人。 有朋友开玩笑说,硅谷提出Vision(愿景),国内当作Mission(任务)。这是大洋两岸目前在面对创新时惯性思考范式的差异。Vision是为梦想买单,Mission则是为了当下的生计。通常我们会举国之力去发展的都是“不做就死”的领域,跟国家的安全红线强相关,例如杂交水稻、两弹一星、芯片、量子计算等。我觉得人工智能目前还没有到这个层面,虽然迟早会到。 甲小姐:OpenAI也会被质疑商业化。 张斯成:阿尔特曼被问过很多次商业化问题,他的回答是“I have no idea”,中国有人这样说可能估值马上砍一半。 2019年,阿尔特曼在加入OpenAI前后写过一篇博客,表达他的政治理想,也涵盖了他对商业化的考量。文章里讲到,他认为未来的资本主义制度应该做一个升级。后来他开展了一个UBI(Universal Basic Income,意指“全民基本收入”)的社会性试验项目。大概意思是,当机器人或AI已经极大智能化,大部分脏活累活都能干,社会成本会大幅降低,让所有从事社会生产的人持有一定股份,这时候资本主义会发生一个根本性变化。 因此阿尔特曼提出了万物摩尔定律:未来在AI时代,社会成本主要有两大构成,一个是AI的获取成本,一个是能源的获取成本。这两大成本会急剧降低,当它们趋近于0的时候,社会中的商业化就不再是一个难题,因为“商业化”这个概念可能会产生根本性改变,或者消失。 甲小姐:事实是,OpenAI已经依靠微软走上商业化道路了,马斯克甚至抨击他们已经违背了OpenAI的初衷。 张斯成:OpenAI确实面临很现实的商业化问题,他们和微软签了一个协议,体面地解决了商业化难题。他们签的协议也是脑洞大开,相当于微软租了这家公司,微软给OpenAI投资,OpenAI帮微软赚钱,OpenAI壮大到一定程度后就能把自己的股份赎回去。 这是四两拨千斤,太聪明了。更何况ChatGPT爆火之后,大家似乎也瞬间相信了OpenAI的商业潜力。OpenAI预计今年会有2亿美元收入,明年收入达10亿美元。现在大家不会再问阿尔特曼商业化问题,只会关心他们什么时候优化出GPT-4。 3.谈商业:“100亿俱乐部” 甲小姐:现在国内的科技大厂已经悉数宣布大模型相关布局,你怎么看大厂的动作? 张斯成:大厂一定会做同质化平台,而不是差异化平台。现在国外有论文,有开源代码,大厂也不用从头开始,可以直接在GPT-3.0上搭。对于大厂的动作力度,我有几个判断: 因为有“All in AI”的誓言,而且全球两大搜索引擎都做了,百度也必须要跟进,以保持同一梯队的资格; 字节和腾讯都是做内容的,如果他们不做就可能把一些业务拱手让人,所以他们必须要做; 阿里和华为两家我认为至少有一家会做,也可能是两家都做。他们都是有能力的,阿里内部有达摩院在做M6大模型,华为也有盘古大模型。但华为比较低调,经常都是先做了再说,他们可能不会特别突出自己的大模型能力,而是会独立做一些基础设施,比如大算力芯片等;阿里可能会考虑将大模型能力运用到电商领域,毕竟电商还是阿里目前的基本盘。另外,从云计算的层面看,阿里可能会看重华为的做法,如果华为把大模型作为云资源销售的重要利器,阿里就不得不跟进了。 甲小姐:现在也有很多创业公司已经在布局了,你能否画一个界限,资金储备在多少钱的公司有机会成为中国的OpenAI? 张斯成:100亿美金。很简单,马斯克他们用10亿美金设立OpenAI,之后微软2019年又投了10亿美金,现在20亿美金花完了,微软又宣布未来投入100亿美金,这足够OpenAI烧十年。 不过我认为在中国从头做大模型可能不会用这么多,但估计至少要投入两三百亿元人民币。中国人工和电力成本可能低一些,但训练成本、机器成本、芯片成本以及聘请科学家的成本也是不低的。所以这是个100亿俱乐部。 甲小姐:你认为除了钱,创业公司要做大模型还有哪些门槛? 张斯成:大模型的算法本身不是门槛,这些都有很多公开的论文。存在的门槛除了资金以外,主要还是人才和数据,特别是有丰富经验的工程化人才,和高质量的训练数据。即便在foundation model上去做fine-tune,去做垂类模型,也是需要相当的人才、算力、数据储备的。 甲小姐:你从什么时候开始关注ChatGPT? 张斯成:我在去年年初看到Gartner报告里提到生成式AI,因为我也算是人工智能领域出来的,博士学了相关专业,所以我认为AIGC可能会带来翻天覆地的变化,它会带来内容的极大丰富,但我当时没时间投入。 当时国内大多数公司还是以Bert路线为主,只有OpenAI在执着做GPT。直到11月份ChatGPT出现,就开始在各种群里进行疯狂测试。 甲小姐:你的计划是什么? 张斯成:我在去年12月决定要下场的,不能错过这个未来十年最大的机会。但我认为自己没有足够的号召力组队从头去做大模型,也不能做太通用的场景,所以打算做一些垂类场景。在这个层面上,我对老王(王慧文)挺身而出连钱带人一起去做中国版OpenAI是相当敬佩的。 我预计在一些2C的领域大概还有6-12个月时间可以赚快钱,比如说类似Copy.ai 、Jasper.ai的项目,现在欧美市场已经有二三十个了,国内可能有更多。12个月之后,等大厂反应过来,团队和业务也成形后,这类公司就会比较难生存。国内的大厂也不大喜欢收购这类公司,因此基本没有出路。我认为很多垂直领域比如说2B还是有相当机会的。 甲小姐:你对技术合伙人有清晰的画像吗? 张斯成:技术合伙人最好是NLP相关的,最好做过大模型,也不需要特别大咖的,有工程化经验,能够紧贴前沿,保持足够的动手能力很重要。 甲小姐:你现在看好的垂直场景有哪些? 张斯成:我比较看好几大类: 第一个是教培行业。当然是在政策支持的领域,比如职业教育。可以利用Bot(机器人)的方式开展的教培,让用户自行选择需要什么样的服务。大语言模型目前展示出来一个很有意思的特点,就是可以帮助强化认知教育的效果。但这个领域应该如何开展可能需要一定的技巧。 第二个是设计领域,特别是在高维设计方向上,目前复杂度是需要降低的。比如建筑领域需要各种设计视图和渲染效果,游戏领域需要快速建模和智能交互,工业制造领域需要在条件约束之下尽可能激发创意,这些都可以用生成式AI技术来帮助提效。 第三个是视频类,这个也是AIGC创业离钱最近的领域,因为商业模式已经相当成熟。比如在YouTube或B站上的大V,他们有百万级粉丝,对他们而言内容生产是流水线式的,滚着流量赚钱,曝光越多收入越多。所以他们对内容迭代频率的需求强烈,可以用生成式AI快速生成创意、收集材料、编辑成稿。当然,这个领域有个坏消息是有巨头存在;但好消息是,不是只有一个巨头存在。 但我觉得等这波热浪稍微降温之后会看得更清楚,因为我也存在认知盲区。现在太热了,过热的时候容易导致一些错误的判断。 比如我个人认为生成式AI在医疗领域会有很大可能性,但是很少有人讨论这方面。医疗领域有两大场景,一个是医疗影像,一个是生物制药。 生物制药领域谷歌已经开始做了,他们的Alphafold就能预测大量的蛋白质3D结构。这几年在硅谷已经有公司在往这个方向尝试,利用AI来帮助寻找新的药物靶点或合成新的小分子药品。但这块必须要和药厂深度合作,因为需要足够的数据源对模型进行训练。 另外医疗影像方面也有很大的机会,对影像的诊断是一个重要场景,比如说国内的联影医疗已经利用AI手段帮助医生做CT影像的灶点排查。随着大语言模型在多模态领域的扩展,相信这块能够成为新的蓝海。 4.谈技术:“不是非GPT不可” 甲小姐:从技术上看,GPT和Bert等大模型中存在一个最优路径吗? 张斯成:在和我沟通过的人群中,这个问题可以分成三类情况: 第一类是专业人士,他们不会认为谁比谁更优。客观来看,Bert和GPT在技术上是不分伯仲的,只是大家各有侧重。谷歌内部除了Bert也在做其他模型,但他们现在确实承认GPT表现出来的一些特性非常值得研究。因为目前来看,大家普遍认为要实现AGI,超大模型是一个很有希望的路径,但不是非GPT不可。只能说,在朝AGI演进之路上,OpenAI通过ChatGPT和InstructGPT证明了GPT可能是更理想的一个大语言模型。 第二类是吃瓜群众,可能都不知道什么是Bert,只知道ChatGPT,并且认为这代表了人工智能的未来。 第三类是介于两者之间,就是我们这群既不吃瓜也没有很专业的人,我们还是比较相信GPT的。之前我一直想写一篇文章,标题是《因为看见,所以相信》。对于我们这帮实用主义者来说,看见了,就相信了。因为现在ChatGPT表现出来的性能明显甩谷歌几条街,谷歌还翻车了,所以大家就会认可GPT,更愿意在上面花时间研究。 甲小姐:为什么现在想要做大模型的都纷纷表示“太缺人了”? 张斯成:可能是因为过去几年国内做生成式AI的公司,90%都在使用Bert路线。当时GPT表现出来的实用性比较低,性价比方面难以满足项目类的需求。或许,国内的创业环境一直都逼着大家不得不考虑短期的功利性。 甲小姐:听说云知声的黄伟之前认真比较过GPT和Bert,但选了Bert。 张斯成:但据说他们在看到instructGPT之后就开始切换到GPT路线了,在业内而言动作还是相当快的。现在有一种设想是用SparseGPT来进行压缩,可以在保持精确度的情况下显著降低训练成本,降低对算力的需求。 另外,据说还有一些学者从基础设施入手,提出不用GPU,比如英伟达的A100或H100,而是使用云计算的常规算力来进行训练。这个理论上似乎是有一定机会,只能等几大云平台公司来实现了。 5.谈价值:“还没到互联网寿终正寝的时候” 甲小姐:ChatGPT的社会价值是什么? 张斯成:ChatGPT是一次大型社会化实验。这是OpenAI对GPT模型的压力测试,让全社会一起用,来测试模型的通用性,这样才能够对微软承诺,产品已经达到商用性能。 我相信AGI肯定会带来一次深刻的革命,不亚于工业革命,但ChatGPT还没到这个程度。如果要类比的话,我认为ChatGPT的影响类似iPhone诞生。iPhone带来的最大变革就是把按键输入变为触屏,这是一次人机交互的变革,导致很多人开始思考自己工作生活各方面的变化,由此带来了整个移动互联网时代。这是一种遍布社会各个角落的自激反应。 我认为现在还没到互联网寿终正寝的时候。ChatGPT可能会带来新一代互联网,我个人称之为“智能互联网”。这代互联网最根本的特点,是Bot将成为人机之间最基本触面,不再是App,也不是Browser。 这种变化将引发众多场景的范式迁移,甚至进而影响互联网的经典架构。 ChatGPT的爆火,实际上是一场普遍的社会心智教育,可能会带来三重影响:第一,AI是一种基础能力,人们要考虑如何更好地利用它来提升自己的综合能力;第二,AI能力的提升可能会重构我们日常生活的范式,我们要用新的方式来解决原有的场景难题;第三,可能会带来更多微创新,让某些场景从原来的想象变成现实。 对于我们这几代人而言:“抢走你工作的从不是AI,而是其他掌握AI工具的人。”而对于之后几代人来说:“区别你和AI的从不是人性,而是对星辰大海的向往。” 甲小姐:现在很多人都在关注这波创业的人,大家的共识是,创业公司可能要做一些更合适的应用场景,做垂类市场,但是如果不做大模型,一个创业公司如何建立壁垒? 张斯成:如果纯粹做2C的业务,是没有壁垒的,就是要快。 以前在钉钉“创业”的时候,我们信奉的一句话叫“天下武功唯快不破”,也就是要狂奔,不仅要比对手跑得快,还要比平台跑得快。我个人总结这段经历时,很感谢微信团队当年的“不杀之恩”,因为这个剪刀差让钉钉逃出生天。 现在大环境已经变了,2C类的创业公司干到一定的程度只有两条出路,要么被人碾压,要么被人收购。如果问现在还能不能搞出一个滴滴?我认为没机会了。在国内目前的平台格局中,C端场景几乎没法独立跑出来。因为巨头都在背后,基本是蓄势待发且虎视眈眈,一旦某个领域的PMF被验证,就能够直接以他们的资源和用户快速碾压初创公司。 甲小姐:当时滴滴能出头但现在没机会的核心变量是什么? 张斯成:当时滴滴快的开始的时候,巨头内部也不确定该不该下场做,而且当时可以做的业务机会非常多,它们甚至都无法抽身来投入出行领域。但现在巨头普遍处于机会匮乏和饥渴的状态,一旦开始互卷,创业公司几乎没有胜算。 甲小姐:如果现在有一家初创公司还想做C端,它的机会是什么? 张斯成:如果要做C端,就做国际市场。如果要在中国做,就做B端。 甲小姐:国际市场也会面临巨头厮杀。 张斯成:但国际市场足够大,国际上的巨头基本会比较包容,如果哪家创业公司做得不错,他可能直接收购,而不会用自己的体量把它碾死,这是国内外创业生态的不同。 所以选择2C领域的创业公司只能靠速度,在夹缝中迅速推出爆款产品,以忠诚用户的体量来形成护城河,否则很可能帅不过三秒就被巨头碾压了。但2B领域还是有很多机会的,从过去十年云计算/SaaS的发展历程看,大平台也很难靠规模化来席卷企业服务领域,因为这是一个为差异化付费的市场。 甲小姐:你认为国内现在对ChatGPT还有哪些待解的命题? 张斯成:现在所有人关注的主要问题是,ChatGPT到底如何在中国落地?因为中国现在没有一个真正的ChatGPT,百度的文心一言出来后可能会面临一些挑战。 另一个比较大的未知因素是:国家到底会如何监管? ChatGPT这类产品,从知识属性上看是一个认知教育工具,对内是教育,对外是认知作战,到处都有价值观的痕迹。在某种程度上,OpenAI的ChatGPT,和好莱坞的电影工厂起到了类似的作用,有意或无意中传播了西方的价值观。因为训练模型时使用的语料分布在很大程度上就决定了它输出内容的倾向。 目前为止,LLMs(大语言模型)的机理依然是黑盒子,我们也无法通过调参来确保它的输出是符合认知教育所要求的。在这种不确定性下,结合对社会性数据安全的考量,我估计中西方之间未来大概率会“划洋而治”,各自扶持ChatGPT类的产品。 甲小姐:你认为此时此刻市场对ChatGPT的认知存在某些普遍的误区吗? 张斯成:现在很难判断对和错,但比较明显的误区有两个: 首先是一个认知误区,以ChatGPT为代表的生成式AI,实际上是生产力工具,可以帮助人类提效,但很难取代人类的角色。它可能逐步会取代个别工作种类,如果结合机器人本体还可以帮助人类摆脱某些不适合人类的工作。但在相当长一段时间内,它对多数人而言是一种高效的神器,能够更好地提高工作和沟通效率。所以,公众和媒体不用杞人忧天,可以试着回想下iPhone出来之后社会整体的改观和进步。 其次,我认为当下某些观点狂热过头了。ChatGPT爆红之后,这类AI技术的确会改变很多生产关系,持续引发一系列的场景升级,但它本质上并没有将生产力提高量级的能力,离“工业革命”带来的震撼还很远,因此不用刻意鼓吹。 人类离AGI(通用人工智能)的实现恐怕还有相当长的一段距离,ChatGPT只是隐约间为黑暗中前行的人类投来了一道曙光。过去十年的经验证明,很多创新是经不起鼓吹的,开始有多狂热,最后就有多少一地鸡毛。例如区块链、加密货币、Web3.0几乎都是这样,如果最初让他们安静地发展,反而有可能展现出真正的价值。 我个人相信AGI的时代一定会到来,但这中间可能还需要经历50甚至100年,我们这代人能不能看到需要打个问号。所以现阶段不要神化ChatGPT。神化一个事物会往往会带来恐惧,这种恐惧对于创新的发展来说是不利的。我们要有信仰,我们更需要朝着信仰奋斗的土壤。 甲小姐:我一直认为试错和犯错是两件事。科技创新本身需要试错,比如OpenAI在窗口期做了这个大规模的社会实验。但如果我们在试错阶段就把它摁住,把试错当犯错,无法进行社会数据的采集和社会实验,我们的差距可能越拉越大。 张斯成:你说得非常正确。某种程度上,过早过严的监管很可能会遏制创新。我们可以表达乐观,但不要神化它,也不要丑化它。ChatGPT归根到底还是在AI大范畴下的,它如何创造更高的生产效率,帮助国家发展经济,帮助百姓提高生活体验,这是关键所在。返回搜狐,查看更多 责任编辑:
甲小姐谈ChatGPT:为了不沦落为“废话文学”,必须思考清楚几个议题|甲子光年
作者 | 甲小姐 本文导读: 1.功能性vs人格化:两种本质相反的牵引力 2.不用可信vs必须可信:少部分人细思恐极,大多数人惶然而不自知 3.真命题vs假命题:AGI不是一个好命题 4.商业价值vs商业模式:发明电灯的人不一定直接享受到电力革命的红利,却依然值得歌颂 5.理论洁癖vs暴力美学:长期信仰来自深刻理性 6.有意瞄准vs无意击发:一场企业家精神对科学界的反哺 1.功能性vs人格化:两种本质相反的牵引力 ChatGPT作为史上界面最朴素却圈粉最快的科技产品,给人的冲击感不是发生在眼球层面,而是颅内层面的。 火到“上头”背后有两重原因: 一方面是功能性的胜利,如帮人们写作文、编程、收集结构化资料,其内容生成的速度和质量甚至超出很多在AI行业深耕多年的从业者的预期; 另一方面是人格化的胜利,它会理解意图、声明立场、表达恭喜、道歉、自我修正答案,并拥有上下文的记忆连贯性,体现出实时的自主学习能力,简言之,就是“像人”。 打个比喻,因为渴望飞行又没有翅膀,人类造出了飞机。一直以来,AI界一直在“造飞机”,之前各类突破性进展都让飞机的功能性越来越强,而ChatGPT却似乎造出了一只“鸟”。这也是为什么ChatGPT被很多从业者定位为“通用人工智能(AGI)”雏形的原因。 功能性与人格化看似在这一代ChatGPT上得到了平衡,但从本质看,二者有着相反的牵引力。 如果追求功能性,重点是回答本身的正确、精准、靠谱,最好其回答有明确的可溯源的出处。排除写作文等本来就需要发挥创意的功能,不同人问同一个问题应该有类似的答案(千人一面),因为大部分功能性问题是在寻求正确解或最优解。这更像“改进版搜索引擎”,New Bing就是这么做的,这有其明确的价值,却不是革命性的体验; 如果追求人格化,重点是交互感、创新性、超预期,意味着不能有死记硬背的感觉,因为死记硬背并不是人类学习与交互的惯性方式,这意味着回答要有个性、丰富性、多样性甚至狡猾性。 诡异的地方恰恰在于,后者往往比前者看起来更“聪明”,更“机灵”,但往往更“不可信”。 在今天版本的ChatGPT中,你可以轻易诱导它犯错,而且它会犯许多出乎你预料的错,有的回答会一本正经地胡说八道,有的回答会陷入滔滔不绝的“废话文学”,但由于它的表达方式足够讨巧,会认错、道歉,会自我“澄清”,因此这甚至让你感到开心、好玩、可爱――ChatGPT正是以人格化特征建立了用户心理的“容错性”,而这也是为什么人格化相比功能性是今天ChatGPT大火更显著的助燃剂(大家纷纷在朋友圈晒问答,被分享的段落绝大部分是ChatGPT表现出情商的片段、超预期的部分、搞错的部分)。 在诸如“评价一下甲子光年”这样的问题中,ChatGPT的回答是带有狡猾性与迎合性的。如果你在对话前文表达了对甲子光年的认可,ChatGPT马上就会附和,是一个机灵的捧哏,但换个人再问,回答立刻变成不知道――ChatGPT只是在当前对话中根据用户反馈进行修正,当我们重启一个对话,测试相同的问题时,ChatGPT会表现出失忆或犯错。 从原理看,今天的ChatGPT之所以给人一种很强的“理解力”,是因为ChatGPT是“重新表达”材料,而不是从数据库中逐字引用,这让它看起来像一个学生用自己的话表达思想,而不是简单地重复它读过的东西。 “重新表达”和搜索是两件事――正是因为这种“重新表达”,造成了ChatGPT“理解”了材料的“错觉”。 然而,举一反三和胡编乱造间有一个微妙的界限,这个界限在人与人之间的对话中往往也是模糊的。这就引发了一个关键问题:ChatGPT可信吗? 什么是可信?如何辨别其回答是否可信?这些问题背后,还有一个前置性问题:ChatGPT的一系列延伸价值和未来想象,是否需要建立在“可信”的基础上? 2.不用可信vs必须可信:少部分人细思恐极,大多数人惶然而不自知 很多人想当然地以为,现在不够“可信”,是因为模型还不够大、数据还不够多、技术还不够强,或者是因为缺乏安全技术与监管手段,这是对“可信”的理解还不够透彻。 内容分两种,一种的本质属性不依赖“可信”,一种的本质属性必须“可信”。 前者往往是kill time(消磨时间)类型内容,核心是抓住用户的时间,占领时间越多越好,用户越上瘾越好。典型代表是今日头条、抖音、各类游戏。字节系诸多产品最初都以放弃可信度换取UGC的海量内容,以个性化取代了绝对权威,以“最适合的”取代了“最优解的”。文章视频从相对高门槛的作者生产、编辑分配,变成相对低门槛的用户生产、算法分配,构建了算法推荐的世界; 后者往往是save time(节省时间)类型内容,核心是准确、科学、实用、工具属性,典型代表是搜索引擎、维基百科。很多人近来逐渐减少在搜索引擎上投入的时间,转而去知乎甚至B站搜索,也恰恰是因为商业导流的泛滥和各巨头间内容围墙的普遍存在,搜索结果正变得没那么可信、没那么直接。 对准确性有强诉求的人群将很快发现,如果无法保证ChatGPT的可信度,而对生成内容的校验方式又需要回归到搜索引擎,或者需要溯源内容出处以做再判断(New Bing就是以罗列出处链接的方式来嫁接回答内容与可信出处),其价值将大打折扣。试想,如果ChatGPT每一次给我的回答,我都要交叉验证,那不是多此一举吗? 特德・姜在《ChatGPT是网上所有文本的模糊图像》一文中写道:“任何对内容工厂有好处的东西都不适合搜索信息的人。”他用压缩算法做了一个类比:如果一种压缩算法被设计成在99%的原始文本被丢弃后重建文本,我们应该预料到,它生成的很大一部分内容将完全是捏造的。 换言之,需要kill time的人和需要save time的人往往是两拨人。需要个性化生成式内容的人和需要搜索引擎的人的本质诉求是不同的。前者是“1到正无穷”,需要创意和与众不同,不存在“最优解”;后者是“无穷中寻一”,需要精确、准确、正确,要无限逼近全局最优解。 ChatGPT是为了kill time而生还是save time而生呢?两条路都有巨大的商业前景,都不可怕,但最可怕的是:你似乎是可信的,但其实不然。最怕的是你以一种看似可信的方式,出现在了需要可信的场景,却交付了不可信的内容。 当然,一个自然的问题是:能不能既要也要呢?能不能在消除不可信的同时,保留人格化、创意化的天马行空的部分?这是一个目前业界各类产品都未能验证的期待。 可信意味着可记录、可验证、可追溯、可审计,而这很可能与大模型理念的本质就是冲突的。我们在昨天的文章里写到,考虑到安全隐患,ChatGPT的发布公司,OpenAI,在安全保护机制方面对ChatGPT进行了较多限制,ChatGPT似乎正因此处于一种“情绪崩溃”的状态。(见《第一批因ChatGPT坐牢的人,已经上路了|甲子光年》) 我之所以这么早强调“可信”这一点,是因为随着大型语言模型生成的文本在网络上发布得越多,网络整体的信息质量就变得越模糊。伴随信息过载,可信愈发困难,而“可信”这个问题越晚一天解决,就越难解决。用我同事涂明的话说,就是“其实信权威和信机器没什么两样,如果机器个性化更强,最后就可能变成信自己,信息极化。” 从“个性化捧哏”到“个性化忽悠”只隔着一层窗户纸。少部分人细思恐极,大多数人惶然而不自知――难道出路在于“每个人都是自己获取信息的第一责任人”? 3.真命题vs假命题:AGI不是一个好命题 前文提到,ChatGPT被很多从业者定位为“通用人工智能(AGI)”,因为从产品效果来看,ChatGPT的智能水平已经表现出某种人类心智的特征,有人格化属性,有灵动的“有机感”。我们知道有机物和无机物最本质的区别是有机物含碳,但AGI与非AGI的边界却没有这么清晰。 为什么?因为AGI本身就不是一个真命题、好命题。 字面意义理解,AGI为“通用人工智能”,而什么是通用?什么是智能?人脑算通用吗?文理科生的思维逻辑与知识储备差异极大,从字面意义理解,人脑也不算通用智能。从沃尔夫假说来看,语言是思维的映射,母语英语的人和母语中文的人,本身思维方式就呈现出巨大的不同,脑补能力也不同。 那么,什么是“理解”? 如果一个大语言模型已经编译了大量学科术语之间的相关性,多到可以对各种各样的问题提供合理的回答――我们是否应该说它实际上理解了该学科? 这是一个哲学命题,我的答案是,能表现得理解,就是理解。 关于“理解”乃至“意识”,人类自己也始终没有精准定义。我们做AI,并不是要从原理到外在复刻一个人类大脑,只要表现出人类对话的外在特征,就可以定义为理解与表达。(否则还能怎么办呢?) 有很多网友质疑ChatGPT并非强人工智能,理由无非是“ChatGPT虽然能够做到XXX,但是它并没有理解”,这种质疑相当于是在争辩“如果一个智能被机器实现了,就不能被叫做智能”,这是悖论不是辩论。或者说,今天争论ChatGPT是“强人工智能”还是“弱人工智能”,也许不是一个真问题。 一个更务实的问题是:这个“9岁儿童”的智能会在“18岁成年”时长成什么样子?其极限在哪里? 圣塔菲研究所前所长Geoffrey West在科普书《规模》中揭示了规模法则(scaling law)。在West眼中,有一种不变的标准可以衡量看似毫无关联的世间万物――无论是生物体的体重与寿命,还是互联网的增长与链接,甚至是企业的生长与衰败,都遵循规模法则。规模法则关心复杂系统的特性如何随着系统大小变化而变化。 以规模法则的视角看待ChatGPT背后的大模型,一个自然的问题是:模型一定是越大越好吗?如果数据量足够大、算力足够充沛,是否AI的效果会无限上扬? 面对这个问题,业界多方的答案是Yes and No。 持Yes观点的人认为,现在的“大”并不足够大。 从历史角度看,上世纪60年代,图灵奖获得者马文・明斯基在批判第一代神经网络时,认为它所需要的计算量很大,当时他说的“大”指的是数十KB。如今看来,这种规模是极小的。试想一下,在二十年后,今天的大模型是否还能称之为大模型呢? 从用脚投票角度看,不同公司的LLM(Large Language Model,大语言模型)基本都是基于Transformer构建的自回归、自我监督、预训练、密集激活模型,他们接连表现出惊人的能力,证明了more is different。 从内容类型角度看,目前ChatGPT还是针对文本对话或者写代码,下一步一定会拓展到图像、视频、音频等多模态,乃至逐步纳入AI for Science、机器人控制等领域,这是通往AGI的必经之路,目前只是刚刚开始,在短期的未来,当然要一鼓作气地做“大”。 持No观点的人认为,大模型虽好,但其性能有一个上限,虽然这个上限尚不明确。 从通用性的角度看,目前的基础大模型不会选择根据低频数据更新参数,否则大模型就会因为对某些长尾数据进行过拟合而失去通用性。 从专有领域的角度看,硬件在进行推理时,往往无法承载超规模的预训练模型,人们需要针对具体应用进行模型的裁剪和优化。此外,专有领域也不一定需要超大规模的模型,不恰当的网络架构也许会造成对计算资源极大的浪费。值得一提的是,GPT-3 之所以取得了非常好的效果,并不仅仅是是因为“大”,也包括他们找到了一种“提示”的方法,这些方法也可以应用到非常小的模型上。 从数据供给的角度看,《Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning》(P Villalobos, J Sevilla, L Heim, T Besiroglu, M Hobbhahn, A Ho [University of Aberdeen & MIT & Centre for the Governance of AI & University of Tübingen] (2022) )的估算结论是到2026年左右,高质量的NLP数据将会用光,低质量NLP数据会在2030到2050年用光,而低质量图像数据会在2030到2060年用光。 这意味着:要么到时我们有新类型的数据源,要么我们必须增加LLM模型对数据的利用效率。否则,目前这种数据驱动的模型优化方式将会停止进步,或者收益减少。 研究表明,可用数据将在未来被“消耗殆尽” 此外还有一些问题:我们还没有充分使用已有的数据;超大规模模型的调优问题还没有被解决;如何从预测任务迈向决策任务……一个最本质的问题是,是否给出足够的时间、足够的钱、足够的数据,所有问题最终都能够被大模型解决?大模型的极限在哪里? 比尔・盖茨评价ChatGPT出现的重大历史意义不亚于互联网和个人电脑的诞生,这个表述究竟是否高估,与大模型这条能力曲线的走势息息相关。 4.商业价值vs商业模式:发明电灯的人不一定直接享受到电力革命的红利,却依然值得歌颂 另一种对ChatGPT的普遍担忧是成本问题。 有网友表示:“训练大型人工智能模型的成本已在数量级上逼近人类愿意拿出来的最大成本,若人类的总功率增量不能加速,模型参数的持续增长无法加速。” 对此,我更认同理想汽车CEO李想在朋友圈的表达:“搜索引擎公司看待ChatGPT的成本,和燃油车企业早期看电动车的成本如出一辙。他们都在想:这么高的成本,咋盈利呀?” 今天,用成本与收益的角度来评价ChatGPT为时过早。对于突破性技术进展而言,从一开始就以商业维度来考量似乎有失公允,质疑ChatGPT烧钱,类似于质疑探索航天事业烧钱。 首先,AI行业本身就有工业界反哺科学界的特征。类似ChatGPT这种迈向AGI之路的探索看似发生在工业界,但其价值本身是外溢出商业范畴的,是科学进展的重要组成部分。发明电灯的人不一定直接享受到电力革命的红利。但如果拨开时光机回到过去:是不是应该鼓励发明电? 其次,就算在商业语境范畴内看待这项技术,如果一项技术的成本只是时间问题,如果可以证明其成本随着时间推移会逐渐降低到合理值,那么这就不是一项技术在早期阶段需要被挑战的“主要矛盾”。新兴技术的账怎么算,我个人的观点是,更需要去看这条道路的第一性原理,而不是过去、现在、未来几年烧不烧钱,能不能赚钱。 再次,ChatGPT离赚钱没那么远。以ChatGPT对程序员的助力为例:依据GitHub的数据,2021年,中国有755万程序员,排名全球第二。放眼全球,程序员数量已经超过7300万,比2020年增长了1700万。根据预测,2025年GitHub上的程序员估计能达到1亿。这里面,随便几个百分点的降本增效,都是一个巨大的市场空间。此外,大家很关注ChatGPT对搜索引擎的替代,但另一个巨大的市场是office类产品、在线文档类产品和ChatGPT的融合――如果能够让写word、做Excel、画PPT的效率提升50%,我会毫不犹豫给甲子光年全员开通付费账号。 一直以来,我都认为“商业价值”与“商业模式”是两件事。商业模式有两种,一种是人为事先设计的,另一种是做好商业价值之后伴生而来事后总结的,伟大的公司往往是先有商业价值而后有商业模式,而不是相反。对于技术突破而言,模式永远是结果而非原因。在本该求因的阶段求果,可能抓错了主要矛盾,也丧失了战略机遇。至少,我国AI距离世界最先进水平的差距并不是财力。当然,考虑到成本问题,未来也许会出现“股份制大模型”,多方群策群力,共建超级平台,这都是“术”层面的问题。 5.理论洁癖vs暴力美学:长期信仰来自深刻理性 托马斯・库恩在《科学革命的结构》中提出,科学进步的轨迹是跳跃式的。科学通过“革命”的方式进步,通过摆脱那些遭遇到重大困难的先前世界框架而进步。这并非一种朝向预定目标的进步。它是通过背离那些既往运行良好、但却不再能应对其自身新问题的旧框架而得以进步。 这个角度看,我们无疑正在经历一场关键的科学革命。相比于其他学科以及早年间的AI派系,今天的AI行业更趋近于一场集体的范式迁移,这是由底层哲学观牵引的。 ChatGPT背后的GPT系列体现了LLM应该往何处去的发展理念。很多人开始相信,揭开AGI的真正钥匙正在于:超大规模及足够多样性的数据、超大规模的模型、充分的训练过程。这条道路看似朴素,却足以让AI表现出智能“涌现”的能力,未来也许会持续带来意想不到的惊喜和惊吓。这种思想简言之就是将“参数至上和数据至上”的思想发挥到极致,从细分技术“分而治之”到“大一统、端到端”,从理论洁癖走向暴力美学。 OpenAI并非这种哲学的奠基者。1956年达特茅斯会议首次提出“AI”概念后,AI路径之争、派系之争始终存在。自深度学习诞生以来,AI行业的发展越来越像是一个暴力的拟合机器,多次里程碑节点都来自于LLM模型规模的增长,而非突破性理论的推动(当然不能说大模型没有突破性技术,只是这种技术的实现路径不是理论洁癖者所甘心的画风,比如做超大规模的LLM模型对技术团队的工程实现能力要求是非常高的,仿佛“驯兽师”一般,包含无数技巧、脏活累活)。 ChatGPT之所以到达今天的高度,是OpenAI坚持信仰的结果。OpenAI基本坚定地把LLM看做是通往AGI的一条必由之路。2018年OpenAI提出GPT模型,在风头不如BERT的情况下,再次提出GPT-2模型;随着Google提出T5模型之后,再次提出GPT-3模型,今天依然在同样的路径上矢志不渝。 这颇有“以凡人之身躯领悟天之意志”的决绝感。大部分人都是因为看见才相信,OpenAI对技术判断的前瞻性和其笃定信念是黄金一样可贵的东西。 我的观点是:信仰一定不是凭空产生的,信仰是需要对问题的深刻认知才会产生。OpenAI看似疯狂,却一定不是无脑all in。我一直相信长期信仰(而非短期狂热)的背后是深刻的理性。 此外值得一提的是,今天的热潮正在推动着国内很多宣传与决策的快速跟进,这种跟进往往是建立在认知还没有清晰之前,这很容易导致“走偏”。我个人并不期待AI的发展需要全球走向完全相同的路径。这不仅容易偏废,也会导致产业的脆弱性――人各有志,AI为何不可多样性呢。就算是直接对标效而仿之,每一次弯道超车也要清醒论证,否则可能不是弯道超车,而是弯道翻车。 6.有意瞄准vs无意击发:一场企业家精神对科学界的反哺 最后说点题外话,这次ChatGPT的爆发,让我想起了八个字“有意瞄准,无意击发”――这八个字用来形容狙击手。你需要像狙击手一样专注,朝对的方向,心无旁骛地瞄准,至于兔子什么时候出来、枪什么时候会响,只是时间问题。 历史是在钟摆声中进步的。回顾人类文明发展史,在古代,人们还没有掌握万有引力定律和牛顿定律之前,可能会直接记录下物体各种运动现象,用眼睛而非逻辑去研究星星,而万有引力定律和牛顿定律之后,方法自然不一样了。打个比方,人们通过观测、记录来研究星星,正如大模型;人们发现万有引力定律,就是理论突破。大模型→理论突破→大模型→理论突破,文明进步总是在螺旋中上升。当理论越强,对模型的依赖越小。 感谢ChatGPT在岁末年初交付关键一役,业界已经冰冷太久。此时此刻的全球科技产业界士气大涨,就这一点而言,OpenAI已是功不可没。自我2015年开始写和AI相关文章开始,冷冷热热也经历了好几轮。ChatGPT再次验证了科技行业的不变真理――高估低估常有,但永远没有盖棺定论的一天。 科技行业永远需要鲶鱼。ChatGPT与其说是热点,更应该定位为拐点。所以,无论ChatGPT的高温天气能持续多久,我都愿意为其添一把火――这是一场企业家精神对科学界的反哺,一场好久不见的暴力美学,一场技术信仰的胜利。
版权声明:除非特别标注原创,其它均来自互联网,转载时请以链接形式注明文章出处。