chatgpt爆火后的冷思考 chatgpt为什么这么火
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
早在去年chatGPT发布的时候,国内就有相关从业者开始利用先知优势,为国内用户提供付费注册体验服务,这个月流量爆破之后,chatGPT的国内相关赚钱的项目开始浮出水面。卖账号:最简单粗暴的赚钱之法通过提供代为注册chatGPT账号的方式,收取一定的服务费。最早在电商平台售卖,一般价格在5到15元不等,根据账号是否独享等费用有所区别。电商平台封禁相关关键词后,转到抖快小红书等自媒体渠道或者微信私域渠道,提供服务的相关方数量增加后,价格略有下降。相对直接售卖账号,还有一种增值类的玩法,算是给小白的一揽子解决方案。众所周知,因为一些原因大部分人是无法直接访问chatGPT进行体验的。因此,就出现了捆绑销售或者产品包类的解决方案。搭配科学上网套餐,用户直接购买后实现直接访问chatGPT。一般该类套餐的价格在200到300元之间。如果套餐内的代理服务器比较稳定,这个价格比单买贵不了多少。广告联盟:大流量的变现之路大部分人出于对chatGPT的好奇,只想简单体验一下,未必想要长期使用的。于是该变现会是整个项目流量变现的大头。通过自媒体短视频或者微信公众号获取的目标用户流量,给予一定的免费体验次数。如果用户还需要继续体验,则需要关注公众号或者观看广告视频等方式解锁。当然,首次打开小程序体验的开屏广告也是重要的变现方式之一。这种方式下,需要有持续的流量进入以及转化链路设计,比如如何引导新用户观看视频广告,简洁的使用说明等。定制化服务:高客单价的转化思维部分土豪用户希望获得更专业的服务或者基于企业的定制类开发集成,而推出的产品包。目前看到的最贵的是单月900元的收费。仅就chatGPT而言,目前的信息源了解到的,尚未发布定制类的版本,仅有chatGPT plus的收费版本或者开放API接口。因此大部分售卖定制类的大多接入国内某个人工智能或者给一个chatGPT plus版本接口。结语
chatgpt开源吗
通过聊天对话方式,它可以写报告、做作业、写代码、写论文……这些贴近日常的刚需和特点,既能戳中普通人的痛点,又很接地气。ChatGPT的火爆是技术工程和服务产品的胜利。
{
2023年春节刚过,ChatGPT就像春天里的一把火,引爆了沉寂许久的AI行业。
2023年春节前的一天,家住南山的林先生一家围坐在一起聊天。“ChatGPT到底是啥?”林先生好奇地问在大学读书的女儿,“就是大学版的‘作业帮’”,女儿回答说。“不会吧?就只是给大学生写论文的?”一时也说不清楚这个ChatGPT到底是啥的林太对女儿的回答不认同,她开始留意有关ChatGPT的相关消息。
根据2月1日瑞银发布的一项研究报告显示,仅仅发布两个月,ChatGPT月活跃用户已达1亿,这是历史上增长速度最快的应用。
ChatGPT给出的自定义是:ChatGPT 是OpenAl公司推出的一种聊天机器人技术,它是基于Transformer模型的语言生成模型。这项技术在自然语言处理领域取得了显著的成果,它能够生成逼真的人类语言回答,并且在多种应用场景中得到了广泛的使用。
真的可以写论文
就像林先生的女儿说的那样,ChatGPT的确可以写论文,美国一项针对18岁以上学生的调查显示,有89%的人通过ChatGPT完成作业,50%的人借助它来写论文。
“做论文提纲很棒,但生成论文的文字有点乏力、偏八股,而且多数情况下也只能生成500字左右,但比人快。”用过ChatGPT的小费同学表示,用过之后感觉对话非常理性,AI痕迹略重,重复率很高,写出的稿件需要再润色一下。虽说使用效果没有那么理想,但小费还是直呼找到救星了,不再为写论文掉头发了。在试用多次后,小费还总结说,虽然ChatGPT自己认为,作为AI模型,可以生成任意长度的文本,但每次使用ChatGPT时,最好是提出非常具体的要素,那样答案才会更加具体,所以写论文通常都是一个段落一个段落找它写。小费觉得最方便的是,回答的内容可以随时中英文切换,非常方便。
林太在浏览网上有关ChatGPT消息后也注意到,自ChatGPT问世以来,产生了不少有争议的使用方式。例如,有学者用ChatGPT写论文,并把其列为作者;有学生使用ChatGPT写作业等。事实上,有消息称自2月份以来,国际上各个主流的学术会议以及学校,都禁止使用ChatGPT等AI工具进行论文和作业的写作。
“满足了我对AI的所有幻想”
除了写论文,ChatGPT还可以做很多事情。林太尝试着让ChatGPT写了几个选题。以业内人士的角度读了文章后,林太最大的感受是写得已经非常靠谱了,最亮眼的是,写出的东西背景资料比较全面,这要是专业人士来写的话,至少要提前做些功课,而用ChatGPT来写的确省下很多时间。
在某互联网大厂工作的张涛觉得,最早的AI虽说可以实现自主创作,但没有产生价值,如果把最早的AI比成刚出生的婴儿,那这次ChatGPT的出现就像是已经成长到四五岁的孩子,不仅能听懂大人的话,还会主动说话,使用一些工具。“ChatGPT真正实现了我们所期望的AI的样子。” 张涛表情认真地说。
“ChatGPT满足了我对AI的所有幻想,全程没废话,专业且利索,在使用后就有种想马上分享给大家的强烈欲望。”在去年12月就开始使用ChatGPT的深圳90后UI设计师萨姆兴奋地表示。在开始使用时不熟悉用法,用经验对比判断感觉与电商的智能客服没啥区别,在了解了玩法后,发现不仅可以使用它,还可以训练它,基本上能完成自己想要的事情。萨姆认为,ChatGPT未来场景充满想象力,随着AI文字、绘画等技术的成熟,元宇宙实现不是没有可能。
“超级棒!爱了,爱了,爱了”。互联网从业者小李在试用后说,“帮我写视频文案,吸引眼球的视频标题,还可以3分钟帮我创建一个网址。使用ChatGPT结合excel,工作效率提升10倍,写出的代码也超级牛,自己想不到的,它也会帮忙提示出来。”
接地气的聊天戳中普通人“痛点”
“ChatGPT真的很犀利,有一种感觉就像在和真人聊天,而且它无所不知。”有用户表示,ChatGPT不像其他的搜索工具,给出的回复都是没有加工过的原材料,它就像你要什么菜直接点,给你炒成了可以上桌的菜一样。
“此前AI让大家很失望,虽然在人脸识别等方面有所突破,但是场景非常有限;阿尔法狗的问世虽然让人兴奋,但也更像一个游戏。”360创始人周鸿t认为,“以前AI发展过程中有很多非常好的技术,百姓往往是不能理解的,很多时候无法实现出圈。现在ChatGPT有非常好的场景,通过聊天对话方式,就可以解决写报告、做作业、写代码、写论文等问题,这些贴近日常的刚需和特点,既能戳中普通人的痛点又接地气。”
“ChatGPT是通过一个上千亿参数的大语言模型,相当于把网络上很多人类的知识都进行了理解和训练,模拟了人脑对知识的储存,使得回答问题完全像是跟一个成熟、油滑的人对话。”周鸿t举例说,以前跟网络机器人聊天,总感觉比较奇怪,因为它的背后逻辑是获取我们文化的关键词,然后去搜索相关内容,僵硬地推送回来。而ChatGPT则是通过很多大语言模型,进行模拟和训练,模拟了人类大脑的存储和处理能力,最终做到了很多问题虽然言之无物,但是滴水不漏。
浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林分析认为,ChatGPT主要应用是AIGC内容创作和代码创作,其中对于普通人来说,AIGC内容创作是关键,ChatGPT在算法逻辑上,在上下文语义理解上,的确有过人表现。
盘和林分析, ChatGPT作为一个人工智能模型,真的在产出类似人类的常识、认知、需求和价值。比如提问ChatGPT对很多社会问题的看法时,它可以从“广大群众”的角度,通过客观理论的推理来进行解释,从而提供具有社会价值的答案。
“而从技术角度来说,它因为引入了新的算法技术RLHF,即基于人类反馈的强化学习。可以说,ChatGPT的火爆是技术工程和服务产品的胜利。” 盘和林指出,过去我们更为常用的是LLM,也就是大型语言模型,但是它的建模过程中并没有显式的引入人的偏好和主观意见,因而就缺少了人们从ChatGPT上面可以找到的“人的味道”。
中国科学技术大学信息科学与技术学院教授宋彦分析认为,ChatGPT火爆的原因有很多,“我认为其中最重要的是,它能够满足用户的需求,极大地提高生产效率。ChatGPT可以回答问题,相比于使用传统搜索引擎,这种方式能够更快地得到答案。ChatGPT还可以生成各类的文本,这对于文字工作者来说,就可以极大程度地减轻其工作量。对于有些场景,甚至只需要对ChatGPT生成的文本做简单的修改就可以了。对于主要从事文字工作的单位来说,ChatGPT可以实实在在地起到潜在的减员增效的作用,这也就确保了ChatGPT一定具有庞大的市场,这也导致了国内外各个头部企业,例如谷歌、百度等,争相研发ChatGPT的竞品。这也进一步导致了ChatGPT的火爆。”
ChatGPT要动人类的奶酪?
以前微软的小冰、百度的小度、小米的小爱同学面市后,林太都曾第一时间试用过,但在林太看来,它们只是智能音箱产品,好玩、好用,增加了生活的趣味性而已,并没有想到会对自己工作产生多大影响。但随着ChatGPT的出现,林太多了一丝恐慌,“AI真的要取代我的工作了!”这或许并非杞人忧天。
“已经不用等到35岁中年危机了,我现在就很有危机,以前从来没想到会被AI逼着‘内卷’”。张涛体验过ChatGPT也表示,这一次“狼”真的来啦!
对于这种对职业的担忧,多数专家学者并不认可。
“人类社会中,技术的高速发展其实就是依赖于社会上越来越多的工作可以被取代,取代之后,我们就可以在它的基础上去做更加复杂的工作,也就是说我们应当站在设施之上,站在巨人肩膀之上,利用这些先进的设施,我们能干比它高得更多的东西。”ChatGPT对于人类来说就相当于工具,不会因为工具的发展,而取代人类部分的脑力劳动。就像电脑下棋,那显然是在地球上下的最好的一个电脑,但是,这并不妨碍人类去下棋。
深圳职业技术学院电信学院、集成电路学院副院长余菲举例说,就好像有机器可以搬重物后,难道人类以后就彻底躺平了?当然不是。在机器去做这些工作之后,人们就可以去做其他的事情了。
余菲分析认为,事实上AI不会妨碍人类去学习或者研究其他的东西。就好像计算机问世后,人类会用计算机去完成更多、更复杂、更伟大的一些东西,计算机只变成了一个底层的工具,人类目前的智力水平远在这些工具之上,这些工具永远只能被人类所用。
“每一项新技术的提出和大规模使用,都会对就业或多或少产生一定的影响,ChatGPT应该也不例外。”宋彦表示,不排除ChatGPT生成的文本有些内容是完全错误或者有误导性的,因此其生成的文本还是需要人工校验和修改。也就是说,ChatGPT目前并不能完全取代人工的岗位,但是它可以增加人工处理的效率,过去需要几个人做的工作,在使用了ChatGPT之后,可能只需要一个人花很少时间就完成了。而越是文字标准化程度高的岗位,受到的影响可能越大;而那些专业性强的领域,受到的影响可能会较小。此外,当前已经有直接受到冲击的领域,比如程序设计,很可能未来的工作模式也会发生显著变化,或许程序员更重要的工作是如何与AI配合实现高效代码撰写和管理。
“从使用者的角度来说,尤其是从业者的角度来看,ChatGPT还未能达到完全取代人工的程度,离我们所追求的最终形态的AI还相差甚远。”宋彦分析认为,ChatGPT生成的文本如果是专业人员审核,可以很快发现其中存在的纰漏,有些内容甚至是完全错误以及带有误导的,这一点近期有不少各行业的专家都有提到。一个明显的短板是,ChatGPT无法对当前最新的热点事件和词汇做出恰当的回应,这也导致了ChatGPT注定需要定期且频繁的维护。而ChatGPT的训练过程需要大量的人工参与,例如数据清洗和标注,这也将极大地提高ChatGPT的维护成本。另外,GPT系列模型从本质上说还是大规模符号的匹配和罗列,只不过比以往的系统规模更大,并未实现真正的推理、演绎乃至“思考”,这与真正的“智能”还有很长距离,这种方式与我们人类完成推理学习仅仅需要少数样本的情况也有很大不同。
“搭不上ChatGPT这班车,很可能会被淘汰”
有专家预测,ChatGPT是人工智能里程碑,更是分水岭,这意味着AI技术发展到临界点,企业需要尽早布局。与此同时,ChatGPT的火爆在国内学术和企业界也引起了不小的震动,很多国内企业都想要打造自己的ChatGPT相关技术或资源。
据了解,截至目前,阿里巴巴、百度、腾讯、京东、360均已在类chatGPT产品或生成式AI赛道上布局。
“要看到ChatGPT的无限潜力,如果企业搭不上ChatGPT这班车,很可能会被淘汰。”周鸿t强调说,这应该是一场革命的开始。他透露说,360不会放弃对该技术的跟踪。
“一些公司如果过去10年在服务器、算力上没有投入,没有做人工智能的团队,也没有几千亿几百亿网页及大数据的存储,这样的公司想搭ChatGPT的车就是来蹭蹭热度。”周鸿t指出,现在人人都在炒这个风,但并不是人人都能搭上这班车,还是在于一个“长期主义”,是否在这方面有相应的技术积累。而其中,有搜索引擎技术能力的公司,是最有机会在这个领域搭上这班车的。
“只有把人类所有知识用来训练AI,才是最强大的。“周鸿t分析认为,目前国内公司一般只能做中文检索。其次,与网页可以实现共享链接不同,智能手机和APP从某种意义上说把数据割裂了,这种割据甚至对立带来信息孤岛,使任何一家都无法实现AI知识学习训练。“倘若这两个问题不解决,即便有与国外同样的算力,可能也会面临很多困难。这需要国家有些相应政策,无论是反垄断还是引领互联网世界更为开放透明。”周鸿t表示。
■请回答,ChatGPT
问:ChatGPT的出现会导致人类培养不出下一个爱因斯坦吗?
答:ChatGPT的出现不会直接导致人类无法培养出下一个爱因斯坦。虽然 ChatGPT在处理某些任务方面可以超越人类,但它仍然只是一种工具,其能力和局限性都受到其训练数据和算法的限制。同时,人类的创造力和创新能力是ChatGPT所无法取代的,因此仍然存在培养出下一个爱因斯坦的可能性。
问:未来人类该如何与ChatGPT相处?
答:未来人类与ChatGPT和其他AI工具的关系将取决于人们如何使用这些工具,下面是一些建议:
1、明确AI的限制: 人们需要了解AI的局限性,并不把它们看作是绝对正确的。它们只是提供信息和结果,而不是最终决策。
遵循道德准则: 在使用AI时,人们应该遵循道德准则,以确保它们不会对他人造成不良影响。
2、充分利用人类智慧:人们应该将 AI 作为工具,并在决策中充分利用人类智慧和判断力。
3、保持沟通: 人们需要与AI保持良好的沟通,以确保它们正确理解人们的要求和需求。
4、继续学习:人们应该继续学习和了解 AI,以确保它们能够充分利用这些工具。
5、通过遵循这些建议,人们可以确保与ChatGPT和其他AI工具的关系是建设性和有益的。它们可以帮助人们更好地解决问题,并为未来的发展和创新奠定基础。
问:如何评价深圳市人工智能发展水平?
答:深圳市在人工智能领域的发展非常迅速,已经成为全球人工智能产业的重要中心之一。深圳市政府高度重视人工智能发展,出台了一系列的政策措施,鼓励企业加大人工智能技术的研发和应用,并且聚集了众多优秀的人工智能企业和人才。
在技术研发方面,深圳市的人工智能企业在计算机视觉、自然语言处理机器学习等领域取得了不少的成果。这些成果已经被应用于很多领域,如智慧城市、智能制造、智能医疗、无人驾驶等。同时,深圳市还拥有一流的高校和研究机构,这些机构在人工智能技术的研究和人才培养方面作出了重要贡献。
总的来说,深圳市在人工智能领域具有很高的发展水平,未来还有很大的发展潜力,可以成为推动中国人工智能产业发展的重要力量。
线索征集
好的故事需要有人去挖掘,好的风景需要有人去发现。@故事发现者,如果有感动到你的故事、你闻所未闻的故事,让你对深圳这座城市的历史和未来有所思考的故事;如果有能让你感受到深圳文脉跳动的景象,让你大开眼界的创意空间,欢迎联系晶报提供“元故事”“观文脉”选题和线索。根据选题和线索的价值,晶报将为故事发现者提供100-1000元不等的报料费。
请扫下方二维码
填写报料线索或故事简介
来源 |?晶报APP
统筹?| 李岷
记者 |?赵军
制图 | 勾特+AI Kala?
编辑 | 李慧芳 邹振民
chatgpt是哪个公司开发的 chatgpt用什么浏览器打开
chatgpt是什么意思,chatgpt国内能用吗,chatgpt中文,chatgpt注册ChatGPT已经成了全球信息技术产业界毋庸置疑的现象级产品。
它以“通用人工智能”的名义,跟人类唠家常,帮人们起草邮件和律师信,回答一些玄奥的终极哲学问题,写一段可用的Python代码,回答一些看似需要复杂和递进逻辑的问题,根据一些人物设定撰写一段电影剧本,书写一首优美的情诗,捉刀大学生的论文作业……似乎人类历史上还没有这么一个全能的AI物种。比尔盖茨说ChatGPT出现的意义“不亚于互联网的诞生”,微软CEO纳德拉(Satya Nadella)说它堪比工业革命,人工智能口头爱好者们又一次惊呼“奇点”来临,普通人再度担心自己的工作被ChatGPT这样的全能型AI助手取代……从IBM的“深蓝”,到Google的AlphaGo,再到OpenAI的ChatGPT,25年过去了,AI在不断进化,人类对AI的日常反应却看不出什么心智上的成熟,这真的是一件令AI开心的事。
我已经用ChatGPT干过诸多不可描述之事,发现它并不能每每得心应手,却能在一些看似更艰深的问题上给出更出色的答案和解决方案。比如你问它比亚迪能不能打败特斯拉,它可能会给出一些结构清晰而无奇、事实谬误颇多同时又毫无个性的论述;但如果你问它自动驾驶将如何改变一辆汽车的工业设计,它倒是能够从底盘革新、内饰变化、数字娱乐和外型突破等方面给出充满由内至外想象的论述。从整体而言,ChatGPT相当的不完美,尤其是在提供令人信服的准确性方面,但它在提供结构化的信息论述、打开想象力和解放创造力等领域经常令人类觉得惊艳。你说不上来它对你有什么无懈可击的具体用处,但它又能帮你实现和完成一些琐碎的、冗余的甚至有创造力的事。
正是这么一个看似无用却有用、看似有用却无用的ChatGPT,推动它的母公司OpenAI被微软追加累计的超过100亿美元的投资,它用两天时间突破100万用户,Facebook曾经花了305天;它突破1亿用户花了两个月,就连TikTok也需要9个月――请记住,与Facebook和TikTok不同,ChatGPT还不是一个独立的消费级互联网产品,它仍然仅是一个采用了GPT-3自然语言模型的包含1750亿参数的大型神经网络――当它被优先授权给微软集成在Office和Bing等办公软件和搜索引擎服务的时候,才真正地变成一个“可用”的产品。
但这已经让中国的人工智能独角兽们够嫉妒的了。
500名员工,公司整体估值接近300亿美元,这是OpenAI;动辄几千人,公司估值/市值充其量10-20亿美元,这是中国的多家AI“小巨头”。
因为人效和价值的巨大差距,更因为ChatGPT对全人类现实社会骤然释放的影响力,ChatGPT的诞生给中国人工智能领域的刺激是不小的。很多人又跳出来了,感慨中美人工智能差距进一步拉大,中国想赶上这波浪潮“任重道远”。还有一些人,又开始热衷探讨为什么中国没有自己的ChatGPT,结论仍然是“中国缺乏创新土壤”和“中国互联网公司都在搞直播和买菜”这样,既不负责又罔顾事实的蠢话。
中国互联网公司并没有都在搞直播和买菜,他们在从事半导体开发、AI模型研究和自动驾驶;美国的互联网公司搞直播、买菜尤其是互联网金融的时候也很风生水起,那些拿着手电筒和放大镜拼命找自己问题,极力美化对手,用遮瑕霜不遗余力涂抹对手的问题,把原因归咎于简单粗暴的理由的人,可以闭上你们的嘴,这不是反思中国为什么不能率先诞生自己的生成式人工智能模型的正确姿势。
作为在人工智能和自然语义处理领域积累最多的中国互联网公司,百度过去五年一直在搞自己的深度学习大模型“飞桨“(Paddle Paddle),甚至用自己的通用AI芯片“昆仑芯”训练自己的模型――它们是百度训练自己的“ChatGPT”的基本环境和前提。阿里巴巴、字节跳动和滴滴也都有基于自身需求的自然语义训练模型。可以说,在训练复杂的上百亿参数的自然语义模型方面,中国的公司和研究机构的“家底”并不薄弱,起点也并不比美国同行低――至少在2016年前后的时候是如此。这几年中美人工智能界在大模型领域产生的差距,不是意识、起点和能力的问题,而是道路和方法的问题。
中国与美国在类ChatGPT的人机对话模型领域的差距,也不是所谓的监管导致的。如果你与ChatGPT就一些更丰富的宗教、文化、民族和地缘政治等议题展开过坦率的交流的话,你会意识到它在看似拒绝和审慎讨论这些议题的背后隐藏着某些特定的立场倾向,是与美国社会普遍公认的主流价值观微妙重合的。可以说,任何一个,而不是某一个自然语义的复杂模型,其模型建构、语料采集、训练和参数调整的过程,都是基于特定价值体系的“内容审查”的过程,都有着维系其价值体系的自觉。我们不是应该不应该在自然语义模型里“生成”中国的价值立场的问题,而是它该如何生成,才能真正地制衡英语主导全球互联网语料库必然导致的世界观与文化霸权,加强中文语言理解基准在全球自然语义处理体系的权重,进而为世界人工智能和人机对话的发展提供文化上的多样性。
我也严重不同意中文互联网信息内容质量太糟糕导致中国类ChatGPT模型语料源头被“污染”的说法,这同样是既偷懒又显得大聪明的判断。因为互联网上的信息总量原因,英语内容无疑是世界上最多的,质量堪忧的极端化内容也是最多的,它们都会影响自然语义模型训练的过程和结果。ChatGPT在早期的训练中优先使用内容质量较高的社交论坛Reddit上的高赞内容,是有特定的语料选择倾向的。如果中国优先选择知乎和得到等知识类社区,以及主流媒体优先作为语义模型的语料库的话,就不存在语料被污染的问题。更遑论以大部分持“中文内容质量低”的人们的外语水平和阅读广度,根本不足以支撑他们的论断。
但是无论如何,ChatGPT的横空出世,对我这么一个多年来一直呼吁“告别硅谷崇拜”的人来说,的确是一个不大不小的刺激,也是一个观念的挑战。
这不是因为我觉得中国和美国在人工智能领域竞争的差距就此拉大了,而是因为ChatGPT这样的通用人工智能人机对话模型,是一个真正可能从全人类――而不是某一个特定领域和行业的角度,推动社会生产协作与文明进程的工具。其意义大于移动互联网的出现,堪比电子邮件和搜索引擎的诞生。作为一个人工智能大国,中国早就不是电子邮件和搜索引擎诞生时期的信息技术产业一穷二白的国家了,但是,我们却没有让这类能影响人类文明进程的通用人工智能的创新首先发生在中国,训练一个基础语料由中国文化与价值体系为建构的模型。
更何况,ChatGPT的模型训练方式,很大程度上依靠的是“大力出奇迹”的参数升级、反复训练和模型依据生成内容反馈持续迭代优化――这原本是中国团队最擅长的工作方法。当一家美国的创业公司用从微软融来的钱不惜代价投入巨额算力成本,大量雇佣非洲和中东的数据工人进行信息标注、用最高效率的迭代与Google这样的巨头进行自研语义处理大模型的“军备竞赛”时,你还是有一种很不真实的感觉――这究竟是一家旧金山公司还是一家深圳公司。
像ChatGPT这样的自然语义处理模型应该可以诞生在中国但却没有诞生在中国,其原因还得从中国从事人工智能的科技公司――无论巨头还是创业公司这些年在干什么开始说。
很多人可能从来没意识到的一个问题是:像ChatGPT这样的超大规模通用自然语义处理模型,由一家AI创业公司建构最可能产生奇迹,而在一家科技巨头内部通常不会实现更好的结果。这就是为什么Google的LaMDA对话应用模型和近期仓促上阵的Bard都没有大放异彩的原因,也是百度接下来势必面临的挑战。
为什么?首先是因为通用自然语义处理建模太烧钱了。其实,烧钱通常并不是大公司的本事,反倒是创业公司的特权。科技巨头几乎都是上市公司,百亿美元级别的投资砸在一项相当长时期看不到回报的事上,首席财务官在面对董事会和股东大会时的压力是很大的,也经常是被股价惩罚的,这导致大公司不敢做大冒险,不大冒险就不会有大迭代。什么叫“大力出奇迹”?就是先花大钱出大力,然后再祈祷奇迹的发生,而不是默认一定得出现奇迹,然后再决定花钱出力。
可惜,大公司只能是后者。这也是为什么即便从ChatGPT受益颇丰的微软,也只敢从一开始的10亿美元,历时四年,直到今年的百亿美元,一笔一笔,持续地追加投资,以支持OpenAI在微软的“体外”,多年如一日地训练GPT模型。微软通过投资OpenAI获得的股权享有整合ChatGPT模型能力进入其Office和搜索引擎的优先权,它未来会不会吃掉OpenAI可能是一件不太好说的事,但至少市值近万亿美元,一年收入几百亿美元的微软,是绝对不敢一开始就“大力出奇迹”,兀自凭一己之力训练这个模型的。
其次,因为人们对科技巨头从事创新事业的容错度很低,而对创业公司的错误和偏差较为优容。Google为了应对以ChatGPT的压力,仓促推出了人机对话测试版Bard,被发现一些对话出现了基本的事实错误,于是被无限放大,市值一夜蒸发千亿美元。事实上Google不是不清楚这一点,要不是被逼急了,它也不会这么冒失。Google在2021年公布的LaMDA模型,参数级别和信息搜索能力都明显高于当时OpenAI训练的GPT-3,但Google迟迟不敢公测其效果,就是因为害怕它出现失误,引发公众的不信任和股价的下滑。
Google在乎的,OpenAI都不在乎。从ChatGPT发布的第一天起,它就公开地说自己没有信息检索能力,语料库也只到2021年12月,更回答不了很多关于价值和道德判断的问题,还经常犯事实错误。对ChatGPT的自我“摆烂”,测试者很宽容地接受了,对它在编程、文学创作、格式化写作、寻医问诊等领域展现的信息关联、情感表达、逻辑结构、思维连贯性一系列能力惊叹不已,对它犯的错误轻轻带过。
2019年3月,在GPT-2模型取得前所未有的成功后,成立了4年的OpenAI决定由一家非盈利的基金会转变成为一家商业公司。毕竟没有任何一家基金会能受得了它的首席科学家年薪150万美元,2019年5月,山姆・奥特曼(Sam Altman)出任OpenAI的CEO。接着,OpenAI获得了微软的10亿美元投资。2020年5月,OpenAI推出的GPT-3模型,参数从GPT-2的15亿陡升至1750亿,形成了一个前所未有强大的自动学习系统。
可见,一家含着金汤匙出生、融得到巨资、有巨头业务捆绑加持的人工智能初创公司,从事通用的人工智能自然语义模型建构与开发,不计成本投入模型训练,是最理想的状态。最强大的模型带来的想象力和商业回报足以刺激微软和其它的投资者。
那么,怎么这个逻辑在中国就跑不通了?中国曾经有没有一个强大的通用自然语义人工智能模型,哪怕就是一个雏形?
要回答这个问题,不妨看看微软首次投资OpenAI的时间:2019年7月。在微软押注OpenAI的GPT模型之后4个月,也就是2019年11月,微软负责必应搜索业务、同时也是微软人工智能最高负责人的全球资深副总裁、中国香港籍计算机科学家沈向洋宣布离开工作了20余年的微软。而沈向洋对微软通用人工智能模型的最后一个贡献,就是由微软亚洲互联网工程院在2014年主导研发的聊天机器人――小冰。
2020年7月,小冰从微软独立出来,成为一家中国的人工智能创业公司,沈向洋出任董事长,原微软亚洲互联网工程院常务副院长李笛出任CEO。小冰独立之际已发展至第六代以上,产品形态涉及对话式人工智能机器人、智能语音助手、人工智能创造内容提供者和一系列垂直领域解决方案。小冰曾经引发公众讨论的,除了充满情感和女性性征的聊天机器人之外,还有它在汉语诗歌创作领域的惊艳表现――她出过一本诗集《阳光失了玻璃窗》,收获了不少好评,以及更多的争议。
毫无疑问,一个能写诗,进行简单情感和基于常识的对话的小冰机器人,是几年前全世界范围表现上乘的对话式通用人工智能模型。
沈向洋主导的团队不可能不懂搜索,更不可能不懂人工智能。而沈向洋从微软出走和小冰的“独立”,加之微软CEO纳德拉主导的对OpenAI的投资和合作绑定,其实是中美最顶级的人工智能操盘手,在通用人工智能模型领域的一次正式的分道扬镳。
那么,今天的小冰,还写诗么?它在做什么?
这两年,小冰早就不写诗了。它在忙着商业化。它成立了游戏工作室,为游戏提供NPC脚本对话内容;它与冬奥会合作,提供自由式滑雪空中技巧视觉评分系统;它为万得资讯提供人工智能生成的上市公司公告文本摘要;它给万科等企业定制了客服专用的虚拟数字人……它在努力地成为一家“赋能”各行各业,同时让自己能造血赚钱的人工智能解决方案公司。
一句话,昔日代表了通用自然语义人工智能模型较高水准、中国人撑起全部格局的人工智能团队,现在成了一个生成式人工智能与决策型人工智能混合的、为具体的场景提供具体解决方案的人工智能供应商。
你不能说这是小冰的“堕落”,毕竟它只从资本市场融资了数亿元人民币。按照ChatGPT的模型训练方法,这些钱一天就花完了。没了微软的护身庇佑,小冰得自己顾自己的命。可是,我也从来没听说过百度、腾讯或者字节跳动,想过要投资小冰,支持它继续搞通用自然语义人工智能的大模型。
不仅仅是小冰。过去几年中国也有其它从事通用人工智能自动建模和异构计算,让国内外7-8种芯片通过该模型接入软件的创业团队,但只要是拿这个模型出来融资,就搞不定任何的一个投资人。中国的投资机构从未表现过对通用人工智能模型的兴趣,和哪怕一点点的想象力。
“超过85%的投资人一上来就要求我们介绍产品的场景,我们说我们帮GPU对接软件生态,连英伟达都用我们的模型,投资人说这个不算场景。我们说我们也有客户,卫星、码头、智慧城市和智慧工业的研究,他们说你干得太散了,我们不投”。这是我自己听到过的做通用人工智能模型的创业者对我的吐槽。
众所周知,中国的VC是最喜欢“教育”创业者的,当然也少不了教育从事人工智能创业的科学家。“你得在这个行业有点数据”,这是他们最爱教育AI创业者的一句话。
在某一个行业有数据,而且要专注在某一个细分领域提供解决方案,这是中国大多数号称投资人工智能的VC和PE们的思维定式。然后看的就是“场景有多大”,安防摄像头的场景足够大,于是估值模型就变成了中国这么大,能安多少个摄像头?每个摄像头多少钱?总的摄像头盘子有多大?好,盘子足够大,摄像头这个细分领域我们投了。再看看港口智慧物流,中国有多少个港口?有多少个是深水港口?每个港口码头能为AI解决方案付多少钱?原来就付这么点儿钱啊,看来“港口”这个场景不够大,那我们不投。AI虚拟数字人做客服?能跟元宇宙挂上啊,那有故事有想象力,好,我们可以投投试试。
所以,你看到的情况就是,中国的人工智能“四小龙”基本都在做摄像头和人脸识别的生意,都变成了AI的项目实施和集成商,商业模式一如30年前的东软和软通动力,自己活得举步维艰,巨额亏损,还得撑着中国人工智能产业的排面,撑着人工智能这一领域的估值和想象力。
在相当长的一段时间内,几乎没有哪个人工智能领域的投资人发自内心地相信一个通用的模型能在各个行业复用。其中偶尔有几个对通用模型有点耐心和兴趣的,基本都是人民币基金,美元基金对中国团队搞通用模型的尝试真的是兴趣阙如。你以为是他们通过对比OpenAI和Google这样的公司的模型训练难度和水平,从而觉得中国团队做起这个事来有差距?那你还真是想多了。他们知道GPT模型研发是怎么回事的时间,也就是最近这俩月的事。
那些大言不惭“在我眼里商汤和旷视就是卖安防摄像头的”的一线投资经理,那些傲然地跟创业者说“你这个模型又不是场景”的一线投资合伙人,更遑论那些历史上几乎不投人工智能,过去这么多年一直在鼓捣中国创业者“出海”搞加密货币的美元投资基金的合伙人,今天都突然摇身一变,宣称要支持创业者搞“中国的ChatGPT”了。那么你倒可以想想,他们的信誓旦旦和踌躇满志,含有几分对通用人工智能模型的理解和真诚,又有几分是投机和算计。
你更可以想想,一个超级自然语义模型的训练可能一天就得烧几千万甚至上亿人民币,更何况现在提供大模型训练的算力模块――世界顶级的GPU,因为美国的无理禁运而变得越来越难以获取。以那些投资人过去这么多年的心性和行事风格,他们又能坚持得了几天,肯说服投委会投多少笔钱进去,还是能帮这些创业团队搞定GPU的问题?不定哪天,弄不好也就半年之后,他们就又开始催着这些做通用模型的团队,尽快“在细分领域实现商业化”。
以百度对飞桨PaddlePaddle模型投入的坚持,尚且不可避免它从一开始就将这个模型产业实践化,尽快追求在不同行业的商业化。而在很大程度上,通用人工智能大模型的训练,存在着海量数据、高质量有创造力的内容输出和产业应用落地的“不可能之三角”。
能实现海量数据和高质量有创造力的内容输出,就势必不能快速应用于某一个产业的具体落地――比如ChatGPT。
要想在人类创造的互联网最大范围的海量数据里创造具体的产业落地场景,就一定无法提供最高质量的结果,因为