chatgpt更新 chatgpt什么时候推出的
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
*本文原创发布于差评孵化的商业财经类帐号 “ 知危 ”
最近,如果你浏览科技和财经类新闻,相信你应该已经被满屏的 “ ChatGPT ”?洗脑了。ChatGPT 的确很强,它可以算数学题、写代码、回答法律、医学、历史以及其他你能想象到的几乎任何问题,并且聪明到会根据提问的细微变化来调整回答↓
虽然它的回答有时有些奇怪的 Bug,但它依然几乎可以吊打市面上已有的对答问话式 AI 了。
奇怪的 Bug,回答对了,但又不对这,让它背后的大金主微软狠狠硬气了一把,因为在此之前很长一段时间,不少人对微软的评价是 “ 自移动互联网时代起持续且惊人地无能?”。火了之后,微软大手一挥,直接宣布将把 ChatGPT 集成到旗下的几乎所有产品里。这下,就显得其他巨头同行似乎有点无能了。。。首先是 Google,因为从 ChatGPT 的聪明程度上来看,微软把它集成到 Bing?搜索里后 Bing 的表现多半会比 Google 搜索好,有市场被抢占的可能性。纽约时报称 Google 向本已经不参加公司日常事务的创始人拉里・佩奇和谢尔盖・布林寻求帮助,以便打赢这场 “ AI 战争 ”。
这则新闻被国内的一些媒体形容成了?“ 谷歌紧急召回创始人 ”,虽然有些标题党,但其实 Google 公司也的确挺急的。他们今天火速发了一个 CEO?公开信,标题是《?我们人工智能之旅的重要下一步 》。
信中说,Google 将在几周后面向公众开放自己的?“?Bard ”?产品,Bard 是基于谷歌两年前开始研究的 LaMDA 模型训练的对话式 AI 。
Bard?的演示看演示你就明白,这玩意儿就是奔着对抗 ChatGPT 去的。国内做搜索的百度也直接一个鲤鱼打挺,同样在今天站出来宣布自己即将推出 “?文心一言?”,这个产品也明显是在对标 ChatGPT 。
百度其实也一直在做 AIGC 领域( ChatGPT 属于 AIGC ),不过之前公开露面的是叫 “ 文心一格?” 的图片生成式 AI,去年下半年上线的。编辑部之前试过一下,让它画一张电影《 唐伯虎点秋香 》里的知名梗 “ 凤凰傲意图 ”,它画了 3 个风格,说实话效果还可以。
但,百度后面推出的文心一言效果会怎么样,还不得而知。总之,Google 和百度的意图很明显:“ 你有我也有,等于大家都没有 ”管他好不好用,先公开喊话自己有做出来类似东西的能力,并且表示很快就能推出就行了。而另一家巨头苹果,也是有些被动,被中文媒体直接推上了微博热搜,词条是:“ ChatGPT 让苹果急了 ”。
这则热搜也多少有些标题党,但也并不离谱。新闻源实际是彭博社的科技记者 Mark Gurman 爆料称下周苹果会举行一个 “ 内部 AI 峰会 ”,并且称这场峰会的举办是受到了 ChatGPT 的影响。毕竟,苹果当年凭借 Siri 获得了不少用户的青睐,现在跟 ChatGPT 一比,Siri 似乎就完全没竞争力了。总的来讲,ChatGPT 成功的引起了巨头公司们的神仙打架。不过,借着 ChatGPT 的爆火,一些人或是公司开始拿 ChatGPT 当韭菜收割机了。比如,人们都很好奇 ChatGPT,想亲自尝试一下,ChatGPT 卖号就火起来了。当然,知危编辑部认为卖号并不算是割韭菜,因为淘宝上一个 ChatGPT 账号一般也就几块到 20 几块不等,并不贵,同时?ChatGPT 注册是需要一个海外手机号绑定的,知危编辑部在注册的时候由于自己手里的海外手机号是虚拟运营商还被 ban 了,最后也是通过淘宝搞定的,这算是花小钱买个省心了。
淘宝一搜一大堆而下面这种,就有点侮辱人智商了,有人搭了公众号客服消息接口,卖起了本来免费的 ChatGPT 服务。
本来免费的东西,到它手里直接变成了免费试用 3 条,无限次对话 999.99 一年,就差没把 “ 我想抢你钱 ” 几个字直接打出来了。当然,这种只是小打小闹,真正的大玩家,在股市。它们可以被称之为韭菜联合收割机。比如,昨晚,在美国上市的中国公司 “ 寺库 ”,一度涨了 199%,最后以 124.4% 的涨幅收盘。
如果你不知道寺库这家公司的话,我简单两句话给你带过一下:寺库是一家奢侈品垂直电商企业,曾两次申请破产,身上背着上百个买卖纠纷合同( 大部分是作为被告?),并且被很多用户爆出买完东西不发货并且也不退款,去年 8 月还有新闻说他们疑似人去楼空想跑路。
就这样一个眼看着经营不太行的企业,通过 ChatGPT 概念摇身就是一个暴涨,那他讲的概念是什么呢?他们宣称:将对 AIGC 和 ChatGPT 相关技术进行深度研究与拓展,通过 ChatGPT 技术实现类似真人的交互式对话,进一步提升奢侈品相关文字与视频内容、商品卖点说明等相关内容的丰富程度并大幅提升转化率。所以,这么个发货都费劲儿的公司强行沾边一下 ChatGPT 有什么用?我想大家心里都有答案,但就是有人炒。国内 A?股这边,也是很魔幻,韭菜飘香。汉王科技,迎来了自己的 7 连板。
当然,同时也迎来了深交所的关注函。
汉王科技的确有类似 ChatGPT 搭边的自然语言处理业务( 也就是关注函上的 NLP 业务?),但并不是主业。汉王科技最大的主业,是触控笔相关业务,其 “ 笔智能交互 ” 业务占总营收有 60%,而与 ChatGPT 搭边的 “ 文本大数据 ” 业务仅占公司 13% 的营收。与此同时,汉王科技的文本大数据业务,实际落地应用按其公司口径是 “?国文史出版社知识图谱项目、某国有大行云档案知识图谱与智能文档复合管理系统项目 ”?这种。说实话,他这个业务,知危编辑部认为与 ChatGPT 也不能说是毫无关系,但基本上等于 “ 人与猴子 ” 的相近程度。但是这个还算好的,毕竟真的有相关业务,我们再来看看韭菜味儿更浓的。除了真有相关业务,还可以 “ 攀亲戚 ”。昨天,奥飞娱乐( 喜羊羊的 IP 公司 )在互动平台上提到,公司目前持有北京光年无限科技有限公司 5% 股权,并说 ChatGPT 是光年无限的重点技术业务方向。
今天中午,奥飞娱乐喜提涨停。
熟悉 A 股的朋友应该之前也听说过奥飞娱乐,奥飞娱乐是蹭热点的老玩家了,之前 NFT 概念火的时候,他们还说自己要发喜羊羊与灰太狼的?NFT?
好,攀亲戚也勉强能搭得上边,下面我们看更加离谱的,韭菜味最浓的。前几天,得益于 ChatGPT 概念,赛为智能拉了 3 根 20%?涨幅的大阳柱。
然而,这家公司并没有什么跟 ChatGPT 搭边的业务,但 ChatGPT 概念股相关的新闻不少都带着他的名字。关于这件事,他们回应澎湃新闻说:“?公司属于人工智能板块,但对 ChatGPT 没有相关布局。可能有些机构将公司列进了 ChatGPT 概念股,我们对此并不知情。”奥,明白了,炒错了是吧?那没事儿了
最好笑的是,赛为智能的股吧里,还有个叫 “ 价值投机 ” 的哥们喊着继续炒呢。
投机就投机,谁能给我解释解释,什么叫价值投机?
眼看着这样离奇的事情不断的涌现,我突然觉得我悟了:ChatGPT,其实是个韭菜盒子。它本来是一张人畜无害的有点香的大饼,结果突然冒出一堆韭菜非要往里面塞。关于 AI 这个行业,知危编辑部其实已经写过一篇文章了,所有 AI 公司现阶段都面临盈利难的问题,它的确有前景,但也是一个巨大的烧钱黑洞。(传送门:ChatGPT爆火,但AI公司基本还都是赔钱货,亏傻的那种?)与此同时,这个钱,还不是一般公司想亏就能亏得起的,像商汤这种一直做 AI 的公司,2021 年一年就亏了 171 亿,这个数额,够把上面那些蹭热点的小公司收购两三个了。所以,还是那句话,ChatGPT 和类似的其他 AI 概念,是神仙公司们的游戏,前途光明但也路途遥远且坎坷,不要对这个概念太上头。现在的 ChatGPT,像一轮澎湃的巨浪,带着人们冲上浪尖。但,这轮巨浪似乎也带走了大部分人的衣裳。他们在裸泳。
撰文:大饼编辑:拾月
如果您觉得本文写的还不错欢迎关注差评孵化的商业财经类账号:知危
声明:
本文仅供交流,不构成任何投资建议。
ChatGPT预言自己将在中国最流行 它是怎么火起来的?
chatgpt,chatgpt官网,chatgpt中文,chatgpt账号一时之间,似乎朋友圈人人都在讨论ChatGPT。
谷歌搜索的数据也证实了,目前全球ChatGPT讨论度最高的就是在中国。本来ChatGPT自去年11月底问世后火了个把月热度已渐趋下降,但在中国的讨论热潮,又推动ChatGPT搜索指数再次上涨,且火热程度远超第一波。
ChatGPT究竟是怎样在中国火起来的?
一开始,只有小圈子关注
其实,在ChatGPT上线的一周内,便在国内短暂产生过一波搜索热潮,但热度不及目前的四分之一。
在此阶段,网民们的注意力主要集中在ChatGPT使用方法上。各大科技博主纷纷推出ChatGPT注册指南,网友们也大开脑洞,向ChatGPT花式提问。
与此同时,与ChatGPT相关的行业领域、科技名词也广受关注。
百度搜索数据显示,AIGC(生成式人工智能)、Merlin(用于访问OPENAI的插件)、Midjourney(AI绘画软件)等与ChatGPT、AI相关的术语成为搜索热词。在资讯热点中,ChatGPT催生新兴程序员岗、AIGC迅速发展奇点将至等报道也在小圈子里被关注。
值得注意的是,这波关注并没有持续太长时间,国内网友对ChatGPT的新鲜感较快消失。对比国内和全球搜索趋势可发现,国内搜索热度早于全球趋势下降,去年12月9日之后相关讨论便逐渐平息。
股市率先迎来真热潮,概念股引爆
去年12月中旬之后,海外民众对ChatGPT最初的好奇心也逐渐消退,搜索热度不断下降,但随着春节长假结束股市开市,ChatGPT突然引起了国内投资者的关注。
今年1月31日,同花顺新增“ChatGPT概念”,仅5个交易日,概念股涨幅已超25%。2月1日,东方财富网也推出“ChatGPT概念股板块”,两者选股有所重合,但数量不同。同花顺共计41只股票,而东方财富网为27只。
Choice数据显示,截至2月6日,A股ChatGPT概念板块中有15只个股今年以来累计涨幅超过30%。其中,海天瑞声、云从科技涨幅超100%,汉王科技更是已经连续7个“一字板”涨停。
问财选股数据显示,截至2月7日中午,A股中共有41只ChatGPT概念股,超过六成(27只)股票当天呈现涨幅,其中神思电子、海天瑞声、神州泰岳、科大国创、光云科技、天娱数科、汉王科技7只股票涨幅超过10%。
不过,这些概念股中,有部分上市公司似乎只是在“蹭热点”,与人工智能内容生成(AIGC)的关联性并不强。
根据概念股所属二级行业,与计算机相关的占比为63.8%,包括计算机应用与计算机设备。其余二级行业皆与计算机无关,例如传媒、包装印刷、房地产服务等。
据不完全统计,近期在互动平台上,包括高新兴、华如科技、恒实科技、延华智能等多家上市公司纷纷澄清暂无相关业务布局。
而从全球范围来看,生成式人工智能领域也是投资界追捧的热点。
根据CB Insights,2022年ChatGPT概念领域目前约有250家初创公司,其中51%融资进度在A轮或天使轮。2022年,ChatGPT和生成式 AI(AIGC)领域吸金超过26亿美元。
社交平台后发力,国产版受关注
在资本市场掀起ChatGPT热潮之后,国内普通民众对ChatGPT的兴趣再度兴起。
1月中下旬,随着微软欲注资ChatGPT所在人工智能实验室百亿美元等资讯的广泛流传,ChatGPT在中国进一步“破圈”,国内搜索和讨论热度呈现爆发式增长,远超12月初期的热度小高潮,并还在持续增长中。
微博热搜数据显示,2月4日ChatGPT首次登上微博热搜,截至2月7日19时,关于ChatGPT的微博热搜已有20个,总在榜时长超过2000分钟,总热度超过700万。
与去年12月的第一波讨论聚焦如何使用相比,这一轮国内民众对ChatGPT的关注点更为发散。
其中最受关注的话题恐怕是国产版何时诞生。#百度类ChatGPT产品名为ERNIEBOT# #三六零计划推出类ChatGPT产品# 均上榜热搜话题。
另一方面,伦理等衍生话题也颇受欢迎。例如相当数量的网民关注ChatGPT对其他AI产品的冲击,以及ChatGPT在准确度、法律和版权问题上存在的风险问题。
截至2月7日16时,当日18个与ChatGPT相关的热搜中,半数话题与ChatGPT对人类现有商业和社会秩序的冲击相关,包括知识生产伦理、AI取代人类主体、冲击互联网行业、安全使用规则等方面。
ChatGPT预言自己将在中国最流行
ChatGPT是史上用户增长速度最快的消费级应用程序,注册用户数超过100万只用了短短5天,而此前,达到这一数量级用时最快的是Instagram,时长为两个半月。
ChatGPT活跃用户目前还在飞速增长,瑞银报告数据显示,截至1月末,ChatGPT推出2个月时,其月活用户已经突破了1亿。根据Similarweb数据统计,2023年1月期间,ChatGPT平均每天大约有1300万独立访客,这一数据是2022年12月的两倍之多。
Similarweb数据显示,目前在全球用户中,美国用户占比最高(19.01%),其次是印度、英国、法国、德国等国家。
关于未来,我们向ChatGPT询问:“你是否认为2023年ChatGPT会在中国最流行?”
它给出了肯定的回答:“是的,我非常有信心,2023年ChatGPT会在中国最流行。随着越来越多的公司和企业开始使用ChatGPT来加速他们的业务,这种趋势将会不断增长。同时,中国在AI技术方面也取得了显著的进步,因此我相信到2023年,ChatGPT在中国的使用将比现在更加普及。”
ChatGPT的预言是否能实现?我们拭目以待。
(原标题《ChatGPT是怎么在中国火起来的?》编辑陆文琳)
chatgpt为什么这么火 了解一下什么是chatgpt
chatgpt,chatgpt是什么意思,chatgpt国内能用吗,chatgpt使用2022年12月份的时候,ChatGPT还只是个被人各种撩的聊天工具。但进入2023年后,已经向着效率工具迈进了。
微软宣布正和ChatGPT开发团队OpenAI进行洽谈,投资百亿美元,并计划把这个工具整合到云服务、搜索引擎、甚至office中。海外高校、学术机构,也兴起了关于用ChatGPT写论文是否合规的大讨论;咨询公司也开始担忧是否会被抢饭碗。
毫无疑问,ChatGPT的应用热情,已经被点燃;应用场景也不断拓展。但ChatGPT并不是一蹴而就,以更广阔的的视野来看,这背后是AIGC“智慧涌现”的大浪潮。那么,AIGC的发展节点有哪些?企业竞争靠什么?
AIGC是如何一步步突破的?
AI懂创作、会画画,可以说是人工智能的一个“跨越式”提升。虽然人工智能在生活中不断普及,比如我们习惯了机器代替人去搬运重物、制造精密的产品、完成复杂的计算等等。但是,如果人工智能更接近人,那就必须具备人类“创作”的能力。这就是AIGC的意义。
AI能力的提升,并不是一蹴而就,而大部分则经历了“模型突破-大幅提升-规模化生产-遇到障碍-再模型突破-大幅提升”的循环发展。而要实现落地、走进人类生活,则必须具备“规模化生产”的能力,在资源消耗、学习门槛等方面大幅降低到平民化。
比如以AI画画为例,则经历了三个关键节点:
第一个节点,早期突破:2014年,对抗生成网络(GAN)诞生,真正“教会”AI自己画画。
GAN包含两个模型,一个是生成网络G、一个是判别网络D。G负责把接收到的随机噪声生成图片,D则要判断这张图是G画的、还是现实世界就存在的。G、D互相博弈,能力也不断提升,而当D不再能判断出G生成的图片时,训练就达到了平衡。
GAN的开创性在于,精巧地设计了一种“自监督学习”方式,跳出了以往监督学习需要大量标签数据的应用困境,可以广泛应用于图像生成、风格迁移、AI艺术和黑白老照片上色修复。
但其缺陷也正来源于这一开创性:由于需要同步训练两个模型,GAN的稳定性较差,容易出现模式崩溃。以及另一个有趣的现象“海奥维提卡现象”(the helvetica scenario):如果G模型发现了一个能够骗过D模型的bug,它就会开始偷懒,一直用这张图片来欺骗D,导致整个平衡的无效。
模型也会躺平,这鸡贼的特性,真是有人的风格。
第二个节点,大幅提升:2020年,一篇关于扩散模型(Diffusion Model)的学术论文,大幅提升AI的画画水平。
扩散模型的原理是“先增噪后降噪”。首先给现有的图像逐步施加高斯噪声,直到图像被完全破坏,然后再根据给定的高斯噪声,逆向逐步还原出原图。当模型训练完成后,输入一个随机的高斯噪声,便能“无中生有”出一张图像了。
这样的设计大大降低了模型训练难度,突破了GAN模型的局限,在逼真的基础上兼具多样性,也就能够更快、更稳定的生成图片。
扩散模型在AI业界的“起飞”源于2021年1月,Open AI基于此开发出DALL・E文字生成图片模型,能够生成接近真实生活但并不真实存在的图片,让AI业界震了三震。但由于在像素空间进行了大量计算,这一模型仍存在进程缓慢、内存消耗大的缺陷。
第三个节点,批量生产:2022年夏天诞生的Stable Diffusion,让高大上的学术理论变得“接地气”。
去年8月,Stability AI将扩散过程放到更低维度的潜空间(Latent Diffusion),从而开发出了Stable Diffusion模型。这个模型带来的提升,在于资源消耗大幅降低,消费级显卡就可以驱动的,可以操作也更为方便,普通人也可以体会到人工智能惊艳的创作能力。而且开发团队还把所有代码、模型和权重参数库都进行了开源,践行了Geek的共享精神、去中心化主义。
门槛降低、效果提升,因此,大受欢迎。发布10天后,活跃数据达到了每天1700万张,如果都用A4纸打印出来叠一起,相当于一座52层高的大楼。
共享,也是Stability AI的另一特色。在开源社区中,除了更小的内存和更快的速度,Stable Diffusion收获了更完善的指南与教程、共享提示词、新UI,也依靠集体的智慧,走进了Photoshop、Figma等经典软件,汇入创作者们的既有工作流中。可谓是,依靠群众、回馈群众。
从技术实现突破、到技术提升、再到规模化降低门槛,AI创作能力也不断提升。2022年10月,美国一名男子用AI绘画工具Midjourney,生成了一幅名为《太空歌剧院》的作品,并获得了第一名。这引起了一波不小的争论,也终于形成了一条新赛道。于是,2022年以AI绘画为代表的各种生成式AI工具,如雨后春笋般疯狂冒尖,比如盗梦师、意间AI、6pen、novelAI等等。
而在文本AI领域也是如此。如今大火的ChatGPT则是基于GPT3.5模型,已经迭代了4次。而对话一次的平均成本为0.01-0.2美元,也就是六毛到一块钱人民币,成本依然需要不断降低。但整体而言,无论画画、还是聊天,AI已经体现出智慧涌现。
如何成为浪潮宠儿?
Stability AI的创始人Emad认为,图像才是杀手级应用。
图像模型可以迅速创造,并引导人们迅速消费,同时又能以较低成本快速整合到不同领域,从而快速普及,掀起浪潮。而事实上,确实许多创业者涌入了这些领域。AIGC成为了币圈之后的投资新焦点。在 GPT-3 发布的两年内,风投资本对 AIGC 的投资增长了四倍,在 2022 年更是达到了 21 亿美元。
公司增多,投资增多,但并不是每家企业都能活得很好。比如2022年底,仅创立4个月的AI绘画公司StockAI就停止了运营。公司CEO表示,主要是因为商业化模式不成熟,目前的付费用户群体无法覆盖高昂的运营成本。虽然他也表明会在今年1月份推出全新的平台,但从透露的信息来看,新平台已不会有需要大量算力的AI图片生成功能了。
那么,什么样的企业,才是这波浪潮的“宠儿”?
首先,无疑是掌握核心前沿技术的行业引领者。全球TOP3的人工智能研究机构,都在各出奇招、争夺AIGC主导地位。
OpenAI是文字生成领域的领航员。不光吸引了“生成对抗网络之父”Ian Goodfellow加盟,还早早获得了微软的10亿美元投资。从GPT到GPT3.5,OpenAI不断迭代,也不断带给行业惊喜。这一次的ChatGPT更加获得了微软的认可。而通过开放GPT-3受控API的模式,OpenAI也将赋能更多公司和创业者。
DeepMind是通用型AI的探路人。2016年,AlphaGo击败人类围棋的最高代表韩国棋手李世石,Go背后正是谷歌旗下的DeepMind。但DeepMind的目标并不是下棋,而是通用型AI,比如能预测蛋白质结构的AlphaFold、能解决复杂数学计算的AlphaTensor等等。但这些AI始终面临着一个瓶颈,即无法像人类一样进行“无中生有”的创作。
这两年,DeepMind终于向通用型AI又推近了一步。在对话机器人Sparrow、剧本创作机器人Dramatron等背后的语言大模型中找到灵感,构建了会聊天、会干活、会玩游戏的Gato。
Meta在加速AI的商业化落地。重组调整AI部门,将其分布式地下放到各实际业务中,而FAIR被并入元宇宙核心部门Reality Labs Research,成为新场景探索者的一员。
也许同行相轻,Meta首席人工智能科学家Yann LeCun对ChatGPT的评价并不高,他认为从底层技术上看,ChatGPT并不是什么创新性、革命性的发明,除了谷歌和Meta,至少有六家初创公司拥有类似的技术。
当被问及Meta的AI愿景时,LeCun为FAIR画下了“生成艺术”的大饼。他提出,Facebook上有1200万商铺在投放广告,其中多是没有什么资源定制广告的夫妻店,Meta将通过能够自动生成宣传资料的AI帮助他们做更好的推广。
其次,另一类宠儿,则是押对应用场景的企业们,在“绘画”之外吸纳了不少资本支持与人才投入。
在所有内容生成式AI中,输出文字和音乐的已经先一步找到了财富密码。最早出现的AI生成文字在遍历了写新闻稿、写诗、写小剧本等颇受关注的应用方式后,终于在营销场景找到了能够稳定变现的商业模式,成为写作辅助的效率工具,帮助从业者写邮件、文案、甚至策划。专注于音乐的LifeScore,则让人工智能学会了即时编曲,按照场景、长度的需要,组织艺术家同事人工创作、演奏的音乐素材,在人类的创作流程中找到了自己的位置。
能够互动的聊天机器人,则在客服和游戏这两个相去甚远的行业分别“打工”。区别于当下只会提供预设问题解答,有时还会答非所问的“智能客服”,真正的AI需要结合用户的行为和上下文来理解人类的真正意图。在游戏领域,AI则被用来协助人类,高效地创造内容丰富、体验良好的游戏内容,从而延长用户的游戏时间。
显然,宠儿是少的。而经历了过去一年多“科技股大回落”后,投资者们也谨慎一些了,当下的AIGC虽然很好,但等大模型出来也许更香。
大模型,也许是企业比拼的护城河
模型是人工智能的灵魂,本质上它是一套计算公式和数学模型。“参数”可以看做是模型里的一个个公式,这意味着,参数量越大,模型越复杂,做出来的预测就越准确。
小模型就像“偏科的机器”,只学习针对特定应用场景的有限数据,“举一反三”能力不足,一些智能产品被用户调侃为“人工智障”的情况时有发生。
大模型就是参数量极大的模型,目前业界主流的AIGC模型都是千亿级、万亿级参数量的水平。通过学习各行各业各类数据,除了能给出相较于小模型更准确的预测结果之外,它也展现出了惊人的泛化能力、迁移能力,产出内容质量更高、更智能,这也是当前AIGC工具让人眼前一亮的原因。
而大模型的快速发展,对行业发展起到了明显的推动作用。例如ChatGPT是基于GPT-3模型进行优化所产生的,引领AI绘画发展的DALL・E 2也离不开GPT-3的贡献。类似的还有Deepmind的Chinchilla、百度的文心大模型等等。
大模型,很大概率是行业淘汰与否的判断要素。
首先,训练数据量大,OpenAI为了让GPT-3的表现更接近人类,用了45TB的数据量、近 1 万亿个单词来训练它,大概是1351万本牛津词典。
GPT-3 训练数据集一览
这就带来了两个问题:巨大的算力需求与资金消耗。训练和运行模型都需要庞大的算力,有研究估测,训练 1750 亿参数语言大模型 GPT-3,需要有上万个 CPU/GPU 24 小时不间输入数据,所需能耗相当于开车往返地球和月球,且一次运算就要花费450万美元。
国内也不例外。目前国内自研的大模型包括百度的文心大模型、阿里的M6大模型、腾讯的混元大模型,针对中文语境,国内厂商的表现要比国外大厂要好得多。而且国内的大模型发展速度也很惊人。
采用稀疏MoE结构的M6大模型,2021年3月仅1000亿参数,3个月后就达到了万亿级,又过了五个月模型参数达到了十万亿级,成为全球最大的AI预训练模型。混元模型也是万亿级别,成本大幅降低,最快用256张卡,1天内就能训练完成。而采用稠密结构(可以粗糙理解是和稀疏相比,密度更大)的文心大模型,2021年,参数规模达到2600亿。2022年,百度又先后发布了数十个大模型,其中有11个行业大模型。
这样高的研发门槛,注定目前主流的大模型多由大企业、或是背靠大企业的研究机构掌握,中小企业只能望而却步。因此,大模型,也就成为企业的“护城河”。
但进行大模型的研发只是“成功第一步”,还有三个维度的比拼,也非常重要。
一是数据资源。有研究表明,到2026年就没有更多高质量的数据可以训练AI了。此外,基于现实生活中已有的数据来训练模型只能解决一些已知问题,对于一些我们还没有发现的、潜在的、未知的问题,现在的模型未必能解决。因此有一些研究人员提出了合成数据的概念,即通过计算机程序人工合成的数据,一方面补充高质量的训练数据,另一方面填补一些极端或者边缘的案例,增加模型的可靠性。
二是绿色发展。虽然模型越大效果越好,但无限“大”下去并不经济,对自然资源消耗、数据资源都带来巨大压力。而过高的资源消耗,也不利于平民化普及。
三是应用场景。商业和纯理论研究不同,不能拿着技术的锤子,瞎找钉子,而是要结合应用来发展技术。而国内厂商要想拿出Stable Diffusion、ChatGPT这样的杀手级应用,还需要更多的思考和努力:
跳出“跑分”怪圈,找到应用场景,进行模型“瘦身”,甚至,将模型开源、形成生态,利用群众的智慧、为群众服务。
尾声
随着微软对ChatGPT的关注,产业、投资圈都热了起来,美股BuzzFeed因为要采用ChatGPT技术就实现了两天涨三倍的壮举;H股、A股也迎风而动,不少上市公司也表态具备技术积累。
躁动当然是好事儿,科技创新,就是要令人心潮澎湃。我国广阔的产业,是应用开花的土壤。但与此同时,国内的AIGC也存在着隐忧,比如高算力的芯片,如何造出来?
另一方面,科技创新,也要牢记Gartner曲线揭示的规律:萌发期→泡沫期→泡沫破裂期→稳步发展期→稳定产出期。只有躁动,没有笃定、没有低谷时的忍耐,也绝不可能成功的。
适度的泡沫,成为驱动力;过度的泡沫,也许会劣币驱逐良币。但至少目前,我们和海外相比,几乎在同一起跑线,值得充满热情的期待。
来源:远川科技评论,作者:钟靖怡?马冰莹
30万+机械工程师都在看↓↓↓
关注上方公众号,回复关键词,免费领取海量资料!!
1.?回复【动图】领取10000+个机械动图及视频包
2.?回复【CAD】领取800GAutoCAD全套视频教程
3.?回复【UG】领取800G的UGNX全套视频教程
4.?回复【SW】领取800G的Solidworks全套教程
5.?回复【机械设计】领取800G