淘优惠

淘优惠

openai推付费版chatgpt openai创始人谈chatgpt

热门文章 0
openai中文版,openai开源吗
人人都是产品经理社区
・广东

最近一段时间,OpenAI 打造的 ChatGPT 在互联网上引发了众多网友的关注,而回顾 GPT 这一系列模型的演变历程,我们可以梳理出怎样的发展脉络?OpenAI 的发展路径又可以为国内企业带来怎样的思考?不如来看看作者的解读。

打开网易新闻 查看精彩图片

古希腊神话中,一位名叫赫尔墨斯的神,会充当人神之间的信使,穿着带有双翼的飞鞋,行走在神明与人类之间。

根据《荷马史诗》的记载:“在天神中,赫尔墨斯是最喜欢引导凡人前行的。”这句话用来形容OpenAI与AI的关系,虽不中亦不远矣。

上一周,OpenAI打造的ChatGPT出尽风头,成为国内外AI领域的头号热门话题。关于ChatGPT的对话能力,大家可能已经通过很多文章感受过了。简单总结,就是对答如流,无所不能,可替程序员写代码,可替商务人士出方案,还能替作家编故事。一度让久违的“谷歌已死”“XX职业又要被AI取代了”之类的AI威胁论说辞,开始大量出现了。

关于ChatGPT的神奇之处,看多了也有点审美疲劳了,冷静下来思考一下:

  • 为什么同样是AIGC,问答、对话这类NLP领域应用更容易引起轰动,激发人们对通用人工智能的希望?
  • 为什么同样是预训练模型,相比BERT、GPT3等前辈,ChatGPT的对话能力产生了质的飞跃?
  • 为什么同样是做AI,OpenAI要死磕NLP,从GPT1到 ChatGPT不断迭代?

OpenAI的CEO、联合创始人 Sam Altman曾说过一句话:“Trust the exponential,Flat looking backwards,vertical looking forwards”,相信指数的力量,平行地向后看,垂直地向前看。ChatGPT出现代表着,AI似乎已经站到了指数级飞跃的关键点上。但起飞的ChatGPT,并不是一蹴而就的。

从GPT到ChatGPT,恰好代表了OpenAI在大模型领域切实走过的历程,从中可以看到,OpenAI在AI大模型竞争中,已经探索出了一条属于自己的道路,就如同赫尔墨斯一样,成为引领AI技术前进的使者。

如果OpenAI是传递AI前沿进展的赫尔墨斯,ChatGPT就是那双带着双翼的金丝鞋。我们既要关注ChatGPT这双鞋究竟有多神奇,更有必要搞懂,OpenAI选择的这条大模型道路有何玄机。

今天,中国科技企业与研究机构都在积极投布局大模型,求术不如问道,我们不妨从GPT这一系列模型的演变历程,望向OpenAI关于AI与大模型的战略思考与发展脉络。

一、从GPT-1到ChatGPT,超神模型的演化足迹

OpenAI在博客中写道,ChatGPT 是从 GPT3.5 系列中的模型进行微调而诞生的。

正如名称中所暗示的那样,GPT- 3.5是OpenAI设计的一系列NLP模型中的第四个,此前还出现了GPT C 1、GPT C 2 和 GPT C 3。

在 GPT 出现之前,NLP 模型主要是基于针对特定任务的大量标注数据进行训练。这会导致一些限制:

  • 大规模高质量的标注数据不易获得;
  • 模型仅限于所接受的训练,泛化能力不足;
  • 无法执行开箱即用的任务,限制了模型的落地应用。

为了克服这些问题,OpenAI走上了预训练大模型的道路。从GPT1到ChatGPT,就是一个预训练模型越来越大、效果越来越强的过程。当然,OpenAI的实现方式并不只是“大力出奇迹”那么简单。

第一代:从有监督到无监督GPT-1。2018年,OpenAI推出了第一代生成式预训练模型GPT-1,此前,NLP任务需要通过大规模数据集来进行有监督的学习,需要成本高昂的数据标注工作,GPT-1的关键特征是:半监督学习。先用无监督学习的预训练,在 8 个 GPU 上花费 了1 个月的时间,从大量未标注数据中增强AI系统的语言能力,获得大量知识,然后进行有监督的微调,与大型数据集集成来提高系统在NLP任务中的性能。

GPT-1的效果明显,只需要极少的微调,就可以增强NLP模型的能力,减少对资源和数据的需求。同时,GPT-1也存在明显的问题,一是数据局限性,GPT-1 是在互联网上的书籍和文本上训练的,对世界的认识不够完整和准确;二是泛化性依然不足,在一些任务上性能表现就会下降。

打开网易新闻 查看精彩图片

第二代:更大更高更强的GPT-2。2019年推出的GPT-2,与GPT-1并没有本质上的不同(注意这一点),架构相同,使用了更大的数据集WebText,大约有40 GB的文本数据、800万个文档,并为模型添加了更多参数(达到惊人的 15 亿个参数),来提高模型的准确性,可以说是加强版或臃肿版的GPT-1。

GPT-2的出现,进一步证明了无监督学习的价值,以及预训练模型在下游NLP任务中的广泛成功,已经开始达到图灵测试的要求,有研究表示,GPT-2生成的文本几乎与《纽约时报》的真实文章(83%)一样令人信服。

打开网易新闻 查看精彩图片

(GPT-2表现)

第三代:跨越式进步的GPT-3。2020年,GPT-3的这次迭代,出现了重大的飞跃,成为与GPT-2迥然不同的物种。

首先,GPT-3的体量空前庞大,拥有超过 1750 亿个参数,是GPT-2的 117 倍;其次,GPT-3不需要微调,它可以识别到数据中隐藏的含义,并运用此前训练获得的知识,来执行下游任务。这意味着,哪怕从来没有接触过的示例,GPT-3就能理解并提供不错的表现。

因此,GPT-3也在商业应用上表现出了极高的稳定性和实用性,通过云上的 API访问来实现商业化。这种入得了实验室、下得了车间的能力,使得GPT-3成为2020年AI领域最惊艳的模型之一。

当然,GPT-3也并不完美。正如联合创始人 Sam Altman所说,GPT-3的水平仍处于早期阶段,有时候也会犯非常愚蠢的错误,我们距离真正的人工智能世界还有很长的距离。另外,GPT-3 API 的很多基础模型非常庞大,需要大量的专业知识和性能优异的机器,这使得中小企业或个人开发者使用起来比较困难。

第四代:基于理解而生成的ChatGPT。终于在2022年,OpenAI的预训练语言模型之路,又出现了颠覆式的迭代,产生了技术路线上的又一次方向性变化:基于人工标注数据+强化学习的推理和生成。

打开网易新闻 查看精彩图片

前面提到,一开始预训练模型的出现,是为了减少监督学习对高质量标注数据的依赖。而ChatGPT在GPT -3.5大规模语言模型的基础上,又开始依托大量人工标注数据(据说OpenAI找了40个博士来标数据),这怎么又走回监督学习的“老路”了呢?

原因是,GPT 3.5虽然很强,但无法理解人类指令的含义(比如写一段博文、改一段代码),无法判断输入,自然也就很难给出高质量的输出答案。所以OpenAI通过专业的标注人员(据说是40个博士)来写词条,给出相应指令/问题的高质量答案,在基于这些数据来调整GPT -3.5的参数,从而让GPT -3.5具备了理解人类指令的能力。

在人工标注训练数据的基础上,再使用强化学习来增强预训练模型的能力。强化学习,简单理解就是做对了奖励、做错了惩罚,不断根据系统的打分来更新参数,从而产生越来越高质量的回答。所以这几天很多人在互动中发现,ChatGPT会承认错误、会修改自己的答复,这正是因为它具备从人类的反馈中强化学习并重新思考的能力。

因为ChatGPT具备了理解能力,所以才被看作是通向通用人工智能AGI的路径。

当然,ChatGPT也并不是完美进化体。OpenAI的官网明确提示,ChatGPT“可能偶尔会生成不正确的信息”,并且“对2021年之后的世界和事件的了解有限”。一些比较难的知识,比如“红楼梦讲了什么”,ChatGPT会一本正经地胡说八道。

从GPT模型的演进和迭代中,可以看到OpenAI是不断朝着自然语言理解这一目标前进,用更大的模型、更先进的架构,最终为通用人工智能找到了一条路径。

从GPT-1到ChatGPT的纵向演变,会看到OpenAI对大模型的独特理解与技术脉络――通过模型预训练提升NLP指标,抵达强人工智能。NLP领域究竟特殊在哪里,值得OpenAI如此执着?

二、OpenAI的大模型差异化之路

前文中不难看出,OpenAI对于文本生成模型的执着,因为做够得久、投入够多,所以能够做得更好,是非常有长期战略定力的。

与之相比,和GPT-1同年推出的预训练模型,还有谷歌发布的BERT,但后者在火爆一段时间之后影响力明显减弱;而NLP问答领域一向由Meta引领,Meta AI 的 OPT 模型和GPT-3 达到了同等的参数量,但效果就不如OpenAI。同期选手中,OpenAI对于语言模型的用心显然是更多的。

一方面是资源投入,无论是越来越大的模型,需要消耗庞大的算力资源,ChatGPT所需要的高质量标注数据,依靠博士级别的专业人士来完成,比起将数据标注任务分发给众包平台,显然会消耗更多的人力和财力。

另一方面,是技术投入,大规模预训练、增强学习等技术都用在提升NLP对话系统在开放通用领域上的理解和推理能力。NLP是认知智能,要提升就必须解决知识依赖,而知识又是非常离散且难以表示的,要解决带标数据不足、常识知识不足等问题,是非常具有技术挑战的。

多年前IBM的Frederick Jelinek就说过:“每当我开除一个语言学家,语音识别系统的性能就会改善一些。”颇有种“解决不了问题,就解决提出问题的人”的既视感。所以也可以说,OpenAI选择了一条更难走的路,去解决真正困难的问题。

此外,聚焦NLP领域也意味着OpenAI会承担隐形的机会成本。

今年AIGC(AI生成内容)在资本市场和应用市场都有很大的进展,与AI作画、音视频生成、AlphaFold2所解决的蛋白质结构预测等生成任务相比,NLP任务都是直接用词汇和符号来表达概念,此类模型通过“API+云服务”来完成商业化服务,无论是云资源的消耗量还是接口调用服务收费,所获得的收益也是远不及图像音视频或科学计算的。拿同样的精力做十个八个Dalle模型,肯定能赚得更多。

科技博主王咏刚在博客中分享了一个故事,称与OpenAI的两位联合创始人交流,发现这二人甚至不知道AIGC是什么意思!

说到这里,或许可以得出结论,OpenAI作为一个旨在“实现安全的通用人工智能(AGI)”的公司,就是在不计投入、不计商业回报,专心致志地通过过预训练大模型来提升NLP任务的各项指标,从而接近AGI的愿景。

为什么OpenAI能够走出这条引领潮流的大模型差异化之路呢?

一方面是NLP的特殊之处。

NLP 不是魔术,但是,其结果有时几乎就是魔术一般神奇。通用人工智能必须具备认知智能,这也是目前制约人工智能取得更大突破和更广泛应用的关键瓶颈,而NLP正是认知智能的核心。Geoffrey Hinton、Yann LeCun都曾说过类似的观点,深度学习的下一个大的进展,应该是让神经网络真正理解文档的内容。

也就是说,当AI能理解自然语言了,AGI可能就实现了。

另外,OpenAI的运行模式也起到了关键的影响。

突破性创新早期需要大量的投入,大模型的开发需要大量的基础设施投入,而ChatGPT的对话系统短期内很难靠调用量的规模化来摊平研发成本。因此,OpenAI是一个非营利性研究机构,没有迫切的商业化压力,因此可以更专注于NLP领域的基础研究,这是商业型AI公司所很难实现的。

2011年,自然语言领域的泰斗肯尼斯・丘吉(Kenneth Church)发表了一篇长文《钟摆摆得太远》(A Pendulum Swung Too Far),其中提到:我们这一代学者赶上了经验主义的黄金时代,把唾手可得的低枝果实采摘下来,留给下一代的都是“难啃的硬骨头”。

深度学习是经验主义的一个新高峰,而这个领域的低枝果实也总有摘完的一天,近年来有大量AI科学家发出警告,深度学习面临很多局限性,单纯用深度学习很难解决一些复杂任务,或许不用太久,基础性突破就会成为AI产业的重要支撑。

GPT的演进也说明了,AI的突破需要循序渐进、从小到大地一步步实现,今天,每家AI企业和研究机构都在做大模型,相比CV计算机视觉、数字人、元宇宙等AI应用,NLP要显得暗淡很多。而如果一窝蜂去摘容易的果实,最终会制约AI深入产业的脚步。

ChatGPT的出现提醒我们,唯有啃下基础领域的硬骨头,才能真正为AI带来质变。

作者:藏狐

来源公众号:脑极体(ID:unity007),从技术协同到产业革命,从智能密钥到已知尽头。

本文由人人都是产品经理合作媒体 @脑极体 授权发布,未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

特别声明:本文为网易自媒体平台“网易号”作者上传并发布,仅代表该作者观点。网易仅提供信息发布平台。

造车新势力难过年:被执行超167万!

烧光84亿又一家造车新势力离开了,造车新势力洗牌,造车新势力驶入产能过剩怪圈,已经倒闭的造车新势力

韩联社1月6日消息,由于全球经济衰退导致需求萎缩,LG电子2022年Q4陷入盈利冲击,其主营业务,如电视和家电,整体不景气。初步计算显示,LG电子2022年Q4营业利润为655亿韩元,同比下降91.2%。LG方面称,暴跌原因在于原材料价格上涨、物流和营销成本增加以及汇率大幅下跌。

根据韩联社旗下金融数据公司Yonhap Infomax的调查,其营业利润比平均预期低79.5%。值得注意的是,LG电子本季度营收方面并没有太大影响。第四季度其营收同比增长5.2%至21.85万亿韩元,创下了季度新高,但该公司没有公布净收入数据。

界面新闻1月6日消息,跟踪苹果产业链多年的分析师郭明Z在推特发文称,苹果公司AR/MR头戴装置开发进度因机构件落摔测试不及标准,与软体开发工具的时程故晚于预期,故大量出货时间可能将自原本2Q23延后到2Q23底或3Q23,这代表1月份苹果为此新装置举办媒体发布会可能性逐渐降低。

按照目前开发进度,苹果较有可能会为AR/MR举办一场春季发布会,或是在WWDC发布此新装置。

财联社1月6日消息,据知情人士透露,AI聊天机器人ChatGPT的创建者OpenAI正在谈判以收购要约的形式出售现有股票,该公司的估值将达到290亿美元左右。OpenAI去年发布一系列基于人工智能的产品,引起了公众的密切关注,包括图像生成程序DALL・E 2和聊天机器人ChatGPT。如果以这一估值完成收购,OpenAI将成为少数几家能够在私募市场以更高估值融资的初创公司之一。

上述知情人士说,风险投资公司Thrive Capital和Founders Fund正在就投资该交易进行谈判。该交易将以股票销售的形式出售,总额至少为3亿美元。该交易的结构为收购要约,投资者从OpenAI的员工等现有股东手中购买股票。

《证券时报》1月6日消息,IDC近日发布2022年V2版IDC《全球物联网支出指南》。受疫情影响,在本期预测中,IDC小幅下调了2022年中国物联网市场IT支出规模,但随着疫情防控政策措施的优化调整,未来五年中国物联网发展将保持平稳向好态势。IDC预测,2026年中国物联网IT支出规模接近2981.2亿美元,占全球物联网总投资的1/4左右,投资规模将领跑全球。此外,中国物联网IT支出以13.4%的五年CAGR稳定增长,增速超过全球平均水平。

从技术维度来看,与2022V1版相比,硬件市场占物联网IT投资规模的四成,仍是物联网占比最大的技术市场。值得注意的是,凭借着物联网的推广和部署,物联网市场逐步积累形成了海量物联数据,物联数据的分析和应用正成为下一阶段的重点。基于市场发展,本次预测IDC上调了服务器和存储市场的IT投资规模。除此之外,在连接技术方面,中国固移融合、宽窄结合的物联接入能力正在迅速提高。

6、晶圆代工厂联电公布2022年12月营收

台湾《经济日报》1月6日消息,晶圆代工厂联电今日公布2022年12月营收,月减7%至209.46亿元新台币,和去年同期相比减少3.29%,这已是其连续四个月出现衰退。2022全年度营收则为2787.05亿元新台币,年增30.84%。此外,在终端需求持续疲弱之下,联电去年第4季营收678.36亿元新台币,和第3季营收的753.92亿元新台币相比,季减超过一成。

联电先前预估,去年第4季晶圆出货季减约10%,产能利用率将降至90%。联电表示,随着智能手机和其他终端设备逐渐采用OLED面板,将持续推动22/28纳米增长。此外,车用芯片业务增长趋势明确,将继续与现有和潜在车用芯片客户寻求更多合作机会,维持未来增长动能。

7、京东方回应拿下苹果手机大单传闻:目前不便对单一客户信息透露过多

《证券日报》1月6日消息,知名苹果分析师郭明Z近日发文称,京东方已获得今年下半年发布的新款iPhone 15与iPhone 15 Plus的大部分显示屏订单,有望成为相关系列产品最大的显示屏供应商。对此,京东方董秘办人士回应表示,公司在持续对苹果等客户资源进行拓展或加深合作,目前不便对单一客户信息进行过多透露,具体以公告为准。


金色5分钟播报:手机中国:腾讯会议崩了无法进入 网友乐了 老师慢点修 不

央视金色三分钟

【金色财经转】新闻播报:

时间:2022-12-15 01:55:00 至 2022-12-15 01:59:59

1. 手机中国:腾讯会议崩了无法进入 网友乐了 老师慢点修 不急

据 今日头条 - 手机中国 报道:根据部分网友的反馈,腾讯会议无法正常进入,卡在“正在进入会议”上。 不过,部...

2. “腾讯会议崩了”冲上热|金色财经转

金色财经转发报道:12月12日,“腾讯会议崩了”冲上热搜。对此,腾讯会议在官微回应:由于网络故障,导致部分...

3. “腾讯会议崩了”冲上热(上)

金色财经转发,据 第一财经 2022-12-12 16:33报道12月12日,“腾讯会议崩了”冲上热搜。对此,腾讯会议在官...

4. 腾讯网:穿越时代 数据让炼钢从此更智能

据 腾讯网 报道,现代的转炉炼钢法由一位无心插柳的英国工程师贝斯麦(Henry Bessemer)于1856年发明,由此开...

5. 腾讯会议崩了无法进入(下)

接上篇内容:腾讯会议崩了无法进入(上)joges91tu/TPmhMz17918hIk~noop.image?_iz=58558&from=article.p...

6. 17173游戏网:腾讯难得的高口碑游戏 没广告还不氪金 结果都在今年凉凉

据 今日头条 - 17173游戏网 报道:腾讯的游戏虽然一直被玩家吐槽,但是腾讯的扶持独立游戏的极光计划的口碑...

7. 腾讯会议崩了无法进入|金色财经转

金色财经转发报道:【CNMO新闻】为了保险起见,现在很多学校仍然使用钉钉、腾讯会议等开会或者上课。但现在...

8. 腾讯会议崩了无法进入(上)

金色财经转发,据 手机中国 2022-12-12 15:32报道【CNMO新闻】为了保险起见,现在很多学校仍然使用钉钉、...

9. 腾讯新闻:TOPBRAND|糖友饱饱/楚郑获融资 格力跨界预制菜 Tim

据 腾讯新闻 报道,近日,植物肉品牌black sheep foods宣布完成1230万美元的a轮融资,由unovis领投,bessemer...

10. 界面新闻:TOPBRAND|糖友饱饱/楚郑获融资 格力跨界预制菜 Tim

据 界面新闻 报道,近日,植物肉品牌Black Sheep Foods宣布完成1230万美元的A轮融资,由Unovis领投,Bessem...

11. 网易订阅:财联社12月15日电 美国证券交易委员会(SEC)提议 对股票

据 网易订阅 报道,财联社12月15日电,美国证券交易委员会(SEC)提议,对股票交易金西行大刀阔斧的改革,以改善...

12. ZAKER资讯:对话好未来 AI 团队负责人 刷屏全网的 Chat GP

据 ZAKER资讯 报道,起因是美国人工智能公司 OpenAI 发布免费机器人对话模型 ChatGPT(GPT-3.5 系列),模型中...

13. 腾讯网:估值200亿的AI公司 要干掉谷歌了?

据 腾讯网 报道,继AI绘画爆火后,又一款AIGC产品刷屏了海内外的社交网络,它就是美国AI公司OpenAI在11月底发...

14. 闲醉山人:OpenAI崛起史 人工智能大佬是怎么炼成的?

据 闲醉山人 报道,一些创业企业也看上了AI领域的前景,OpenAI成为了其中的佼佼者,其创造的人工通用智能(A...

15. 钛媒体官方网站:透过ChatGPT的进化足迹 OpenAI传达了哪些信号

据 钛媒体官方网站 报道,OpenAI的官网明确提示,ChatGPT“可能偶尔会生成不正确的信息”,并且“对2021年之后的...

16. 财经网科技:马斯克或拖欠推特租金

据 财经网科技 报道,马斯克或拖欠推特租金 财经网科技12月14日讯,据凤凰网科技消息,在被埃隆?马斯克 (E...

17. ZAKER:暮鼓晨钟 焕新未来城邦

据 ZAKER 报道,元邦是由 Meta Media 超媒体控股(HK0072)和百度希壤与 BV 百度风投合资创办的一个元宇宙城...

18. zoroo.eth:Web3日报 1209

据 今日头条 - zoroo.eth 报道:希望现有团队会这样做- Illuvium 13日起部署私人测试版- STEPN新增夜间模式...

19. 金色5分钟播报:IT之家:传音 TECNO 全球旗舰新品发布会将于 12

【金色财经转】新闻播报:时间:2022-12-15 01:50:00 至 2022-12-15 01:54:591. IT之家:传音 TECNO 全球旗...

20. Web3日报 1209|金色财经转

金色财经转发报道:Web3日报 1209- 以太坊明年3月上海升级,支持质押ETH提款;下周将为上海升级推出新的公...

21. Web3日报 1209(下)

接上篇内容:Web3日报 1209(上)>查看详情推荐阅读以下标签:# StarMon ## Coinhub ## Lido Finance ## Alpa...

22. 螺旋实验室:直播 造车 元宇宙 2022年的悲喜参不透

据 螺旋实验室 报道,百度和“希壤”和网易的“瑶台”,在2022年似乎成为了企业开会的工具,虽然看起来噱头十足...

# WBTC ## Hegic ## Swerve ## Nexus Mutual ## Cream ## InstaDapp ## PancakeSwap ## ForTube ## OpenOcean ## 0X ## 1INCH ## AAVE ## curve ## Yam ## Acala ## Polkastarter ## Bancor ## WePiggy ## Sushiswap ## bZx ## DODO ## Balancer ## dYdX ## Uniswap ## Yearn.finance ## Terra ## IOTA ## SHIB ## YFII ## DOGE ## DASH ## Tron ## BSV ## USDT ## BCH ## EOS ## LTC ## XRP ## zkRollup ## Zk-snark ## Lightning ## Raiden ## 币乎 ## OMG ## Near ## Kusama ## Oasis ## BSC ## SOLANA ## DFINITY #