熵云gpt和chatgpt的区别 ChatGPT语言模型是怎么训练的

从ChatGPT能力养成看数字经济到知识经济的趋势

从ChatGPT概念股

按：这些天被邀请给券商和投资人讲了3次ChatGPT和AIGC，不是纯技术，而是技术和趋势场景结合帮助决策，所以写点，无法展开，另外这不是用ChatGPT写的哈。

ChatGPT

? ? ? ?2022年，ChatGPT和Stable diffusion标志着AIGC技术的爆发。一般来说，技术驱动的经济模式发展要经历五个阶段：即产生、爆发（资本/资源介入的发展）、平稳、成熟和类要素阶段。在平稳和成熟阶段，不用考虑技术细节仅靠经济规律宏观分析就能够发现价值看到趋势；但在产生和爆发阶段，我们不能忽略对技术细节的了解，而且需要结合技术特征和经济规律才能把握变化、抓住机遇、找到穿越未来的方向，如同在火势刚开始时了解它的引燃原因从而精准采取方案一般。本文结合ChatGPT的训练原理与新知识经济理论来解释：为什么说ChatGPT乃至AIGC已经突破了数字经济而过度到了新知识经济。知识经济相关理论请参考笔者公开出版物。

? ? ? 实际上迄今为止OpenAI并没有公开相关ChatGPT的完整技术细节，相关ChatGPT技术原理都是从ChatGPT“出生证明”介绍上获得的。注意：本文不是技术文章，对具体的技术原理感兴趣的朋友可以参考笔者或其他作者相关的《人工智能》《深度学习》等教材或者慕课视频；但这里我们需要了解ChatGPT训练方法的思想是什么？因为这可以帮助我们进一步了解知识经济中要素的地位、变化从而确定未来的方向。

图2：ChatGPT网站说明截图

? ? ? ?在这段话里，OpenAI阐述ChatGPT有这个几个特点（它们很重要，后面有涉及）:

? ? ? 第一，? ChatGPT类似于InstructGPT（sibling model），这意味着可以从公开的InstructGPT分析ChatGPT；

? ? ? ? 第二，? ChatGPT通过交互对话方式训练的；

? ? ? ?第三，? ChatGPT能够回答问题、承认并纠正错误且能够拒绝不适当的回答等（能力）。

? ? ? ?这张出生证很短，但是它给了ChatGPT一个清晰的画像：OpenAI试图提供给一个人们高效率的、可信的、有能力的人工智能助手。

? ? ? ? 实际上这三个描述恰好决定了“产生ChatGPT”的方式，或者说ChatGPT技术原理与此有关。作为一个注释：可信人工智能是一个人工智能的发展方向，特别是当人工智能进入到一些关键性领域，例如金融、医学和军事中。我们的《中国金融科技创新发展指数报告》中提出，人工智能与金融的融合分为三个阶段，在进入到产能阶段后需要迈过两个门槛，一个是可解释门槛，一个是可信门槛。我们和其他一些团队在这方面做了许多工作可以参考相关公开出版物。

图3：ChatGPT的原理图/类InstructGPT

? ? ? ? 从ChatGPT的原理图可以看到，其整体分为三个步骤，这三个步骤恰好是为了“雕琢出“需要的能力和画像。

? ? ? ?第一步（Step1）是监督学习构建能力基础，重点是泛数据的价值和第一类知识价值模式。我们知道：有了数据，监督学习是构建能力的好方法，注意模仿学习也是可以考虑的。一些学者认为这是数字经济中重要的数据要素价值产生的典型方式，这样理解虽然没有问题，但却是因为不了解技术细节而忽略的更本质的东西：第一有质量的数据需要庞大的成本，传统思维的数据价值实现方式有边际天花板，这形成了新的数据价值阶段，从监督过度到无监督，从专业数据过度到泛数据，这是知识经济理论的必然结果，ChatGPT以及大语言模型乃至AIGC必然的路径，这里的技术细节是ChatGPT乃至问答模式其实是一个“接龙“，是输入一系列输入token后预测后面的token，所以用监督学习通过获得条件概率来获得，类似于输入法，泛数据实际上解决了标注问题（能力问题），但要注意没有解决可信问题，因为回答的token（注意是一个接一个预测，这里需要了解一点自然语言处理知识）是概率分布抽样得到的，即存在随机性，一个随机做事的人，你肯定也不大容易相信哈；第二点实际上在现有的数字经济框架并不容易发现，需要拓展到知识经济，那就是第一类知识价值模式，ChatGPT中的P本来就含有预训练的意思，预训练技术Finetune是深度学习爆发的导火索（想想Hinton先生的那片2006年奠基性文章），这显然是第一类价值模式，即知识的直接迁移和同水平组合（SLC）。需要看到的是，类似的构造能力的方式将会产生更多的方法，并在未来新的场景中产生新的应用。这一步获得的是放飞自我的小白。

? ? ? 第二步（step2）收集比较数据并训练奖励模型，这是构建可信能力的基础，其本质上是第三类知识经济价值模式。粗看这一块和许多传统语言模型不同，但实际上这个在2017的公开论文中就有了（即基于偏好的模式），按照InstructGPT中原理介绍，对于同样问题前面获得的放飞自我的大白会生成的ABCD共4个回答（生成多少都可以，为什么？），参与的人（专家）会给出ABCD四个答案的排序，而实际上ChatGPT是每次抽两个构建评分（大的是1，小的是0），这样可以构建6个评分结果（C(4,2)）。这样构建的奖励模型实际上可以看作可信监督员，要不我们就称为监管机关把，还是监管员把（一行三会原谅我）。

? ? ? ?第三步（step3）强化学习架构实现固本强基，固定可信能力基础提升效率，这里涉及到第二类知识价值模式。其实这个与传统强化学习有些差异，强化学习本质上环境是奖励的载体，这里是用了第二步的奖励模型就不用考虑环境了，可以看到其实是介于强化学习和模仿学习之间，该思路也是17年的论文就有人提出了。其实这里需要看Instruct论文才能够看到更重要的细节，即这里的奖励不仅仅是第二步的奖励模型，还包括了KL散度以避免与GPT3.5产生过大的差距，可以理解为除了监管机关还有法律这个准绳，所以结果是可信的。因为它带有“可信”价值导向和资源可筛选机制，所以这是典型的第二类知识经济价值模式的体现。

? ? ?深度学习刚兴起时，以监督学习为代表的训练方法促使了“标注”行业的诞生，大量的数据标注公司比人工智能企业更早获得了技术的第一桶金；而当数据要素化并逐渐称为基础设施的过程中，以ChatGPT为代表的AIGC所依赖的训练方法具有“泛数据、非监督、可信目标、通用能力”的特点，其本质从最初的数据要素三重价值逐渐转化到新知识经济的三重价值，强人工智能的道路上，经济模式也由数字经济转化到知识经济。

【参考文章】：

张宁，《知识经济十二讲》

张宁，数字经济的模式和方向，新理财；

Vaswani, Ashish, et al. "Attention is all you need." Advances in neural information processing systems 30 (2017).

Radford, Alec, et al. "Improving language understanding by generative pre-training." (2018).

Ouyang, Long, et al. "Training language models to follow instructions with human feedback." arXiv preprint arXiv:2203.02155 (2022).

Chen, Mark, et al. "Evaluating large language models trained on code." arXiv preprint arXiv:2107.03374 (2021).

Neelakantan, Arvind, et al. "Text and code embeddings by contrastive pre-training." arXiv preprint arXiv:2201.10005 (2022).

Brown, Tom, et al. "Language models are few-shot learners." Advances in neural information processing systems 33 (2020): 1877-1901.

chatgpt有多火 ChatGPT 为什么火

chatgpt是什么意思,chatgpt官网,chatgpt怎么用,chatgpt概念股

　　参考消息网2月15日报道聊天生成预训练转换器（ChatGPT）推出仅2个多月就创造了用户增速奇迹，它强大的功能引发全球热议，这也让开发ChatGPT的开放人工智能研究中心及其首席执行官萨姆・奥尔特曼声名鹊起。美国《福布斯》双周刊记者与这位最近避开媒体的投资者和企业家谈到ChatGPT、人工智能以及他的人工智能工具是否对谷歌搜索构成威胁。全文摘编如下：

　　“我对引起这么大的反应有点意外”

　　记者问：随着ChatGPT的受欢迎程度、使之货币化的努力以及围绕与微软合作的兴奋，我感觉我们正处于一个拐点。从你的角度看，开放人工智能研究中心在发展过程中处于什么位置？你将如何描述这个拐点？

　　萨姆・奥尔特曼答：这绝对是一个激动人心的时刻。但我希望这只是刚刚开始。事实上，这将是一条技术发展及其对社会产生的积极影响不断呈几何级数增长的道路。我们现在这么说ChatGPT，我想我们以后可能还会这么说。我们很可能遇到一个预料之外的绊脚石。但我认为，我们很有可能其实已经弄清这里包含的重要意义，而这种范式会把我们带得非常非常远。

　　问：你对ChatGPT引起的反应感到惊讶吗？

　　答：我想做这件事，因为我觉得能成功。所以，我对引起这么大的反应有点意外。但我希望也认为人们真的会喜欢它。

　　我们这个团队对于推出新产品历来都没那么兴奋。我们只是说，“咱们先试试。试试看会发生什么”。这个项目我很努力地推动。我的确认为它能行。

　　“我不认为ChatGPT会取代搜索”

　　问：在整个人工智能生态系统中存在泡沫的情况下，这是一场对你们有益的大潮吗？还是生出噪音使你们的工作更加复杂？

　　答：两者兼而有之。

　　问：你认为人工智能市场的现状与云计算、搜索引擎或其他技术的出现有什么相似之处吗？

　　答：我觉得总有相似之处，也总有一些特别的东西。多数人犯下的错误是过多谈论这些相似，而不是使它们各不相同的微妙之处。因此，谈论开放人工智能研究中心时很容易说：“啊，没错，这会和云计算之争一模一样。而且会有若干这样的平台，你只要把其中一个作为应用程序接口（API）就可以了。”这么说也可以理解。但它有很多东西非常不同，人们会做出非常不同的特征选择。云在某些方面有很大不同，但你把东西放上去，就得到服务。我认为，各种人工智能产品之间的扩展会大得多。

　　问：人们不知道ChatGPT是否会取代传统搜索引擎，比如谷歌搜索。这是激励你或者说让你兴奋的东西吗？

　　答：我的意思是，我不认为ChatGPT会取代搜索。但我认为，有朝一日，人工智能系统可以做到，但不仅如此。我更感兴趣的是思考除了搜索以外会有什么。我不记得我们在网络搜索之前做过什么，我当时年纪还太小。

　　“我们和通用人工智能还有一些距离”

　　问：你觉得我们已经接近类似通用人工智能这样的目标了吗？我们怎么知道这个版本的GPT或者其他任何东西什么时候快要实现了？

　　答：我觉得我们和通用人工智能还有一些距离。但是，我最近常常思考我们怎么才能知道这一点。我在过去五年或者更长时间里得到的一点新认识在于，这不会是一个非常明确的时刻，而将是一个更加渐进的过渡，将是人们所说的“慢起飞”。对于通用人工智能在哪一刻实现了，大家的看法都不会一致。

　　问：开放人工智能研究中心总裁格雷格・布罗克曼曾说，开放人工智能研究中心虽然由研究驱动，却并不反资本主义。你如何在以营利为目的以满足想要回报的投资者与开放人工智能研究中心的更广泛目标之间达成平衡？

　　答：我们尝试设计一种结构，据我所知，它不像外面的任何一个企业结构，因为我们真的相信自己在做的事情。如果我们只把这看作又一家科技公司，我会说：“太好了，我知道剧本，因为我整个职业生涯都在做这件事，所以咱们做一家特大的公司吧。”但如果我们的确真正实现通用人工智能，那就不一样了，我们需要某种不同的东西（在公司结构上）。所以我为我们的团队和投资者如此成功倍感兴奋，但我认为任何一家公司都不应独占人工智能宇宙。通用人工智能的利润如何分享、使用如何分享以及管理如何分配，这是需要新思路的三个问题。

　　“我们将继续开源”

　　问：在你创造产品的过程中，如何保持开放人工智能研究中心的开放精神？

　　答：我认为，我们实现这一目标的最重要方式是推出像ChatGPT这样的公开工具。谷歌没有把这些东西提供给公众使用。别的研究实验室出于其他原因没有这么做，有些人则是担心不安全。但我相信，我们需要社会感受它，跟它角力，看到好处，也理解弊端。所以我认为，我们做的最重要的事情就是把这些东西摆出来，这样世界就可以开始了解将要面对什么。在我为开放人工智能研究中心感到骄傲的一切事情里，最骄傲的之一就在于，我们在通用人工智能上推开“奥弗顿之窗”（一种用于理解在某个特定时期哪些政策在政治上为公众接受的模型），以我认为健康并且重要的方式，即便有时候让人不舒服。

　　除此之外，我们希望提供日益强大的API，同时能够让它们更加安全。我们将继续开源，就像我们开源了CLIP（2021年发布的视觉神经网络）。在引发图像生成繁荣的领域开源。最近，我们开源了Whisper和Triton（自动语音识别系统和编程语言）。所以我相信这是一个多管齐下的策略，一方面要拿出东西，另一方面要平衡每样特定东西带来的风险和收益。

　　问：那么你觉得开放人工智能研究中心在营利方面的商业压力或现实问题会不会与公司的整体使命发生冲突？

　　答：完全没有。你可以随便向任何人打听我的情况。我在这方面有点出名，那就是不容忍任何我不想容忍的东西。如果我这么想，我就不会去交易。

　　问：你们这些人不是穿着粗布衬衣的苦行僧，不会说：“我们不想借此获利。”但同时感觉你们也不是出于致富的动机。

　　答：我认为这无疑是一种平衡。我们要让人们非常成功，取得很大回报（在股票方面），这很好，只要是在正常合理的水平上。我们希望有能力现在就做好日后如何跟社会分享这件事。我觉得我们做得很好，达成了平衡。

　　GPT最酷和最令人害怕的事

　　问：到目前为止，你看到有人用GPT做的最酷的事情是什么？最让你害怕的是什么？

　　答：真的很难挑出一样最酷的东西。看到人们做的事情如此多样，这太棒了。我可以告诉你我个人认为最有用的一点，那就是总结，这对我绝对意义非凡，远超我的预想。我可以得到完整文章或长电子邮件的线索概括，这远比我想象的有用。此外还有一点很酷：身边好像有一位超棒的程序员，你可以提出内行才懂的编程问题或者让对方帮你调试代码。

　　至于吓人的事？我当然一直非常关注利用开源图像生成器生成复仇式色情（未经过他人同意，任意散布含有他人色情内容的照片或视频的报复手段――本报注）的行为。我认为这将造成巨大的、可以预见的危害。

　　问：你觉得这些工具背后的企业有责任保证那种事情不发生吗？还是说这只是人性不可避免的一面？

　　答：我觉得两者兼而有之。存在如何监管的问题。在开源之上发展起来的公司，与最终用户有最后关系的公司，也要承担一定的责任。所以，我觉得会是共同负责和共同问责。

本文地址： https://www.xxs100.com//show-395227.html