chatgpt最强大的功能是什么 ChatGPT 概念
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
原文标题:《从 GPT-1 到 GPT-4 看 ChatGPT 的崛起》
原文作者:阿法兔研究笔记
ChatGPT 是个啥?
ChatGPT 是个啥?
近期,OpenAI 发布了 ChatGPT,是一个可以对话的方式进行交互的模型,因为它的智能化,得到了很多用户的欢迎。ChatGPT 也是 OpenAI 之前发布的 InstructGPT 的亲戚,ChatGPT 模型的训练是使用 RLHF(Reinforcement learning with human feedback)也许ChatGPT 的到来,也是 OpenAI 的 GPT-4 正式推出之前的序章。
什么是 GPT?从 GPT-1 到 GPT-3
Generative Pre-trained Transformer (GPT),是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话 AI。
2018 年,GPT-1 诞生,这一年也是 NLP(自然语言处理)的预训练模型元年。性能方面,GPT-1 有着一定的泛化能力,能够用于和监督任务无关的 NLP 任务中。其常用任务包括:
-
自然语言推理:判断两个句子的关系(包含、矛盾、中立)
-
问答与常识推理:输入文章及若干答案,输出答案的准确率
-
语义相似度识别:判断两个句子语义是否相关
-
分类:判断输入文本是指定的哪个类别
虽然 GPT-1 在未经调试的任务上有一些效果,但其泛化能力远低于经过微调的有监督任务,因此 GPT-1 只能算得上一个还算不错的语言理解工具而非对话式 AI。
GPT-2 也于 2019 年如期而至,不过,GPT-2 并没有对原有的网络进行过多的结构创新与设计,只使用了更多的网络参数与更大的数据集:最大模型共计 48 层,参数量达 15 亿,学习目标则使用无监督预训练模型做有监督任务。在性能方面,除了理解能力外,GPT-2 在生成方面第一次表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。在“变得更大”之后,GPT-2 的确展现出了普适而强大的能力,并在多个特定的语言建模任务上实现了彼时的最佳性能。
之后,GPT-3 出现了,作为一个无监督模型(现在经常被称为自监督模型),几乎可以完成自然语言处理的绝大部分任务,例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。而且,该模型在诸多任务上表现卓越,例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器(仅 52% 的正确率,与随机猜测相当),更令人惊讶的是在两位数的加减运算任务上达到几乎 100% 的正确率,甚至还可以依据任务描述自动生成代码。一个无监督模型功能多效果好,似乎让人们看到了通用人工智能的希望,可能这就是 GPT-3 影响如此之大的主要原因
GPT-3 模型到底是什么?
实际上,GPT-3 就是一个简单的统计语言模型。机器学习的角度,语言模型是对词语序列的概率分布的建模,即利用已经说过的片段作为条件预测下一个时刻不同词语出现的概率分布。语言模型一方面可以衡量一个句子符合语言文法的程度(例如衡量人机对话系统自动产生的回复是否自然流畅),同时也可以用来预测生成新的句子。例如,对于一个片段“中午 12 点了,我们一起去餐厅”,语言模型可以预测“餐厅”后面可能出现的词语。一般的语言模型会预测下一个词语是“吃饭”,强大的语言模型能够捕捉时间信息并且预测产生符合语境的词语“吃午饭”。
通常,一个语言模型是否强大主要取决于两点:首先看该模型是否能够利用所有的历史上下文信息,上述例子中如果无法捕捉“中午 12 点”这个远距离的语义信息,语言模型几乎无法预测下一个词语“吃午饭”。其次,还要看是否有足够丰富的历史上下文可供模型学习,也就是说训练语料是否足够丰富。由于语言模型属于自监督学习,优化目标是最大化所见文本的语言模型概率,因此任何文本无需标注即可作为训练数据。
由于 GPT-3 更强的性能和明显更多的参数,它包含了更多的主题文本,显然优于前代的 GPT-2 。作为目前最大的密集型神经网络,GPT-3 能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的各位哲学家――预测生命的真谛。且 GPT-3 不需要微调,在处理语法难题方面,它只需要一些输出类型的样本(少量学习)。可以说 GPT-3 似乎已经满足了我们对于语言专家的一切想象。
注:上文主要参考以下文章:
1.GPT 4 发布在即堪比人脑,多位圈内大佬坐不住了!-徐杰承、云昭 -公众号 51 CTO 技术栈- 2022-11-24 18: 08
2.一文解答你对 GPT-3 的好奇!GPT-3 是什么?为何说它如此优秀?-张家俊 中国科学院自动化研究所 2020-11-11 17: 25 发表于北京
3.The Batch: 329 | InstructGPT,一种更友善、更温和的语言模型-公众号 DeeplearningAI-2022-02-07 12: 30
GPT-3 存在什么问题?
但是 GTP-3 并不完美,当前有人们最担忧人工智能的主要问题之一,就是聊天机器人和文本生成工具等很可能会不分青红皂白和质量好坏,地对网络上的所有文本进行学习,进而生产出错误的、恶意冒犯的、甚至是攻击性的语言输出,这将会充分影响到它们的下一步应用。
OpenAI 也曾经提出,会在不久的将来发布更为强大的 GPT-4 :
据说,GPT-4 会在明年发布,它能够通过图灵测试,并且能够先进到和人类没有区别,除此之外,企业引进 GPT-4 的成本也将大规模下降。
ChatGP 与InstructGPT
ChatGPT 与 InstructGPT
谈到 Chatgpt,就要聊聊它的“前身”InstructGPT。
2022 年初,OpenAI 发布了 InstructGPT;在这项研究中,相比 GPT-3 而言,OpenAI 采用对齐研究(alignment research),训练出更真实、更无害,而且更好地遵循用户意图的语言模型 InstructGPT,InstructGPT 是一个经过微调的新版本 GPT-3 ,可以将有害的、不真实的和有偏差的输出最小化。
InstructGPT 的工作原理是什么?
开发人员通过结合监督学习+人类反馈中获得的强化学习。来提高 GPT-3 的输出质量。在这种学习中,人类对模型的潜在输出进行排序;强化学习算法则对产生类似于高级输出材料的模型进行奖励。
训练数据集以创建提示开始,其中一些提示是基于 GPT-3 用户的输入,比如“给我讲一个关于青蛙的故事”或“用几句话给一个 6 岁的孩子解释一下登月”。
开发人员将提示分为三个部分,并以不同的方式为每个部分创建响应:
人类作家会对第一组提示做出响应。开发人员微调了一个经过训练的 GPT-3 ,将它变成 InstructGPT 以生成每个提示的现有响应。
下一步是训练一个模型,使其对更好的响应做出更高的奖励。对于第二组提示,经过优化的模型会生成多个响应。人工评分者会对每个回复进行排名。在给出一个提示和两个响应后,一个奖励模型(另一个预先训练的 GPT-3)学会了为评分高的响应计算更高的奖励,为评分低的回答计算更低的奖励。
开发人员使用第三组提示和强化学习方法近端策略优化(Proximal Policy Optimization, PPO)进一步微调了语言模型。给出提示后,语言模型会生成响应,而奖励模型会给予相应奖励。PPO 使用奖励来更新语言模型。
本段参考:The Batch: 329 | InstructGPT,一种更友善、更温和的语言模型-公众号 DeeplearningAI- 2022-02-07 12: 30
重要在何处?核心在于――人工智能需要是能够负责任的人工智能
OpenAI 的语言模型可以助力教育领域、虚拟治疗师、写作辅助工具、角色扮演游戏等,在这些领域,社会偏见、错误信息和毒害信息存在都是比较麻烦的,能够避免这些缺陷的系统才能更具备有用性。
Chatgpt 与 InstructGPT 的训练过程有哪些不同?
总体来说,Chatgpt 和上文的 InstructGPT 一样,是使用 RLHF(从人类反馈中强化学习)训练的。不同之处在于数据是如何设置用于训练(以及收集)的。(这里解释一下:之前的 InstructGPT 模型,是给一个输入就给一个输出,再跟训练数据对比,对了有奖励不对有惩罚;现在的 Chatgpt 是一个输入,模型给出多个输出,然后人给这个输出结果排序,让模型去给这些结果从“更像人话”到“狗屁不通”排序,让模型学习人类排序的方式,这种策略叫做 supervised learning,本段感谢张子兼博士)
ChatGPT 存在哪些局限性?
如下:
a) 在训练的强化学习 (RL) 阶段,没有真相和问题标准答案的具体来源,来答复你的问题。
b) 训练模型更加谨慎,可能会拒绝回答(以避免提示的误报)。
c) 监督训练可能会误导/偏向模型倾向于知道理想的答案,而不是模型生成一组随机的响应并且只有人类评论者选择好的/排名靠前的响应
注意:ChatGPT 对措辞敏感。,有时模型最终对一个短语没有反应,但对问题/短语稍作调整,它最终会正确回答。训练者更倾向于喜欢更长的答案,因为这些答案可能看起来更全面,导致倾向于更为冗长的回答,以及模型中会过度使用某些短语,如果初始提示或问题含糊不清,则模型不会适当地要求澄清。
ChatGPT’s self-identified limitations are as follows.
Plausible-sounding but incorrect answers:
a) There is no real source of truth to fix this issue during the Reinforcement Learning (RL) phase of training.
b) Training model to be more cautious can mistakenly decline to answer (false positive of troublesome prompts).
c) Supervised training may mislead / bias the model tends to know the ideal answer rather than the model generating a random set of responses and only human reviewers selecting a good/highly-ranked responseChatGPT is sensitive to phrasing. Sometimes the model ends up with no response for a phrase, but with a slight tweak to the question/phrase, it ends up answering it correctly.
Trainers prefer longer answers that might look more comprehensive, leading to a bias towards verbose responses and overuse of certain phrases.The model is not appropriately asking for clarification if the initial prompt or question is ambiguous.A safety layer to refuse inappropriate requests via Moderation API has been implemented. However, we can still expect false negative and positive responses.
责任编辑:张靖笛
chatgpt注册可以用qq邮箱吗 了解一下什么是chatgpt
chat怎么注册账号,chat为什么注册不了在过去,普通人能做的事在数量层间都差不太多(至少在相近数量级内)。即便相对聪明,人脑都有生物规则约束,无法快速取得技术上的时间绝对领先优势。随着机器智能的崛起,不同人之间的差距、可以做的事情的数量/质量,在可见的未来将不断被拉开,且这个趋势将无法避免。
例如,AI作画最近引发了不少关于“其是否对传统画家造成不利影响”的讨论。事实上,有了AI的辅助,总有一小部分画家因为能够掌握这类最新的技术,因为能更高效地创作出更具想象力的作品而收益。一个基本的判断是,AI仍旧很难替代人类,但却能在特定领域内帮助一小部分人提升工作效率与扩大自身视角。
这篇文章就首先介绍下OpenAI推出的聊天机器人ChatGPT。也许你会问,仅仅是一个聊天机器人,这有什么的。这边建议您亲身体会之后再做判断。AI的核心魅力在于一旦拥有一个成熟可靠的产品,理论上它是可以无限规模化应用,并且能够不断迭代进化。
ChatGPT自上线以来,一直备受人们关注,并衍生出各种花里胡哨的玩法… 但这篇文章只总结一些个人认为比较实用、且一直能够用下去的几种朴素的方式。
ChatGPT能够帮助快速理清一些学术概念及不同概念之间的区别。
E.g.:
- What is “concept A” and what is the most related application?
- What is the difference between “concept A” and “concept B”?
事实上也适用于任何概念的查询。
可以简明说明文章的行文逻辑,每一段涵盖哪些点,2分钟给你论文的Introduction来一个初稿,其实就是一种更先进的“计算机辅助设计”。
E.g.: Write a paper about XX topic. First introduce A, then introduce B. Give two examples about XXX. … Finally, summarize the above contents and possible future directions.
这其实是我目前所感受到最实用但相对被低估的用法。机器也许只能达到人类60分水平,甚至更低,但其胜在效率与自身知识储备容量。有了它,就相当于阿凡达系列里面人类穿上了机械外骨骼,达到之前所从未体验过的写作效率。我们目前已经很多别的类型辅助写作工具,例如Grammarly可以自动纠正语法错误。但像ChatGPT这样的,目前应该还没有第二家。
当你不知道一件事情该怎么做的时候,当你需要某个domain knowledge的时候。例如,你想要做一个小项目,但不知道如何搭建框架,你可以问:
E.g. What should be included when considering XXX (a certain task)?
- Establishing a big data platform for electric vehicle management
- Building a automated vehicle control algorithm
- …
chatgpt概念还能炒作多久 chatgpt谁研发的chatgpt是什么意思,chatgpt下载,chatgpt国内能用吗,chatgpt原理
今天大盘继续调整,关键成交量非常低迷,沪市只成交了不到3000亿,深市也只成交了5114.5亿,到底机构都干啥去了?
或许,当下的私募大佬、公募基金经理,都在忙着一件事,那就是找机器人聊天,不管是ChatGPT,还是其他类似的应用。大家都在忙着问问题,或者找机器人写作文,写论文,甚至是绘画。
若真如此,也难怪当下的行情,除ChatGPT这个概念外,其他热点都没有多少持续性,就连昨天爆炒的工业机器人板块,今天也降温了。
确实,Z哥也低估了ChatGPT概念的热度,昨天在想,可能大家新鲜感一过,一切就都成过眼云烟。但现实并非如此,当你真正接触到ChatGPT之后,才会被其震撼到。
一位朋友在使用过ChatGPT之后发出感叹,如果未来它继续训练资产配置、投资组合、风险控制等等,那么我们现在这些做投资的,可能真的要成为失业人员了……未来5到10年世界会是什么样子?想想有点可怕。
今天,ChatGPT概念的炒作仍在继续,尽管个股有些分化,科大讯飞、广云科技等个股出现调整了,但概念龙头还在大涨。比如海天瑞声再度20CM涨停,汉王科技虽然开板,但继续大涨9%,还有云从科技、拓尔思等继续上涨。
毫无疑问,继云从科技之后,海天瑞声成为了新的龙头。
海天瑞声今天表示,我们也注意到ChatGPT等AIGC类话题近期在国内、国外产业界引发了大量关注和讨论,公司认为这对于产业界更加重视AI的整体发展是一个利好,但公司自身始终秉承冷静、理性、专业的态度看待包括ChatGPT等在内的各类产业界新现象对公司业务所能产生的实质影响,我们认为整个AIGC领域未来将保持长期向上发展趋势,但其发展速率、阶段性效果需要冷静分析、避免短期盲目过热,公司始终坚信需要回归到行业及公司业务基本面看待各类新现象所能产生的价值。
但是,在股价大幅飙升之后,困扰投资者的一个问题是,现在关于ChatGPT这个概念的炒作,是否已经出现泡沫了?
对此,Z哥将这个问题抛给了ChatGPT自己,让它来回答。
而ChatGPT给出的答案是,“没有。ChatGPT的概念炒作并没有出现泡沫,因为它是一种新兴的技术,它的发展还处于初级阶段,投资者对它的认知还不够深入,所以没有出现泡沫的现象。”
随后,Z哥又问了它另一个问题:A股炒作的ChatGPT概念股海天瑞声是泡沫吗?
看到ChatGPT给出的答案,Z哥有些不甘心,连续问了两次,结果答案都一样:“不是。A股炒作的概念股海天瑞声(688787)是一家专注于智能语音技术的公司,其产品和技术在国内外市场都有很高的知名度和口碑,其股价也一直保持稳定上涨的趋势,因此不能说它是泡沫。”
Z哥心中是有所怀疑的,它真的知道什么叫“泡沫”,或者什么是股市的泡沫吗?其实它大概率是不知道的。一方面,它的知识还不够“新”,中信证券在近期一篇研报中指出了数据的实时性问题。
目前英文版本的ChatGPT数据截至2021年,而中文版本的ChatGPT数据截至2020年,数据库版本滞后的主要原因是由于语言类大模型的技术限制。ChatGPT目前的在GPT大模型上加入标注数据训练模式让实时数据的引入非常困难,如果要重新预训练模型,我们估计每次预训练需要用到1000块以上的英伟达A100显卡工作半个月至一个月的时间,成本在百万美元以上。而如果采用使用微调的方式专门训练新知识,会导致新知识的在模型内的权重过高,频繁的微调也会导致模型“遗忘”旧的知识。
另一方面,其数据的真实性也仍不够可靠,可能是在“不懂装懂”。
在大量的测试后我们发现,虽然ChatGPT回答问题的准确性有所提高,但如果提出的问题较为模糊或者本身包含部分错误信息在内,模型有可能以“一本正经”的语气生成完全错误甚至凭空捏造的回答。真假答案的混杂会让用户在需要对专业性问题寻求答案时产生严重的困扰,这也是目前语言类大模型普遍存在的问题。
所以,ChatGPT还有较长的学习之路要走,也可以说“未来可期”。今天下午的消息,有道AI技术团队已投入到ChatGPT同源技术AIGC在教育场景的落地研发中,目前该团队正在AI口语老师、中文作文批改等细分学习场景中尝试探索,将尽快推出相关的demo版产品。
可以预感,今晚美股,网易有道股价可能会起飞。因为昨天,刚刚宣布中文版ChatGPT项目“文心一言”将在3月面世的百度,其股价昨晚大涨了12%。
(文章来源:每日经济新闻)