open ai定义自己的模型 大模型时代的ai之变与开发之根
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
OpenAI最新发布的ChatGPT模型,是基于GPT-3.5系列里的一个模型微调而成,用强化学习技术进行训练。“预训练-微调”是大模型走上“战场”前的必经之路,如果你足够看重这种方式,说是一种“范式”也不过分。
而强化学习在这里比较学术的说法是“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)。
从名字也可以看出来了,擅长交互。
ChatGPT模型以对话方式和人进行交互,也就是俗称人和人工智能对话。
你问,它答。可以想象成一个机器人,或者某种耐心的客服。
这些ChatGPT模型的前辈都做到,但ChatGPT模型更优秀,所以一群技术发烧友和疯了一样去尝试。
ChatGPT模型仍处于免费试用阶段,所以,更多网友都去“对话”了。
(之前,GPT-3根据使用量“token”收费)
Dall-E、Imagen、Stable Fusion、Midjourney、Lambda、Imagen Video等AI炫酷新词,其实都是AI模型的名字,现在又有了ChatGPT模型。
来看一段,网友对ChatGPT的灵魂拷问:
除了对话,还可以让这个AI模型干一些更复杂的活。比如,写剧本,写诗,甚至可以承认错误,如果你认为它的回答不对,你可以让它改正,给更好的答案。
ChatGPT模型的前辈在聊天上让人类不舒服,它们只是话语通顺,但脱离实际。
一位资深AI工程师对ChatGPT模型的感受是:“谈不上完美,但大受震撼!”
人类肉眼可见各种AI模型的能力在迅速提升,一试便知不是空话。试了,就有结论了,不需要吹牛,不需要包装。
让人发出一种感慨:前进吧,起飞吧,AI。
(完)
亲爱的数据,出品
openai创始人谈chatgpt 用chatgpt和openai赚钱靠谱吗
opensea创始人,open公司,open ai lab 这家公司好不好,openai 中国甚至有人预言如果谷歌不做出改变很快就会被淘汰,到时候自己愿意每月花15-20美元使用ChatGPT。
不过好消息是,目前ChatGPT正处于 免费试用阶段,有条件的小伙伴可以赶紧试试。 (链接放在文末)
ChatGPT有多神奇?
有网友分别问谷歌和ChatGPT“如何使用Latex表示微分结果”,相较于谷歌中规中矩的回答:
ChatGPT则是一下给出了直接可用的代码,你只需动动手复制粘贴即可:
还有人让ChatGPT给出冒泡排序的最坏时间复杂度,并且要求它用“19世纪40年代黑帮电影中讲话很快的聪明人”口吻说出来,也被ChatGPT轻松拿捏:
直接问下面代码的bug是啥,ChatGPT也能给你说得明明白白:
除了计算机,ChatGPT在其他领域表现也很出色,比如它还能AI在线问诊。
当你告诉它自己得了皮疹,并且呼吸困难,感觉很虚弱时,ChatGPT会像医生一样为你分析病因,并建议你比起吃药,更需要戒烟、多锻炼。
与搜索引擎里需要小心分辨的医疗广告对比,可以说很贴心了。
还有许多机智的网友,像上文提到的那样,用ChatGPT来搞设计。
比如这位网友让ChatGPT给自己设计卧室,然后用它给出的文字做提示词,去MidJourney生成图像,连请设计公司的钱都省了。
那么,介绍了这么多,ChatGPT背后原理究竟是什么?
背后原理
顾名思义,ChatGPT是在GPT-3.5系列中的一个模型上进行微调而成,该系列已在2022年初完成了训练。
它以对话方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求。
与OpenAI今年初发布的InstructGPT一样,ChatGPT也是使用强化学习进行训练,但在数据收集设置上有所区别。
在模型训练中,OpenAI使用监督微调:训练者提供对话样本,扮演对话的双方,即用户和AI助手。
除此之外,训练者还可以访问模型编写的建议,帮助他们撰写答案。
为了创建强化学习的奖励模型,研究团队需要收集比较数据,为此,他们随机选择模型编写的信息,对替代结果进行抽样,再让训练者对样本进行排名。
通过上述的奖励模型和近端策略优化对模型进行微调,并执行了此过程的多次迭代,最后得出了该模型。
不过别看它在许多方面表现都很出色,研究人员也承认现阶段ChatGPT还存在一些bug。
举个例子,有网友在多次尝试后就指出,ChatGPT经常会过度使用某些短语,比如反复重申“自己是由OpenAI训练的语言模型”。
除此之外,有时候ChatGPT的回答过于冗长,甚至当网友告诉它自己需要更短一点的回答时,它反而说的更多了。
还有理性的网友指出,ChatGPT想要替代谷歌也没那么容易。
一位在Alphabet工作的网友就现身说法,谷歌也不是没有考虑过在搜索引擎中引用大模型,但最大的问题是成本太高了。
如果要对用户收费的话,价格很可能高达150~200美元每月,恐怕没有几个人愿意支付这笔钱。
不过,OpenAI的CEO萨姆・阿尔特曼(Sam Altman)对ChatGPT的未来发展表示很有信心:
他表示,语言接口将是未来的一个发展方向,而ChatGPT就是为大家先打了个样,相信很快大家就能用上能跟自己聊天、回答问题并提供建议的AI助手了。
话说回来,你还想到了ChatGPT哪些好玩的用途?
有条件的小伙伴赶紧戳下面链接试试吧~
指路链接:
https://chat.openai.com/
― 完 ―
量子位 QbitAI ・ 头条号签约
关注我们,第一时间获知前沿科技动态
访问管理者报告1000字
户可以在其 Mac 上利用最先进的 Windows 体验来运行超过 200,000 款 Windows 应用和经典游戏,还可以一键下载、安装和配置 Window...
推荐使用client_uni(uniapp前端)和api_uni(WordPress插件)搭配使用。uniapp+WordPress开发,支持多端(微信小程序、...
博客管理系统是一个融合线上、线下的网民在线交流管理信息化系统。它的使用为网民、运营者搭建了一个方便快捷的信息资讯管理平台;也为媒体机构、融媒体提供了更大、更广的...
腾讯科技有限公司 ・ 产品架构工程师 (已认证)
写作本系列文章的背景是我们要在大数据平台/企业数据湖场景下给出中心化的用户身份认证方案。此前,我们实现过Windows AD + Kerberos的集成方案,由...
前几天看到一条微博热搜#手机流氓软件藏得有多深# https://weibo.com/1642512402/LyRczeBu4
Hello folks,我是 Luga,今天我们来聊一聊在?Kubernetes Cluster 编排生态环境中一个至关重要的安全 Topic:Kubectl ...
最近有不少群友运用 AIGC 工具来提升工作效率,我听说连 3D 数字资产的渲染贴图素材都能生成了。
科研路上我们往往会读到让自己觉得想法很惊艳的论文,心中对不同的论文也会有一个排名,以下介绍了一些知乎作者心中白月光般存在的深度学习领域论文,看看是否你们拥有同样...
泼辣修图5.11.4最新版为用户带来更多新版的修改工具,进一步优化相关的设备,可以更舒畅的使用去修改图片,还有很多贴纸,文字等等小工具使用,丰富照片情景,感兴趣...
我们都知道 VLAN 的中文名为"虚拟局域网",VLAN 是一种将局域网设备从逻辑上划分成一个个不同的网段,从而实现虚拟工作组的新兴数据交换技术。这一新兴技术主...
做外贸的领英新人经常有一个问题:领英上添加好友时,同一条好友邀请信息给大量的人发,会导致领英账号被封吗?
在讲pytest与unittest的区别文章中,我们知道其中一个区别就是参数化,unittest框架使用的第三方库ddt来参数化的,而pytest框架就直接...
免费开源的私有云及云管平台来了,除虚拟化外,还支持纳管主流的 9 大公有云及私有云平台,欢迎大家安装体验!
前面一节已经讲过访问百度的脚本,现在一个登录的UI自动化案例,以禅道为例(暂时不用公司网站,最近公司信息安全管控比较严格)。
前面一篇文章cust学习笔记5――登录接口参数关联,简单介绍了关联的使用方法,我们不管做接口功能测试还是接口性能测试,都涉及关联、参数化和检查点。那么现在介...
关于OBproxy的功能与介绍就不再详细说明了,从3.1.3开始,OB提供了config server的源码作为tool在开源仓库内。
minicom minicom 是一款启动速度快,功能强大的串口终端调试工具,当然缺点就是纯字符界面,没有图形界面的调试工具看起来直观方便,但是它功能十分强大,...
目前,城市工程建设规模不断扩大,工艺流程纷繁复杂,如何做好现场施工监管、控制事故发生频率,一直是施工企业、政府管理部门关注的焦点。利用现代科技,优化监控手段,实...
腾云先锋 ・ 腾云先锋(TDP)成员 (已认证)
如未实名,参考实名认证指引:https://cloud.tencent.com/document/product/378/3592