淘优惠

淘优惠

open ai定义自己的模型 大模型时代的ai之变与开发之根

热门文章 0

淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】


亲爱的数据
・北京
打开网易新闻 查看精彩图片

OpenAI最新发布的ChatGPT模型,是基于GPT-3.5系列里的一个模型微调而成,用强化学习技术进行训练。“预训练-微调”是大模型走上“战场”前的必经之路,如果你足够看重这种方式,说是一种“范式”也不过分。

而强化学习在这里比较学术的说法是“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)。

打开网易新闻 查看精彩图片

从名字也可以看出来了,擅长交互。

ChatGPT模型以对话方式和人进行交互,也就是俗称人和人工智能对话。

你问,它答。可以想象成一个机器人,或者某种耐心的客服。

这些ChatGPT模型的前辈都做到,但ChatGPT模型更优秀,所以一群技术发烧友和疯了一样去尝试。

打开网易新闻 查看精彩图片

ChatGPT模型仍处于免费试用阶段,所以,更多网友都去“对话”了。

(之前,GPT-3根据使用量“token”收费)

Dall-E、Imagen、Stable Fusion、Midjourney、Lambda、Imagen Video等AI炫酷新词,其实都是AI模型的名字,现在又有了ChatGPT模型。

来看一段,网友对ChatGPT的灵魂拷问:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

除了对话,还可以让这个AI模型干一些更复杂的活。比如,写剧本,写诗,甚至可以承认错误,如果你认为它的回答不对,你可以让它改正,给更好的答案。

ChatGPT模型的前辈在聊天上让人类不舒服,它们只是话语通顺,但脱离实际。

一位资深AI工程师对ChatGPT模型的感受是:“谈不上完美,但大受震撼!”

人类肉眼可见各种AI模型的能力在迅速提升,一试便知不是空话。试了,就有结论了,不需要吹牛,不需要包装。

让人发出一种感慨:前进吧,起飞吧,AI。

(完)

亲爱的数据,出品

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
特别声明:本文为网易自媒体平台“网易号”作者上传并发布,仅代表该作者观点。网易仅提供信息发布平台。

openai创始人谈chatgpt 用chatgpt和openai赚钱靠谱吗

opensea创始人,open公司,open ai lab 这家公司好不好,openai 中国

甚至有人预言如果谷歌不做出改变很快就会被淘汰,到时候自己愿意每月花15-20美元使用ChatGPT。

不过好消息是,目前ChatGPT正处于 免费试用阶段,有条件的小伙伴可以赶紧试试。 (链接放在文末)

ChatGPT有多神奇?

有网友分别问谷歌和ChatGPT“如何使用Latex表示微分结果”,相较于谷歌中规中矩的回答:

ChatGPT则是一下给出了直接可用的代码,你只需动动手复制粘贴即可:

还有人让ChatGPT给出冒泡排序的最坏时间复杂度,并且要求它用“19世纪40年代黑帮电影中讲话很快的聪明人”口吻说出来,也被ChatGPT轻松拿捏:

直接问下面代码的bug是啥,ChatGPT也能给你说得明明白白:

除了计算机,ChatGPT在其他领域表现也很出色,比如它还能AI在线问诊。

当你告诉它自己得了皮疹,并且呼吸困难,感觉很虚弱时,ChatGPT会像医生一样为你分析病因,并建议你比起吃药,更需要戒烟、多锻炼。

与搜索引擎里需要小心分辨的医疗广告对比,可以说很贴心了。

还有许多机智的网友,像上文提到的那样,用ChatGPT来搞设计。

比如这位网友让ChatGPT给自己设计卧室,然后用它给出的文字做提示词,去MidJourney生成图像,连请设计公司的钱都省了。

那么,介绍了这么多,ChatGPT背后原理究竟是什么?

背后原理

顾名思义,ChatGPT是在GPT-3.5系列中的一个模型上进行微调而成,该系列已在2022年初完成了训练。

它以对话方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求。

与OpenAI今年初发布的InstructGPT一样,ChatGPT也是使用强化学习进行训练,但在数据收集设置上有所区别。

在模型训练中,OpenAI使用监督微调:训练者提供对话样本,扮演对话的双方,即用户和AI助手。

除此之外,训练者还可以访问模型编写的建议,帮助他们撰写答案。

为了创建强化学习的奖励模型,研究团队需要收集比较数据,为此,他们随机选择模型编写的信息,对替代结果进行抽样,再让训练者对样本进行排名。

通过上述的奖励模型和近端策略优化对模型进行微调,并执行了此过程的多次迭代,最后得出了该模型。

不过别看它在许多方面表现都很出色,研究人员也承认现阶段ChatGPT还存在一些bug。

举个例子,有网友在多次尝试后就指出,ChatGPT经常会过度使用某些短语,比如反复重申“自己是由OpenAI训练的语言模型”。

除此之外,有时候ChatGPT的回答过于冗长,甚至当网友告诉它自己需要更短一点的回答时,它反而说的更多了。

还有理性的网友指出,ChatGPT想要替代谷歌也没那么容易。

一位在Alphabet工作的网友就现身说法,谷歌也不是没有考虑过在搜索引擎中引用大模型,但最大的问题是成本太高了。

如果要对用户收费的话,价格很可能高达150~200美元每月,恐怕没有几个人愿意支付这笔钱。

不过,OpenAI的CEO萨姆・阿尔特曼(Sam Altman)对ChatGPT的未来发展表示很有信心:

他表示,语言接口将是未来的一个发展方向,而ChatGPT就是为大家先打了个样,相信很快大家就能用上能跟自己聊天、回答问题并提供建议的AI助手了。

话说回来,你还想到了ChatGPT哪些好玩的用途?

有条件的小伙伴赶紧戳下面链接试试吧~

指路链接:

https://chat.openai.com/

― 完 ―

量子位 QbitAI ・ 头条号签约

关注我们,第一时间获知前沿科技动态

发布于:山西省

访问管理者报告1000字


快乐的小丸子

户可以在其 Mac 上利用最先进的 Windows 体验来运行超过 200,000 款 Windows 应用和经典游戏,还可以一键下载、安装和配置 Window...

26
程序源代码

推荐使用client_uni(uniapp前端)和api_uni(WordPress插件)搭配使用。uniapp+WordPress开发,支持多端(微信小程序、...

374
程序源代码

博客管理系统是一个融合线上、线下的网民在线交流管理信息化系统。它的使用为网民、运营者搭建了一个方便快捷的信息资讯管理平台;也为媒体机构、融媒体提供了更大、更广的...

212
WangXP

腾讯科技有限公司 ・ 产品架构工程师 (已认证)

写作本系列文章的背景是我们要在大数据平台/企业数据湖场景下给出中心化的用户身份认证方案。此前,我们实现过Windows AD + Kerberos的集成方案,由...

1162
苏生不惑

前几天看到一条微博热搜#手机流氓软件藏得有多深# https://weibo.com/1642512402/LyRczeBu4

814
Luga Lee

Hello folks,我是 Luga,今天我们来聊一聊在?Kubernetes Cluster 编排生态环境中一个至关重要的安全 Topic:Kubectl ...

1296
mixlab

最近有不少群友运用 AIGC 工具来提升工作效率,我听说连 3D 数字资产的渲染贴图素材都能生成了。

711
统计学家

科研路上我们往往会读到让自己觉得想法很惊艳的论文,心中对不同的论文也会有一个排名,以下介绍了一些知乎作者心中白月光般存在的深度学习领域论文,看看是否你们拥有同样...

423
用户7442547

泼辣修图5.11.4最新版为用户带来更多新版的修改工具,进一步优化相关的设备,可以更舒畅的使用去修改图片,还有很多贴纸,文字等等小工具使用,丰富照片情景,感兴趣...

856
武汉海翎光电

我们都知道 VLAN 的中文名为"虚拟局域网",VLAN 是一种将局域网设备从逻辑上划分成一个个不同的网段,从而实现虚拟工作组的新兴数据交换技术。这一新兴技术主...

842
用户10333507

做外贸的领英新人经常有一个问题:领英上添加好友时,同一条好友邀请信息给大量的人发,会导致领英账号被封吗?

1625
全栈测试开发日记

  在讲pytest与unittest的区别文章中,我们知道其中一个区别就是参数化,unittest框架使用的第三方库ddt来参数化的,而pytest框架就直接...

611
CloudPods

免费开源的私有云及云管平台来了,除虚拟化外,还支持纳管主流的 9 大公有云及私有云平台,欢迎大家安装体验!

1975
全栈测试开发日记

  前面一节已经讲过访问百度的脚本,现在一个登录的UI自动化案例,以禅道为例(暂时不用公司网站,最近公司信息安全管控比较严格)。

753
全栈测试开发日记

  前面一篇文章cust学习笔记5――登录接口参数关联,简单介绍了关联的使用方法,我们不管做接口功能测试还是接口性能测试,都涉及关联、参数化和检查点。那么现在介...

1094
爱可生开源社区

关于OBproxy的功能与介绍就不再详细说明了,从3.1.3开始,OB提供了config server的源码作为tool在开源仓库内。

712
kr
1164
怪兽

minicom minicom 是一款启动速度快,功能强大的串口终端调试工具,当然缺点就是纯字符界面,没有图形界面的调试工具看起来直观方便,但是它功能十分强大,...

1614
TSINGSEE青犀视频

目前,城市工程建设规模不断扩大,工艺流程纷繁复杂,如何做好现场施工监管、控制事故发生频率,一直是施工企业、政府管理部门关注的焦点。利用现代科技,优化监控手段,实...

973
相柳

腾云先锋 ・ 腾云先锋(TDP)成员 (已认证)

如未实名,参考实名认证指引:https://cloud.tencent.com/document/product/378/3592

1784