淘优惠

淘优惠

有朝一日会取代人脑?究竟什么是ChatGPT,它有哪些功能?

热门文章 0

淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】

有朝一日能觉醒,有朝一日能觉醒的意思,有朝一日是贬义吗,有朝一日是什么时候

2022年11月底,一款应用程序一经推出,就迅速蹿红国内外网络,风靡全球。

在短短5天时间中,其注册用户就超过100万人,2个月内,注册用户就达到1亿

相比之下,Tiktok花了9个月才达到1亿用户,而Instagram(IG)更是花费了长达2.5年的时间。

据路透社引述瑞士银行(UBS)发布的一份报告显示,今年1月期间,这款应用程序每天都有约1300万访问者

《哈佛商业评论》更是将其描述为是

“人工智能的转折点”。

而这款应用程序便是名为ChatGPT 的AI聊天机器人,它也因此成为了目前史上最快达到1亿用户数的应用程序,高开暴走。

什么是ChatGPT ?它具体都有哪些功能?它有多厉害?才让这么多用户对其产生浓厚兴趣,趋之若鹜

ChatGPT作为一款聊天机器人,是由美国人工智能研究实验室Open AI,于2022年11月30日发布的一款全新聊天机器人模型

可以将其理解为是一套大型语言计算机,是采用人工智能技术对语言进行处理的一套工具。

“GPT”中的“G”代表“create生成”,表示其生成文本的能力。

“P”代表“practice 训练”,它会使用一个机器学习任务中的模型,并以此来训练另一个模型,并提供大量用于预训练的文本。

“T”则代表“transformer神经网络”,用于检查数据序列中所有元素之间的联系。

所以,ChatGPT其实也是一种“文本生成”技术。当你输入文字以后,AI会对其做出判断,从而给出相应的回复和答案。

依靠人工智能技术,ChatGPT通过机器学习算法,能与用户进行更加广泛的主题交流。

但与一般机器人不同的是,ChatGPT不仅通过学习和理解人类的语言来进行对话,还能结合,回顾上下文进行互动,甚至能翻译,帮助你进行内容创作,写文案,写代码等等

比如苹果手机用户们,经常使用的“siri”,其实就是一种利用AI来给予回答的工具。只不过ChatGPT除了可以回答你的问题以外,还可以帮你写文章或者码程序。

ChatGPT知识渊博,具有创造力,其主要功能表现为以下7个方面

1、翻译:和大部分翻译软件一样,ChatGPT也具备这样的基础功能,当你输入中文或者英文,ChatGPT能快速的帮你翻译为另外一种语言。

ChatGPT 目前也支持中文,但是其运行速度仍不及英文。

2、修正语句错误:当你如输入内容时,ChatGPT能判断语句的出错之处,并进一步要求程序分析解释出错原因,以及如何进行修改。

3、写诗填词:只需输入你想要的任意关键词,ChatGPT就能根据关键词,写出符合主题的语句或者文章,帮助你进行文案创作。

4、整理文章重点:当你输入的内容是长篇的文字段落时,ChatGPT也能对其进行分类,并列出重点,这个功能很适合会议记录时使用。

5、故事剧本创作:你只需要输入指令,并要求好格式,给出一个例子。ChatGPT就能完成一个短篇小说的创作,或者有角色对话的剧本。

6、电邮回复客户:只需输入收件内容,ChatGPT 能撰写出相应的回复信件,这个功能有助处理日常客户咨询量较大的时候。

7、编写程序:ChatGPT 不仅懂得如何依据指令编写程序,还能处理代码压缩、程序语言转换(JavaScript 到 Python)、生成 SQL 语句等等。

但由于ChatGPT还处于技术的起步阶段,会因为AI数据库、计算方式等各种原因,格隆汇公告精选︱近14个交易日累涨260%!ChatGPT概念龙头海天瑞声再次提示风险|石家庄市|思泰克|人民币格隆汇快讯,格隆汇是什么公司,格隆汇最新文章,格隆汇2021年

  【今日焦点】

  中国能建(601868.SH):拟定增募资不超150亿元 用于中能建哈密"光(热)储"多能互补一体化绿电示范项目等

  中国能建(601868.SH)公布2023年度非公开发行A股股票预案,此次非公开发行的募集资金总额(含发行费用)不超过150.00亿元,扣除发行费用后的募集资金净额将30.00亿元用于中能建哈密"光(热)储"多能互补一体化绿电示范项目、15.00亿元用于甘肃庆阳"东数西算"源网荷储一体化智慧零碳大数据产业园示范项目、30.00亿元用于中国能源建设集团浙江火电建设有限公司光热+光伏一体化项目、5.00亿元用于湖北应城300MW级压缩空气储能电站示范项目、25.00亿元用于乌兹别克斯坦巴什和赞克尔迪风电项目、45.00亿元用于补充流动资金等。

  海天瑞声(688787.SH):短期内暂未看到由AIGC带来的大幅订单增长,会持续关注最新发展及抢抓相关领域的新发展机遇

  海天瑞声(688787.SH)发布股票交易异常波动暨风险提示公告,公司专注于为包括AI技术公司在内的AI产业链各类机构提供算法模型开发训练所需的专业数据集,业务与从事人工智能算法及应用开发的企业有比较大的区别。截止公告披露日,公司未与OpenAI开展合作,其ChatGPT的产品和服务未给公司带来业务收入,该领域对数据需求的发展趋势有待观察。从目前公司实际情况来看,短期内暂未看到由AIGC带来的大幅订单增长,公司会持续关注该领域最新发展,抢抓相关领域的新发展机遇。

  TCL中环(002129.SZ):拟投资41亿元建年产35GW高纯太阳能超薄单晶硅片智慧工厂及其配套项目

  TCL中环(002129.SZ)公布,公司与银川经济技术开发区管理委员会("银川经开区管委会")就在银川经济技术开发区投资建设年产35GW高纯太阳能超薄单晶硅片智慧工厂及其配套项目("DW五期项目")达成投资合作事宜,签署了《项目合作协议书》,项目计划总投资额约41亿元。

  和远气体(002971.SZ):氢气业务营收占比约8%左右

  和远气体(002971.SZ)发布股票交易异常波动公告,公司的氢气业务营收占比约为8%左右,其中高纯氢气涉及的业务占比较小,对公司当期利润不构成重大影响;公司已公告的宜昌和潜江两大特气产业园仍处于建设期,投产和产生效益需要一个过程。

  南都电源(300068.SZ):拟中标不超3.23亿美元的新型电力储能项目

  南都电源(300068.SZ)公布,公司于近日收到意大利某主要电力公司的中标通知书,南都电源以第一名中标其美国锂电储能系统项目,中标总容量为1.36GWh,中标金额为最高不超过3.23亿美元。

  海康威视(002415.SZ):拟增资石家庄森思泰克并引入战投、加速汽车电子业务的发展

  海康威视(002415.SZ)公布,公司全资子公司石家庄森思泰克拟新增注册资本23.98亿元人民币,其中海康威视拟以持有的控股子公司杭州海康汽车技术有限公司("汽车技术")60%股权作价10.788亿元人民币、以持有的控股子公司芜湖森思泰克智能科技有限公司("芜湖森思泰克")44.4%股权作价2.664亿元人民币,共计作价13.452亿元人民币进行增资,持有石家庄森思泰克不低于56.0969%股权;同时,石家庄森思泰克拟以公开挂牌方式引入一个或多个战略投资者投资金额共计10.528亿元人民币,获得石家庄森思泰克不超过43.9031%股权,最终增资金额及持股比例以挂牌认购成交结果为准。增资完成后,石家庄森思泰克注册资本将由1万元人民币增加至239801万元人民币,海康威视将持有石家庄森思泰克不低于56.0969%的股权,仍将维持对石家庄森思泰克的控股权,合并其财务报表。此次增资石家庄森思泰克,可以增加其运营资金,增强其承接系统集成项目的竞争优势,满足石家庄森思泰克未来业务发展的需求;通过引入战略投资者,石家庄森思泰克的股权结构能够得到有效优化,有利于完善公司的治理结构,同时更好地加速汽车电子业务版块的发展,优化汽车电子在技术、市场、资源等方面的资源配置。

  通合科技(300491.SZ):公司充电桩业务可能面临技术研发与市场开拓不及预期的风险

  通合科技(300491.SZ)发布股票交易异常波动公告,近期市场新能源汽车充电桩板块关注度较高,根据公司《2021年年度报告》,2021年公司实现营业收入42106.84万元,其中充换电站充电电源系统(充电桩)及电动汽车车载电源产品营业收入为13542.8万元,仅占公司营业收入的32.16%。充电桩市场参与者众多、竞争激烈,未来发展存在不确定性,公司充电桩业务可能面临技术研发与市场开拓不及预期的风险,进而对公司经营业绩产生不利影响。

  浪潮信息(000977.SZ):源大模型及相关应用尚未产生实际收入

  浪潮信息(000977.SZ)公布,2021年9月,公司发布了中文语言大模型"源1.0"。但是,截至目前,公司源大模型及相关应用尚未产生实际收入,公司郑重提示广大投资者注意公司股票二级市场交易风险,审慎决策,理性投资。

  英力特(000635.SZ):生产的氢气属于中间产品,自用于生产聚氯乙烯产品

  英力特(000635.SZ)发布股票交易异常波动公告,公司生产的氢气属于中间产品,自用于生产聚氯乙烯产品,无单独出售和单独商用的情况。

  【经营数据】

  秦川物联(688528.SH)业绩快报:2022年年度归母净利137.12万元,同比减少95.30%

  秦川物联(688528.SH)公布2022年年度业绩快报,报告期内,公司实现营业收入3.68亿元,同比增长20.36%;实现归属于母公司所有者的净利润137.12万元,同比减少95.30%;基本每股收益0.01元。

  安迪苏(600299.SH)业绩快报:2022年度净利润12.47亿元、同比下降15.29%

  安迪苏(600299.SH)发布2022年度业绩快报,实现营业总收入145.29亿元,同比增长12.90%;归属于上市公司股东的净利润12.47亿元,同比下降15.29%;基本每股收益0.46元。

  顺博合金(002996.SZ)业绩快报:2022年度净利同比下降41.10%

  顺博合金(002996.SZ)披露2022年度业绩快报,报告期内,公司实现营业总收入110.66亿元,同比增长10.83%;归属于上市公司股东的净利润2.02亿元,同比下降41.10%;基本每股收益0.46元。

  迈得医疗(688310.SH)业绩快报:2022年度净利增1.18%至6523.96万元

  迈得医疗(688310.SH)公布2022年度业绩快报,2022年公司实现营业收入3.84亿元,与去年同期相比增长21.76%;利润总额8586.62万元,同比增长21.84%;实现归属于母公司所有者的净利润6523.96万元,与去年同期相比增长1.18%;基本每股收益0.78元。

  有研粉材(688456.SH)业绩快报:2022年度净利降27.42%至5895.53万元

  有研粉材(688456.SH)公布2022年度业绩快报,报告期,公司实现营业收入27.92亿元,较上年同期增加0.39%;营业利润5376.07万元,较上年同期减少31.97%;利润总额6220.33万元,较上年同期减少27.62%;归属于母公司所有者的净利润5895.53万元,较上年同期减少27.42%;基本每股收益0.57元

  生益电子(688183.SH)业绩快报:2022年度净利增18.40%至3.13亿元

  生益电子(688183.SH)公布2022年度业绩快报,报告期内,公司营业收入35.35亿元,比上年同期减少3.09%;利润总额3.099亿元,同比增长10.82%;实现归属于母公司所有者的净利润3.13亿元,比上年同期增加18.40%;基本每股收益0.38元。

  新锐股份(688257.SH)业绩快报:2022年度净利增10.10%至1.502亿元

  新锐股份(688257.SH)公布2022年度业绩快报,报告期内,公司实现营业收入11.86亿元,同比增长32.56%;实现利润总额1.92亿元,同比增长8.13%;归属于母公司所有者的净利润1.502亿元,同比增长10.10%;基本每股收益1.6186元。

  中国国航(601111.SH):1月旅客周转量同比升62.2%、环比升121.6%

  中国国航(601111.SH)公布2023年1月主要运营数据,2023年1月,公司及所属子公司(简称"集团")合并旅客周转量(按收入客公里计)同比、环比均上升。客运运力投入(按可用座位公里计)同比上升38.4%,环比上升96.1%;旅客周转量同比上升62.2%,环比上升121.6%。其中,国内客运运力投入同比上升35.5%,环比上升107.6%;旅客周转量同比上升57.9%,环比上升129.6%;国际客运运力投入同比上升152.1%,环比上升0.2%;旅客周转量同比上升419.8%,环比上升23.3%;地区客运运力投入同比上升32.0%,环比上升45.0%;旅客周转量同比上升57.7%,环比上升99.1%。

  中国东航(600115.SH):1月旅客周转量同比升42.70%、客座率为68.33%

  中国东航(600115.SH)公布,2023年1月,公司客运运力投入(按可用座公里计)同比上升17.21%,其中国内、国际、地区航线客运运力投入分别同比上升14.13%、152.21%和51.79%;旅客周转量(按客运人公里计)同比上升42.70%,其中国内、国际和地区航线旅客周转量分别同比上升38.65%、260.02%、78.67%;客座率为68.33%,同比上升12.20个百分点,其中国内、国际、地区航线客座率分别同比上升12.09个百分点、19.93个百分点、10.93个百分点。

  南方航空(600029.SH):1月客座率为72.67%、同比升9.65个百分点

  南方航空(600029.SH)公布,2023年1月,集团客运运力投入(按可利用座公里计)同比上升25.41%,其中国内、地区、国际分别同比上升22.08%、284.01%、114.26%;旅客周转量(按收入客公里计)同比上升44.62%,其中国内、地区、国际分别同比上升40.01%、585.78%、198.71%;客座率为72.67%,同比上升9.65个百分点,其中国内、地区、国际分别同比上升9.32、27.20、20.47个百分点。

  海南机场(600515.SH):1月旅客吞吐量245.54万人次、同比增长24.99%

  海南机场(600515.SH)披露2023年1月机场业务生产经营数据快报,起降15,741架次,同比增长5.49%;旅客吞吐量245.54万人次,同比增长24.99%;货邮吞吐量14845.96吨,同比下降4.82%;其中,三亚凤凰机场,起降12,272架次,同比增长4.02%;旅客吞吐量214.69万人次,同比增长24.69%;货邮吞吐量12,388.20吨,同比下降0.05%。

  春秋航空(601021.SH):1月客运量环增48.43%、同降12.20%

  春秋航空(601021.SH)公布2023年1月份主要运营数据,当月实现总载运人次1512.10千人次,环比增长48.43%,同比下降12.20%;实现货邮载重量5851.37吨,环比下降3.21%,同比下降37.64%。

  潞安环能(601699.SH):1月商品煤销量405万吨,同比增长15.71%

  潞安环能(601699.SH)公布,1月原煤产量496万吨,同比增长2.27%;商品煤销量405万吨,同比增长15.71%。

  海航控股(600221.SH):1月旅客周转量环比升135.26%、同比升68.44%

  海航控股(600221.SH)公布2023年1月主要运营数据,2023年1月,集团客运运力投入(按可利用客公里计)环比上升97.57%,同比上升51.79%。旅客周转量(按载客人数计)环比上升135.26%,同比上升68.44%。收入客公里环比上升132.28%,同比上升73.17%。

  中国建筑(601668.SH):1月新签合同总额3358亿元 同比增长12.4%

  中国建筑(601668.SH)公布2023年1月经营情况简报,公司2023年1月新签合同总额3358亿元,比上年同期增长12.4%。

  中煤能源(601898.SH):1月商品煤销量2413万吨 同比下降3.0%

  中煤能源(601898.SH)公布2023年1月份主要生产经营数据,本月商品煤产量1099万吨,同比增长4.2%;商品煤销量2413万吨,同比下降3.0%,其中:自产商品煤销量1073万吨,同比下降9.0%。

  新华保险(601336.SH):1月原保险保费收入351.81亿元、同比下降1.9%

  新华保险(601336.SH)公布,公司于2023年1月1日至2023年1月31日期间累计原保险保费收入约人民币351.81亿元,同比下降1.9%。

  赣粤高速(600269.SH):1月份车辆通行服务收入约3.53亿元

  赣粤高速(600269.SH)公布,公司2023年1月份车辆通行服务收入约为3.53亿元。

  【签约投资】

  景旺电子(603228.SH):拟投资30亿元新建高多层PCB智能制造基地项目

  景旺电子(603228.SH)公布,公司拟与信丰县人民政府签订《信丰县人民政府与深圳市景旺电子股份有限公司关于新建高多层PCB智能制造基地项目投资合同书》,计划在江西信丰高新技术产业园区投资新建高多层PCB智能制造基地项目,并在信丰县人民政府辖区内设立全资子公司,具体负责项目建设运营。项目分两期建设,预计总投资约30亿元,其中固定资产投资预计约20亿元以上。

  协鑫集成(002506.SZ):拟投资20亿元新建阜宁12GW高效光伏组件项目

  协鑫集成(002506.SZ)公布,公司于2023年2月15日与江苏省阜宁经济开发区管委会签订了《12GW高效光伏组件项目投资协议》,就公司在阜宁经济开发区投资建设12GW高效光伏组件项目达成合作意向。项目总投资估算约20亿元人民币。

  古鳌科技(300551.SZ):与比太科技就HJT、钙钛矿电池真空镀膜等部件、设备委托加工、生产达成战略合作

  古鳌科技(300551.SZ)公布,2023年2月15日,公司与比太科技签订了《太阳能光伏设备战略合作协议》,比太科技是一家高端太阳能设备研发企业,拥有新一代可低成本量产的太阳能电池装备核心技术,希望扩充产能。公司致力于投入光伏产业,拥有大规模智能设备的生产、制造、加工能力。为了创造更大的经济效益,实现双方优势互补,经双方友好协商,就高效异质结电池(HJT)、钙钛矿电池的真空镀膜等部分部件、设备委托加工、生产合作事宜达成该协议。

  【合同中标】

  华依科技(688071.SH):获得智己汽车某项目惯性导航总成定点

  华依科技(688071.SH)公布,公司于今日收到智己汽车科技有限公司(简称"智己汽车")的定点通知。智己汽车选择公司作为某项目惯性导航总成定点的开发工作,具体产品供应时间、价格以及供应量以签订的供应协议及销售订单为准。

  国机汽车(600335.SH):中标2.69亿元宝骏涂装产线项目

  


正文番外篇


展开全文

英文原版:/blog.html

作者:符尧, yao.fu@ed.ac.uk,爱丁堡大学 (University of Edinburgh) 博士生,本科毕业于北京大学与 彭昊,Tushar Khot在 艾伦人工智能研究院 (Allen Institute for AI) 共同完成英文原稿与 剑桥大学郭志江 共同翻译为中文感谢 上海交通大学何俊贤,加州大学洛杉矶分校鲁盼,达特茅斯学院刘睿博 对初稿的讨论与建议。感谢 Raj Ammanabrolu (Allen Institute for AI), Peter Liu (Google Brain), Brendan Dolan-Gavitt (New York University), Denny Zhou (Google Brain) 对终稿的讨论和建议,他们的建议极大程度上增加了本文的完整度。

最近,OpenAI的预训练模型ChatGPT给人工智能领域的研究人员留下了深刻的印象和启发。毫无疑问,它又强又聪明,且跟它说话很好玩,还会写代码。它在多个方面的能力远远超过了自然语言处理研究者们的预期。于是我们自然就有一个问题:ChatGPT 是怎么变得这么强的?它的各种强大的能力到底从何而来?在这篇文章中,我们试图剖析 ChatGPT 的突现能力(Emergent Ability),追溯这些能力的来源,希望能够给出一个全面的技术路线图,来说明 GPT-3.5 模型系列以及相关的大型语言模型是如何一步步进化成目前的强大形态。

我们希望这篇文章能够促进大型语言模型的透明度,成为开源社区共同努力复现 GPT-3.5 的路线图。

致国内的同胞们:

  • 在国际学术界看来,ChatGPT / GPT-3.5 是一种划时代的产物,它与之前常见的语言模型 (Bert/ Bart/ T5) 的区别,几乎是导弹与弓箭的区别,一定要引起最高程度的重视。

  • 在我跟国际同行的交流中,国际上的主流学术机构 (如斯坦福大学,伯克利加州大学) 和主流业界研究院(如谷歌大脑,微软研究院)都已经全面拥抱大模型。

  • 在当前这个阶段,国内的技术水准,学术视野,治学理念和国际前沿的差距似乎并没有减少,反而正在扩大,如果现状持续下去,极有可能出现技术断代。

  • 此诚危急存亡之秋。

多年以后,面对行刑队,奥雷里亚诺・布恩迪亚上校将会回想起父亲带他去见识冰块的那个遥远的下午。―― 《百年孤独》 加西亚・马尔克斯

1. 2020 版初代 GPT-3 与大规模预训练

初代GPT-3展示了三个重要能力:

  • 语言生成:遵循提示词(prompt),然后生成补全提示词的句子。这也是今天人类与语言模型最普遍的交互方式。

  • 上下文学习 (in-context learning):  遵循给定任务的几个示例,然后为新的测试用例生成解决方案。很重要的一点是,GPT-3虽然是个语言模型,但它的论文几乎没有谈到“语言建模” (language modeling) ―― 作者将他们全部的写作精力都投入到了对上下文学习的愿景上,这才是 GPT-3的真正重点。

  • 世界知识:包括事实性知识 (factual knowledge) 和常识 (commonsense)。

那么这些能力从何而来呢?

基本上,以上三种能力都来自于大规模预训练:在有3000亿单词的语料上预训练拥有1750亿参数的模型( 训练语料的60%来自于 2016 - 2019 的 C4 22% 来自于 WebText2 16% 来自于Books 3%来自于Wikipedia)。其中:

  • 语言生成的能力来自于语言建模的训练目标 (language modeling)。

  • 世界知识来自 3000 亿单词的训练语料库(不然还能是哪儿呢)。

  • 模型的 1750 亿参数是为了存储知识,Liang et al. (2022) 的文章进一步证明了这一点。他们的结论是,知识密集型任务的性能与模型大小息息相关。

  • 上下文学习的能力来源及为什么上下文学习可以泛化,仍然难以溯源。直觉上,这种能力可能来自于同一个任务的数据点在训练时按顺序排列在同一个 batch 中。然而,很少有人研究为什么语言模型预训练会促使上下文学习,以及为什么上下文学习的行为与微调 (fine-tuning) 如此不同。

令人好奇的是,初代的GPT-3有多强。其实比较难确定初代 GPT-3(在 OpenAI API 中被称为davinci)到底是“强”还是“弱”。一方面,它合理地回应了某些特定的查询,并在许多数据集中达到了还不错的性能;另一方面,它在许多任务上的表现还不如 T5 这样的小模型(参见其原始论文)。在今天(2022 年 12 月)ChatGPT 的标准下,很难说初代的 GPT-3 是“智能的”。Meta 开源的 OPT 模型试图复现初代 GPT-3,但它的能力与当今的标准也形成了尖锐的对比。许多测试过 OPT 的人也认为与现在的text-davinci-002相比,该模型确实 “不咋地”。尽管如此,OPT 可能是初代 GPT-3 的一个足够好的开源的近似模型了(根据 OPT 论文和斯坦福大学的 HELM 评估)。

虽然初代的 GPT-3 可能表面上看起来很弱,但后来的实验证明,初代 GPT-3 有着非常强的潜力。这些潜力后来被代码训练、指令微调 (instruction tuning) 和基于人类反馈的强化学习 (reinforcement learning with human feedback, RLHF) 解锁,最终体展示出极为强大的突现能力。

2. 从 2020 版 GPT-3 到 2022 版 ChatGPT

从最初的 GPT-3 开始,为了展示 OpenAI 是如何发展到ChatGPT的,我们看一下 GPT-3.5 的进化树:

在 2020 年 7 月,OpenAI 发布了模型索引为的 davinci 的初代 GPT-3 论文,从此它就开始不断进化。在 2021 年 7 月,Codex 的论文发布,其中初始的 Codex 是根据(可能是内部的)120 亿参数的 GPT-3 变体进行微调的。后来这个 120 亿参数的模型演变成 OpenAI API 中的code-cushman-001。在 2022 年 3 月,OpenAI 发布了指令微调 (instruction tuning) 的论文,其监督微调 (supervised instruction tuning) 的部分对应了davinci-instruct-beta和text-davinci-001。在 2022 年 4 月至 7 月的,OpenAI 开始对code-davinci-002模型进行 Beta 测试,也称其为 Codex。然后code-davinci-002、text-davinci-003和ChatGPT 都是从code-davinci-002进行指令微调得到的。详细信息请参阅 OpenAI的模型索引文档。

尽管 Codex 听着像是一个只管代码的模型,但code-davinci-002可能是最强大的针对自然语言的GPT-3.5 变体(优于 text-davinci-002和 -003)。code-davinci-002很可能在文本和代码上都经过训练,然后根据指令进行调整(将在下面解释)。然后2022 年 5-6 月发布的text-davinci-002是一个基于code-davinci-002的有监督指令微调 (supervised instruction tuned) 模型。在text-davinci-002上面进行指令微调很可能降低了模型的上下文学习能力,但是增强了模型的零样本能力(将在下面解释)。然后是text-davinci-003和 ChatGPT,它们都在 2022 年 11 月发布,是使用的基于人类反馈的强化学习的版本指令微调 (instruction tuning with reinforcement learning from human feedback) 模型的两种不同变体。text-davinci-003 恢复了(但仍然比code-davinci-002差)一些在text-davinci-002 中丢失的部分上下文学习能力(大概是因为它在微调的时候混入了语言建模) 并进一步改进了零样本能力(得益于RLHF)。另一方面,ChatGPT 似乎牺牲了几乎所有的上下文学习的能力来换取建模对话历史的能力。

总的来说,在 2020 - 2021 年期间,在code-davinci-002之前,OpenAI 已经投入了大量的精力通过代码训练和指令微调来增强GPT-3。当他们完成code-davinci-002时,所有的能力都已经存在了。很可能后续的指令微调,无论是通过有监督的版本还是强化学习的版本,都会做以下事情(稍后会详细说明):

  • 指令微调不会为模型注入新的能力 ―― 所有的能力都已经存在了。指令微调的作用是解锁 / 激发这些能力。这主要是因为指令微调的数据量比预训练数据量少几个数量级(基础的能力是通过预训练注入的)。

  • 指令微调将 GPT-3.5 的分化到不同的技能树。有些更擅长上下文学习**,如text-davinci-003,有些更擅长对话,如ChatGPT。

  • 指令微调通过牺牲性能换取与人类的对齐(alignment)。OpenAI 的作者在他们的指令微调论文中称其为 “对齐税” (alignment tax)。许多论文都报道了code-davinci-002在基准测试中实现了最佳性能(但模型不一定符合人类期望)。在code-davinci-002上进行指令微调后,模型可以生成更加符合人类期待的反馈(或者说模型与人类对齐),例如:零样本问答、生成安全和公正的对话回复、拒绝超出模型它知识范围的问题。

3. Code-Davinci-002和 Text-Davinci-002,在代码上训练,在指令上微调

在code-davinci-002和text-davinci-002之前,有两个中间模型,分别是 davinci-instruct-beta 和 text-davinci-001。两者在很多方面都比上述的两个-002模型差(例如,text-davinci-001 链式思维推理能力不强)。所以我们在本节中重点介绍 -002 型号。

我们关注code-davinci-002和text-davinci-002,这两兄弟是第一版的 GPT3.5 模型,一个用于代码,另一个用于文本。它们表现出了三种重要能力与初代 GPT-3 不同的能力:

  • 响应人类指令:以前,GPT-3 的输出主要训练集中常见的句子。现在的模型会针对指令 / 提示词生成更合理的答案(而不是相关但无用的句子)。

  • 泛化到没有见过的任务:当用于调整模型的指令数量超过一定的规模时,模型就可以自动在从没见过的新指令上也能生成有效的回答。这种能力对于上线部署至关重要,因为用户总会提新的问题,模型得答得出来才行。

  • 代码生成和代码理解:这个能力很显然,因为模型用代码训练过。

  • 利用思维链 (chain-of-thought) 进行复杂推理:初代 GPT3 的模型思维链推理的能力很弱甚至没有。code-davinci-002 和 text-davinci-002 是两个拥有足够强的思维链推理能力的模型。

    • 思维链推理之所以重要,是因为思维链可能是解锁突现能力和超越缩放法则 (scaling laws) 的关键。请参阅上一篇博文。

这些能力从何而来?

与之前的模型相比,两个主要区别是指令微调和代码训练。具体来说