国内chatgpt 应用场景 chatgpt国内手机可以用吗
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
我们昨天讨论了ChatGPT具有思维链推理能力的原因是code-davinci-002 和 text-davinci-002这两个模型,以及对这两个模型的指令微调和代码训练。详情请参阅AI会思考吗|ChatGPT为什么具有理解和逻辑推理能力?
我们今天分析一下ChatGPT的理论基础,以及国内没有第一个出现ChatGPT的原因。
ChatGPT的理论基础是大型语言模型 (Large Language Model,LLM) 生成领域的新训练范式:RLHF (Reinforcement Learning from Human Feedback) ,即以强化学习方式依据人类反馈优化语言模型。训练过程可以简单总结为三个步骤:预训练一个语言模型 LM >聚合问答数据并训练一个奖励模型 Reward Model/RM > 用强化学习 RL的方式微调语言模型,使得GPT-3.5能够与复杂的人类价值观对齐的原因。
ChatGPT在接受北京商报记者提坦言,训练数据、自然语言生成能力、快速响应、多语言支持、智能定制是其核心竞争力。
我们国内国产自研的源1.0、悟道和文心等AI模型,不仅在参数量上达到了千亿级别,而且数据集规模也高达TB级别。
网上很多人把原因归结在人、财、物,我觉得这些不是根本原因。
据称,OpenAI在成立七年多的时间总共收到了40亿美元的投资,平均每年不足6亿。但国内一年的资产投资就超过了500,000亿元(75,000亿美金),恒大在海花岛这个项目上就投资了1600亿元(250亿美元)。
人的因素就更不存在,很多AI行业的员工称国内技术专家的人数、梯队、创造力、执行力、反应能力、组织能力都超过国外同行的。
也有人把原因归结到政府导向、资本导向,比如研究人员需要遵循国家人工智能实验室的方向,需要取得一定的科研成果才能受到重视。
我觉得这种理由也是站不住脚的,不管是政府还是资本导向,具体的决策也都是由人来实施,而且还有最顶尖的智囊团队来出谋策划,确定路线,最终目的也是为了技术创新,形成技术优势和技术壁垒。
我觉得国内之所以没有出现 ChatGPT,主要原因是我们太不擅长领跑,特别是当技术能力达到相当的能力后,我们会陷入集体迷茫。
还有一个原因是我们对技术路线和创新方向的判断和把控存在失误,特别是原本小众、不被主流认可的技术路线。
比如NLP有两种不同的预训练模型,Bert为代表的“双向语言模型预训练+应用Fine-tuning”模式,以GPT 2.0为代表的“自回归语言模型(即从左到右单向语言模型)+Zero /Few Shot Prompt”模式,国内国际的技术专家普遍更看好Bert模式一些,导致我们国内相当多数的后续技术改进,都是沿着Bert这条路走的。
京东推出产业版ChatGPT 命名ChatJD京东产业链,京东集团产业带项目,京东产业结构,京东如何打造产业园 站长之家(ChinaZ.com) 2月10日 消息:今日,京东宣布,京东云旗下言犀人工智能应用平台将整合过往产业实践和技术积累,推出产业版ChatGPT:ChatJD。 京东表示,ChatJD将通过在垂直产业的深耕,快速达成落地应用的标准,并不断推动不同产业之间的泛化,形成更多通用产业版ChatGPT。 ChatJD将以“125”计划作为落地应用路线图,包含一个平台、两个领域、五个应用。 1个平台:ChatJD智能人机对话平台,即自然语言处理中理解和生成任务的对话平台,预计参数量达千亿级。 2个领域:零售、金融,得益于京东云在零售与金融领域10余年真实场景的深耕与沉淀,已拥有4层知识体系、40多个独立子系统、3000多个意图以及3000万个高质量问答知识点,覆盖超过1000万种自营商品的电商知识图谱,更加垂直与聚焦。 5个应用:内容生成、人机对话、用户意图理解、信息抽取、情感分类,涵盖零售和金融行业复用程度最高的应用场景,在客户咨询与服务、营销文案生成、商品摘要生成、电商直播、数字人、研报生成、金融分析等领域将发挥广泛的落地价值。 (举报) *本文预计阅读时长:10分钟 作为一个机器翻译工程师,自2022年11月30号起,我的心态的从焦虑到平静再到焦虑,每天的感觉就像做过山车一样,跌宕起伏,只因它――ChatGPT。 为何使我如此焦虑 在语言桥,经常跟译员同事打交道,被经常问到的问题是“你认为机器翻译或者人工智能会取代人工译员么”? 但是如今,ChatGPT的横空出世,让我一度觉得,可能最先被替代的不是人工译员,而是我们这些底层的从事NLP领域研究的工程师。毕竟就算ChatGPT的能力再强,还是会生成错误或者有误导性的内容,最终生成的译文或者内容还是需要人类的校对或者修正。而其对于我们从事NLP某个领域研究的工程师来的影响,说是降维打击也丝毫不为过。 第一次焦虑,在ChatGPT刚刚出来的一个月内,我跟几个同事对其进行深入探讨后,陷入了深思――“下一步我们要做什么?”。当NLP模式发生改变的时候,我们要拿什么去做回应,是不是即将被淘汰,如何抓住这一次变革所带来的机遇,焦虑和兴奋伴随着每一个日夜。于是开始了理论的学习,去了解LaMda、Sparrow和InstructGPT等相关技术。 并且,对于资金预算有限的我们,根本没有资格去碰T5及之后的模型,那么我们该如何去做这样的工作。 再一次的焦虑,来自于全民的追捧。当身边所有人,无论是AI从业者,还是AI非从业者,都在谈论ChatGPT时;当朋友圈10条有8条都是ChatGPT时;当知乎每日几条ChatGPT热搜时;当老板拉着一起讨论及强调ChatGPT重要性时;我焦虑了。 个人感觉,这种焦虑至少要持续一段时间。但在这期间,并不影响我们的思考,我们要努力去拥抱它. 接下来,我们还需要解决一个问题:如何在资金有限的情况下,做出及时的回应,去抓住这一次变革所带来的机遇?此外,我们也需要随时关注ChatGPT的发展,看看它最终会发展到什么程度,以及它对机器翻译任务产生的影响。 在此期间,我们应该拥抱它,而不是怀疑它,以充分利用它给我们带来的机会。 ChatGPT有哪些令人惊艳的能力 目前为止,已知ChatGPT会做且做得不错的工作:撰写文案、编写脚本、论文写作、小说创作、代码编程、分析报告、排查系统Bug……ChatGPT各类技能点拉满,实打实的“六边形战士”。而这也是其为何能如此惊艳世人的重要原因之一――十项全能型选手。 譬如,以色列总统艾萨克・赫尔佐格已率先尝试过用ChatGPT来撰写大型会议演讲稿件。 再譬如,89%的美国学生用ChatGPT写作业,更有学生因ChatGPT写出的论文拿到满分。 更令人惊喜的是,在对话ChatGPT时输入知乎体――以“你不会真的以为”为开头的小说?ChatGPT在几秒钟内,就反馈出了一篇短篇小说。虽然故事非常狗血老套,但整体结构完整。 在翻译领域,它更是无所不能。 你可以让他充当一个译员,并给他提一些要求。 可以帮忙润色“机翻味儿”浓厚的机翻译文: 可以充当质量监督员,帮我们检查译文中的低级错误: 等等…… ChatGPT的机翻给你的感觉它不再是一个冰冷的机器,而是一个贴心的助手,它可以生成更符合你要求的译文,甚至可以帮助你做一些检查、释义、润色的工作。 整体用下来,发现它生成的无论是文本还是译文,“机器”的味道不再那么浓厚。 ChatGPT有时会一本正经地胡说八道 疯狂的人总会慢慢恢复理智,于是进入了平静期。过多测试之后,越发现,生成模型在事实性上依然存在很大的问题,特别是在一本正经的胡说八道时,越发觉得可怕。细思极恐,如果使用者真的不了解,真的照做了怎么办? 个人做了这么久的NLP,答案的真实及可控性依然困扰着我,虽然ChatGPT的大部分的回复使我感到惊艳,但作为一个NLP算法工程师,不能抱着娱乐至上的想法去看待这个问题。 在很多真实问答场景中,人们是不能接受犯错的,例如:“双十一优惠政策”,假设生成回复是“满300减300”,商家岂不是亏死;“鸡蛋一般煮多久”,假设生成回复是“5min”,恭喜你吃了个生蛋;假如生成回复中包含了政治内容、事实性错误、偏见问题,该如何解决,这些都是生成模型无法避开的话题。 就Google新品Bard来说,仅因发布会回复答案的一个事实性错误,股价直接暴跌6%。而微软在新Bing的发布会上的例子也只是旅游类开放性问答。 而在ToB的企业场景上,往往是不允许出现事实性错误的。ChatGPT真的可以用在ToB场景吗?针对于无法连接外网的企业来说,如何使用API进行访问?真的有很多企业可以购买设备进行本地部署吗?仅在购买API的情况下,如何将通用接口进行领域数据优化?还是可以不优化,通用即最优?如何保证企业内部数据的保密性,Prompt泄露信息怎么办? 那么,经过真实性验证的内容与生成融合、领域Prompt规范化、设备部署会成为我们重点攻克的课题。 对于ToC来说,娱乐至上,一定会有一些不轨之徒,将其用在刀刃上。那么内容检测将来一定会是一个重点,当ChatGPT生成内容泛滥时,我们如何进行检测,判断哪些是真实人写的,哪些是机器生成的。 虽然目前已经存在一些内容检测工具,例如:OpenAI自身提供的检测器。但只能说,在检测的路上依然是任重而道远。 ChatGPT的机翻效果与主流商业机翻系统相比如何 ChatGPT能力这么强,作为一个专注于翻译行业的NLPer,一个自然而然的想法是,ChatGPT做翻译任务的水平怎样?对比传统的商业机器翻译系统(如Google、DeepL以及我们语言桥自研的LanMT)来说孰优孰劣呢? 首先我们找到了来自腾讯翻译团队的定量测评结果1,他们使用机器翻译领域常用的测试集,使用BLEU、TER等自动化评测指标对 Google、DeepL与ChatGPT的翻译结果进行了定量的评测。总体结论是Google、Deepl等商业机翻系统在各种自动评测指标上还是优于ChatGPT。 与此同时,我们内部也邀请了一些比较有经验的译员,通过体验和对比ChatGPT和我们内部使用的LanMT的机翻效果,也得出了一些主观的结论。中英,对比的机翻 ChatGPT、Deepl和LanMT。 从整体人工评测的结果来看:中译英:Deepl>LanMT>合格水平>ChatGPT ; 英译中:LanMT>Deepl>合格水平>ChatGPT 其实仔细思考,这样的评测或许不太公平,由于ChatGPT是一个对话模型,为了保证生成答案的多样性,每次结果是 从模型中“随机采样(Sample)”出来的,而商业的机器翻译引擎大多是通过“束搜索(beam search)”解码出来的,是模型的最优解。 更进一步来讲,传统的机翻评测大都是从句子级别来进行评测的,而显然ChatGPT对于文档以及上下文的理解能力应该会更强,如果使用文档级别的翻译任务来进行测评,在上下文一致性以及涉及到依赖上下文信息进行理解的文本上,ChatGPT应该会有更好的效果。 由于商业系统针对机器翻译这一个任务做了很多特定的优化,搜集构造了更多有监督的数据,而ChatGPT仅仅通过多任务学习,以及有限的翻译任务监督信号达到了这个效果,还是非常惊艳的。 对于译员来说,有哪些机会
chatgpt翻译靠谱吗 可以用chatgpt做翻译吗
chats翻译,chatwith翻译,chatfilter翻译,chatter翻译