国内chatgpt 应用场景 chatgpt国内手机可以用吗

chatgpt翻译靠谱吗可以用chatgpt做翻译吗

chats翻译,chatwith翻译,chatfilter翻译,chatter翻译

*本文预计阅读时长：10分钟

作为一个机器翻译工程师，自2022年11月30号起，我的心态的从焦虑到平静再到焦虑，每天的感觉就像做过山车一样，跌宕起伏，只因它――ChatGPT。

为何使我如此焦虑

在语言桥，经常跟译员同事打交道，被经常问到的问题是“你认为机器翻译或者人工智能会取代人工译员么”？

但是如今，ChatGPT的横空出世，让我一度觉得，可能最先被替代的不是人工译员，而是我们这些底层的从事NLP领域研究的工程师。毕竟就算ChatGPT的能力再强，还是会生成错误或者有误导性的内容，最终生成的译文或者内容还是需要人类的校对或者修正。而其对于我们从事NLP某个领域研究的工程师来的影响，说是降维打击也丝毫不为过。

第一次焦虑，在ChatGPT刚刚出来的一个月内，我跟几个同事对其进行深入探讨后，陷入了深思――“下一步我们要做什么？”。当NLP模式发生改变的时候，我们要拿什么去做回应，是不是即将被淘汰，如何抓住这一次变革所带来的机遇，焦虑和兴奋伴随着每一个日夜。于是开始了理论的学习，去了解LaMda、Sparrow和InstructGPT等相关技术。

并且，对于资金预算有限的我们，根本没有资格去碰T5及之后的模型，那么我们该如何去做这样的工作。

再一次的焦虑，来自于全民的追捧。当身边所有人，无论是AI从业者，还是AI非从业者，都在谈论ChatGPT时；当朋友圈10条有8条都是ChatGPT时；当知乎每日几条ChatGPT热搜时；当老板拉着一起讨论及强调ChatGPT重要性时；我焦虑了。

个人感觉，这种焦虑至少要持续一段时间。但在这期间，并不影响我们的思考，我们要努力去拥抱它. 接下来，我们还需要解决一个问题：如何在资金有限的情况下，做出及时的回应，去抓住这一次变革所带来的机遇？此外，我们也需要随时关注ChatGPT的发展，看看它最终会发展到什么程度，以及它对机器翻译任务产生的影响。

在此期间，我们应该拥抱它，而不是怀疑它，以充分利用它给我们带来的机会。 ChatGPT有哪些令人惊艳的能力

目前为止，已知ChatGPT会做且做得不错的工作：撰写文案、编写脚本、论文写作、小说创作、代码编程、分析报告、排查系统Bug……ChatGPT各类技能点拉满，实打实的“六边形战士”。而这也是其为何能如此惊艳世人的重要原因之一――十项全能型选手。

譬如，以色列总统艾萨克・赫尔佐格已率先尝试过用ChatGPT来撰写大型会议演讲稿件。

再譬如，89%的美国学生用ChatGPT写作业，更有学生因ChatGPT写出的论文拿到满分。

更令人惊喜的是，在对话ChatGPT时输入知乎体――以“你不会真的以为”为开头的小说？ChatGPT在几秒钟内，就反馈出了一篇短篇小说。虽然故事非常狗血老套，但整体结构完整。

在翻译领域，它更是无所不能。

你可以让他充当一个译员，并给他提一些要求。

可以帮忙润色“机翻味儿”浓厚的机翻译文：

可以充当质量监督员，帮我们检查译文中的低级错误：

等等……

ChatGPT的机翻给你的感觉它不再是一个冰冷的机器，而是一个贴心的助手，它可以生成更符合你要求的译文，甚至可以帮助你做一些检查、释义、润色的工作。

整体用下来，发现它生成的无论是文本还是译文，“机器”的味道不再那么浓厚。

ChatGPT有时会一本正经地胡说八道

疯狂的人总会慢慢恢复理智，于是进入了平静期。过多测试之后，越发现，生成模型在事实性上依然存在很大的问题，特别是在一本正经的胡说八道时，越发觉得可怕。细思极恐，如果使用者真的不了解，真的照做了怎么办？

个人做了这么久的NLP，答案的真实及可控性依然困扰着我，虽然ChatGPT的大部分的回复使我感到惊艳，但作为一个NLP算法工程师，不能抱着娱乐至上的想法去看待这个问题。

在很多真实问答场景中，人们是不能接受犯错的，例如：“双十一优惠政策”，假设生成回复是“满300减300”，商家岂不是亏死；“鸡蛋一般煮多久”，假设生成回复是“5min”，恭喜你吃了个生蛋；假如生成回复中包含了政治内容、事实性错误、偏见问题，该如何解决，这些都是生成模型无法避开的话题。

就Google新品Bard来说，仅因发布会回复答案的一个事实性错误，股价直接暴跌6%。而微软在新Bing的发布会上的例子也只是旅游类开放性问答。

而在ToB的企业场景上，往往是不允许出现事实性错误的。ChatGPT真的可以用在ToB场景吗？针对于无法连接外网的企业来说，如何使用API进行访问？真的有很多企业可以购买设备进行本地部署吗？仅在购买API的情况下，如何将通用接口进行领域数据优化？还是可以不优化，通用即最优？如何保证企业内部数据的保密性，Prompt泄露信息怎么办？

那么，经过真实性验证的内容与生成融合、领域Prompt规范化、设备部署会成为我们重点攻克的课题。

对于ToC来说，娱乐至上，一定会有一些不轨之徒，将其用在刀刃上。那么内容检测将来一定会是一个重点，当ChatGPT生成内容泛滥时，我们如何进行检测，判断哪些是真实人写的，哪些是机器生成的。

虽然目前已经存在一些内容检测工具，例如：OpenAI自身提供的检测器。但只能说，在检测的路上依然是任重而道远。

ChatGPT的机翻效果与主流商业机翻系统相比如何

ChatGPT能力这么强，作为一个专注于翻译行业的NLPer，一个自然而然的想法是，ChatGPT做翻译任务的水平怎样？对比传统的商业机器翻译系统（如Google、DeepL以及我们语言桥自研的LanMT）来说孰优孰劣呢？首先我们找到了来自腾讯翻译团队的定量测评结果1，他们使用机器翻译领域常用的测试集，使用BLEU、TER等自动化评测指标对 Google、DeepL与ChatGPT的翻译结果进行了定量的评测。总体结论是Google、Deepl等商业机翻系统在各种自动评测指标上还是优于ChatGPT。

与此同时，我们内部也邀请了一些比较有经验的译员，通过体验和对比ChatGPT和我们内部使用的LanMT的机翻效果，也得出了一些主观的结论。中英，对比的机翻 ChatGPT、Deepl和LanMT。

从整体人工评测的结果来看：中译英：Deepl>LanMT>合格水平>ChatGPT ; 英译中：LanMT>Deepl>合格水平>ChatGPT

其实仔细思考，这样的评测或许不太公平，由于ChatGPT是一个对话模型，为了保证生成答案的多样性，每次结果是从模型中“随机采样（Sample）”出来的，而商业的机器翻译引擎大多是通过“束搜索（beam search）”解码出来的，是模型的最优解。

更进一步来讲，传统的机翻评测大都是从句子级别来进行评测的，而显然ChatGPT对于文档以及上下文的理解能力应该会更强，如果使用文档级别的翻译任务来进行测评，在上下文一致性以及涉及到依赖上下文信息进行理解的文本上，ChatGPT应该会有更好的效果。

由于商业系统针对机器翻译这一个任务做了很多特定的优化，搜集构造了更多有监督的数据，而ChatGPT仅仅通过多任务学习，以及有限的翻译任务监督信号达到了这个效果，还是非常惊艳的。

对于译员来说，有哪些机会

本文地址： https://www.xxs100.com//show-396041.html

国内chatgpt 应用场景 chatgpt国内手机可以用吗

chatgpt翻译靠谱吗 可以用chatgpt做翻译吗

chatgpt翻译靠谱吗可以用chatgpt做翻译吗