ChatGPT检测器来了!支持中英双语
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
编|郭必扬?
源|SimpleAI
2022年11月30号,OpenAI推出了ChatGPT,给NLP届乃至各行各业的人带来了巨大的惊喜和惊吓[1];
2022年12月5号,由于受到ChatGPT的冲击,Stack Overflow宣布禁止用户在平台上发布由ChatGPT生成的内容[2];
2022年12月8号,我夜不能寐,作为一个普普通通NLP研究者,被ChatGPT冲击到自我怀疑,不断反问自己在ChatGPT时代还能做些什么研究。思来想去,我觉得在ChatGPT如此强大的情况下,我们非常需要一个ChatGPT检测器,来判断一段内容是否是ChatGPT生成的......
当晚我很晚才睡着,但是第二天一大早就醒了,兴冲冲得跟几个好友讨论了这个事儿,经过一番讨论,我们觉得这是个有价值的事儿,值得一做!接着我们在一个更大的群里(孤勇AI研究者群hhh),对这个话题展开了热烈讨论。当天晚上,我们便组建了一个由海内外6所高校或企业的博士生/工程师组成的8人团队,为了一个共同的目标:
“开发一套ChatGPT检测工具,同时收集第一手宝贵的人类-ChatGPT对比数据集,来助力相关学术研究。
这一天是2022年12月9日,是ChatGPT推出的第10天。我们一帮普普通通的国内AI孤勇者们,就这样踏上了一段充满未知和挑战的旅程。
在我们立项之后,也有有业界大佬提出类似的想法,例如一流科技创始人袁进辉12月11日提到“我觉得一个迫在眉睫的需要研究的问题是,怎么区分真实由人类生成的文本和chatGPT生成的文本?”
另外,12月21日,清华大学也开始招募志愿者来收集 ChatGPT 的中文数据;而在国外,根据最近的新闻,普林斯顿大学也有团队在做类似的事情,并于1月3日提出了一个demo (即最近很火的 GPTZero [3])。相比之下,我们可能是最早开始这方面研究的团队了,但是一直很低调而忙碌地在收集数据、分析、训练模型....(其实应该学习人家普林斯顿大学团队,不管东西做了多少,先放出一个Demo....哎,少不更事啊!)虽然风头被抢了,但我们团队一开始的初衷就不是蹭热度,而是为社区做出一些真正的贡献,ChatGPT检测器只是我们计划的一部分,我们计划:
收集一批有价值的人类和 ChatGPT 对比的中英双语问答语料,这对于我们研究人类和大型语言模型(LLM)很重要,可以帮助我们研究LLM的特点、跟人类的差距、未来LLM改进的方向;
对大量的人机对比语料进行细致的分析,并进行多方面的人工评测,探究人类和ChatGPT分别具有什么有趣的潜在的模式。这些探索将有助于思考LLM未来应去往何方;
最后,基于对比数据集以及语料分析,开发应对不同场景的一系列检测模型,这些模型可帮助普通用户和UGC平台来识别、监管 AIGC? (AI Generated Content)。
今天,距离我们立项,已经过去了大约一个月。一个月,我们的私有仓库进行了 166 次 commits,大家基本每天都在为之奋斗:
今天,我们已经收集了中英文的?3-4 万个问题和近 10 万条「人类-ChatGPT 对比」回答语料,涵盖了开放域、计算机科学、金融、医疗、法律、心理等多个领域。这批语料集从各个领域,反映了人类专家和 ChatGPT 在面对同一个问题时会有怎么不同的回答;我们对这批对比语料进行了大量的特征分析,发现了很多有趣的结论,相关的人工测评也正在紧锣密鼓的进行,基于这个语料库和相关分析,我们开发了三种使用不同算法、针对不同场景的?ChatGPT 检测模型(都支持中文和英文,已经上线 🤗?Hugging Face Spaces):
问答版,输入问题和回答,使用预训练模型分类器判断回答内容是 ChatGPT 生成还是人类撰写。访问链接: https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-qa
单文本版,判断任意文本是 ChatGPT 生成还是人类撰写,技术与(1)相同。访问链接: https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-single
语言学特征版,基于一些计算语言学特征,使用机器学习建模进行检测。访问链接: https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-ling
我们近期的计划如下:
Events | Dates |
---|---|
Project Launch / 项目启动 | 2022-12-09 ? |
Comparison Data Collection / 对比数据收集 | 2022-12-11 to Now 🏃?♀? |
Release ChatGPT Detector (Demo) / 检测器 Demo 发布 | 2023-01-11 ? |
Models Release / 模型开源 | Coming in a week 🛬 |
Comparison Corpus Release / 语料集开源 | Coming in a week 🛬 |
Research Paper / 研究论文发布 | Coming in a week 🛬 |
... | ... |
欢迎大家关注我们的项目主页:https://github.com/Hello-SimpleAI/chatgpt-comparison-detection我们将于大约一周内开源代码、模型和语料集,希望得到大家的宝贵反馈!
下面,我们使用我们的检测器,对多个平台的内容以及ChatGPT相应的生成内容,进行检测,包括英文:
Wikipedia概念解释
Quora开放问答
中文:
百度百科概念解释
知乎开放问答
GPT系列模型都在Wikipedia语料上进行了充分的训练,这导致GPT系列模型会生成跟WIkipedia风格十分类似的文本,因此Wikipedia语料十分考验检测器的能力,下面我们随机找一个概念,分别检测人类专家的解释和ChatGPT的解释:
预测正确!(我们同时测了GPTZero,发现其预测错误。GPTZero主要使用文本困惑度以及句子间的困惑度变化来进行预测,一般人类的句子间困惑度差异会较大,而AI生成的内容则较小,而对于WIkipedia这种十分规范的文体,可能句子间的困惑度差异也较小,因此可能导致GPTZero判断错误)
知乎上,我们选取了问题“如何评价OpenAI的超级对话模型ChatGPT”,并测试了周博磊老师的回答和ChatGPT自己的回答:
最后,希望大家关注我们Github项目:Github:https://github.com/Hello-SimpleAI/chatgpt-comparison-detection我们也邀请广大朋友一起来调戏我们的检测器,如果能为我们提供一下预测错误的Bad Cases,那就太感激了!🤗我们的开源代码、模型和语料集,将会和我们的研究论文一并在近期公布,届时再进一步跟朋友们进行交流。鉴于 OpenAI 的“不Open”,以及 AIGC 对当下学界的冲击和社会的潜在风险,我们希望能和更多志同道合的朋友,一起为开放的学术研究做贡献!
后台回复关键词【入群】
加入卖萌屋NLP、CV、搜推广与求职讨论群
?
[1]ChatGPT: https://openai.com/blog/chatgpt/
[2]Stack Overflow禁用 ChatGPT: https://meta.stackoverflow.com/questions/421831/temporary-policy-chatgpt-is-banned
[3]GPTZero: http://gptzero.me/
ChatGPT横空出世!中国能否再次抄袭美国产品,把老外打败?
chatgpt,chatgpt怎么下载,chatgpt官网,chatgpt概念相信在春节期间你一定看过中国的科幻大片《流浪地球》。在影片当中我们发现,人类自以为能主宰地球人的命运。但实际上人工智能已经在控制全人类的命运,而且人工智能经过多年的运算已经建立了自我意识。那是否它将主宰未来人类的未来呢?虽然看似科幻世界离我们很远,但最近ChatGPT的出现却引起了所有人类的关注。而且这个人工智能的新技术让所有人感到惊喜,同时也让所有人感到恐惧。到底是一款什么样的人工智能产品呢?
实际上ChatGPT是一款AI的聊天软件,有点像我们家里用的智能音箱。你跟它对话看,你问的什么问题它马上就可以回答你。而且这款软件主要是由美国AI梦工厂OpenAI开发的一款产品,这产品跟音箱是有点不一样的。它主要是针对人类提出的所有的文字问题进行回答,但是它回答的智能程度已经比较高的,有时候你根本分不清楚到底是人回答还是机器在回答。而且这一款软件不只能回答简单的问题,还可以帮你写代码、做剧本创作,并且为各大公司代写各种邮件,甚至还可以为研究生写论文。当然最近券商也要利用这个产品来写研报。那是否有大量的人员即将失业了呢?
可能到现在为止,你还认为这款产品还是个小儿科。但我告诉你,这个产品推出2个月的时间,月活的用户已经高达1个亿以上。相比之下TikTok在全球发布的大背景下花了9个月的时间才达到1亿的月活用户,而Facebook用了4年半的时间才达到这个体量。所以从用户的使用规模增长来看,你足以看到这款产品的惊艳程度。那为什么大家特别喜欢用这款产品呢?实际上这款产品引入了人类的反馈强化学习系统,也就是说你在这上面问很多问题,然后它根据你的回复答不断的学习跟优化。用户用的越多,问的问题越多,它优化的速度越快,回答就越精准。而且背后它依托庞大的互联网的数据库来不断的为你解答问题。所以最近由此引发了A股的AI概念股的疯狂上涨,像汉王科技都涨了好多个涨停板。那对于很多中国人来说,最关心的是中国能否这次再次赶超美国,通过抄袭美国的产品重新夺回这个领域的第一名呢,就像当年的百度、淘宝把老外赶出中国的场景是否再现。
当然这次我告诉你结论:有点难。为什么这一次跟原来有很大的一个区别呢?首先这种人工智能的聊天软件需要强大的算力。光在里面设置它的参数规模就要达到上千亿次级别,而且ChatGPT的训练需要大量的算力来支持。需要消耗的算力达到3,640 pf-days这样的一个算力系统。我们翻译一下就是每秒需要达到1,000万亿次的一个运算,同时还需要你连续运行3,640天。这么一算至少需要10年的训练时长才能达到目前今天的一个效果。而且我们算了一下,100P的算力至少需要40个数据中心,也就是说如果要完成该数据的这样的一个算力消耗,至少需要布设1,456个数据中心来满足这个软件的运行。
而且目前我们知道ChatGPT使用了将近1万多颗英伟达高端的GPU来进行模型的训练,你要知道英伟达的高端的GPU在整个数据中心算力当中市场占用率高达95%。当然前段时间不巧的是美国针对中国就进行了这一款GPU的一个销售禁止,也就说中国要建立我们的强大的数据算力中心,我们是买不到英伟达的GPU的。当然有人说了,百度不是也推出自己的AI芯片“昆仑”吗?但我告诉你中国的企业更多是做整个AI的设计,当然你要这张芯片必须要去用高端设备来进行代工,所以你仍然要找到台积电和用到高端的光刻机。那一说到这两个大家自然而然明白又是卡脖子的风险。所以未来中国如果跨不开硬件这个门槛那就意味着我们人工智能的聊天机器人就无法进行大规模的训练。
还不止这些,这款软件可是要大量烧钱的。因为它的大量运算就需要大量的投入,要大量消耗电力,还有包括消耗硬件。ChatGPT每回复一次大概要消耗1美分左右,我们看到2022年open AI的整年的亏损已经高达5.45亿美元,也就是说换成人民币大概3-4亿左右给烧掉。所以这就是为什么从2月份开始open AI公司宣布要对个人客户收20美金,但这个商业模式是否能成立我们还有待观察。所以中国企业要大量的投入,也要大量的先烧钱,把东西做到差不多的时候你才可能收的上钱。
第二个核心的点就是美国在人工智能领域的投入主要是在基础性的技术上投入比较多,比如神经网络和深度学习。这些技术可以用于构建大规模的语言模型。所以只有构建大规模的语言模型你才能回答大量各种各样的问题,而中国的人工智能主要集中在研究运用型技术上面,比如说计算机的视觉和语音的识别上面。所以很少有企业投入大规模的基础性技术上面,因为这些基础性技术基本上很难盈利。
第三个最主要的问题是这种学习主要是自然语言的理解方面的一个学习。中文跟英文有很大的一个区别,因为中文的多义性,有它天然的高门槛。所以很多老外学中文的难度比中国人学英文的难度大得多。而像ChatGPT这款产品的背后是互联网庞大的语料库。而对于国内的平台来讲的话,最自然无法避免的就是合规性的问题。所以在中国为了发展这款产品,除了要面对中文的多义性之外,同时还要回答用户的各种刁钻的问题,更重要的是中国版的ChatGPT也需要比国外同类的产品有更严格的审核机制,不是什么问题它都可以回答的,因为有些问题确实回答起来比较敏感。所以在中国回答这些问题可能还要引入人工的审核机制。那这样就好了,就算你推了出来,它也未必是你想要的一个真实的答案。
当然说了那么多难点,是不是中国就做不出来呢?但是百度却不这么说,因为百度对标ChatGPT实际上已出了一款自己的产品,中文的名字呢叫文心一言。但是这款产品要到今年的3月份才能完成测试,而目前还在做线上的冲刺,是否能在3月份及时公布于众我们不得而知。但据说这款产品在国际权威的通用语言理解评估标准上拿到了90分以上,尤其在自然语言处理的领域中国绝对没有一家公司能达到百度的水平。那么最后,你认为百度真能逆袭国外的ChatGPT吗?百度是否能重振辉煌再次把老外赶出中国呢?欢迎大家在评论区留言。
ChatGPT火了,中国人工智能圈有点上火
ChatGPT火了,中国人工智能圈有点上火,chat现在分词春节前,人工智能组织OpenAI推出的大模型ChatGPT,惊艳四座。这让中国人工智能圈“有点上火”。国内业界在迅速反思和行动:我们的差距在哪里?我们将如何正视和改进不足?哪些又是中国从业者的机会?
来源/ 数智前线
作者/ 赵艳秋 徐鑫
春节前,人工智能组织OpenAI推出的大模型ChatGPT,在国内业界引起了不小的轰动。
一名AI从业者告诉数智前线,人工智能每五六年都有一波浪潮,上一波AlphaGO让大家震撼,这一波就是ChatGPT。但这两次大家的心态迥然不同,当谷歌的AI下棋战胜围棋世界冠军时,大家当新闻看,但这一次许多人是从消费者的角度来体验它。一个月里,全世界100万用户在使用和体验它,这是非常颠覆性的体验。这也是AI第一次大规模的自传播。
数智前线获悉,除了感叹于ChatGPT的惊艳体验外,国内业界也在迅速反思和行动:我们的差距在哪里?我们将如何正视和改进不足?哪些是中国从业者的机会?
一名从业人士告诉数智前线,ChatGPT出现后,行业重新变得热闹而有活力,前几年青黄不接、垂头丧气的局面一扫而空。
1
中美差距究竟有多大
在ChatGPT推出后,一位百度资深人士告诉数智前线,他“没有兴趣”谈论ChatGPT,言语之间,五味杂陈。一位人工智能企业创始人称,面对ChatGPT的惊艳表现,心痒痒也迷茫,失眠了。他坦承,从模型的规模到效果,差距还比较远。
有人用同样的问题向国内某厂商的大模型和ChatGPT同时发问,ChatGPT从回答的逻辑性和完整度上都远超国内大模型,国内大模型的答案带有明显的拼凑感,夹杂着不少主题之外的胡编内容。而且,在回复速度上,ChatGPT也领先一截。
从事数字人研发的特看科技CEO乐乘认为,目前全球还没有能跟ChatGPT抗衡的大模型,业界共识是差距在两年以上。国内先不谈弯道超车,趁早追赶反而是更重要的。
虽然一些人工智能资深人士认为,在ChatGPT所涉及的技术上,中美是“平级”的,但华为诺亚方舟实验室语音语义首席科学家刘群,在黄大年茶思屋的讨论中坦承,中国在技术上还是有差距的。其中一个是基础模型本身的差距,虽然我们训练了很多万亿模型或者是几千亿的模型,但训练的充分程度,是远远不够的。“我估计到现在为止,没有哪个模型能吃GPT那么多数据。”
清华大学计算机科学与技术系长聘副教授黄民烈提到,在GPT-3之后,OpenAI所有的模型都没有开源,但它提供了API调用。在这个过程中,它干了一件事,就是建立起了真实的用户调用和模型迭代之间的飞轮,它非常重视真实世界数据的调用,以及这些数据对模型的迭代。当然,在此过程中,它也养活了美国一大帮创业公司,建立了一个生态。
“你看我们国内的大模型研究,是A公司训练了一个,B公司也训练了一个,打个广告就完了,模型开源,你爱用不用。至少目前还没看到一家比较好的公司,把数据和模型的飞轮完整转起来。所以,我觉得这是我们赶超ChatGPT的难点。”一位业内人士坦言。
除此之外,业界人士都提到了算力问题。由于GPU芯片等问题,在一定程度上,国内算力已被卡脖子了。即使国内头部公司,从算力上跟谷歌等相比,差距也是比较明显的。
从数据质量来说,整个互联网的中文数据质量,相比于英文还是有明显差距。“我们可能要想办法,做中英文不同语言之间的数据互补。”有业内人士称。
此外,几乎所有受访人士都提到了OpenAI这家人工智能组织,所体现的纯碎创新精神和长期主义。“其实从原理和方法看,他们所做的东西业界都是了解的,倒没有说什么是美国做得了、我们做不了的。”云知声董事长梁家恩对数智前线说,但像OpenAI和DeepMind,他们可能是业界唯二的两家机构,无论在创新性、投入、决心,还是在顶尖人才储备上,都是一如既往坚持的。“我们看到的是成功,但里面可能已经有很多失败的尝试。”
有资深AI从业者认为,在看不到前景和没有明显效果的阶段,OpenAI非常坚定地做了投入,相反国内倾向于在技术出现突破后,快速追随。“国内大家第一步想的是,我们现在怎么用起来,但在不能用的时候,人家就在长期投入。”
“这件事其实是值得我们学习的,我们真的需要有足够多的钱,有这么一帮热血的人才,能够在一个方向上这样持续积累发力,我觉得这是一个非常必要的条件。”黄民烈称。
最近一段时间,业界也在讨论中国企业能否超越。容联云AI研究院院长刘杰告诉数智前线,围绕业务,尤其是国内的场景,是有超越机会的。在局部应用中开始超越,这也是业界的共识。
2
对中国人工智能界有何启发
ChatGPT是一种大模型。在它推出之前,国内外实际上已有不少大模型。相比其他大模型,它有了业界意料之外的突破,也给国内业界带来启发。
首先,ChatGPT有一个非常强大的技术底座,也就是InstructGPT模型。但这个模型的论文刚发出来时,没有引起特别大的反响,大家觉得也就是 OpenAI的一篇论文而已。梁家恩也告诉数智前线,此前,GPT与BERT模型路线一直在竞争,2018年时BERT模型先赢了,但GPT模型路线一直没放弃,模型参数和数据规模越做越大,最终结合人工反馈增强学习(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路线。因此,业内公司正在关注投入更大精力到GPT模型路线上,技术路线交替竞争,在业内是常态。
其次,ChatGPT引入了强化学习机制。容联云刘杰告诉数智前线,ChatGPT不仅仅像以前的大模型,利用了没有人工标注的数据去学习,还在新版本上引入了人工标注的数据,通过人类的反馈,有针对性地进行优化。“这是ChatGPT一个重要的进展,给了我们很大的启发。”
“这是它核心的一点。”华为终端云服务搜索与地图BU总裁赵世奇称,“今天,我们的模型越来越大,它就像一股洪荒之力,有人会害怕未来它会不会控制人类?但引入了这种强化学习机制后,就相当于给洪荒之力一个引导,让大模型的产出朝着可控的方向走,生成符合预期的结果。”比如,你去问它一些伦理安全的敏感话题,它都能答得很好。
这里的难度是建立怎样的强化学习机制。此前,在下围棋的AI中,强化学习是用胜负做反馈。但对于ChatGPT如此开放的系统,是没有明确的反馈机制的。黄民烈称,过去大家也尝试了强化学习机制,但很多都不太成功。ChatGPT在这件事上取得了突破。
第三,它在数据质量和多样性上非常讲究。OpenAI雇佣了一个数十人的数据团队,其实ChatGPT强化学习的数据量并不大,但对数据多样性、标注体系都有精巧的设计,让数据发挥出了强大的作用。业内认为,这确实是值得我们借鉴的地方。
当然,ChatGPT也有明显的不足。大家公认的,是它善于一本正经地胡说八道。刘杰告诉数智前线,ChatGPT是一个黑盒计算,当下在内容的可信性和可控性上有一定局限。“我们要给它足够正确的知识,再引入知识图谱这类知识管理和信息注入技术,还要限定它的数据范围和应用场景,使得它生成的内容更为可靠,这是我们在做的。”
ChatGPT在AI的技术路线和训练方式上的变革,让人关注它对产业带来的改变。特看科技CEO乐乘预计,很多单点环节里,用不用大模型会有天壤之别。没用大模型,只基于自己上一代小模型做产品的企业,跟应用了大模型且还做了业务垂直化的公司,将无法竞争。
多名创业者谈及,这两年创业市场垂头丧气,所有人都在探寻能够大幅度提升生产力的技术是什么。“ChatGPT其实提供了一种新的范式。垂头丧气、青黄不接的状态可能会成为过去。这个领域出几家千亿级别的公司是完全有可能的。”乐乘说。
3
中国企业的动作
ChatGPT推出后,很多人在讲谷歌、百度的焦虑。但大多数中国业内人士认为,目前ChatGPT还是一个对AI技术范式的探索,它并不能代替搜索。ChatGPT当下一个很大的弊端是无法实时获取互联网信息。由于它只是一个端到端的生成模型,能够自我构造虚假答案,这些都是它替代搜索的障碍。而如果以目前每一条几美分的成本来看,它会让商业搜索引擎公司入不敷出。
它作为搜索引擎的补充是有机会的,因为搜索引擎也讲求“所问即所答”,但这还有一个发展过程。
刘杰认为,ChatGPT主要的产业化路径,目前可能性比较大的首先还是在C端。由于ChatGPT展现出的大模型的创造性,以及对长篇上下文的理解能力,它可能会聚焦于一些开放性、创意性和通用性的任务上。
不过,中国企业在行业市场的探索已经开启。比如,在智能客服领域,云蝠智能CEO魏佳星告诉数智前线,上个月他们在一些场景尝试引入ChatGPT来做外呼的Demo测试,调用ChatGPT来回复客户的问题。
“在智能客服领域应用这项技术,核心点在大模型的NLP(自然语言处理)能力和此前企业里已有的NLP之间怎么结合。”魏佳星说。例如帮助顺丰去做回访的快递通知体系,是基于几个标准动作而进行,在这个封闭条件下应该优先企业已有的技术,满足客户当下的核心需求。
在这个需求之外,此前智能客服中的AI工具,在泛化能力和通用性方面存在一定的缺陷,语料信息不充分时,AI没办法对问题做出反应,ChatGPT大模型能够补全这方面的能力。魏佳星反馈,云蝠智能外呼的Demo测试效果较好。在其他行业里这项技术可能仍处于娱乐状态,但在智能客服领域,ChatGPT已具备商用潜力。
从事通讯及数字化服务的上市企业容联云,从2021年围绕着人机智能对话,做核心技术和产品研发,比如智能客服。目前,在研发与ChatGPT类似的人工智能内容生成产品。
但就模型的规模,刘杰有不同的看法。“ChatGPT的优势是它的大带来的,但在应用落地上,由于它过大,也带来了挑战和局限。”他告诉数智前线,“脱离场景去谈大和小是没有意义的。在特定应用场景、特定条件约束下、在特定的数据上,去训练规模适宜的模型,是我们努力的目标。”
刘杰还称,AI是一个链条比较长的产品技术,如果没有建立一个好的反馈机制,在部署运营阶段,从最前线发现的问题,就很难有效定位解决,所以要让模型去持续成长和优化,“它不是静态的,不是交付了就不再管它。”
云知声梁家恩告诉数智前线,他们一直密切跟进业内最前沿的算法,是最早把BERT和GPT2模型方法用到实际业务系统的团队之一,“现在相当于是把基于BERT的技术框架做个升级,目前已纳入云知声今年的技术升级目标规划中。”梁家恩说,ChatGPT的优势是意图理解、上下文对话管理和高质量内容生成,技术升级后,预计会带来显著的体验提升。
与其他企业一样,云知声的目标是先走通,之后在既有的业务比如在IoT智能语音交互对话,以及医疗行业应用中落地。梁家恩也提到了模型的规模问题,考虑商业化成本,实用模型的参数量最终可能要压到10亿量级。
商汤科技数字文娱事业部总经理栾青告诉数智前线,团队更多是利用GPT等生成式内容进行短视频等创作,让大家在创作的过程当中,把生产效率提升,“这是我们的核心点”。同时,商汤已训练了超过300亿量级超大基模型。
出门问问创始人李志飞则告诉数智前线,出门问问从2019年底开始做生成式应用,2020年GPT-3出来后一直在跟踪大模型。目前发力的一个行业应用是写文案。
某游戏人工智能的资深开发者告诉数智前线,这项技术在游戏的用户互动环节和制作环节能看到应用前景。比如用户和NPC(一种角色)互动对话时调用,由于ChatGPT对自然语言的优秀理解能力,用户和NPC互动的开放性能大幅提升。另外在制作环节里,应用ChatGPT,可通过关键词生成故事线,能给策划在剧情走向设计时提供参考。
另外,在数字人领域,特看科技CEO乐乘告诉数智前线,大模型让数字人的内容生产和交互方式发生了变化。
在没有引入大模型之前,数字人说话和行动基本要靠真人行为去驱动。有了大模型之后,内容的输出可以通过大模型来完成。以直播带货为例,数字人公司先给本地生活、知识付费和直播商家等建立一个数字人的虚拟主播形象,而后可以将大模型接入,让大模型辅助撰写数字人直播带货的话术和脚本,“未来在我们关注的泛生活和电商赛道,可能有30%内容能够通过大模型生成来完成。”乐乘说。
4
ChatGPT在行业落地难
不过,业界资深人士提出,当下ChatGPT在行业里要真正落地还面临困难。
“商业模型上跑不通。”魏佳星对数智前线说。ChatGPT目前调用一次的费用在几美分,智能客服一天的问答场景,通常可能要调用几十万次。“我们一通电话收费才1.2毛,利润可能也就2分钱,现在的成本使得它根本跑不起来。“魏佳星认为,当这项产品的调用成本降到1分钱时,行业里可能就会大范围使用起来。
游戏行业的开发者们也坦言,调用ChatGPT的成本和它当下所带来的回报可能并不成正比。几美分只是调用费用,还不算运营费用。“没有一个老板能接受,NPC回复一句话要花掉几毛钱,即使它说得再好。”而用户的游戏体验是个系统工程,文本互动只是其中的一环。当下即使有厂商愿意不顾高成本使用ChatGPT,最终的用户体验也依然可能无法有质的飞跃。
在游戏制作环节,ChatGPT可能也只能作为策划和游戏设计环节的参考,“乍看中规中矩要素齐全,但细品会发现缺少灵魂,在观念性的创造上仍有待提升”。
不过,乐乘对ChatGPT的成本问题相对乐观。OpenAI公司自己也是初创团队,没有那么有钱。随着竞争加剧,大模型会像水电煤一样,是大家都用得起的状态。
刨除成本考量,在对企业的落地中,ChatGPT这类大模型,也有典型的问题。
容联云刘杰举例,首先,很多客户有私有化部署要求,但这些模型非常大,对资源要求高,当前不太可能实现私有化部署。其次,这些大模型在一些特定行业或特定任务上,专业性是欠缺的,需要去适配。而对于ChatGPT这类非开源的大模型应用来说,对它在下游任务上的微调,如何兼顾成本、灵活性和数据隐私则是一个关键问题。这些问题也造成,这种模型还没有走到服务企业级客户,尤其是大型企业客户那一步。
除此之外,现在人工智能技术都在与企业的核心业务流程做深度融合,而像ChatGPT这个基于大模型的应用服务,更像一个独立的外挂,如何深度绑定,这也成为企业使用它的一个待解决问题。
业界人士期望ChatGPT未来在商业模式上有更好的呈现方式。目前ChatGPT对外提供的API还非常单一,影响了应用。
5
创业公司会被ChatGPT吞噬吗
大家在期待OpenAI的下一个版本。GPT-3大模型发布于2020年, ChatGPT则基于它的改进版本创建。此前盛传,GPT-4将于今年一季度或下半年推出,不过OpenAI的首席执行官 Sam Altman在1月份回应,没有具体的时间表。
一些创业者已经开始关注到,随着大模型被越来越多地应用,细分赛道的创业公司在大模型的强大推力加持下,如何寻找自己的生存空间。
它涉及到两点,首先是如何深化对垂直行业的认知,真正把大模型融入到企业的创新业务流中。特看科技乐乘认为,垂直行业的小模型,考验的是创业公司对垂直行业的know-how。创业公司需要基于对行业的认知深度,采集足够多的场景数据,并基于这些细分数据更好服务用户。用户越多,反馈越多,最终形成数据反馈的闭环。
创业公司在小模型的竞争终局比拼的是,谁家的小模型跟业务结合得紧,且能解决好跟大模型结合的问题。
另一点是,大模型被充分使用、喂得很肥后,是否会成为最强大的AI,最终吞噬细分赛道上小创业公司的发展空间。
海外初创公司Jasper的命运颇能反映这种境况。Jasper是一家基于GPT-3大模型来生成营销文案的AI服务商,去年10月它宣布以15亿美元的估值获得1.25亿美元A轮融资。一个月后,基于GPT-3改进版本搭建的ChatGPT大火,智能程度更泛化的ChatGPT彻底盖过了Jasper的风头。
“对创业者而言,在充分利用已有大模型的情况下,也要尽可能要把小模型的闭环数据保护好。”特看科技乐乘说,这也是他们公司未来会重点攻克的方向。
不过,当下底层大模型还在高速迭代阶段,行业内都在等 GPT-4 出来。乐乘认为,从GPT-3到GPT-4的变迁,很像移动互联网早期 iPhone 1和 iPhone4 阶段iOS的升级速度,它的发展速度也许会超出大家的