复旦大学研发的MOSS距离ChatGPT还有多远？

复旦抢先发布！国内首个类ChatGPT模型！已开放内测申请，代码将于3月发布

复旦院系,复旦高校,复旦规模,复旦创立
来源：AI新媒体量子位（ ID: QbitAI）作者：Pine 萧箫没想到，众人加班加点抢“中国版ChatGPT”热度时，首个国内类ChatGPT模型竟然已经发布了！砸出这个重磅消息的，不是紧锣密鼓宣传的BAT大厂，也不是直接出手几亿的投资大V，而是这段时间来一直没吭气的复旦大学。事情一出，直接引爆了一众社交媒体，不仅在微博刷出数个热搜话题，知乎更是冲上热榜第一。各路“ChatGPT爱好者”连夜赶来围观，甚至由于官网访问人数太多，服务器一度被挤爆，又上了一次热搜。这是怎么回事？原来，复旦NLP团队这个类ChatGPT模型，发布即面向公众进行内测，甚至连预告都没有：紧接着，团队又投下另一颗重磅炸弹：模型3月份就会开源代码。最关键的是模型的名字。复旦团队用了《流浪地球》里面拥有自我意识的AI――MOSS来命名这一模型，直接把消息热度推上顶峰。有网友表示，MOSS率先开放至少有一大优势，那就是“获得更多数据”：ChatGPT有一个巨大的先发优势，就是通过抢先开始公测收集大量用户数据，并且这部分数据现阶段只有人家有。算法都是成熟且公开的算法，真正的核心其实是数据和硬件。说回模型本身。据MOSS自己介绍，它同样具备ChatGPT能实现的这些功能：问答、文本翻译、摘要总结、故事撰写、情绪分析、建议提供、代码和算法编写等。但实际测试效果又是如何，具体训练方法和效果会不会有什么差异？我们一步步来看。MOSS与ChatGPT相比效果如何？据团队介绍，MOSS与ChatGPT主要有三大差异。最主要的就是参数量的不同。MOSS模型的参数量比ChatGPT小了一个数量级。然后是训练方式的不同。虽然MOSS也是自然语言模型基座训练+理解人类意图对话能力训练，但后者的训练方式与ChatGPT采用的RLHF不同。复旦团队没有采取人工标注（指令微调）的方式来进行理解对话能力训练，而是基于与其他AI对话模型的交互来训练自己。没错，相比人类调教，MOSS直接选择和其他AI模型进行对话……最后是开放程度不同。ChatGPT背后模型目前还没有开源，但MOSS承诺会将代码开源。说了这么多，MOSS的效果具体如何？从官方给出示例来看，它问答和生成代码的能力似乎还不错。在问答环节中，让MOSS列五部科幻片，分分钟就能给出（不过，《黑镜》好像是电视剧？）：做表格的速度也非常快：在代码生成中，写个快速排序算法也没问题：但与ChatGPT相比，MOSS的实测效果究竟如何呢？知乎已经有匿名用户称已经拿到了内测资格，并实时更新了一波测试结果，我们将MOSS的回答与ChatGPT简单对比一下。第一轮，先来看看写文章的能力。例如“帮忙写一下国家自然科学基金申请，杰青那种”，MOSS回答如下：我们把问题拿给ChatGPT后，得到了这样的回答：第二轮，来看看写代码的能力。这是MOSS给出的代码实现：完整代码：for(i=1:length(mat文件中的名字)){name=mat文件中的名字[i];data={name};fprintf(‘%s,’,name);}end for这是ChatGPT给出的代码与回答：第三轮，测试一下算法题的效果。MOSS给出了一个实现思路：ChatGPT则包办了代码和具体算法实现的流程：最后一轮，再来看看做数学题的能力。不过从功能介绍来看，MOSS应该还不具备解数学题的能力，这个问题确实不一定能回答出来。ChatGPT则列了个方程解决这个问题：整体来看，MOSS虽然在算法题上表现出了一定的逻辑，但在包括写文章、做数学题等具体解决方案的提供上，还有待继续训练提升。“只是想验证ChatGPT技术路线”针对种种疑问，团队也在官网上做出了回应。首先，是MOSS与ChatGPT的差距上。团队表示，目前它还是一个非常不成熟的模型，距离ChatGPT还有很长的路需要走：我们一个实验室无法做出和ChatGPT能力相近的模型，只是想在百亿规模参数上探索和验证ChatGPT的技术路线。接下来，是针对服务器被挤爆的回应：我们没想到会引起这么大关注，计算资源不足以支持如此大访问量，向大家致以真诚的歉意。最后还有关于命名MOSS的回应：就像过去NLP领域的其他优秀模型一样，作者们都希望使用自己喜欢的影视角色名称命名自己的模型。此外，研究团队还在介绍网站中详细列出了MOSS的限制因素：训练数据中的多语言语料库有限；模型容量相对较小，不包含足够的世界知识；执行方式比较迂回，甚至不按照指示执行；可能会生产不道德或有害的内容；……总结下来，就是MOSS的回答不及ChatGPT就是因为它缺乏高质量的数据、计算资源以及模型容量。不过，有意思的是，团队表示，在这些问题里面MOSS的最大短板是中文水平不够高。具体来说，相较于英文问答能力，MOSS的中文问答水平要低很多，这也与前面提到的预训练模型学习数据量有关：它的模型基座学习了3000多亿个英文单词，而互联网上的中文网页干扰信息如广告很多，清洗难度很大，导致中文词语只学了约300亿个。目前，复旦大学NLP实验室正在加紧推进中文语料的清洗工作，清洗后的高质量中文语料也将用于下一阶段模型训练。当然，和ChatGPT相比，MOSS也不是“一无是处”（手动狗头），起码它会在3月份开源代码。而这一把也将会直接有效降低预训练语言模型的研发和应用门槛，属实是利好中小企业了，邱锡鹏教授也表示：MOSS的计算量相对不那么大，中小企业都能用起来。此外，研究团队对MOSS的“野心”似乎还不止于对话问答、写代码等这些ChatGPT拥有的功能。在这次面向公众内测的同时，团队还透露出了MOSS的下一步计划：结合复旦在人工智能和相关交叉学科的研究成果，赋予MOSS更多的能力，如绘图、语音、谱曲和教学，并加强它辅助科学家进行高效科研的能力等。研究团队MOSS是复旦大学自然语言处理实验室的成果，并且该项目还得到了上海人工智能实验室的支持。研究团队由邱锡鹏带队，其余几位均为复旦大学NLP实验室的成员。复旦大学自然语言处理实验室，是由复旦大学首席教授吴立德先生创建，是我国最早开展自然语言处理和信息检索研究的实验室之一。目前实验室已经发表了大量高水平国际期刊和会议论文，其中包括中国计算机学会推荐的A/B类国际会议和期刊论文（ACL,SIGIR,IJCAI,AAAI,NIPS,ICML等）论文150余篇。此外，复旦NLP实验室还发布了国内首家中文自然语言开源系统FudanNLP，被包括联合国教科文组织在内的国内外多家研发机构采用。邱锡鹏，复旦大学计算机科学技术学院教授，博士生导师，研究方向为自然语言处理、深度学习，发表CCF-A/B类论文70余篇。他还主持开发了开源自然语言处理工具：FudanNLP 、FastNLP，获得了学术界和产业界的广泛使用。对于复旦MOSS模型的发布，你的看法是？参考链接：[1] https://txsun1997.github.io/blogs/moss.html[2] https://www.shobserver.com/staticsg/res/html/web/newsDetail.html?id=584634[3] https://www.zhihu.com/question/585248111/answer/2903204899[4] https://xpqiu.github.io/index.html为伟大思想而生！AI+时代，互联网思想（wanging0123)，第一必读自媒体

大厂齐刷刷跟进 ChatGPT，为何只有百度做出了文心一言？

这些年，互联网大厂们齐刷刷的对一种技术浪潮表态，一共有两次。一次是 2018 年 " 中兴事件 " 后，大厂们纷纷表示，要掌握核心技术，积极 " 造芯 "；另一次是前一段时间，ChatGPT 大火之后，大厂们的人工智能热情被点燃。一见财经注意到，就在两三天时间内，大厂们纷纷向外界透露了自己的类 ChatGPT 研发计划。2 月 7 日，百度官宣将在 3 月上线文心一言（ERNIE Bot），称公司在文心一言的底层模型 " 文心 " 系列上已布局多年，"ChatGPT 相关技术，百度都有 "。2 月 8 日，阿里巴巴一名资深技术专家爆料，阿里达摩院正在研发类 ChatGPT 的对话机器人，目前已开放给公司内员工测试。同日，科大讯飞在投资者互动平台回应称，ChatGPT 主要涉及到自然语言处理相关技术，公司在该方向技术和应用具备长期深厚的积累。2 月 9 日，腾讯对外回应称，公司目前在相关方向上已有布局，专项研究也在有序推进。短短数日，"ChatGPT 热 " 席卷了几乎所有的国内互联网大厂，好像不和 ChatGPT 沾点边，公司就不属于互联网科技公司了。但很多人发现，明确表态推出具体产品的只有百度。｜不是喊口号｜除了大厂们积极表态跟进，"ChatGPT 热 " 也烧到了资本圈， ChatGPT 热度不减，相关概念股受到资本追捧，股价涨幅较大。2 月 8 日，海天瑞声临近尾盘 20% 涨停；云从科技自 1 月 30 日以来的八个交易日内收获了三个 20% 涨停板。不过，几天之后 "ChatGPT 概念股 " 股价相继回落，原因之一是个别公司存在炒概念的情况，根本就没有实际产品。比如，自称 " 人工智能服务器领域市占率位居全球 AI 服务器市场第一 " 的浪潮信息在不到两个月的时间里股价接近翻倍，但最近面对监管机构的问询函，公司称相关应用与 ChatGPT 存在差距，存在短期内无法大规模落地行业应用的风险，且相关应用尚未产生实际收入。而该公司此前曾表示，公司于 2021 年发布的 " 源 1.0" 超大规模预训练自然语言模型，结构与 GPT-3 类似，与 GPT-3 相比参数量增加 40%，训练数据集提升 10 倍，达到 2457 亿参数。分析人士指出，要搞出中国的 ChatGPT，并不是通过喊口号就能实现的，既需要雄厚的财力、人才储备，更需要长期的技术沉淀。ChatGPT 表面上看是一款聊天机器人，但他是基于全世界最强大的大语言模型之一 GPT-3，该模型由 1750 亿个统计性联系组成，在约三分之二互联网、整个维基百科和两个大型图书数据中集中训练。从目前各公司公布的进展看，百度决心最大，而且有成型的产品，这和百度这些年在该领域的深厚技术积淀有很大关系。ChatGPT 受关注，本质上是其背后的公司 OpenAI 在 NLP（自然语言处理）技术领域获得了突破，再加上采取了通过聊天的形式来训练，获得了全球追捧。NLP 被称为 " 人工智能皇冠上的明珠 "，其实百度很早就开始 NLP 方面的研究了，在百度诞生时，百度处理用户的第一次搜索开始，NLP 技术就成为搜索技术的重要组成部分。2010 年初，百度对 NLP 的工作进行了重新梳理与规划，成立百度自然语言处理部。2013 年，百度设立深度学习研究院，连投十年，超过 1000 亿元。2018 年，百度将深度学习平台 " 飞桨 " 升级为操作系统（文心一言的支持系统），并不计成本投入人力财力。2019 年 3 月，百度提出知识增强的语义理解框架 ERNIE（文心一言的前身），在深度学习的基础上融入知识，同时具备持续学习能力，曾一举登顶全球权威数据集 GLUE 榜单。2021 年 9 月，百度发布了 PLATO-XL，这是全球首个百亿参数的对话大模型，一举超过 Facebook 的 Blender、谷歌的 Meena 和微软的 DialoGPT。现在，该模型已更新迭代至文心 ERNIE3.0，参数规模高达 2600 亿，几乎比谷歌 LaMDA（1350 亿）高了一倍，也高于 ChatGPT（1750 亿），是全球最大的中文单体模型。" 目前在国内公司中，豪不夸张的说，没有一家公司的水平接近百度。" 有业内人士指出，百度之所以敢明确表示推出文心一言，是因为已经在这个领域默默耕耘了十几年。｜需要硬实力｜ChatGPT 的背后是大语言模型，而大语言模型背后则包含底层芯片、深度学习框架、海量数据、强大的算力以及雄厚的资金实力。2 月 13 日，原美团联合创始人王慧文在朋友圈发文：5000 万美元，带资进组，不在意岗位、薪资和 title，求组队。海通证券分析师郑宏达第二天就表示："5000 万美元够干什么的？大模型训练一次就花 500 万美元，训练 10 次？" 言外之意，要搞中国的 ChatGPT，一定是非常烧钱的。其实，OpenAI 创立之初就得到了来自硅谷很多大佬在资金上的支持，比如埃隆・马斯克、彼得・泰尔、雷德・霍夫曼等，2019 年 7 月，微软还对 OpenAI 进行了 10 亿美元投资。一见财经相信，国内能拿出巨资搞中国 ChatGPT 的互联网巨头不在少数，但有钱只是第一步，搞人工智能最关键的在于算法、数据和超强的算力。360 公司董事长兼 CEO 周鸿t最近指出，拥有技术积累的企业才能搭上这辆车，" 没有在服务器、算力上投入，也没有 AI 团队的企业，宣布入局都是在蹭热度。"OpenAI 背后，有微软为其提供资金和超强算力，有 GPU 巨头英伟达提供高性能 AI 芯片，而 OpenAI 主要专注于算法和大数据模型。目前，在国内能集齐以上超能力的，放眼望去可能只有百度，百度在人工智能四层架构中有全栈布局，包括底层 AI 芯片、深度学习框架、大模型以及最上层的搜索等应用，而文心一言则位于模型层。百度的文心大模型和 OpenAI 的 GPT 模型类似，2019 年就已经推出，并且已经迭代了多代，从单一的自然语言理解延申到多模态，包括视觉、文档、文图、语音等。最新发布的 ERNIE3.0 Zeus 迭代于 ERNIE3.0，拥有千亿级参数。其已经具备智能创作等各类自然语言理解和生成能力。算法方面，百度拥有多个超算集群。百度还自研了 AI 芯片 " 昆仑 "，已在多场景实际部署。深度学习框架层面，百度飞桨平台在 2022 年底已凝聚 535 万开发者，基于飞桨创建了 67 万个模型，服务 20 万家企事业单位。数据层面，百度的搜索业务本来就积累了很多数据，其在用户需求理解方面有比较明显的优势，这些数据都能支撑 ERNIE bot（文心一言）的充分预训练，而随着 3 月文心一言上线公测，这个模型可能会被训练的更聪明。中金互联网行业首席分析师白洋最近表示："AI 的三要素包括算力、算法和数据，我们认为百度在这三项上拥有领先优势。"｜" 文心一言 " 或重塑百度｜ChatGPT 火爆初期，有人预测会革了搜索的命，谷歌内部拉响 " 红色警报 "，没几天就宣布推出名为 "Bard" 的 AI 聊天机器人。在国内，也有观点认为，百度搜索业务也可能会受影响。但深入研究发现，百度和谷歌不同，面对 ChatGPT 谷歌是被威胁者，而百度是受益者。今年以来，百度股价飙升了近 36%，而在 2 月 7 日百度官宣 " 文心一言 " 的消息时，百度股价当天收盘涨幅超过 15%，创下自去年 2 月以来的历史新高。国盛证券在研报中称，百度在人工智能端具备从芯片到应用的全栈技术布局，在自然语言处理领域的积累深厚，同时 AI 大模型在其他领域也有应用落地。分析人士指出，在 " 文心一言 " 的应用上，百度的思路有点像微软。微软除了将 ChatGPT 与 Bing 搜索结合，还将 OpenAl 的多项技术模型引入 Azure 云服务中，并在 Ofice、Teams 和安全软件中采用更多的 OpenAl 技术。中金公司在研报中预测，百度通过其生成式 AI 产品文心一言，面向 B 端提供标准化 Al 能力，助力企业智能化转型。" 百度股价弹性来自于云、AIGC 和自动驾驶等新业务，若对标 OpenAI 目前的估值 290 亿美元左右，百度的技术和商业实力不弱于 OpenAI。" 中金公司在研报中称。据了解，目前已有接近三百家企业接入文心一言 Al 能力。另外，在近期流出的一份百度内部讲话中，百度 CEO 李彦宏指出，ChatGPT 是 AI 技术发展到一定阶段后的新机会，技术已经到了临界点。百度已经宣布将为百度搜索升级 " 生成式搜索 " 能力，为用户开放式的搜索提问或定制化的信息需求 " 创作答案 "。百度最新发布的 2022 年财报显示，实现营收 1236.75 亿，净利润 206.8 亿元，同比增长 10%，其中第四季度营收 330.77 亿元，净利润 53.71 亿元，同比增长 32%。另外一个值得注意的数据是，2022 年百度核心研发费用达到 214.16 亿元，占百度核心收入比例达 22.4%，已连续九个季度超过 20%。这些年百度一直在加大技术方面的研发投入，有些技术虽然短期看不到效果，但是长远来看，成果正在显现，比如 " 文心一言 "、自动驾驶、AIGC 等都是厚积薄发的成果。有人说，在国内互联网大厂中，百度对 AI 的投入是马拉松式的，所以能做出文心一言也就不奇怪了。上一篇小鹏汽车进入 " 生死时速 "

本文地址： https://www.xxs100.com//show-397116.html