“MOSS”被挤崩了！复旦科研团队：距离ChatGPT还有很长的路需要走

热门文章 2023-02-28 17:56:55 0

淘宝搜：【天降红包222】领超级红包，京东搜：【天降红包222】
淘宝互助，淘宝双11微信互助群关注公众号【淘姐妹】

复旦slam,复旦 science,itsdani复旦大学,复旦科研狗
2月20日，复旦大学自然语言处理实验室发布了国内首个类chatgpt模型moss，立即引起各界关注， moss网站（https://moss.fastnlp.top/）一度瘫痪。目前，已有数万名用户申请参与内测。由于高校实验室的推理服务器资源非常有限，为保证moss较为流畅地给出回复，复旦科研团队只能分批邀请用户参与内测。复旦moss团队回应内测 2月20日晚，moss发布至公开平台邀公众参与内测。当晚，社交媒体上出现截图，显示该平台“服务器流量过载，请明天上午重试”。昨日，moss官网发布公告，解释称“计算资源不足以支持如此大的访问量”“给大家造成非常不好的体验和第一印象”并致以真诚的歉意。昨日凌晨2时30分，复旦科研团队修复了网站服务器。关于moss一个显著的反馈是，moss的英文回答水平比中文高，这在公众与chatgpt的互动中也有类似体现。复旦科研团队坦承，“moss的英文回答水平比中文高，因为它的模型基座学习了3000多亿个英文单词，中文词语只学了约300亿个。”目前，moss的最大短板是中文水平不够高,主要原因是互联网上中文网页干扰信息如广告很多，清洗难度很大。为此，复旦大学自然语言处理实验室正在加紧推进中文语料的清洗工作，并将清洗后的高质量中文语料用于下一阶段模型训练。复旦科研团队相信，这将有效提升模型的中文对话能力。对于网友提出的另一个疑问：“这个模型为何取名moss”，科研团队解释：“与自然语言处理领域的其他一些模型一样，开发者会用自己喜欢的影视角色名称命名模型，如bert、megatron等。我们在训练完第一代模型的时候，正值《流浪地球2》热映，影片中moss给团队每个人留下了深刻印象，所以用它来称呼我们开发的模型，以表达我们对最前沿人工智能模型的不懈追求。”moss回答问题的水平如何？ moss的基础功能与chatgpt类似，可以按照用户输入的指令完成各类自然语言处理任务，包括文本生成、文本摘要、翻译、代码生成、闲聊等等。在预览期间，moss的使用是免费的。那么moss的中英文回答水平怎么样？在面对涉及伦理判断和法律知识等问题时它会如何回答？近日，就有记者与chatgpt聊了聊↓↓↓可以看出，moss的回答语言流畅、逻辑清晰且观点正确。与 chatgpt 类似，moss 有时也会输出一些事实性错误的例子，比如以下例子中《黑客帝国》的导演并不是 thomas neff，而是沃卓斯基兄弟（姐妹）。复旦科研团队也坦诚指出，当前版本的moss表现不够稳定，有些回答存在事实差错或逻辑不顺。除了多轮对话，moss生成代码也不在话下。此外，moss还具备一定的价值观，当被要求回答不合理的问题时，moss会拒绝回答并给出正确的劝导。moss距离chatgpt还有多远？ moss开发的基本步骤与chatgpt一样，包括自然语言模型的基座训练、理解人类意图的对话能力训练两个阶段。复旦大学计算机科学技术学院邱锡鹏坦言：“moss与chatgpt的差距主要在自然语言模型基座预训练这个阶段。moss的参数量比chatgpt小一个数量级，在任务完成度和知识储备量上，还有很大提升空间。”据项目主页介绍，moss 和 chatgpt 的主要区别在于：moss 的参数数量比 chatgpt 少得多。moss 通过与人类和其他人工智能模型交谈来学习，而 chatgpt 则通过人类反馈强化学习（rlhf）进行训练。moss 将是开源的，以促进未来的研究，但 chatgpt 可能不会。据了解，moss 采用参数量为百亿级的自研模型进行训练。在对话能力训练阶段，openai 收集了至少几十万条人类指令 ―― 让各行各业的专业标注员写出指令回复，再将它们输入模型基座，以帮助 chatgpt 逐步理解各种指令。复旦科研团队则采用不同的技术路线，通过让 moss 和人类以及其它 ai 模型都进行交互，显著提升了学习效率和研发效率，短时间内高效完成了对话能力训练。研发团队表示，虽然 moss 已经实现了 chatgpt 的一些功能，但仍然存在许多限制，由于缺乏高质量的数据、计算资源和模型容量，moss 仍然远远落后于 chatgpt。由于训练数据中的多语言语料库有限，moss 在理解和生成英语以外的语言的文本方面表现不佳。团队目前正在开发一个改进版本，以提高其中文语言技能。由于模型容量相对较小，moss 不包含足够的世界知识。因此，moss 生成的一些响应可能包含误导性或虚假信息。有时 moss 以迂回的方式执行，甚至未能遵循指示。在这种情况下，用户可能需要重新生成几次或修改 prompt，以获得令人满意的回复。团队正在积极提高其遵循指示的能力以及生产力。有时 moss 可能会因 prompt 生成不道德或有害的反应。用户可通过单击 “不喜欢” 来帮助减少此类行为，团队将在下一个版本中更新模型。moss可执行对话生成、编程、事实问答等一系列任务，打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。这条路径的走通，为国内学术界和产业界提供了重要经验，将助力大语言模型的进一步探索和应用。邱锡鹏表示：“尽管moss还有很大改善空间，但它的问世证明了在开发类chatgpt产品的路上，国内科研团队有能力克服技术上的重要挑战。”moss研发项目得到了上海人工智能实验室的有力支持。后期，这项工作将通过开源方式和业界社区分享。据介绍发布之后，团队将持续通过提供 moss 的可访问界面，根据宝贵的用户反馈（在许可下）不断改进模型。上海科技综合整理自上观新闻、澎湃新闻、机器之心、每日经济新闻等上观号作者：上海科技

chatgpt能干什么项目如何申请chatgpt账号

chatgpt,chatgpt官网,chatgpt国内能用吗,chatgpt注册
　　作者|Yinting Hou 　　ChatGPT掀起全球热潮，并开始“入侵”人类生活。　　2月19日，根据《韩国经济新闻》报道，出版商SnowfoxBooks即将发行一本由ChatGPT撰写的书籍《寻找人生目标的45种方法》(45 Ways to Find the Purpose of Life)，预计本周三(22日)上架。该书将是全球首本由AI处理整个出版过程的书籍，包括撰文、翻译、较对，以及设计图像。　　报道提到，ChatGPT只花了7小时搜集资料和数据，并以英文写出135页内文。之后，翻译软件Papago以2小时完成韩文翻译，并交由釜山大学AI实验室和Nara Info Tech共同开发的AI韩文检查工具，协助校对与纠正。最终由美国AI影像生成公司Shutterstock AI完成本书封面设计。　　美国Open AI开发的聊天机器人ChatGPT，发布于2022年11月30日，短短三个月里，势如破竹。市场研究机构Similarweb数据显示，2023年1月，ChatGPT独立访问用户达1.015亿，月环比暴增78%。　　根据Sensor Tower数据，TikTok在全球上线后大约9个月才增加了1亿用户，而Instagram则花了2年半时间。瑞银分析师在月初发表的研报中写道，“在互联网高速发展的20年里，我们找不到哪款消费者互联网应用的用户增长速度比ChatGPT更快。” 　　ChatGPT带来的产业规模也是极具想象力的。Open AI预测，2023年将实现收入2亿美元，2024年将超过10亿美元。Open AI的CEO、创始人Sam Altman最近对投资者表示，OpenAI很快就能产生高达10亿美元的年收入，部分是通过向消费者和企业收取产品费用实现的。　　ChatGPT乃至AIGC来袭，“AI取代人类”仿佛即将成为现实，未来诸多人类工种或将消失。　　对此，国研新经济研究院创始院长、中国数实融合50人论坛智库专家朱克力在霞光社近期举行的线上沙龙上指出，AI技术还不至于真正取代人类，相反会给人们带来更多机会和改善空间，“AI在以惊人的速度发展，完成的任务也越来越复杂，但是不能替代人的思想、情感还有创造力等一些独特性。人作为万物之灵，AI不能取代人的价值。” 　　ChatGPT会否取代人类，尚不得而知。但奋起追赶AI，与AI共存，将是人们必须接受的现实。　　ChatGPT开始应用　　作为聊天机器人，在刚刚过去的情人节里，ChatGPT担任了情书代笔。根据一项面向全球5000名用户的调查，有26%受访者表示会找ChatGPT在情人节代写情书。　　2月14日，美国媒体公司Buzzfeed发布了AI设计的测试问卷，供读者填写。Buzzfeed付费使用Open AI开发的软件，将其运用于网站内容制作。这个消息出来后，BuzzFeed的股价三天内暴涨300%，成交量超过4.38亿股。　　除了媒体文本应用，ChatGPT还被应用于专业领域。2月15日，根据金融时报报道，安理国际律师事务所(Allen & Overy)将推出一款人工智能聊天机器人，帮助其律师起草合同。　　安理国际律师事务所表示，去年11月开始测试一款名为Harvey的聊天机器人，用于起草并购文件或给客户的备忘录等任务。目前该事务所所有律师都可以使用该工具，总计约3500人。　　据悉，初创公司Harvey开发了该工具，使用的是OpenAI创建的底层GPT技术。Harvey于2022年11月募资500万美元，由OpenAI创业基金(OpenAI Startup Fund)、Google AI负责人Jeff Dean等参与投资。　　值得关注的是，2月1日，AI版情景喜剧Nothing,Forever在Twitch频道WatchMeForever开始24小时直播，大受欢迎，当日即涨粉超3万人。这部恶搞《宋飞传》(Seinfeld)的动画片，使用了OpenAI的GPT-3达芬奇模型。　　但ChatGPT的初期应用，并没有那么完美。2月6日，Nothing,Forever因角色发表对跨性别者的歧视言论，被停播两周。直到2月20日，剧集才得以重新上线。　　Nothing,Forever 联合创始人Skyler Hartle表示，“我们很尴尬，这根本不反映我们的价值观或观点。”在重新上线前，团队承诺将实施Open AI的内容审核API。　　ChatGPT可以创作小说、剧本，但有时候也会“胡说八道”。科大讯飞多语种业务部总经理周传福在霞光社线上沙龙说道，在体验ChatGPT的时候，要警惕其一本正经的“胡说八道”。当我们要将ChatGPT运用于实际工作中时，还需要对获得的答案、事实进行核查。　　2月10日，Sam Altman在《纽约时报》科技播客Hard Fork中提到，ChatGPT经常出现错误信息，人们对此的批评是公允的。　　据悉，2月7日，微软推出的新版搜索引擎Bing(必应)，是在下一代Open AI大型语言模型普罗米修斯上运行的。Sam Altman指出，该模型比ChatGPT更强大，准确度和实用性都更好。　　人们迫不及待地将ChatGPT投入应用，但随之而来的是争议不断，尤其是教育、学术等领域。　　日前，香港大学向师生发出内部邮件，表明禁止在港大所有课堂、作业和评估中使用ChatGPT或其他AI工具，除非学生事先获得有关课程讲师的书面同意豁免，否则使用此类工具将被校方视为剽窃。　　2022年12月起，以保护学术诚信为由，美国纽约市、洛杉矶、西雅图、阿拉巴马州的蒙哥马利郡、马里兰州的巴尔的摩等禁止在公共学校的网络和设备上使用ChatGPT。　　更有人用ChatGPT署名写论文，发表在《自然》等期刊上。然而，《自然》《科学》的总编都公开表示，不允许AI被列为作者。　　赶紧做中文ChatGPT 　　“ChatGPT出来之后，我首先的体会是，我们要赶紧做中文的ChatGPT。”周传福认为，Open AI在英文上做得最好，国内也应该开始做好ChatGPT中文版。　　2月7日，微软将Open AI技术应用到Bing搜索引擎中，谷歌推出对话式AI服务Bard，而中国大厂百度也宣布推出类似ChatGPT的AI聊天机器人“文心一言”。　　百度表示，该项目英文名为ERNIE Bot，3月份完成内测，面向公众开放。目前，文心一言在做上线前的冲刺。　　2月8日，阿里巴巴也透露在开发类ChatGPT产品，将与办公软件钉钉融合;京东2月10日则宣布，推出产业版ChatGPT，名字叫ChatJD。　　“ChatGPT出来之后，我们看到大模型的效果和希望。通俗一点讲，就是‘暴力出奇迹’，用超级多的参数去生成超级大的模型。ChatGPT在技术、架构等方面没有特别大的创新，但是要做成ChatGPT这种大模型，(中国)还有很多路要走，感觉留给自己的时间不多了。” 　　周传福坦言，训练出GPT这样的大语言模型，在算法、算力和数据都是需要积累的，比如在数据上，几十TB级别的数据才能满足开发需求，这些都不是一天两天可以完成的。“AI是代表未来的，毋庸置疑。作为从业人员，我们一定要跟紧，不能掉队。” 　　公开信息显示，2018年6月，Open AI发布的首代GPT参数量仅为1.17亿个，而ChatGPT背后的GPT-3.5模型已增加至1750亿个参数，多过人脑拥有的860亿个神经元数目。　　如此庞大的模型背后，投入的运营资金也是巨额的。半导体产业分析机构SemiAnalysis估算，应用ChatGPT的一次性训练费用约为8.4亿美元，每天的硬件维护费为69.4万美元，每次对话费用为0.36美分。按此估算，ChatGPT一亿的月活用户每个月只做一次对话，每月也至少需要5682万美元(约合3.86亿元人民币)的维护费。　　显然，在ChatGPT的开发上，技术推动和资本投入都是不可或缺的。东吴证券研究所联席所长张良卫在霞光社线上沙龙表示，“落实到投资层面，主要意义在于会加速整个AI产业爆发式发展。”具体而言，他指出，在算力、算法、数据等AI产业链相关的环节，国内都有投资机会。　　除了互联网大厂及产业链上的企业，国内涉及AI领域的细分企业也不少。东吴证券研究所研究员周良玖指出，这两年做大模型的创业公司越来越多，他们可能在特定细分领域里做了一些小模型;此外还有各类应用公司，比如文本生成、图像生成、图像销售等公司，也在领域内应用AI技术。　　朱克力指出，中美对比而言，中国在各方面的积累至少差两年，追赶难度上并不小。“新事物需要鼓励培育发展，又要考虑监管的问题。从目前的状态来讲，尤其我们差距还这么大的情况下，还是要更多的支持和鼓励。” 　　关于中美在人工智能领域各自的竞争优势，ChatGPT是这样评价的，“美国在人工智能领域的优势体现在其领先的科学研究和技术开发水平，以及其丰富的资金和技术人才。美国还是全球最大的人工智能市场，其在该领域的投资和政府支持也非常强烈。” 　　“中国在人工智能领域的优势体现在其庞大的数据资源和技术人才，以及其快速增长的市场。中国政府在该领域的投入和支持也非常明显，并且对人工智能的重视程度高于其他国家。” 　　AI将颠覆什么? 　　近期，微软联合创始人比尔·盖茨在接受《福布斯》采访时谈到，“不得不说，去年(人工智能领域)的进展让我非常兴奋。这是科技史上具有历史性的时刻之一。” 　　“曾经我们的个人电脑是没有图形界面的，后来才出现了有图形界面的个人电脑，比如Windows和Mac……再后来，互联网又将这一切提升到了一个全新的水平。” 　　“在过去的12个月里，我在人工智能方面所看到的一切都与PC、具有图形用户界面的PC或互联网的出现一样重要，这真是令人震惊。” 　　不同于此前中外大厂推出的语音助手，ChatGPT仿佛一个真实人类，可以进行有逻辑性、连贯性的对话，其颠覆性意义不容小觑。　　“ChatGPT可以和搜索引擎结合起来，形成人机交互的新模型，已经不再是传统的搜索引擎，或者说，直接把搜索引擎这种既有的形式给颠覆了。”朱克力认为，ChatGPT或将创造一种新的生态体系。　　张良卫也指出，AI可能会对各行各业产生各种影响，主要体现在增效降本方面，对于游戏、元宇宙等线上虚拟行业会产生颠覆性影响，“我们认为它的级别，堪比移动互联网的产业机会和革命性，所以带来的投资机会应该是非常大的。” 　　但ChatGPT目前仍然不能取代搜索引擎，例如谷歌发布的Bard模型在发布会上输出了错误的答案，周传福指出，“(ChatGPT)颠覆搜索引擎，我觉得还是需要一些时间。比如它的训练数据时效性滞后，推出之后用的是2021年之前的数据。所以，(ChatGPT)数据如何更新、如何迭代，以及更新的及时性，此外运算的重新训练模型，包括算力和速度，都是需要解决的问题。” 　　周良玖也认为，短期来看，ChatGPT取代搜索引擎的难度是非常大的，“如果同样搜索引擎的用户体量，都使用ChatGPT来替代搜索引擎使用场景的话，在当前节点的成本是一个天文数字，任何公司目前都没有办法承受这么大的成本。” 　　此外，商业模式的变更，除了技术难题，管理问题也会影响行业发展速度，如数据安全、内容合规等，这些维度都需要考虑。　　关于ChatGPT、AI能否取代人类的问题，周良玖认为，AIGC未来作为生产力工具，将给人类各行各业带来帮助，“但如果说未来ChatGPT会取代人，那么发展路径就是有问题的，商业模式是跑不通的。未来的目的肯定是为了帮助人类提升生产力，类似于过去计算机和手机对人的帮助。” 　　朱克力也指出，未来工具和人慢慢融为一体，人机交互将衍生出很多新职业，未来我们会习惯跟AI并存且共同进化，为社会发展提供更多的解决方案。　　“2023年应该是整个AI产业非常热闹的一年，B端、C端会有一些新的东西、新的玩法出来，我觉得非常值得期待。”周传福透露，科大讯飞在Transformer架构上也有积累，在熟悉的行业里，公司也会有深入的探索和新的东西出来。　　“我对2023年也保持期待，”周良玖说道，对于一项真正的创新技术，永远不要低估其长期的市场空间和想象力。“从我们投资人的角度来讲，对于新事物，我们要时刻保持敬畏。”

“白嫖”到头了？美国媒体机构要求 ChatGPT 支付授权费

白嫖真好,白嫖下一句,白嫖成功,白嫖出处
北京时间 2 月 17 日消息，美国主要新闻媒体已经开始批评人工智能实验室 OpenAI 及其聊天机器人 ChatGPT，称该实验室使用他们的文章来训练 ChatGPT，但没有付费。图 1：OpenAI 利用媒体内容训练 ChatGPT新闻集团旗下道琼斯部门的法律总顾问杰森?孔蒂 (Jason Conti) 在一份声明中说：“任何想要使用《华尔街日报》记者的作品来训练人工智能的人，都应该获得道琼斯的适当授权。道琼斯没有与 OpenAI 达成这样的协议。我们认真对待滥用记者作品的问题，并且正在审视这一情况。” 知情人士透露，与《华尔街日报》一样，CNN 也认为使用其文章来训练 ChatGPT 违反了该新闻网的服务条款。CNN 计划与 OpenAI 接洽，要求 OpenAI 支付内容授权费用。在这两家新闻媒体提出担忧前，计算记者弗朗西斯科?马可尼 (Francesco Marconi) 在本周发布推文称，他们的工作成果被用于训练 ChatGPT。马可尼说，他向 ChatGPT 索取了一份新闻来源清单，得到的回复列出了 20 家媒体。 ChatGPT 引用的媒体名单其实，新闻机构并不是第一批质疑其内容是否被人工智能系统擅自使用的公司。去年 11 月，GitHub、微软和 OpenAI 在一起案件中被起诉。在本案中，一位名叫马修?巴特里克 (Matthew Butterick) 的计算机程序员指控称，一款名为 GitHub Copilot 的自动生成计算机代码的工具本质上剽窃了人类软件开发人员的工作，违反了他们的授权条款。今年 1 月，一群艺术家起诉了人工智能生成器 Stability AI、Midjourney 和 DeviantArt，称这些公司下载并使用了数十亿张受版权保护的图像，而没有对艺术家进行补偿或获得他们的同意。 OpenAI 尚未置评。

本文地址： https://www.xxs100.com//show-397160.html