百度热点李彦宏 李彦宏谈文心一言
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
(文/吕栋 贺喜格)
在OpenAI推出GPT-4一天后,百度官宣已久的类ChatGPT产品“文心一言”也终于公开露面,并且和GPT-4一样也是多模态。
北京时间3月16日下午,百度召开发布会,主题围绕新一代大语言模型、生成式AI产品“文心一言”。
观察者网在现场看到,百度首席执行官李彦宏和百度首席技术官王海峰均出席了发布会,并在现场展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
令市场感到有些失落的是,百度在现场并未直接调用“文心一言”,而是采用提前录好的视频进行展示。亮相了,但又没有完全亮相。这种情况可能也在一定程度上影响了百度股价,导致其盘中出现短线下挫。
从现场展示来看,文心一言某种程度上具有了对人类意图的理解能力。但李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展。
观察者网从现场了解到,此次“文心一言”公开亮相后,并不会直接面向公众推出,而是先采用邀请测试方案。从3月16日起,首批用户可通过邀请测试码,在“文心一言”官网体验产品,后续才会陆续开放给更多用户。这可能也间接证实,“文心一言”目前尚未成熟。
那么,百度为何甘冒风险,略显仓促地推出“文心一言”呢?这一方面可能是为了抢得对标ChatGPT的头筹,获得更多用户以训练大语言模型,另一方面则可能考虑到内外部的需求。
李彦宏在现场表示:“在全球的大厂中,百度是第一个做出对标ChatGPT的产品的企业。虽然‘文心一言’的内测体验不能称作完美,但为什么现在发布呢?是因为百度的各个产品现都在等着这样的产品,我们的客户和合作伙伴也在等着这样的技术。”
在此次发布会之前,有外媒援引知情人士称,为了开发“文心一言”,数百名百度员工一直在夜以继日地工作。甚至在正式发布前夕,“文心一言”基于的AI模型仍在接受数据训练。一些员工坦言,他们没有足够的时间来打造一款功能完善的产品。
根据百度方面的披露,“文心一言”大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。
那这次通过视频亮相的“文心一言”表现如何呢?在现场,李彦宏展示了“文心一言”在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。
以文学创作场景为例,“文心一言”根据对话问题将《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。
在数理推算场景中,“文心一言”能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
作为扎根于中国市场的大语言模型,文心一言在中文语言和中国文化上,相比国外的大模型产品无疑会有更好的表现。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。
昨日(3月15日),OpenAI发布多模态模型GPT-4,可接收图像和文本输入来输出文本内容,受到外界关注,而文心一言本次发布的版本同样具备多模态功能,支持文本、图片、音频、视频生成。
在更体现技术能力的多模态生成方面,李彦宏现场展示了“文心一言”生成文本、图片、音频和视频的能力。有趣的是,“文心一言”甚至能够生成四川话等方言语音;“文心一言”的视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。
从“文心一言”的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但整体而言,这类大语言模型还远未到发展完善的阶段,有赖于通过真实的用户反馈而逐步迭代。
王海峰表示,文心一言,是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。
前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新。
多年来,百度大语言模型上投入积极,有市场数据显示,百度研发的50%-60%的投入都给到了Ernie。
近日有外媒援引知情人士称,随着ChatGPT热度上升,今年1月初,百度高管让其自然语言处理团队开始用文心大模型整合出一款对标ChatGPT的产品。但前述知情人士表示,与其他从事类ChatGPT技术的AI开发者所遇到的情况一样,这一项目面临一些挑战。
其中一个挑战是,需要训练该模型对有多种释义的短语或可指代多人的名字进行辨别,从而能对用户的要求做出更精确的反应。另一个挑战是使该聊天机器人生成的语言看起来更像人类说的话。第三个挑战是提高事实准确性,这是大语言模型的一个技术限制;大语言模型会根据不同词语可能出现在一起的概率将句子串起来,而不是根据信息片段。这种限制也使得这种模型难以控制以避免敏感话题。
“文心一言”的真实水平如何,还有待观察百度后续推出的公测版本。据百度披露,自2月份该公司官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。
有市场观点指出,百度之所以没有迅速开放公测,一方面是因为产品尚未成熟,另一方面可能也是出于成本和收入考虑。之前有估算称,ChatGPT每天成本消耗有超过10万美元。来自摩根士丹利的分析师估计,ChatGPT每次查询的成本大约是谷歌传统搜索查询成本的七倍。
在本次发布会上,李彦宏表示:“无论哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年坚持和积累,没法速成。”他同时提到,如果建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,“文心一言”效果会迅速提升。
本文系观察者网独家稿件,未经授权,不得转载。
文心一言是用的chatgpt接口吗 文心一格和chatgpt的差距
文心一言是用什么修辞,文心的意思和含义,一文一心念什么,文心一词的出处千呼万唤,国产ChatGPT终于来了!
今天下午,百度正式推出大语言模型――“文心一言”。
百度CEO李彦宏表示,这是全球大厂里面第一个做出对标ChatGPT的产品,也是百度十几年AI技术积累的结果。
那这个文心一言实力究竟如何呢?
ChatGPT 国产版 or 换壳小度?
首先,相信大家最关心的问题肯定是――文心一言的到底有什么用。
在发布会上,李彦宏展示了文心一言在五个使用场景的表现:
1.文学创作
用户询问文心一言《三体》的作者是哪里人、核心内容是什么、剧版的演员都有谁,文心一言都准确回答,就连张鲁一比于和伟高3cm都知道。
当然,上面这些只是关键词搜索+语音识别的基本操作,普通的小度语音助手也能做到。
文心一言还给出了五个续写《三体》的不同角度,逻辑条理还算清晰,不知道大刘怎么看呢?
2.商业文案创作
在商业创作场景中,文心一言可以根据公司的业务和特点,给公司想一个名字、标语,并解释背后的含义。
不得不说,还是挺实用的,但这些公司的名字似乎还是过于普通了,而且很多都已经被注册了吧~
3.数理逻辑推算
在面对小学奥数经典的“鸡兔同笼”问题时,文心一言也可以应付。
不但能给出结果,还有详细的解题步骤,就和真人一样。
可以看出,文心一言确实具备了一定的思维能力,能够学会数学推演及逻辑推理这类相对复杂任务。
这里还隐藏了一个彩蛋,如果你给出了错误的题目,文心一言经过演算,会直接告诉你问题出错了此题无解,高启盛直呼内行~
4.中文理解
作为“国产版ChatGPT”,文心一言还秀了一把中文处理能力。
在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,李彦宏还用“洛阳纸贵”四个字创作了一首藏头诗。
Leo也拉来了ChatGPT 对比了一番,发现ChatGPT也能回答个大概。
但想让ChatGPT写首中文藏头诗,确实有点为难它了。
然而,我们换一个指令方式,比如和它解释一下什么叫藏头诗,ChatGPT也能勉强写出来。
5.多模态生成
多模态生成方面,现场PPT上展示了文心一言生成文本、图片、音频的能力,甚至能够生成四川话等方言语音,本土化做得还行。
特别是这个根据描述,就能直接生成视频的功能,简直就是短视频营销号的福音。
不过李彦宏表示,为了现场演示效果,这些都是提前录好的,Leo十分好奇文心一言上线后实际效果如何。
带来的产业机会
看完文心一言的演示,作为一个靠码字维持生计的小编,Leo再次感受到了失业的危险......
而李彦宏也表示,AI市场爆发性的需求增长,将释放出前所未有的、指数级的商业价值。他预测,大语言模型将带来三大产业机会。
第一类是新型云计算公司,文心一言将根本性地改变云计算行业的游戏规则。
之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。
李彦宏预告,百度智能云将于近期举办新闻发布会,主题围绕文心一言的云服务和应用产品,既有公有云服务,也可以做私有化部署。
第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。
这方面,百度文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型。
第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。
李彦宏断言,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。
基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。
目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。
-最后-
总的来说,文心一言已经具有类似人类的逻辑以及语言处理能力,但还是有很多不成熟的地方。
整场发布会下来,Leo觉得唯一的亮点就是李彦宏表示:“文心一言不是中美科技对抗的工具。”
这满满的求生欲,隔着屏幕都能感觉到。
有网友表示,文心一言还没准备好,选择发布像是赶鸭子上架。
也有网友对于展示方式采用录播感到不满,认为这是ChatPPT。
还有网友制作梗图嘲讽,文心一言和ChatGPT-4是跑车和垃圾车的区别。
看完发布会后Leo觉得,文心一言除了部分中文语境下的应用,其他方面和Chat GPT 确实还有很长一段距离。
李彦宏也表示,文心一言存在不足,但它的进步速度非常快,未来将适配百度内外不同产品, 用户体验上将展示出惊人的亲和力。
然而,市场似乎并不看好文心一言的前景,发布会举行时,百度的股价应声大跌,跌幅一度接近10%。
不管怎么说,是骡子是马拉出来遛遛就知道真本事,对于文心一言还是必须得实践一下才知道。
至于实际体验如何,等Leo拿到内测资格,再和大家分享吧~