淘优惠

淘优惠

梅剑华:ChatGPT之后会怎样?

双十一活动 0

淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】

梅剑华教授,梅剑lofter,梅剑雄秒人,梅剑是哪部漫画的

梅剑华 山西大学哲学社会学学院教授

文章来源:中国社会科学网

上个世纪之初,物理学引导了科学技术的发展,不论是相对论还是量子力学,都对日后的科技发展产生了深刻的影响。物理学的革命,导致了我们对世界的理解发生了根本的变化。肇始于上个世纪五十年代的人工智能科学发展到现在,导致了我们对人的理解也发生了根本的变化。回顾一系列人工智能科学技术节点,从1997年的“深蓝”,到2016年的“阿尔法狗”、2020年的元宇宙、2023年的【【微信】】,明显看到人工智能技术的发展在不断加速。【【微信】】之父Sam Altman在社交媒体上提出了新摩尔定律,宇宙中的智能数量每18个月就会翻一番。

19世纪的物理学罩着两朵乌云(以太假说和黑体辐射),最终破云见日迎来了物理学大革命,然后是科学技术的一连串突破。100年后,智能科学的发展,在21世纪似乎具有类似的效应。关于人工智能技术的发展也有两朵“乌云”,我指的是对人工智能技术的两种看法可能会对人工智能的发展形成挑战:第一,人工智能技术的发展危及人类的生存,我们会被机器“奴隶”。第二,人工智能无论如何发展都不能超越人类,“奴隶是造不出新长城的。”这两种看法都对人工智能技术持否定态度,二者之间也存在内在冲突。如果一是对的,那就蕴含了人工智能可以超越人类。如果二是对的,那就说明我们可以控制人工智能技术的走向。并不是说这两个看法就是错误的,而是只有实质地回应这两个问题,才能有助于智能技术的进一步发展。在这则短评中,我集中讨论第二个问题。

换一个问法,【【微信】】之后会怎样?鲁迅先生对五四的态度是“提出启蒙,超越启蒙”。诺娜出走以后会怎样?反抗和出走不是目的。《伤逝》里,子君冲破了封建枷锁和自己的爱人在一起了,但终免不了爱情的幻灭。鲁迅是深刻的,他看到了否定、冲破之后的生存状态的同样无趣。这种态度或可为我们关于人工智能技术的看法借鉴。批判之后的人工智能技术该怎样?赞扬之后的人工智能技术该怎样?【【微信】】话题,如日中天,大众媒体上的讨论,基本上也是批判派和赞成派,泾渭分明。关键的乃是第三条路,这个技术对于我们意味着什么?【【微信】】之后会怎样?

图灵测试里的机器程序就是个聊天机器人模型,我们可以说【【微信】】几乎通过了图灵测试。【【微信】】的核心是自然语言处理,它经历了从理性主义到经验主义的转变。20世纪初期的自然语言处理主要是依靠深度学习算法,但它的缺陷是过度依赖大规模的有标注的数据,需要大量数据民工来给数据打标签。但是2018年以来的以BERT、GPT为代表的超大规模预训练语言模型正好补充了自然语言这一缺陷,使得自然语言处理获得极大突破,【【微信】】就是其典范代表。

【【微信】】被定位为通用人工智能,可以表现出9岁小孩的心智能力。因此有人会问,那它会不会像人一样可以成长到18岁从而具有真正的智能。这里头有两个问题:第一,我们是不是还是预设了所谓的通用人工智能就是像人一样的智能,能够完成人类所有的任务。是否真正的技术探索者不应该把人类智能作为基本预设。我们可以从人类智能那里获得启发,但未必要以人类智能为目标。第二,如果认为它具有小孩的心智能力,那么就需要说明,如果最终要获得发展,肯定是一种理性主义和经验主义的结合,而不是纯粹的经验主义探索。因为小孩的大脑并不是一块白板。

人们认为它表现出一定的心智能力,是因为它的回答展现了某种具有心智能力的人的回答的特征。问题在于,“认知的贫穷限制了我们的想象力”,我们只遇到我们自己这样的智能体。是否不具有心智能力的智能体也可以有此回答?是否具有不同类型的心智能力的智能体也可以有此回答?这是开放的。人们的观点来自于生活实践中形成的直觉。任务塑造智能,如果认识主体能完成一定的任务,就被认为是有智能的。在这里,我们不一定要以人类智能作为智能的唯一标准。也有很多人批评【【微信】】的回答会有很多错误,但这不是原则性的,是技术性问题的,肯定会得到克服。

那么智能的标准到底是什么?像人?能做不同的事?灵活性?创造性?等等。

第一是所谓的创新性查尔莫斯在《现实+》一书中,他介绍在2020年7月,【【微信】】-3发布之后,哲学家亨利・谢弗林将对查尔莫斯的一段访谈发布到网上,很多人认为这是查尔莫斯的真实访谈。实际上,是GPT-3模仿了查尔莫斯的回答。有人发现,这个“查尔莫斯”,情绪不大好,喜欢使用“我认为”(这也是查尔莫斯的用语习惯)。它的模仿几乎以假乱真。这里不再是所谓的智能、意识等等一些争议极大的根本问题,而是GPT可以模仿一个人的观点。这带来了一个很有意思的问题:如果让它来学习了解那些研究GPT的学者文章,然后发表观点。它得出的结论和这些学者的观点是基本相同的。我们可以说【【微信】】缺乏创新性,但仔细想一想,学者的观点也许就缺乏创新性。这会让我们反思,到底什么是创新。我们可以说能被【【微信】】回答的问题,就不具有创新性。这就逼迫人类在与【【微信】】的博弈中,不断思考才能产生新的思想。但是问题的关键在于【【微信】】它所拥有的数据包括互联网上的材料和数字化的书籍,因此它比任何一个个体所拥有的信息量都要大,并且它对这些信息进行提炼的能力远远超于人类。在这个意义上,它比人类具有创新性,虽然它自己也许不认为这就是创新性。

第二个是通用性。【【微信】】不仅贯彻在聊天上,也在一般任务上。例如识别物理环境、完成一些具身任务,如果能够达到这一目标,那可以说达到了通用人工智能的目标。朱松纯教授认为大型语言模型在处理任务方面能力有限,它们只能处理文本领域的任务,无法与物理和社会环境进行互动。但是,Sai 【【微信】】等科学家已经在撰文讨论了如何发展这种通用性,对【【微信】】在机器人应用中的使用进行实验研究,机器人里的任务包括:形式化推理和空中导航这些不同的任务。我们可以用语言控制机器人手臂、无人机和家庭助理机器人等等。让【【微信】】超越文本思考对物理世界进行推理,帮助机器人完成任务,实现真正的人机互动。

GPT在创新性和通用性上,展现了更多的可能性,赋予了人类更大的挑战。【【微信】】之后,不管是智能技术还是学术思想的发展,都将和以前不同。将更注重学术的创新性,智能的通用性。这一切不再虚无缥缈,而是可以在人机互动的实践中得到拓展。

举报/反馈


李彦宏平等赋能 李彦宏文心一格新闻发布会视频

怎样评价李彦宏,李彦宏说的最有名的一句话,李彦宏读诗,他人评价李彦宏

IT技术的技术栈正在发生根本性变化。

来源|多知网

作者|冯玮

图片来源|百度

今天下午,百度就新一代大语言模型生成式AI产品“文心一言”召开发布会。

百度创始人、董事长兼首席执行官李彦宏介绍了当前文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

其中的一些能力也同样可适配到教育场景中。

例如,发布会现场,面对“鸡兔同笼”的经典题型,文心一言能梳理出解题思路,并按正确步骤一步步算出答案;文心一言在现场还解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,并用“洛阳纸贵”四个字创作了一首藏头诗。

此前,作业帮、高途、学大、昂立、达内、宝宝巴士、艺术宝等教育领域品牌均宣布已接入文心一言。

宝宝巴士官方曾表示:接入文心一言后,宝宝巴士将基于百度智能对话技术成果,研发面向儿童启蒙的内容产品与服务,并应用于宝宝巴士旗下200余款APP、2500多集视频及9000多期音频启蒙内容、点读笔及绘本等产品中……

李彦宏在现场罕见出现了紧张状态,同时坦言目前的文心一言尚不算完美。

“但为什么今天要发布?因为有市场需求,因为百度的各个产品线从搜索到智能云到自动驾驶到小度,大家都在等着要用这样的技术。更重要的是我们的客户、我们的合作伙伴在等着用这样的技术。”李彦宏说道。

3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。同时期,百度智能云即将面向企业客户开放文心一言API接口调用服务预约。

以下为李彦宏分享全文,经多知网编辑整理。

01

?百度真的Ready了么?

尊敬的各位来宾,各位媒体界的朋友们,欢迎大家来到百度参加我们这次文心一言的新闻发布会,感谢大家一直以来对我们的关注和支持。

这段时间其实不断的有人问我说为什么现在发布?你们是不是真的ready了?

其实百度在过去的十几年当中,一直从AI研发层面坚持投入文心大模型。

第一个版本是2019年就发布了,那么此后的每一年其实都要发布一个新的版本。所以从这个意义上说,文心一言的发布只是我们过去多年努力的一个自然延续。

今天大家对文心一言的期望值是要对标Chat GPT,那这个门槛还是很高的,可以说全球的大厂当中百度是第一个发布的,像Google、Facebook、Amazon等现在都没有真正的发布同类型的同级别的产品,百度是第一个。

从我自己在内测对文心一言的能力体验来说,它确实也不能讲叫做完美。但为什么今天要发布?因为有市场需求,因为百度的各个产品线从搜索到智能云到自动驾驶到小度,大家都在等着要用这样的技术,更重要的是我们的客户、我们的合作伙伴在等着用这样的技术。

大家都在催,我们需要尽早地把它发布出来。

当然,一旦大语言模型这种产品发布出来,它就会获得真正的、真实的用户反馈;而有了用户反馈,它的迭代的速度就会非常快,能力提升也会非常快。

我们大家都希望文心一言能够快一点成长,能够尽早给用户和客户带来价值,让所有的人都从中受益。

所以“十月怀胎,一朝分娩”,今天我就带大家一起来看一看,百度的预训练生成式大语言模型,文心一言长什么样?

我下面用5个Demo来分别展示一下文心一言的能力。

02

五个模块,五种能力

第一个是文学创作,第二个是商业文案的创作,第三个是数理逻辑的推算,第四个是中文的理解,第五个是多模态的生成。

首先来看一下文学创作。

这就是我们文心一言的界面,先来看一个有关三体的例子。

三体的作者是哪里人?想先要知道三体作者是谁,然后要懂得哪里人是什么意思,因为是跟我老乡,所以第一个问题选了可以总结一下三体的核心内容,如果要续写的话,可以从哪些角度出发?

那么他总结了三体的第一步是什么意思?第二步在讲什么?第三步在讲什么?续写又是角色的塑造,情节设计、文化背景、哲学思考。

那么我们追问如何从哲学角度来进行续写生命的意义,人与宇宙的关系,道德和伦理价值和信仰,科技和人文的关系。

再问电视剧三体的演员都有哪些?他比较准确的列出了一系列的参与的演员,那么我们再问于和伟和张鲁一有哪些共同点?都是优秀的实力派演员获过多多个奖项,丰富的表演经验等等。

最后问于和伟和张鲁一谁更高?那么张鲁一比于和伟高三厘米。

我们看到在这一轮的问答当中总共有6轮对话,这些对话可以体现出文心一言总结分析能力、推理的能力还有总结的能力等等。

你要问谁和谁相比更高的话,你先得明白对这个人身高是多少,那个人身高是多少,然后再做一些比较很多这种事实性的东西。

这其实对于一个搜索引擎来说不是那么难,但是对于一个生成式预训练大模型来说,它出错的概率还是挺高的,这些问题都答对相当不容易。

文心一言其实也采用了知识增强和检索增强,我们有5500亿的事实知识在训练数据里,所以可以相对来说保证事实性的问题能够比较准确。

第二个Demo是商业文案的创作。

好,如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,应该给它起个什么名字?信智科技、数字云图、云集科技、意象科技、魔方科技,好,数字云图这个名称不错。

那么给我起一个公司的服务的slogan来表达共赢的概念。

答案就是数智共赢、智慧未来。

当我生成一篇公司成立的新闻稿,数字云图,以共赢的服务理念,用大模型来服务中小企业的数字化升级,要求是600字左右,所以也生成了相应的新闻稿,我就不一个字一个字念了。

大家可以看到这里头涉及到相应的这种理解的能力,表达的能力,也包括一些这种创意创作的能力,这些个能力都是没有办法我们去一一的去教文心一言的,那么怎么做到的?

其实还是要有好的技术,要有大的数据,人们说读书破万卷,那么文心一言可能读了千亿万亿的页面,用了几十亿的搜索请求,用了很多的图片,用了我们全部的知识图谱的这些个5500亿的事实。

在不断训练的过程当中就逐步具备了一些比较通用的能力。

所以也有人讲说是大模型到了千亿的参数千这个参数达到千亿量级,那么又有足够多的训练语料数据来进行训练的时候就会发生什么现象?发生智能涌现,没有教过他的能力,他也会这个可以说是我们这方面的一个例子。

第三个Demo,我们来演示一下数理逻辑的推算。

下面我们来玩一个鸡兔同笼的游戏。

问有多少只鸡多少只兔子?文心一言说这题好像出的不太对,算不出来了,我们改一下,重新问一遍。

解题思路是这样子,答案3只鸡和6只兔子,所以我们看到在这两轮提问当中展现出来的能力,使文心一言大语言模型它的数理逻辑的推理的能力,这方面它不仅知道就是提出的对不对,也不仅仅能够简单的给出来答案,那么也给出来了解题的步骤,这就很像是小学生在解这个应用题了。

它是有逻辑的一步一步的推理出来的。

这样的能力我们在过去一个月左右的这种内测当中,其实不断的看到文心一言在进步,虽然我们现在还不敢说是百分之百这类型的题都能做对,但是他的能力已经是挺强的了。

第四个Demo,我们来演示一下对中文的理解。

因为百度是植根于中国市场的,我们理应在中文的理解和对中国文化的了解上,超出世界上任何一个预训练大模型。

“洛阳纸贵”是什么意思?你必须得知道这个成语,你才能够明白才能答对。当时洛阳的纸到底有多贵,这就有点冷知识了,不是那么容易能够答对的。大家也看到好像涨了两三倍,这个成语在经济学原理里头对应的理论是什么?他很明确的答出来,这是一个需求定律,就是“物以稀为贵”。

最后我们用洛阳纸贵来写一首藏头诗,每一个首字连起来是洛阳纸贵成语。

文心一言在中文理解能力和对中国文化的这种熟悉程度其实是相当高的,它也可以处理英文,只不过确实要承认他的对英文的这种理解和处理能力,现在还没有中文这么好。

部分原因是因为我们在训练数据里头给它注入的英文的数据还没有那么多,在接下来的时间我们会逐步的训练他英文以及其他语种的这些能力,以及将来这种跨语种的翻译推理的能力,那么大家有机会将来可以慢慢来尝试。

第五个Demo是多模态的生成。

请为2023世界智能交通大会来创作一张海报,那么大家看到其实反应是很快的,而且海报很有未来感也很贴切,那么你认为智能交通最适合哪个城市发展?上海、北京、广州、成都。好,再来一个多模,请用四川话将以上内容讲出来。

这时候发展智能交通的应该是那些具有较高人口密度,经济发达,交通需求量大的城市,接下来是一些可能适合的城市。

一上海作为中国最发达的城市之一,上海拥有着繁忙的交通网络和多元化的交通需求,自然交通可以帮助缓解城市家交通压力,提升城市交通效率,改善城市居民出行体验。好。

请将以上内容生成视频。

最适合发展智能交通的应该是那些具有较高人口密度,经济发达,交通需求量大的城市,以下是一些可能适合的城市。

一、上海作为中国最发达的城市之一,拥有着繁忙的交通网络和多样化的交通需求,智能交通可以帮助缓解城市交通压力,提升城市交通效率,改善城市居民出行体验。

二、北京是中国的政治中心、文化中心、国际交往中心。

大家看到生成的视频也是非常的相关,而且还挺美,所以我们这一轮交互分别看到它可以用文字生成图片,可以回答相关的问题,有一定创造性的问题可以用语音,方言大概就是我们演示了四川话,其实它广东话、东北话、闽南话什么也也都能讲,最后是用这些内容来生成视频。

前三个Demo现在文心一言的用户都可以用了。

第四个因为计算成本还是比较高,我们还没有对所有的一言的用户开放,但是如果你是百家号的创作者的话,你肯定对这个功能其实是不陌生的。现在大概每天有几万篇的百家号的文章,通过这个技术会自动的转成视频,在百度里头分发,所以这些技术我们已经都把它连起来了。

那么通过这5个例子的演示,大家会对文心一言行程一个基本的概念。

从文心一言的表现来看,它其实已经具备了很多像人类的这种对自然语言的理解的能力、表达的能力、逻辑推理的能力,这些个能力还在不断的完善的过程当中,我们有时候用的时候会感受到惊喜,有时候可能也会发现明显的错误。

但是有一点是肯定的,就是他的进步的速度非常的快。在未来的一段时间当中一定是一个日新月异的这样的状态。

我们通过对文心一言大模型进行微调,让他去适配百度内外各种各样的产品,那么就可以在用户界面或者说在用户体验上展示出来惊人的亲和力,让每一个产品都离自己的用户离自己的客户更近。

所以文心一言这样的一个大模型会成为每个人必不可少的生产力工具,无论是什么样的公司都不可能在几个月的时间里头靠突击做出来这样的技术,那么它是百度十几年超大规模的这种研发投入慢慢的积累出来的。

所以我们如果说来进一步解释文心一言到底怎么能做出来的话,我需要把我对于IT领域最近发生的一些变化来跟大家分享一下。

03

IT技术的技术栈正在发生根本性变化

过去IT的技术站其实分为三层,一层是芯片层,上面是操作系统层,再往上就是应用层或者软件层。这个事情在PC时代、在移动互联网时代都是这个样子。

但是当我们进入AI时代的时候,IT技术栈从3层变为了4层,也就是这里展示的芯片层。

当然芯片层跟过去的芯片也不太一样:过去以CPU为主,未来很可能会以GPU为主了。再往上我们叫做框架层,比如说像百度飞桨这样的叫做框架。

上面就是模型层,今天文心一言就处在模型层。文心是百度整个模型的一个品牌,以后或者说AI时代的应用都会基于这些大模型来进行开发。所以以后不管是搜索也好、聊天也好、或者什么其他的应用,都会是基于域性链的这种大模型来进行开发。

百度每天比如说搜索有数十亿的这种检索请求,也就意味着文心大模型每天在服务数十亿的用户了,只不过,过去在服务搜索的时候,它是一个判别式的语言大模型。

今天文心一言的发布它是一个生成式的语言大模型。

为什么讲技术栈的变化?

大家知道生成式样的这种AI是非常耗算力的,有时候人们把它叫做暴力美学,要有大算力,要有大模型,要有大数据,那么费用相当的昂贵。4层架构之间相互进行协同,不断的进行优化,就可以使它的效率比别人要高很多,就可以显著地降低成本,尤其是在框架层的模型层之间的这种协同,过去我们在几个月其实已经体会到了这方面带来的这种收益。

讲这4层,其实我真正想讲的是:在全球范围内、在芯片框架模型应用4层都有领先产品的公司,可以说是绝无仅有,百度就是那个唯一。

我们的优势非常独特,这个优势相信大家在未来的文心的迭代速度上可以会有明显的感受。

从2月7号我们正式官宣文心一言要发布以来,也就一个多月一点的时间,已经有650家的企业宣布接入文心一言的生态。这意味着很多企业其实已经明白这是一个大机会,这是任何一个企业都不应该错过的大的机会。

生成式AI它是代表了一个新的技术范式,它会带来市场需求的爆发性增长,商业价值的释放会是前所未有的、指数级的。

对于文心一言的定位,我们认为它是一个通用基础模型,在4层结构上看到可以有能源大模型,交通大模型,媒体大模型等等。

所以文心一言不仅仅会影响到搜索,也不仅仅是会影响到互联网公司,那么它会影响到每一家公司。由于它超强的自然语言理解能力、表达能力以及推理能力,它可以使得任何一个公司都能够离自己的客户更近。

也就是说,任何一个公司都有可能利用这些能力做出更好的用户体验,从而建立更强的竞争优势。

我看到有机构预测,到2030年脑力劳动者的生产效率会因为人工智能而与今天相比有4倍的提升,也就是说很多人他的工作性质会发生不可逆转的改变。

04

大语言模型将带来的三个产业机会

文心一言的发布,或者说生成式大模型的问世会带来哪些个创业机会、投资机会?我觉得至少有三方面。

首先我把它叫做新型云计算。

大家知道云计算在当下最主要的商业模式叫做IaaS。这是公有云提供的基础云服务,主要是算例。那么现在今天在哪要建一个智算中心,通常是我要多少匹的算力对吧?主要是指的这个东西。未来的云计算公司主要的商业模式会变成MaaS,以后的应用会建立在大模型上,而不是建立在过去的云计算的这些算力或者存储上。

这个对于云计算产业是一个Game changer,是一个改变游戏规则的东西。

以前大家看你的基础云服务,看你的算力,看你的存储,今天会看你的模型好不好,你的框架好不好,你的芯片框架模型应用之间协同的好不好、效率高不高?

百度智能云会基于这套理念和这套架构对外去提供服务,赋能千行百业。

我们相信它会使得各行各业在提升效率、在各自领域的应用当中能够有很大的商业机会和效率的提升空间。

随后可能过两个星期,我们智能云会有一个单独的发布会,我们会具体介绍相关产品,既有的公有云服务也可以做私有化部署。

第二类机会我们把它叫做行业模型的精调。

刚才4层架构里头其实在模型层我们没有把文心放上去,而是放了各种各样的行业的这种大模型。

是因为我们觉得很可能是存在这么一个中间层的,任何一个行业都有它自己独特的数据,都有它对自己的行业的独特理解。这些个数据、理解和知识如果跟基础大模型进行结合,就会产生很强大的创造力和效率提升的能力。

这些个能力很可能不是百度所具备的,甚至这些数据也不是别人愿意给到百度的。那么这些能力在各个行业的精调可以避免我们刚才讲到的那些基础模型容易犯的错误,所以它的实用性会更强。

我们认为这也是一类新的商业机会。

第三个就是应用开发。

那么刚才大家看到文字的生成、图像的生成、音频的生成,以及我们熟悉的数字人三D等等,这些个能力一旦结合,再加上它超强的理解能力和表达能力,那么会创造出来很多新的可能性。

所以大模型时代真正最大的机会,既不在基础服务,也不在这个行业服务,我觉得恰恰是在应用。

就好像在移动互联网时代,最大的商业机会可能不是iOS或者说安卓这样的操作系统,而是微信、抖音、淘宝这些个应用一样。

那么在人工智能时代,我相信一定会出现杀手级的应用、现象级的新的产品,大家会不断看到一个个里程碑事件的发生。

最后我想说在文心一言发布之后,我们就会建立起来一个好的这种反馈闭环:用户的真实的反馈,开发者的模型的迭代以及开发者的调用之间会形成一个正向的循环,给大家士别三日当刮目相看,这样一个惊喜。

最后我想说,文心一言不是中美科技对抗的工具,而是一代代百度技术人员在追寻我们让科技改变世界的梦想当中的一个自然的结果,是我们服务亿万客户,赋能千行百业的最新的平台,更是创新驱动发展的最佳的证明。

谢谢大家的理解和支持。

本文作者:冯玮