我们和ChatGPT聊了下中国半导体产业 结果…
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
集微网报道(文/陈兴华)对于“写一篇关于中国半导体行业发展的深度分析和形势预测”文章,或许很多行业专家和机构分析等都很难“招架”,抑或给出不同角度的分析讨论及预判。由于半导体产业纷繁复杂、细分领域及牵动因素过多,并且不断发生各类形势变化,这一开放问题很难有统一的答案。
如今,在ChatGPT被认为正“掀起新一轮AI革命”背景下,或许有人认为可以使用这一奇妙的工具辅助撰文。毕竟有数据显示,89%的美国大学生使用ChatGPT做家庭作业,53%的学生用其写论文,另有由ChatGPT创建的63%以上论文摘要被提交给学术审稿人等。
而看上去“无所不能”的ChatGPT,也开始引发部分争议。一方面,基于智能化和人性化的交互使用体验,ChatGPT赢得诸多好评,一度引爆用户刷屏社交媒体和海量下载。另一方面,由于遭受ChatGPT的强势“冲击”,美国高校和学术界也开始对这一“作弊神器”发出禁令。
对于ChatGPT到底能不能写出好文章,集微网记者以“写一篇关于2023中国半导体行业深度分析和形势预测”为题进行了使用验证,以下是其作品及相关解析。为了提高本文整体可读性,在不改变语义表述的前提下,记者对ChatGPT的个别语句及标点略有调整。
此外,记者分别从ChatGPT英文版、中文版以及外链公众号“ChatGPT在线”分别咨询相关问题发现:ChatGPT中文版以及“ChatGPT在线”存在较多明显语义问题,而英文版(已译为中文)回答质量相对较高,并在文中部分附上。
首先,记者在对话框中输入:写一篇关于中国半导体行业发展的深度分析和形势预测文章,不少于1000字。
ChatGPT回复称:半导体行业是当前全球经济发展的重要驱动力,在中国也是一个快速增长的产业。近年来,随着中国对半导体技术的不断投入,中国的半导体产业得到了长足的发展。
中国半导体产业始于20世纪70年代,当时仅有一些小型半导体元器件制造企业。到90年代初,中国开始推动半导体产业的发展,通过引进先进技术、扩大生产规模、提高技术水平等途径,使中国半导体产业得到了较快的发展。随着中国经济的不断壮大和国内外市场的扩大,中国半导体产业进一步发展壮大。
如今,中国半导体产业已经发展成为全球最大的半导体产业之一,其在全球半导体市场中占有重要地位。中国半导体产业的主要特点是生产能力强、技术水平高、市场份额大。
随着中国经济的持续增长和技术水平的不断提高,中国半导体产业将继续发展壮大。预计未来几年,中国半导体产业将进一步完善生产体系、提高生产效率、加快技术创新,以满足国内外市场的需求。
同时,中国半导体产业也面临着一些挑战。全球半导体市场竞争激烈,中国半导体企业需要不断提高自身竞争力。此外,中国半导体产业还面临着芯片技术的短缺以及生产成本不断上升的问题。
为了应对这些挑战,中国半导体产业需要加强与国际先进技术的合作,并不断提高生产效率,提高产品质量,扩大国际市场份额。同时,中国政府也需要继续加大对半导体产业的支持力度,以促进产业的健康发展。
总体而言,中国半导体产业具有广阔的发展前景,将在未来几年继续发挥重要作用。但是,要想实现长期健康发展,中国半导体产业还需要面对并解决诸多挑战。
总结:相比之前的AI对话助理和单一的搜索结果,ChatGPT在语言逻辑和系统上进步很多,互动反馈的行文架构清晰、内容通畅,包括首先根据中国半导体产业发展的历史、现状和未来进行了概述,然后指出了存在的一些挑战以及相对对策,最后在结尾作了总结提炼。
但是,从回复体量及内容来看,ChatGPT的分析显然不够全面、专业和深度,停留在一些宏观的宽泛理论层面,同时缺乏个性鲜明、前瞻预判的明确观点,以及对字数要求有自己的倔强。另外,ChatGPT不时会“罢工”,需要再发送“继续”后才会接着回复完整答案。
紧接着,对于相关挑战和机遇,记者继续追问:目前,中国半导体行业发展的优势和劣势分别是什么?
ChatGPT回复道,首先中国半导体行业的优势涵盖:
1.政府支持:政府对半导体产业提供了大力支持,以提高国内的技术水平和产业竞争力。
2.庞大市场:中国作为世界上最大的市场之一,拥有巨大的消费潜力和需求。
3.人才储备:中国拥有众多的高素质人才,为半导体产业的发展提供了巨大的人力资源支持。
其次,中国半导体行业的劣势包括:
1.技术瓶颈:尽管中国在半导体技术方面取得了长足的进展,但仍然面临着落后于国际先进水平的瓶颈。
2.依赖进口:中国半导体产业仍然对关键元器件和设备的进口极度依赖,严重限制了其独立发展能力。
3.产品质量问题:中国半导体产品的质量还有待提高,与国际先进水平存在明显差距。
总结:可以看出,ChatGPT的回复条理清晰且部分“言之有理”,对中国半导体产业发展的优劣势继续进行了宏观概述和分析论证,包括优势方面聚焦“政府支持”、“市场推动”和“人才储备”三大因素,而且相关劣势也是国内半导体行业发展历来存在的部分问题。
但也应注意到,ChatGPT并没有具体提及国内政府如何支持,以及技术瓶颈具体是什么等。同时,记者发出的问题聚焦“目前”,而ChatGPT的回答如果放在十年前或许也适用。由此,如果将ChatGPT作为了解半导体产业的初级入门,以及行文框架工具可能是一个不错的选择。
随后,记者尝试以更全面、详细的描述让ChatGPT明白需要撰写的文章结构和论述过程,即“以一位行业专家的名义写一篇《2023中国半导体行业深度分析和发展形势》的文章,需要论述中国半导体行业的国内外竞争环境,中国半导体的核心竞争力、劣势不足和未来发展形势预测,以及对于中国半导体的发展破局的对策建议,并且给出个性鲜明的结论,总字数不少于1500字。”
对此,ChatGPT回复称,作为资深的半导体行业专家,我想对2023年中国半导体行业的发展做一个全面的分析。
近年来,中国半导体产业发展迅速,现已成为全球市场的主要参与者。然而,该行业在国内外面临着众多挑战,包括来自美国和其他国家老牌企业的激烈竞争、贸易紧张局势和供应链中断。
尽管存在这些挑战,中国的半导体行业仍拥有多项关键优势,可以为未来的增长奠定基础。首先,该行业受益于庞大且不断增长的国内市场,受中国快速增长的中产阶级和技术投资的推动。其次,中国政府一直通过政策和投资积极支持该行业的发展,从而刺激了创新和增长。最后,中国拥有大量技术工人和工程师,其中许多人接受过半导体技术方面的培训。
尽管有这些优势,该行业也面临着几个关键的弱点,包括对外国技术的依赖、质量控制问题以及对知识产权保护的担忧。为了应对这些挑战并开启未来增长,该行业必须专注于发展其核心竞争力、改进其质量控制流程并解决知识产权问题。
总而言之,2023年中国半导体行业既面临挑战,也面临机遇。只要投资和战略到位,中国半导体行业有潜力继续增长,成为全球市场的主要参与者。我相信该行业将克服目前的障碍.并在未来几年达到新的高度。
总结:在发展态势方面,ChatGPT提到了“中国面临着众多挑战,包括来自美国和其他国家老牌企业的激烈竞争、贸易紧张局势和供应链中断”,并且根据中国半导体产业存在的优劣势进一步论证及作出展望。可见其回复仍然具有较为系统、通畅的逻辑内核,同时与上一条回复前后对中国半导体产业发展的优劣势解读形成了训练逻辑论证上的统一。
不过回复弊端依然比较明显,包括ChatGPT表示“将对2023年中国半导体行业的发展做一个全面的分析”,但答案分析既不全面、相对空泛,缺乏进一步细化和专业解读,也依然没能满足用户的“字数”需求。据此,可见ChatGPT的底层数据和知识经验训练存在较大局限性,以及缺乏全面、深度、系统和专业性的“思考”分析和个性化论证。
最后,记者问道:对于2023年半导体行业进入下行周期以及存在的美国系列制裁等问题,对中国半导体行业发展提出一些建议和对策。
ChatGPT回复表示:1.加强研发力度。加大对半导体技术的投入,提高半导体行业的技术水平,提高自主创新能力,降低对外国技术的依赖。
2.强化国内产业链的建设。鼓励国内企业加速发展,增加国内产业链的自主制造能力,加大国内高端半导体芯片的生产能力。
3.提高国际合作水平。寻求与其他国家和地区的合作机会,加强国际半导体行业间的合作与交流,提高国际竞争力。
4.加大政策扶持力度。政府应该加大对半导体行业的扶持力度,降低行业发展的门槛,帮助企业快速发展。
5.提高灵活性和适应性。应该适应市场的变化,加强灵活性和适应性,快速应对环境的变化。
通过以上措施,中国半导体行业可以应对下行周期和美国系列制裁等问题,继续快速发展。
总结:看得出来,ChatGPT的回复言辞堪称依旧在宏观策略上“天马行空”,为中国应对半导体行业进入下行周期以及美国的系列制裁等问题提供了五大建议,包括加强研发力度,强化国内产业链建设,提高国际合作水平,加大政策扶持力度,以及提高灵活性和适应性。
然而,这依然属于“说了不少但又好像没说”,并没有较为充分的“干货”内容和价值建议。如果将问题换成“中国如何发展半导体产业”,想必答案同样适用。另外,由于现在ChatGPT模型限定在一两年前的知识结构,所以也没有更多的数据信息被放到模型中。由此,虽然ChatGPT对各类信息进行了系统化整合,但很难用于严肃、专业、深度和前瞻的知识论证和分析。
结语
从整体结果来看,在辅助半导体行业文本撰写上,ChatGPT的文字表达、内容逻辑和信息梳理等方面均具有较高水平。对于提出的相关问题,ChatGPT能较快速生成逻辑通顺的系列答案,以及在继续追问或多轮问答下不断完善答案等,将来有望成为作者检索及论证信息的重要途径之一。
不过,ChatGPT的互动反馈仍然存在内容“干货量”偏低、部分不够准确以及逻辑强于内容等各类问题,尚有较多提升空间。同时,ChatGPT生成的答案是基于历史知识经验数据训练的结果,不具备准确判断新形势和部分专业领域推演的能力,因而很难进行严肃的行情分析和专业讨论。
简而言之,ChatGPT尚无法取代人类的独立思考能力和批判性思维,因为人的情感投射、认知分析、创造力等素养能力仍是人之为人和具备独特能力及个性的根本。未来,通过不断完善底层数据训练、软硬件生态以及用户使用体验,或许ChatGPT能更准确解决一些专业、严谨和场景化的行业问题。(校对/张轶群)
siri有可能升级为chatgpt吗 siri改了吗
升级后siri不能用了,新版本siri怎么了,siri改版了吗,苹果更新后siri不能用吗关于人工智能,最近一段时间要说什么最火,那当数OpenAI推出的ChatGPT。
这个连马斯克都大赞「scary good」(好得吓人)的大型语言模型,甚至被预言即将取代谷歌。
有推特用户通过同一问题问谷歌和ChatGPT,后者不仅回答得更为有条理、清晰明白,而且还给出了可以执行的代码。
我也试了一下。让ChatGPT写一份Python代码,抓取微博前十个热搜条目,还真给出了代码示例,可以直接「Copy code」运行,不过不保证一定能够正常工作。而同样的问题你拿去谷歌搜索,却无法给出这样的答案。
不仅会写代码,ChatGPT还会写诗、写小说、翻译、做阅读理解、进行头脑风暴以及陪你聊天等。
相对于Siri、小爱同学的「播放音乐、定闹钟、拨打电话」来说,ChatGPT明显是一个更聪明的AI助手。
ChatGPT虽好,但是想要超越谷歌,却还需要些时间,比如由于不能联网爬取网页内容,所以ChatGPT往往无法获取最新的资讯。而谷歌自己其实也有一个聊天机器人LaMDA。
实际上,就我个人的使用情况来看,ChatGPT虽然暂时无法取代谷歌,但是取代智能手机的「人工智障们」,却是有可能的。
Siri们为什么一点也不「智能」?
对于智能手机的定义,业内有一个普遍的共识:
智能手机是具有独立的操作系统,独立的运行空间,可以由用户自行安装软件、游戏、导航等第三方服务商提供的设备,并可以通过移动通讯网络来实现无线网络接入的手机类型的总称。
这个定义相对于不那么「智能」的功能机来说,没什么问题,但是相对于大众想象中的「智能」来说,还是差了好几个银河系,特别是如今ChatGPT横空出世的情况下。就以手机行业的鼻祖型人工智能Siri来说。
比如把「我是一个单身狗」这句话,同时和Siri和ChatGPT说,后者会表示很遗憾,并且鼓励继续加油寻找。而Siri则像智障一般表示:你说了算。
如果你再问「我朋友‘阳’了,我该怎么办」,ChatGPT会准确理解「阳」的含义,并给出非常贴心的建议。而Siri一直卡在理解「阳」究竟是个什么意思的阶段:这个问题我还真答不上来。
没有对比,就没有伤害,Siri这种傻呆傻呆的人工智能助手,在ChatGPT这种全面进化的AI Assistant面前,不像人工智障像什么?
那么问题来了,苹果作为全球市值最高的科技公司之一,就不能复制ChatGPT的能力,给到Siri吗?
查了一下资料,之所以Siri的智能程度远低于同行,这里面主要有两个原因:一是苹果公司不愿意这么做;二是即使苹果愿意这样做,最终也会因为成本而放弃。
先来说第一点。
不知道你发现没有,最近几年以来,Siri的关注度越来越低,而且十几年来好像也没啥进步。现在我们唤醒iPhone,似乎也和十几年前做的事差不多:「打电话给妈妈」,「播放周杰伦的歌」。
除了这种傻瓜式的基础指令执行外,一旦你试图想要让Siri再多做一些事情,问一些复杂一点的问题,这货就开始进入「摆烂状态」。这也导致,Siri出道即巅峰,后面持续被iPhone用户和媒体嫌弃。
一个显著的证据就是,国外著名媒体The Verge间隔六年多,两次截然相反的评论。
2011年,在乔布斯逝世前一天,苹果正式发布Siri。这时The Verge的评论是:「Siri 最牛的地方就是它的工作原理――至少在大多数情况下,它的水平都能超出用户的预期。」
到2017年时,The Verge提出Siri已经「明显跟不上时代发展」,用户对它的不满情绪也开始蔓延。
之所以大家感觉Siri越来越退步了,有两点原因,一是其他人工智能助手进步得太快了。刚刚我们提到的ChatGPT就不说了,亚马逊的Alex在控制智能家居方面,表现就比Siri好很多,谷歌的Google Assistant,则在语义对答和搜索方面,大放光彩。
而Siri之所以进步得慢,也和其生态系统比较封闭,阻碍了第三方厂商接入,从而让Siri丧失了面对更多用户场景进行调校的经验有关。此外,苹果的隐私政策也使得其在收集用户的问题上,比较谨慎。
二是苹果对于Siri本身的定位其实不够清晰,导致在这方面的投入不够坚定。一直以来,虽然苹果对外宣传Siri是像一个真正的虚拟助手那样执行复杂任务,但实际上用户体验的感觉却是,它只提供了一种通过语音控制手机的途径,比如傻瓜式的「播放音乐、查找网页」等。
苹果之所以会有这样的定位摇摆,主要也是因为内部意见的分歧:一方认为,Siri应该专注于搜索功能,而另一方则认为Siri应该往一个智能型、多任务型助理方向发展。
正如一位前苹果员工在接受The Information采访时所言:「乔布斯在Siri推出后的第二天去世了,苹果也由此失掉了(Siri的)前进方向。」
第二点,如果苹果想要利用类似ChatGPT的技术来应用到Siri上,那么这个费用即便是「土豪如苹果」,也负担不起。
我在使用ChatGPT的时候,就遇到过这家伙频频罢工的情况。这背后一方面原因是ChatGPT的运营机构OpenAI在面对突然爆发至上百万激增用户时,面临的短时间服务器扩容不及;
另一方面则在于,ChatGPT的交互成本很高。
目前,GPT-3是目前市场上最大的语言模型之一,拥有1750亿个参数。而ChatGPT使用的技术则是位于GPT-3和明年即将到来的GPT-4中间的GPT-3.5,这个语言模型在Azure AI超算基础设施(由 V100GPU 组成的高带宽集群)上进行训练,总算力消耗约3640 PF-days(即每秒一千万亿次计算,运行3640个整日)。
如此大的数据规模,这就导致ChatGPT的单轮回答成本非常高,大概是几美分。按照1毛钱(人民币)算,10句话就是一块。
要知道苹果全球有十几亿iPhone用户,2018年时,Siri的活跃用户量就超过了5亿,即便每人每天只问Siri一句话,费用也高达5000万,这个成本明显是无法承受的。
这也是为什么ChatGPT至今仍只在少数几个国家开放内测。
所以,纵观主流手机厂商的人工智能助手,苹果的Siri,三星的bixby,华为的小艺,小米的小爱同学,vivo的Jovi,以及oppo的小布,都仍未达到ChatGPT的水平,更远未达到和人自然交流的程度。
当然了,Siri们虽然无法有ChatGPT的水平,但是如今的手机其实已经在不知不觉中,运用人工智能技术改善我们的用机体验了。
让智能手机变智慧
在华为2017年的财报中,有这么一段话:
打造开放生态拥抱未来作为未来智能世界的重要入口之一,智能手机将演进成为智慧手机,从被动的个人工具变成人类的分身,成为主动为消费者服务的日常AI助理。
正是在这一年,华为发布了集成专用神经元网络单元(NPU)的人工智能处理器麒麟970,以及搭载人工智能处理器的HUAWEI Mate 10系列手机。
由于首次在SoC内集成了独立的采用HiAI移动计算架构的AI硬件处理单元NPU,麒麟970开创了手机人工智能计算的先河。华为官方介绍,有了这款芯片,智能手机不仅能「听」和「看」,而且能听懂、看懂、会思考!能理解用户的诉求,积极做出响应。
这个NPU有什么用呢?比如说在相机APP中引入的「AI场景识别」概念,就可以在我们拍照时,根据当前的场景及物体自动设置最佳拍摄参数,让小白轻松拍出好照片。
那么,五年过去了智能手机有没有变得「更智能」呢?
对于这个问题,可能很多人难以回答。相对于AlphaGo大战李世石这种让大众感知到AI强大实力的事件来说,智能手机里的AI应用,显得比较润物细无声。就像空气一样,平时我们不会有很大的感知,但是它确确实实存在,甚至不可或缺。
实际上,如今的智能手机已经无法离开AI的帮助了。
从手机最关键的芯片,到底层操作系统,再到应用层面的APP,甚至只是一个小小的图片文字识别功能,都有人工智能的身影。
就拿最新推出的第二代骁龙8来说,集成了两个AI处理器,与前代产品相比,AI性能提升2倍。
对此,高通高级副总裁及CMO莫珂东表示,「我们把人工智能作为设计第二代骁龙 8 的关键技术,将全新的旗舰移动平台打造成一个创新引擎,一个真正的 AI 大师。」
值得一提的是,在第二代骁龙8芯片的支持下,手机终端具有了更强大的自然语言处理(NPL)能力。比如基于第二代骁龙 8的AI性能,小米宣布会在2023年推出离线版小爱同学,支持离线对话、语音唤醒、离线翻译等功能。这一方面可以保护我们的隐私,另一方面也让AI的使用不再依赖于网络。
手机操作系统本身的人工智能应用,也相当庞大。据我观察,凡是手机厂商宣传中提及「智能」两个字的功能,都主要是AI的功劳,比如说ColorOS的智能识别能力;
凡是手机厂商的操作系统中,有「自动化运行」、「智能化推荐」等属性的应用,都是人工智能的应用结晶,比如MagicOS的YOYO建议。
这两个「凡是」,基本上是我们肉眼能感知到人工智能在手机上的应用实例。而在更深层次的系统底层,人工智能也在发挥作用,比如说OriginOS 3为了保证前台应用算力充足,使用的「不公平调度」功能。
如果把人工智能在手机的应用比作一座悬浮于大海的冰山,那么Siri们就是我们感知最强的部分,智能推荐、识图、AI拍照等是感知的第二层次,第三层次则是更底层、更不容易感知、但技术也更强大的系统后台调度、隐私保护以及芯片算力设计等。
可以看到,人工智能在智能手机上的应用,已经远不止Siri们。让Siri们拥有ChatGPT的功能固然好,但即便Siri们永远也比不上ChatGPT,也无法阻止人工智能技术渗透进入智能手机中,使其演进为华为年报中所说的「智慧手机」。
拳打谷歌ChatGPT火出圈!投资人称更需警惕投资泡沫化跟风
拳头和谷歌,谷歌能和拳头玩吗原标题:拳打谷歌ChatGPT火出圈!投资人称更需警惕投资泡沫化跟风
来源:第一财经
一夕之间,ChatGPT突然火了。
所谓ChatGPT,是在今年11月30日,由人工智能实验室OpenAI上线的新模型,其网页应用允许用户免费使用,目前用户与ChatGPT之间的对话互动包括了普通聊天、信息咨询、撰写诗词作文、修改代码等,甚至令用户产生ChatGPT能否取代谷歌等搜索引擎的疑虑。
一位技术领域人士认为,让ChatGPT 类平台、以及短视频平台或购物社交平台来取代搜索引擎,容易让知识来源单一化,这是危险的。东吴证券团队也认为,ChatGPT模型仍无法很好解决虚假信息的问题,甚至过度猜测用户意图导致回答偏差较大,因此其本质仍偏向AIGC内容生产工具,而非搜索引擎。
此外,ChatGPT火速出圈,但对话过程中也经常会发生因语料积累不足而产生的“事故”。多位AI界行业人士对第一财经记者表示,无需因ChatGPT的智能而对AI产生恐惧,ChatGPT的出圈本质是算力与样本量提升后得到的自然结果,更需警惕的是将ChatGPT归属于AIGC赛道后引发的创业与投资泡沫。
“上瘾”的聊天AI
据官网介绍,计算模型GPT-3.5支持的通用聊天机器人ChatGPT,能回答连续性的问题、承认自己的错误、质疑不正确的假设,甚至拒绝不合理的需求。从写剧本、写诗、设计游戏,到给程序找bug,乃至制定一份“毁灭人类”的计划,这个AI能做的事情超乎想象。
美国企业家马斯克询问了ChatGPT如何设计Twitter,AI回答称:“为了使用户更容易查看线程互联网对话并与之交互,你可以将线性一维界面转换为二维无限网格。”
有人认为,ChatGPT的出现堪比AlphaGo打败李世石。12月5日,OpenAI创始人兼CEO阿尔特曼(Sam Altman)发布推文表示,ChatGPT用户数已突破了100万。在这条推特下,马斯克询问“每次聊天的平均费用是多少”, 阿尔特曼回复表示,“用户平均每次聊天所花费的可能是个位数美分。”
目前ChatGPT仍处于免费测试阶段,不限量向公众开放,基于其破百万的用户数,平台所花费的成本不算小。不过,在使用过程中,用户提供的反馈对OpenAI也是最有价值的信息,可以不断训练语言模型,修正错误答案。
第一财经记者注册并体验了一下ChatGPT对话。虽然目前ChatGPT并没有开放给中国地区的用户,但界面仍可使用中文。记者首先让AI自我介绍,其回复,“我是Assistant,一个由 OpenAI 训练的大型语言模型。我的工作是帮助人们回答各种问题,尽可能提供准确和详细的信息。我可以回答各种问题,无论是关于历史、科学、人文还是其他话题。”
计算机领域从业人士高毅对第一财经表示,试用ChatGPT的体验很奇妙,一个聊天AI 能写代码,能用“意念”分析代码,甚至能用“意念”分析一个超时程序的运行结果,“一开始以为他打开了个gcc 或者 python 之类的外部进程辅助分析,但试下来感觉并不是这样,而是他真的像人一样在试图理解这些代码。”
高毅故意提供了一些有问题的输入程序,使其根本无法正确执行,还故意给了个有生之年无法运行结束的程序,而ChatGPT像人而非机器一样,无视了上述这些不重要的问题,转而专注于问题的核心点,并在有限时间内给出了解答,“虽然他回答有小的错误,但能够做到这一步真的已经非常厉害了。”
东吴证券研报分析认为,ChatGPT的模型经历从GPT到GPT3的升级,优化主要来自算力增加。GPT、GPT-2和GPT-3在算法模型并没有太大改变,但参数量从1.17亿增加到1750亿,预训练数据量从5GB增加到45TB,其中GPT-3训练一次的费用是460万美元,总训练成本达1200万美元。虽然训练数据量和算力大幅增加使GPT-3有显著优化,但高额投入也使其只能走B端变现。
此次ChatGPT出圈,其技术模型最大变化出现在2022年推出的GPT3.5,技术迭代成优化来源于1月发布的InstructGPT模型中增加了人类对模型输出结果的演示,并在对结果进行排序的基础上训练,加上指令调整的帮助,虽然其只有13亿个参数,但回答准确率、道德表现却好于GPT-3。
ChatGPT虽然强大,仍然有其局限性,比如偶尔会犯错误,有一定的误导性;作为一个AI,它也不能提供对人或事件的判断和评价。但基于其反馈强化学习系统,ChatGPT也在不断学习完善。有用户表示,前几天问ChatGPT的时候提供的错误答案,过了一天之后就已经被修正,或许是很多用户的反馈帮助ChatGPT对正确的答案进行了排序。
日常对ChatGPT进行调戏逗乐仅是娱乐项目,一旦作为严肃工作内容,则需要严谨对待。据了解,程序员交友网站Stack Overflow上已出现大量通过ChatGPT自动生成的内容,给Stack Overflow的质量管理造成影响。Stack Overflow方面发布公告称,由于从ChatGPT中获得正确答案的平台比率太低,发布由ChatGPT创建的答案对网站和询问者以及寻找正确答案的用户都有很大危害。“禁止用ChatGPT直接生成垃圾答案,否则封号。这是一个临时性规定,目的是应对目前论坛上ChatGPT生成内容的泛滥之势。”
对此,ChatGPT回应称,“因为AI生成的答案不总是准确或相关的,可能会导致Stack Overflow上混淆错误答案,误导在寻求帮助的用户。”“Stack Overflow禁止用AI生成答案是合理的。”阿尔特曼也表示,正试图阻止ChatGPT随机编造,现阶段让其与当前技术保持平衡是很棘手的。随着时间的推移,会根据用户反馈来改进。
对AI无需过分恐慌
开发出ChatGPT的公司是何来头?公开信息显示,ChatGPT由人工智能公司OpenAI开发,成立至今已经七年,坊间传言其最新估值已达到两百亿美元。
OpenAI最初是由马斯克、阿尔特曼等六人在2015年联合创办,最初为非营利性机构。2018年马斯克宣布退出,2019年,OpenAI宣布重组为一家“有限营利(capped-profit)企业”,并接受了微软10亿美元的投资,双方表示将合作替Azure云端平台服务开发人工智能技术。此次推出的ChatGPT也是在微软Azure AI服务器上完成的训练。
阿尔特曼在12月6日发布的推文中感谢微软和Azure,他表示,微软和Azure做了大量的工作,构建了迄今为止最好的AI 基础设施,但目前并没有因为OpenAI 推出的东西而获得足够的荣誉。
此次ChatGPT的火热出圈也引发外界对AI是否即将战胜人类的恐慌。但多位AI界面人士对记者称,目前ChatGPT更多是算力与语料调教后的正常结果。
据国盛证券研报,ChatGPT的背后离不开大模型、大数据、大算力,其技术底座使用的是微调后的GPT-3.5系列模型,有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。GPT-3.5在微软Azure AI超算基础设施上进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640个整日)。
针对外界认为ChatGPT可以取代搜索引擎的观点,前Google总部科学家、出门问问创始人李志飞认为,相对于语音助手和搜索引擎,ChatGPT目前还有很多不能干或干不好的实情,如不能查询附近的川菜馆,不能进行打电话、定日历、播放歌曲等手机本地操作。此外,ChatGPT大概率不能回答训练时它没有看到的最新网页知识,不一定能正确回答一个五年前政治人物今年的年龄,大概率不能做对简单的逻辑题和加减乘除题。
总结来说,李志飞认为,ChatGPT的“认知”建立在虚拟训练文本上,没有跟实时的数据库或信息连接,也没有显式的逻辑推理,仍有些“空中楼阁”的味道,所以特别适合插科打诨。
虽有不少声音将ChatGPT与谷歌等搜索引擎对比,但东吴证券团队认为,由于ChatGPT模型仍无法很好解决虚假信息的问题,甚至过度猜测用户意图导致回答偏差较大,因此其本质仍偏向AIGC内容生产工具。搜索引擎核心是海量信息集合,而非信息创造;但在“存在标准答案”的编码、数学计算等领域,ChatGPT或将对搜索引擎产生一定冲击。其次,相比更多面向B端客户的GPT-3,C端学习和使用成本低、产出效果好的ChatGPT有望助力AIGC破圈,并在接收海量用户反馈的过程中继续迭代,推动AIGC文字内容生产走向全民化。
不少游戏人士和插画人士也开始关注ChatGPT,但不少用户在使用之后反馈表示ChatGPT并没有想象中那么智能。有一位游戏行业人士发现,ChatGPT对于2021年之后发生的事情似乎了解得并不多,“问它《原神》,它不知道稻妻(原神的一个地名)是哪里。”该用户说。另有用户向ChatGPT提问“《原神》的开发公司是哪家”,得到的回应不是米哈游而是腾讯。
对此,另一位用户表示,目前ChatGPT的学习的数据样本只截止到2021年,等到训练的人数增加了,反馈内容的质量便会有所提升。此外,部分用户向记者反馈认为,ChatGPT在不同语种的识别和解读上存在差异,使用中文和同样内容转译成的英文输入得到的反馈结果并不相同。
尽管目前ChatGPT仅能实现文字应答,但是不少插画人士也开始利用ChatGPT工作。一位插画师告诉记者,对于目前市面上流行的AI绘画软件stablediffusion,插画师常苦于反复修改提示语但仍无法得到理想的结果。不过ChatGPT提供了一个新的思路:用于生成指导AI作画的提示语模板,即利用AI告诉AI如何作画。“相当于把ChatGPT当成一个人类惯用语和ai绘画能理解的语言中间的翻译器,只需要在它生成的模板中填写几个关键词然后粘贴到stablediffusion就好了,经过ChatGPT转换后的指令成的图比原先手动输入的内容相比要好很多。”
相较而言,人工智能研究专家、创新工场人工智能工程院执行院长王咏刚持有更谨慎的态度,他表示,其一,AI创作目前在知识教育领域争议很大,例如王咏刚杜撰了一个学术概念“镜像等离子规范场”,但ChatGPT竟然真的一本正经地进行了解读。
王咏刚称,ChatGPT的模仿能力和文笔越好,这个未来风险就越值得重视且需要提前应对。今天的AI生成理论,还没办法保证生成内容的逻辑正确与合理;建立人类领域专家参与的AI训练过程,发展与正确性相关的增强学习算法可能会是未来的一个AI科研热点。
其二的担忧点在于AI/CS专业人需保持冷静,王咏刚认为,面对大幅提升多轮对话能力的ChatGPT,越是AI/CS的从业者越是不能一味地顶礼膜拜;最起码,应该有测试和验证的精神,不断探索新模型的能力上限,甄别模型生成答案时真正的“记忆认知”和基于特征相似性的“模仿游戏”。
警惕盲目跟风
ChatGPT的火爆让国内创投圈再次热议AIGC的投资价值,AIGC 全称AI-Generated Content,指利用AI技术寻找数据规律并泛化生成的内容。
国泰君安研发分析称,AI绘画是AIGC的一大重要分支,目前处于由简单的降本增效向创造额外价值升级的阶段,跨文字和图像的多模态内容成为关键的发展节点。2022年8月,Stable Diffusion、Midjourney等AI绘画应用因《太空歌剧院》作品的获奖而在海外迅速出圈,此后热度蔓延至国内,无界版图AI、意间AI等应用于9月底相继上线,其中意间AI用户数在42天内突破百万。此次ChatGPT仅用5天便实现百万用户数,AI问答及其他分支应用的热度有望持续攀升。
就技术层面而言,国泰君安称,模型效率、素材库丰富度是AIGC应用的核心竞争力。以AI绘画为例,此前流行的GAN模型存在一定局限性,包括从噪声/条件到最终结果的一步到位式生成方式难度较高,面对复杂数据时容易训练失败,跨模态生成效果较差等。但2022年出现的Diffusion模型在这三方面均有改善,模型迭代驱动多个AI绘画应用出圈。
并且此次OpenAI发布的ChatGPT模型较前代而言有较大进步,如减少不真实回答、避免有害回答、挑战用户问题前提等,同时还具备连续对话的记忆能力,人机交互体验更为逼真。丰富的内容素材库保障模型得到充分训练,并最终生成高质量内容,是AIGC应用的另一核心竞争力。
因此,浙商证券研报认为,ChatGPT模型的出现对于文字模态的AIGC应用具有重要意义。从下游相关受益应用来看,包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看,包括算力、数据标注、自然语言处理(NLP)等。
至于ChatGPT加入后对行业造成的“威胁”,高毅表示,ChatGPT不一定能完全替代所有人,但可能是相对基础的那部分,“具体到软件行业,今天能离谱地生成和分析代码,那明天很有可能 PRD 文档都能直接生成软件产品,仅需少量资深产品研发测试等人力介入。作为从业者,平时还是得多想想,哪些技能是更深的、不那么容易被替代的。”
就目前ChatGPT存在的问题而言,主要是来自于训练过程和数据集的局限性,此次面向用户免费开放能够进一步强化训练,从而完善模型质量。国盛证券研究所发现,目前OpenAI等巨头已着手自建计算集群来满足AIGC的要求,这种集中式的训练对GPU、存储、机房、供电等基础设施均有巨大需求。国内部分创业团队目前基于公有云训练,随着需求的增加,也有望转向自建集群。
今年以来,我国“东数西算”战略自上而下快速推进,作为数字经济的基础,“算力即权力”,其重要性不言而喻,此前国内厂商的更多互联网应用聚焦于“存”而非“算”,随着AIGC技术在全球的兴起,“东数西算”的算力需求将越来越显著。
未来随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,AIGC有望加速发展。但针对此次ChatGPT再次点燃创投圈内AIGC赛道的火热,王咏刚持有谨慎态度。2022年11月,王咏刚前往硅谷,拜访了多家投资公司、科技公司、创业团队,他发现科技圈里几乎人人都在谈论AIGC,似乎没有AIGC包装的创业项目就不是好项目,没有AIGC概念的科研就发不出好论文。
但实情的确如此吗?在后续与OpenAI两位联合创始人的交流中,王咏刚发现,对方会通过非常技术化、务实的心态谈论其工作计划与技术思考,但他们并不知道AIGC到底是什么意思,这令王咏刚非常诧异,思考之后王咏刚认为,“从科技上开创AIGC这个新领域的OpenAI创始人,其实并不需要知道类似AIGC之类纯粹用来包装科技概念的新名词。他们要研究的是大模型结构、并行训练加速、神经网络优化等等具体科学与技术。这样的人才是真正的创建者和领航者。”
目前国内AIGC一片火热,在王咏刚看来,其中一部分创业者、投资者、或将AIGC快速包装成应用产品的大多数,其实只是并无能力决定科技大方向的跟风者。“期望跟风者在AIGC这个大舞台上,不要过于头脑发热,还是要多判断一下,自己构建的所谓‘产品’,到底是有益于人类进步的,还是向已经碎片化的内容世界继续灌水或倾倒垃圾的。”王咏刚表示。