淘优惠

淘优惠

chatgpt手机版在哪可以下载 chatgpt带来的危机如何应对

热门文章 0
chat手机版下载,chatch it,chatchlog,chat apk
1.智能客服: ChatGPT 可以用作自动化客服系统,为客户提供 24/7 在线帮助2.聊天机器人: ChatGPT 可以制作聊天机器人,提供人性化的交互体验。3.文本生成:ChatGPT 可以生成高质量的文本,应用于各种领域,如新闻报道、广告文案等4.问答系统: ChatGPT 可以用作问答系统,自动回答用户的查询问题。9.语言模型: ChatGPT 可以用作其他 NLP 模型的预训练模型,提高效果10.文本分类: ChatGPT 可以用作文本分类系统,对文本进行分类。

AI与ChatGPT区别 chatgpt可以取代ai程序员吗

ai和at区别,ai和it,ai和cg,ai和lot
1、压力、狂热和久违的“ALL In”像一颗兴奋的火种,ChatGPT正在中国科技公司急速蔓延。百度CEO李彦宏直接把自己2023年的OKR定为:“引领搜索体验的代际变革”。一位百度内部人士对36氪表示,李彦宏认为这次机会绝不能错过,不同于元宇宙火时他持怀疑态度,从没在公开场合讨论,但AIGC(人工智能生成内容)、ChatGPT却多次说过。对这家中国搜索公司来说,这项火遍全球的突破性人工智能技术,为它带来了全新的想象力。2月7日,百度宣布将发布类似ChatGPT的项目“文心一言”后,其港股股价应声而涨12%。市场是如此期待中国也能尽快推出类ChatGPT产品。多位百度人士告诉36氪,高层下了死命令,要在一个月时间内看到产品,“3月完成内测”。一股自上而下的压力全面袭来。“所有OKR推迟,就搞文心一言。”多位百度员工向36氪描述了公司内部当前的紧绷状态:“技术琢磨怎么研发、产品经理思考怎么接入、销售在想怎么卖。”用来训练数据模型的稀缺资源――英伟达A100芯片,“全部调用给文心大模型,其他组都借不到”。紧张的倒计时下,北京西二旗的科技园里,百度的算法工程师们迎来一个个封闭开发的不眠夜。由百度CTO王海峰担任总指挥,协调两大事业群、百度核心AI人才组队攻坚――百度在用一种最高级别的战备姿态来迎接这场“搜索代际变革”。36氪获悉,字节跳动也已集结了几个核心部门,组成团队布局类ChatGPT产品。“头部的平台公司里面,字节肯定是反应最快和投入最坚决的。”一位投资人评价,比如去年字节AI把人脸卡通化的应用已经火过一波。业内也对字节的表现充满期待。“像ChatGPT这样的人工智能,与个人电脑 、互联网同等重要。”连比尔盖茨都如此公开表示。微软在ChatGPT推出后,对孵化该产品的公司OpenAI又宣布追加100亿美元投资,让这家仅有500人的创业公司估值高涨至290亿美元。中国股市情绪汹涌。2月上旬开始,“ChatGPT概念股”如雨后春笋,包括汉王科技、海天瑞声、科大国创、科大讯飞在内的多支股票接连大涨,即便他们的业务只和ChatGPT底层的AI技术有部分关联,也并没有成型的产品。科技属性、流量纪录、资本疯狂……ChatGPT成为后疫情时代的第一个绝佳故事脚本,没人不爱它。大公司在狂欢,创投圈也在骚动。2022年底,一家美元基金的年轻投资人Kevin被派到硅谷,彼时,硅谷已经因ChatGPT陷入疯狂,他所在的基金敏锐地觉察到这个变化,因此那阵基金各个赛道的投资人“都在关注AI的变量”。甚至有人相信,这“可以让TMT投资人续命15年”。过去几年,互联网增长见顶的讨论不绝如缕,人们不得不向投机味道浓重的Web3、元宇宙投注热情。而当ChatGPT横空出世,人们共同体验了它似模似样地捉刀作业、起草邮件、书写代码,甚至富有逻辑地胡说八道后,共识前所未有地快速成型。全球互联网人口在过去一年增长了近1亿,增长率仅约2% 来源:Datareportal短短两三个月,热潮就从硅谷传到中国,从去年年底的“新时代来了”,变为今年年初“人人都知道新时代来了”。随着前美团二号位王慧文发布自带5000万美元入局AI大模型、广纳技术英雄的招募贴,热烈的情绪走向高潮。AI公司出门问问创始人李志飞最近也与王慧文面议AI大模型到深夜。“ChatGPT把去年躺平的中国创投圈都炸醒了,”李志飞几天前在朋友圈写道,此时“堪比2010年左右开启的移动互联网,听到最多的词是All in”。盘点“天选之人”时,36氪原本认为,卖掉搜狗的王小川错过这次机会堪称憾事――清华计算机系毕业的王小川创立搜狗18年,业务涵盖搜索、输入法、翻译,均与AI语言模型相关――但意外听到他也在计划创业,回归做AI大模型的消息。36氪向王小川求证,他承认,自己在“快速筹备中”。更多内容可点击链接:ChatGPT中国变形记|深氪-36氪 「打造中国OpenAI」,「西湖心辰」这家创立时间不到两年的小公司怎么敢夸下海口?相比于国内的其他创业团队,心辰具有以下几大优势:1.在大模型的研究和商业化落地要早一年。积累了超过百万的用户,并训练出了匹敌GPT3.5的模型RIO。2.创始人蓝振忠曾在Google主导研发了大模型ALBERT(学术引用4300+),在大模型领域颇有影响力,也让他和AI风云人物们建立了紧密合作,比如Transformer作者、Character.ai创始人Noam Shazeer。3.初步组建了一支高人才密度的团队,覆盖了大模型的架构、训练、推理等关键环节,吸纳了来自Google、Meta、Amazon等公司的高管和科研专家。4.背靠中国的新型研究型大学西湖大学,拥有丰厚的人才储备和强大的算力资源。在蓝振忠看来,多模态大模型在AI进化演变中是一个必然趋势,这也是西湖心辰想要打造的「中国OpenAI」的目标之一――创造一个可以自助联网的多模态大模型。蓝振忠深知要做成中国OpenAI需要「高举高打」,正在寻觅一位如Sam Altman一样拥有极强的资源整合能力、充满远见且对技术狂热的CEO入局。作者|李梅 西西编辑|陈彩娴无论近日蹭 ChatGPT 热度的讨论有多少,一个客观的行业事实却是:在赶超 OpenAI、打造「中国版 ChatGPT」的决赛圈中,最终能登上光明顶的团队并不多。大致来说,目前国内追击 ChatGPT 的团队可以分为三类:一类是有人才、有资本的互联网大厂,如百度、京东、字节等;一类是有强大科研实力(尤指能开发语言大模型)的产学研初创团队,如西湖心辰、智谱 AI等;还有一类,则是 ChatGPT 火起来后入局的互联网老兵们,如王慧文、王小川等。(AI科技评论稍后将会推出更详细的派系梳理,敬请关注)这三类团队,各有优势与劣势,但需要具备的基本要素却是共通的:首先要有充足的资金,因为大模型的研发需要大量的算力投入;其次要有能干的研发人才,精通算法与工程,能够训练出性能卓越的语言大模型;最后是擅长商业落地的职业经理人团队,能够整合资源、把握市场、搞定客户……而这一点,常被忽略。为什么 OpenAI 能研发出 DALL・E 与 ChatGPT 这样的产品?OpenAI 成立的目标是实现通用人工智能(AGI),这个专业的词汇实际上并不能为大众所耳熟能详,但通过 ChatGPT,现在所有的互联网用户都能在与 ChatGPT 的交互中直接感受到了一个知识跨领域的 AI 系统是什么样的,了解到 AI 不再是 AlphaGo 这样只能下围棋的机器。总的来说,首先是良好的产品设计创新,而这反映了 OpenAI 团队在落实宏远目标上的优秀执行能力:既能仰望星空,又能脚踏实地。OpenAI 做对了三件事:一是积极对外争取资源,引入了像微软这样的巨头;二是保持了研发团队的创新独立性,敢于激进地科研;三是具有沿途下蛋的商业思维,在追随 AGI 的道路上,开发创新产品,既能吸引用户,又能通过强化学习的方式收集大量优质数据,反哺科研。换言之,国内的三类团队在追击 ChatGPT 的过程中,也要具备这三要素。大厂的潜力暂不评论,但偏科研的 AIGC 初创团队与偏商业的二次/连续创业团队,在起点上的劣势则显而易见,前者缺商业资源能力,后者缺人才与技术积累。西湖心辰的创始人蓝振忠很早就看到了这个风险点。作为一家由西湖大学孵化的初创企业,西湖心辰正在积极寻找像 OpenAI 的Sam Altman 一样既对技术狂热,又有极强资源整合能力的CEO。一位有经验的 CEO,对 ChatGPT 类的初创公司意味着什么?又为什么要加入西湖心辰这样的初创公司?1、独树一帜的「ChatGPT 玩家」在这波 ChatGPT 的玩家中,西湖心辰是一个独特的团队,其独特之处与它的创始人蓝振忠有密切联系。(此前AI科技评论报道过《ALBERT一作蓝振忠:从谷歌离职回到西湖大学,只为打造一个24小时在线的「心理咨询师」》)蓝振忠的本科毕业于中山大学,后到卡内基梅隆大学读博,研究方向为计算机视觉与多媒体分析。蓝振忠对人工智能的想象,是像电影《Her》里面的萨曼莎一样,能文能武,掌握文字、语音、图像多个模态的能力,所以立志成为多模态研究者,2018年加入谷歌 AI 的研究与机器智能组从事自然语言处理(NLP)研究。在谷歌,蓝振忠依托谷歌的 TPU 资源,两个月就训练出了性能媲美 3 亿参数大模型 BERT 的轻量化版本:ALBERT,开拓了 AI 领域内研究轻量化大模型的先例。2020年6月回国、加入西湖大学后,蓝振忠又继续基于大模型开发了辅助心理咨询的聊天机器人「小天」,并创立了西湖心辰。创始人同时具备语言大模型与视觉模型训练能力的特质,让西湖心辰也从一开始就朝着多模态的产品方向发展。在SD开源之前,心辰就敏锐的判断text2image模型正在脱离实验室的范畴,达到商用级别, 在2022年8月快速推出了AI画图产品「盗梦师」(现已改为「造梦日记」)。据了解,「造梦日记」目前积累了超过百万 C 端用户,数十家 B 端用户。作为一个次日留存接近 50% 的小程序,造梦日记一方面能在商业上盈利,为西湖心辰研发大模型输血;另一方面,造梦日记与小天一样,像 OpenAI 的逻辑,在与用户的交互中收集了领先行业的高质量数据,反哺了算法的优化。「造梦日记」优秀画作入选2022卢浮宫国际艺术展国内语言大模型的玩法最先是在学术圈兴起,产学研团队有物理性的客观优势。西湖心辰能在这波 ChatGPT 中紧跟行业步伐,与国内的大小厂竞争,也是因为其有领先其他玩家数年的语言大模型研发基础、商业化产品探索与坚实的科研人才基础。ChatGPT 还没出来之前,西湖心辰就已经有自研的文本生成产品「Hey Friday」。他们最早在海外推广,有数万用户,去年八月 AIGC 在国内火起来后,他们就开始研发面向国内的文本生成产品,ChatGPT 刚出来没多久,西湖心辰就推出了类 ChatGPT ――「心辰Chat」。在时间上,心辰Chat 比一批号称「即将推出」的公司快了将近一个月、甚至两个月的时间。相比许多功能未明的种子「中国版 ChatGPT」,心辰Chat 目前更具确定性,抢了先机。在产品设计上,心辰Chat也做了许多创新:首先,「心辰Chat」是一个可以自助上网的 AI 系统。我们向它提问新近发生的事件,比如「马斯克什么时候收购了Twitter?」、「美团联合创始人王慧文,最近做了什么?」等等,它都能对答如流。「心辰Chat」问答示例而 ChatGPT 目前无法访问互联网上的内容,接入Bing搜索之后才能联网,所以对于「马斯克什么时候收购了推特」的提问,它则会根据旧语料给出「马斯克最近并没有收购过推特,推特是一家独立的公司......」这样的回答。其次,「心辰Chat」是一个多模态对话系统。ChatGPT只具有文本生成的单模态功能,但在与「心辰Chat」的对话中,我们除了能让它写作以外,还可以用它来生成图像。「心辰Chat」生成图像示例如上图所示,在所生成图像的基础上,用户还可以直接「用嘴修图」,交互方式便捷有趣。在蓝振忠看来,多模态是一个必然趋势,因为单模态的学习能力有限,比如用户告诉 AI一个颜色词「红」,如果「看不到」红色对应的图像,AI 是无法理解这个词的;类似地,假如只有关于「跑」的文字和图像,AI 也无法获取这个动作的真正含义。虽然西湖心辰是一家初创公司,但由于创始团队在文本与图像两个模态上均有一定时间的积累,同时避免像谷歌急匆匆推出与 ChatGPT 差异化不大的产品 Bard 引来的反感与抨击,西湖心辰选择追求多模态版的「中国版 ChatGPT」。西湖心辰有积累,但蓝振忠也看到:作为一个小团队,能否田忌赛马,在国产 ChatGPT 的竞争中冲出重围,西湖心辰还需要更强的武装与策略。2、西湖心辰的长处与短板「如果我们今年不打算入局 ChatGPT,我们今年的盈利就已经能覆盖研发投入、实现净利润收入了。」蓝振忠告诉 AI 科技评论。行业内的一个共识是:AGI 的实现是万里长征,沿途会产生许多能引起小爆点的成果,正如 DALL・E 不会是 OpenAI 的收官之作一样,ChatGPT 之后,OpenAI 也会在原来的基础上推出更强大的产品。AGI 需要长期主义,ChatGPT 的追随也同样如此。当蓝振忠与团队决定加入打造中国版 ChatGPT 后,他们就意识到,他们需要一位 CEO。长城非一日建成,AGI 的研究也非一日之功。虽然文字生成神器 ChatGPT 是一个更为具体的目标,但在蓝振忠等玩家的眼中,ChatGPT 只是通往罗马的一个驿站。而就拿这个小小的驿站来说,最终能参与的团队就不会太多。以语言大模型的研发为例。数据、算法与算力,三者缺一不可。平心而论,西湖心辰在类 ChatGPT 上的科研基础与技术积累已经超过了大多数的 AI 公司。首先看数据。ChatGPT 之所以能甩开全球的竞争对手,关键在于数据积累。ChatGPT 一经推出,一周内就收获了百万用户的使用,在初始数据(用户反馈)的积累上对模型不断迭代,强者愈强。但幸运的是,ChatGPT 进不来中国,所以中国的团队还有机会。目前来看,追击 ChatGPT 的三类中国团队当前都处于起跑线上,大厂、初创企业与资本大鳄的差距都还不算太大。凭借技术积累,西湖心辰这样的小公司是有长板的。以数据为例。西湖心辰的产品矩阵包含小天、造梦日记、Hey Friday,合计用户量超过 140 万 C 端用户、数十家 B 端用户。早期的数据积累,包括用户咨询、写作、绘画的提示词描述等,能够为心辰Chat提供高质量的数据源泉,这是许多公司所没有的。其次是算法人才。ChatGPT 的诞生并非偶然,跟其背后的团队 OpenAI 聚集了一批科研天才有很大关系。一位博士毕业的行业观察者告诉 AI 科技评论,OpenAI 的成功与其团队的年轻化与理想化分不开。从个人发展的规律来看,无论国内外,无论有没有「35 岁被裁员」的压力,许多科研人才过了35岁、40岁后,都普遍从一个有理想的科研青年,进入了回归家庭的养老状态。学术界也逃不开「35 岁」的年龄分水岭:由于通过长聘教轨制度考核的难度太大,许多青年教师在拿到终身教职后就会选择躺平。因此,一个能吸引年轻、有理想的人才的团队,将是决胜 ChatGPT 的关键。而依托高校科研力量、能不断聚集年轻科研人才的团队,在这一点上具有独特优势。据了解,目前西湖心辰的团队已经有大模型研发的技术积累,比如 RIO模型,是国内最早商业化落地的经过 Instructional Learning 的大模型,其效果已经超越了原版GPT-3。比如造梦日记能做到秒级出图和更强的中文理解,也是心辰团队对于采样函数和模型理解层做了独特的优化的结果。此外,西湖大学为西湖心辰提供了强大的算力支持。蓝振忠介绍,如果西湖心辰只在图像生成与文本写作上发力,现有的人才资源、客户资源与算力资源是足够的;但在追赶 AGI 与 ChatGPT 这样更大的目标上,西湖心辰需要更多的资源。算力是重要的壁垒之一。如上图所示,大模型的研发需要解决诸多问题,左图中从右往左,黄色部分到绿色部分、再到黑色部分,研发环节会越来越底层,难度越大、研发投入也需要更多。目前,大多数的团队都只进行到数据端的数据标注,算法端的监督学习,而 OpenAI 是从数据清洗、自监督学习开始,从底层做起。日前谷歌推出 Bard 来与微软对战,行业人评价这本质上是 TPU 与 GPU 的对决。而对国内没有 TPU 的团队(包括西湖心辰在内)来说,算力的壁垒会更高。据蓝振忠了解,国内许多公司、甚至大厂,都没有一千张以上的 GPU,那么对西湖心辰这样的创业公司来说自然更难。对于这个问题,蓝振忠很理性。他认为,要解决资源问题,一要引入更多的资本,二要与大公司合作(如微软与 OpenAI 的模式),三要建立良好的客户联系(包含小 B 端)。而目前,西湖心辰的团队中,包括蓝振忠本人也是一位科学家,更擅长做研究。因此,西湖心辰需要一位 CEO!3、寻找「奥特曼」从造梦日记开始,西湖心辰就进入了许多投资人与行业的眼中。这意味着,西湖心辰将要进入下一个更大的阶段,同时也将面临更大的挑战。加上越来越多的玩家涌入 ChatGPT,AIGC 往工程化更进一步,蓝振忠知道,寻找一位能高举高打的CEO很关键。他们相信,西湖心辰会是国内最有潜力实现 ChatGPT 的团队之一,但现实的问题也需要脚踏实地去解决。早在图像生成中,蓝振忠就向AI科技评论表示:「不仅是 AI 画画,事实上文本生成也具备极大的潜力。」与图像生成相比,文本生成的用户基础展示出了更大的成本优势。不同于图像生成的用户囿于 B 端、甚至小 B 端,图像生成的使用群体主要是专业人群,场景也有限,而文本生成的应用场景覆盖营销文案写作、邮件写作、办公写作、论文写作、短消息回复等等用途,也更细碎。一个图像生成软件目前在风格与内容泛化上的能力仍较弱,只能与垂直领域结合,但文本生成可以同时提供多项功能服务,任何人都可以使用、也都需要。因此,虽然语言大模型的投入更大,但当用户足够多,数十亿的成本平摊下来,几乎可以忽略不计,跟高速的建设是一个逻辑。同时,类似插画师的用户群像在使用工具上的能力更强,而文本生成的用户更多是 C 端小用户,后者更愿意依托现有产品,这也给了类似 ChatGPT 这样的文本生成产品提供更大的增值服务空间。事实上,这也是微软的 CEO 萨特亚对人工智能的理想。自萨特亚接手微软 CEO 后,他认为微软的业务应该依托三个方向的科技投入,而这三大技术则是云计算、人工智能与量子计算。在萨特亚的想象中,我们的生活还远远没有智能化;如果足够智能化,那么一个普通的职工每天就不会花那么多时间在琐碎的办公环节上,比如回复邮件、写工作汇报、写周报日报、订机票等等。而文本生成,正可以帮助人们的时间从这些琐碎的日常中解放出来。――这也是蓝振忠的科研理念。从研究人工智能开始,他就相信,未来会有《Her》里面的萨曼莎一样的 AI 系统,让每个人都有一个私人助理。蓝振忠表示,他希望寻找一位能认同该理念、对 AI 能产生的价值潜力有强认同的 CEO。只有发自内心的认同,才能全力以赴。他指出,Sam Altman 当初引入微软这样的资本大鳄,对 OpenAI 研发出 ChatGPT 是功不可没的关键一步。微软对 OpenAI 有认同,为支持 ChatGPT 的研发,萨特亚曾坚决抵抗内部的反对、甚至绕过 CFO 直接调用原本用于微软内部研发的服务器。在追求 AGI 的道路上,Sam Altman 不一味坚持技术理想主义,眼光独到、引入微软,平衡了技术发展的需求与商业转化的目标,找到了一条正确的道路帮助 OpenAI 往 AGI 的理想更近一步。随着 ChatGPT 的成功,微软又大笔加注,OpenAI 的科研实力也将肉眼可见地潜力无限。蓝振忠谈道:回到中国的市场来看,西湖心辰与 OpenAI 在人才与规模上具有许多相同之处。OpenAI 能在谷歌、微软、Facebook 等等大厂云集的美国赛场中突围而出,西湖心辰在国内同样也有机会。作为一名科学家,蓝振忠很严谨,不画饼。过往的产品打造已经验证了西湖心辰的商业潜力,蓝振忠与团队清楚自己的科技实力,也看到自身管理经验的不足,而合作是共赢的基础。西湖心辰需要 CEO、需要战友,也需要合作伙伴。ChatGPT 有门槛,有商业价值。西湖心辰麻雀虽小、五脏俱全,加之当前国内风云未定,如果你是一位看好 ChatGPT 的成功创业者,西湖心辰邀请你来当 CEO!有兴趣的读者欢迎自荐,联系西湖心辰创始人蓝振忠:lanzhenzhong@westlake.edu.cn更多内容,点击下方关注:蓝振忠也发「英雄帖」,中国版 ChatGPT 明星公司寻找 CEO本文来自于微信公众号“AI科技评论”――“聚焦人工智能前沿研究,关注人工智能青年成长。”AI科技评论是专注人工智能(AI)学术和科学前沿的平台,前身是雷锋网的学术频道。欢迎搜索关注微信公众号“AI科技评论”(ID:aitechtalk)了解更多相关报道。

chat gpt在国内啥时候火的 chatgpt从哪火起来的


人工智能的成功,不只归功于金字塔尖的天才。AI 不会识别物体,需要大量数据学会分辨五官和交通灯。AI 对信息来者不拒,仰仗人工帮它剔除数据库有害的那部分。当 AI 最终出现在镁光灯下,数据标注员们完成了单调而重要的职责,然后又隐入黑暗。火爆全球的 ChatGPT,大概也是一个「一将功成万骨枯」的故事。ChatGPT 的「幕后英雄」ChatGPT 有多厉害不必多言,它和你用自然语言交谈,编写代码、撰写论文、通过考试、创作诗歌都不在话下。比起之前的「人工智障」,ChatGPT 的前身 GPT-3 也是一大进步,但它存在一个问题,容易脱口而出暴力、性别歧视和种族主义言论,所以无法真正普及开来。有了前车之鉴,为了保证 ChatGPT 的温和无害,OpenAI 建立了一个额外的安全机制。▲ 图片来自:shutterstock它基于涉及暴力、仇恨和性虐等内容的例子,训练出能够检测有害内容的 AI,再把这个 AI 作为检测器,内置到 ChatGPT 之中,在内容到达用户之前,起到检测和过滤的作用。以上例子需要经过数据标注(Data labelling),这是一项浩如烟海的人力劳动,由肯尼亚的工人们负责,为有害内容打上标签。从 2021 年 11 月起,OpenAI 向外包公司 Sama 发送了数万个文本片段,其中大部分体现着互联网最黑暗的角落,涉及性虐、自杀、酷刑等内容。▲ 图片来自:Sama一位数据标注员在阅读无法接受的有害内容后,开始反复出现幻觉。工作的重负,并没有换来待遇的优越。《时代周刊》调查发现,为 OpenAI 工作的 Sama 数据标注员,工资约为每小时 1.32 美元至 2 美元。他们每 9 小时轮班,阅读和标注 150 至 250 段文字,每段从 100 个单词到 1000 多个单词不等。但是 Sama 回应,工人每 9 小时轮班标注 70 段文字,而不是最多 250 段,税后每小时的收入在 1.46 美元到 3.74 美元之间。Sama 还自称是一家「有道德的 AI 公司」,帮助 5 万多人摆脱了贫困。如果有道德是指帮助脱贫,那或许没有错,毕竟这些生活困苦的工人没有更多的选择。但是「副作用」如影随形,身心折磨成了必要的代价。因为 Sama 对员工工作效率要求极高,公司很少组织心理辅导活动,更何况这些活动本身也没有什么用处。有员工曾提出想要一对一的咨询,但被 Sama 管理层一再拒绝。OpenAI 也回复了外媒 Quartz,他们支付的费用几乎是东非其他内容审核公司的两倍,并给员工提供福利和养老金。尽管各方说法不一,但是基本的事实没有出入。为了让 AI 更安全,为了让 OpenAI 的通用 AI 造福人类,海量工人付出了巨大的精力,甚至遭受了创伤。但是当 OpenAI 估值近 300 亿美元,他们始终籍籍无名。末端的毛细血管数据标注员并不是一个新鲜的工种。早在 2007 年,计算机视觉专家李飞飞雇佣了一群普林斯顿的本科生,以 10 美元/小时的价格让他们试验做数据标注。如今,数据标注早已发展成产业,但待遇明显下降,主角也不再是大学生。2019 年前后,有媒体报道过国内的数据标注员,他们散落在河南、山东、河北等地的四五线小城。类似地,Sama 的总部位于旧金山,在肯尼亚、乌干达和印度雇佣员工。除了 OpenAI,它还为 Google、Meta 和微软等硅谷客户标注数据。然而在近两年,Sama 打定主意「金盆洗手」。2022 年 2 月,Sama 决定结束与 OpenAI 的合作,员工不再需要忍受痛苦,但生计也难以维持,「对我们来说,这是养家糊口的一种方式」。今年 1 月,Sama 的态度更加决绝,打算退出所有自然语言处理和内容审核工作,只做计算机视觉数据标注,与所有涉及敏感内容的业务分道扬镳,包括终止与 Meta 在东非的合同。为 Meta 工作的 Sama 员工在非洲内罗毕办事处,专注审核本地生产的内容,斩首、虐待儿童等内容超出了他们的接受程度。一位员工将审核图片内容描述为「生活在恐怖电影中」。有需求就有市场,从来不缺这样的外包公司。总部位于卢森堡的外包公司 Majorel,在非洲负责 TikTok 的审核服务,有报道称将由它接手 Meta 的工作。这家公司也曾为人诟病。2022 年 8 月,Insider 调查了摩洛哥 Majorel 的状况,发现工人们经常轮班工作超过 12 小时,标注涉及虐待动物、性暴力等的短视频,休息时间少于美国同行,公司的「健康顾问」又帮不上什么忙。作为科技产业链末端的毛细血管,数据标注还出现在更多的地方。2022 年 11 月,The Verge 报道,亚马逊在印度和哥斯达黎加聘请了工人,他们负责观看仓库摄像机数以千计的视频,从而改进亚马逊的计算机视觉系统。▲ 图片来自:Reuters但是因为至少八小时的目不转睛,他们出现了头痛、眼痛和视力下降。自动驾驶汽车同样需要数据标注,才能学习怎么识别路牌、车辆、行人、树木和垃圾桶,它对标注的准确性要求还要更高,因为这可能直接决定了人的生死。《麻省理工科技评论》2022 年 4 月的一项调查发现,包括特斯拉在内的自动驾驶公司,让委内瑞拉工人标注自动驾驶数据,工资仅有平均每小时 90 美分多一点。至少目前,数据库依然需要人类净化,AI 识图仍然需要人类拉框。而问题在于,和付出的精力相比,工人们的待遇和心理健康并不那么理想。那些越来越边缘的人自 ChatGPT 横空出世,不少人担心起了自己的饭碗,这可能是一种非常具体的危机感。与此同时,AI 和人类的关系,也在另一个维度发生了微妙的变化――它改变了人类的工作方式,以及存在的工作类型,让海量的劳动力隐居幕后。比如数据标注员,他们的工作门槛并不高,往往没有硬性的学历要求,经过几天培训就能上岗。知道要标注的是什么、标在哪里,基本就算入门了,剩下的时间留给熟能生巧。他们往往也不是正式员工,而是外包形式,就像为 OpenAI 服务的肯尼亚工人。这意味着,他们身处一个更加不稳定的世界,待遇更低,地位更加边缘,职场发言权也更少,只是亦步亦趋而已。AI 的进展究竟如何,他们或许并不知道。2018 年,GQ 报道在 《那些给人工智能打工的人》提到:「我们没有研发能力,纯粹也就是一个(代工的)富士康。」▲ 卢德运动.相似的情形曾在历史上演。在 19 世纪初的英国,自动化纺织机普及开来,工厂更希望雇佣廉价的无技术劳动力操作机器,导致许多技术娴熟的手工工人失业。时代的车轮在继续前行,为 AI 服务的数据标注员,也在被 AI 慢慢替代。2022 年 6 月,特斯拉计划解雇 200 名美国员工,他们负责标注视频,帮助改进驾驶员辅助系统。原因可能在于,近年来特斯拉的自动化数据标注有了进展,可以代替人力完成部分工作。特斯拉 Autopilot 软件总监曾在 AI Day 上表示,公司能在一周内收集并自动标注 1 万个 45 到 60 秒的视频片段。相比之下,「人工标记每个片段可能需要几个月的时间」。2020 年,世界经济论坛预言,到 2025 年,8500 万个工作岗位将被机器取代,9700 万个新工作岗位又将诞生。被他们看好的职位,基本都是人工智能和机器学习专家、数字化转型专家、信息安全分析师这类技术人才。与之相对的低收入、低技术职业,则在一步步地退出舞台,最终可能消失在机器的阴影之中。