亿联网络:微软宣布旗下所有产品将全线整合ChatGPT,这使得公司产品未来升级迭代的方向更加明确
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
亿联网络2月21日披露投资者关系活动记录表显示,海外企业缩减资本开支,是在当前经济环境下更加强调运营效率,是有选择性地缩减资本开支,砍掉一些边缘化业务。企业通信设备能够提升企业整体的运营效率,所以反而可能增加投入部署。另外,我们的竞争对手大多来自海外,我们明显的竞争优势就是高性价比,因此目前的环境也有利于我们的竞争力进一步增强。从经销商2022年Q4的下游数据来看,呈现缓慢恢复的趋势。目前我们对2023年海外需求的判断主要是美国区域整体需求仍然较为强劲,欧洲需求预计是上半年相对弱一些,下半年会逐渐好转。
我们是微软Teams在国内最紧密的合作伙伴,微软宣布旗下所有产品将全线整合ChatGPT,这也使得我们产品未来升级迭代的方向更加明确,我们未来研发投入的方向就是更好地满足语音智能和版本更新的需求,给客户带来更好的体验。另外,ChatGPT的本质还是人工智能,公司在人工智能领域有较强的技术储备,如智能语音追踪、人脸识别、智能消噪等,都是公司一直投入在做的人工智能技术。
什么样的奇葩资本才能孕育出ChatGPT?|AI
什么样的奇葩企业要从减少检化验上降成本,什么样的奇葩都有知乎,什么样的奇葩男女让涂磊当众离场,什么样奇葩的是怎么都让我给遇到了上一次在朋友圈引发大规模“恐慌”,担心自己的职业会被AI(人工智能)替代还是在2016年――谷歌DeepMind研发出AlphaGo,先后击败了包括李世石和柯洁在内的顶尖棋手。
7年后,这类担忧再次涌现,只不过理由发生了变化:上次是复杂博弈,这次是高效生成。一个会回答问题、生成文章,甚至能写出论文的生成式AI(AIGC)――ChatGPT爆红网络。
从硅谷到全球,从技术探讨到伦理争议,从科技界到一二级资本市场,再到学术界,所有对其感兴趣的人都在讨论ChatGPT,这也让其背后的公司【【微信】】备受市场热捧。微软宣布第三轮合作,其估值据称也已达到290亿美元,这在美国创投市场很罕见。
与此同时,ChatGPT就像一个开关,触发了科技巨头们的“竞争欲”。谷歌发出“红色警报”,内测“Bard”;苹果准备召开年度内部AI峰会;百度宣布3月上线“文心一言”,还有更多科技企业蠢蠢欲动,新一轮较量摆在面前,人工智能“军备竞赛”从这里开始升温。
ChatGPT爆红,原本只是个“测试品”
在美国旧金山18街和福尔松街的交叉路口,褪色的红色油漆写着“先锋大厦”的灰色建筑物内,是人工智能研究公司【【微信】】的办公室,整体风格看起来像一个仓库,有300多名员工在这里上班。11月中旬,他们接到了一个不同寻常的任务。
据美国媒体报道,【【微信】】员工被要求快速上线一款聊天机器人。一位高管称,该聊天机器人将被称为“Chat with GPT-3.5” ,两周后将免费向公众开放。
这与原本安排不符。近两年,【【微信】】一直在开发名为“GPT-4”的更强大语言模型,并计划于2023年发布。现在正在进行内部测试和微调,做好上线前准备。
但【【微信】】的高管改变了主意。担心竞争对手可能会在GPT-4之前,抢先发布自己的AI聊天机器人超越他们, 【【微信】】拿出了2020年推出的旧语言模型GPT-3的强化版本GPT-3.5,在此基础上进行了微调。
2022年11月30日,新款的聊天机器人ChatGPT诞生了。通俗来说,ChatGPT能够生成人类语言回答问题。并且在与人对话中不断优化,更能以人类的方式理解文字,生成结果。
依靠世界最强大的语言模型之一,“测试品”ChatGPT一经发布便开始风靡全球,成功抢占市场和用户心智。瑞银(UBS)分析师劳埃德・沃姆斯利(Lloyd Walmsley)在近日的研报中估计,1月份ChatGPT月活跃用户达到了1亿。相比之下,根据Sensor Tower数据,TikTok用了9个月才达到相同水准,Instagram则花了30个月。沃姆斯利表示,ChatGPT有望成为有史以来最受欢迎的App之一。
“ChatGPT引起广泛触动,从商业视角来看是大模型性能的质变提升,让生成式人工智能有能力构建更多场景的解决方案,使更多新商业模式塑造成为可能。”经纬创投投资董事王冰醒告诉《中国新闻周刊》。
ChatGPT引发的热度远远超出了【【微信】】的预期。在此之前,Meta(FaceBook母公司)的BlenderBot、Calactica等AI项目均以失败告终,受此影响,这些员工并未对ChatGPT抱有高期待。据《财富》报道,【【微信】】首席技术官米拉・穆拉蒂称“这令我们非常惊讶。”在旧金山召开的风险投资活动上,【【微信】】联合创始人兼首席执行官山姆・阿尔特曼(Sam Altman)也承认低估了ChatGPT引起的热度。
因此,与ChatGPT走红相比,【【微信】】尽量在保持低调,淡化产品重要性。在社交媒体上,阿尔特曼便表示“ChatGPT非常有限”,在1月中旬的一次采访会中,他谈到,虽然ChatGPT技术表现令人印象深刻,却并不可靠。与此同时,【【微信】】也不允许任何员工公开发言。
有分析指出,阿尔特曼如此谨慎的原因是担心对ChatGPT过多渲染,可能会引起监管部门关注。AI技术自诞生起,就伴随着围绕透明度、偏见、歧视、虚假信息等方面的争论。同时,【【微信】】对ChatGPT采取的限制措施较少,赋予其更多讨论敏感话题的权限。
阿尔特曼是【【微信】】的关键人物。他身上有着硅谷明星初创者相类似的创业叙事:高材生、辍学创业、风投青睐。在预科毕业进入斯坦福大学学习计算机科学两年后,阿尔特曼和两位同学辍学创办了Loopt,并与其他七家企业一起进入了创业孵化公司Y Combinator(YC)首批投资名单。
2014年,28岁的阿尔特曼接替联合创始人保罗・格雷厄姆掌舵Y Combinator,担任总裁。次年还入选了福布斯30位30岁以下风险投资人榜单。在他带领下,YC的投资版图不断扩张。相应的,YC估值在2016年达到800亿美元――在五年中增长了17倍。
2015年【【微信】】创立。由阿尔特曼、布罗克曼、PayPal联合创始人彼得・蒂尔(Peter Thiel)、LinkedIn联合创始人雷德・霍夫曼(Reid Hoffman)以及埃隆・马斯克(Elon Musk)在内的一批风投精英共同出资10亿美元创建。
一年前,谷歌刚刚收购一家AI初创公司DeepMind。据《纽约客》2016年的报道称,【【微信】】对专攻方向并不清晰,但他们尤其担心DeepMind正在研发能够监控全球竞争对手的高级AI产品。
马斯克是【【微信】】的主要资助者之一,他一直认为人工智能是对人类的“最大的生存威胁”。也因此,【【微信】】吸收了马斯克的信念,在创立之初就宣传自己的使命是确保通用人工智能(AGI)造福全人类。
然而2018年2月,马斯克离开了【【微信】】。他在社交媒体上表示,特斯拉正在与【【微信】】竞争,“不同意【【微信】】团队想做的事情”。
一年后,2019年3月,阿尔特曼辞去了YC总裁一职,随后成为【【微信】】的首席执行官。2019年对【【微信】】的技术进展来说也颇为重要。2月,GPT-2模型问世,具有15亿个参数,40GB的数据训练量达到第一代GPT的十倍,只需要按下按钮,就能生成论文和文章。也是从这时候开始,【【微信】】才走进大多数人的视野。
但正是技术不断迭代,训练所消耗的成本越发高昂,加上高精尖人才成本和运营费用,让【【微信】】烧钱速度更快了,公司不得不寻求更多投资来维持运转。
“非营利”情怀孵化出特殊的融资结构
在硅谷,高成长性企业并不少见,但【【微信】】独特之处在于是一家“非营利”机构。这意味着,投资带不来真金白银的回报,没有风投机构愿意白白奉献。若想要继续发展,“非营利”模式在财务上不可持续。
这个问题在2017年就已经被【【微信】】领导层发现。根据《MIT Technology Review》2020年的报道,在为公司制订规划过程中,【【微信】】总裁布罗克曼等核心成员发现,通用人工智能领域,其他企业用于实现突破性成果的计算资源每三四个月翻一番――花的钱更多了。很明显,发展通用人工智能所消耗的计算成本和研究需要的资金远远超过【【微信】】作为非营利公司筹集的资金。
这需要一种不同于“非营利”的组织模式,既能获得风投资金,又能忠于创建使命――【【微信】】在第一份声明宣称自己的目标是为每个人而不是股东创造价值。
于是,【【微信】】做出了一个关键性决定,创建一家能够吸收风险资本的营利性公司。2019年3月1日,【【微信】】 LP建立,作为营利和非营利的混合体,被【【微信】】称之为“上限营利”公司。至此,【【微信】】由【【微信】】非营利实体(【【微信】】 Inc)及其营利性子公司【【微信】】 LP组成。
此前,【【微信】】在2018年4月发布的章程中,除了再次强调愿景使命外,也提到“需要大量资源来完成使命”。【【微信】】表示,将始终努力采取行动,最大限度地减少员工和利益相关者之间可能危及广泛利益的利益冲突。
也因此,【【微信】】创建了一种非同寻常的融资结构:按照投资数额,以特定倍数回报,第一轮投资者的回报率上限为其投资的100倍。任何超过该金额的回报都归最初的【【微信】】非营利实体所有。
【【微信】】 LP的建立,加上【【微信】】 每每强调“惠及全人类”“专利共享”“引领技术研究”等价值观,向投资者讲述吸引人的高估值叙事,叩开了与科技巨头微软深度合作的大门。
2019年7月,微软向【【微信】】 注入了10亿美元。这笔投资使微软成为【【微信】】使用云计算服务的“独家”提供商。【【微信】】的模型严重依赖云计算服务,据《The Information》称,【【微信】】一直是谷歌云最大的客户之一,2019年和2020年向谷歌支付了超过1.2亿美元的云计算费用。因此也有媒体表示,微软将部分投资额折算成了旗下云计算平台Azure的使用额度。
随着时间推移,两者之间的合作愈发紧密,从投资拓展至技术领域。2020年9月,【【微信】】授权微软使用GPT-3模型。【【微信】】曾表示,微软在2019年和2021进行了多年的数十亿美元投资。据《纽约时报》报道,自2019年以来,微软对【【微信】】至少投资了30亿美元。如今,随着ChatGPT火爆,投资额也将直线攀升。
1月23日,【【微信】】宣布,作为合作的第三阶段,微软将进行“多年期数十亿美元的投资”。据Semafor报道称,投资高达100亿美元,包括其他风投公司。【【微信】】的估值也将达到290亿美元,这比2021年140亿美元的估价翻了一番,使【【微信】】成为美国最有价值的创业公司之一。
【【微信】】估值不断上涨,一些风投也开始闻风而动。《华尔街日报》早前援引知情人士表示,风险投资公司Thri【【微信】】和Founders Fund正在以290亿美元估值,寻求从员工在内的投资者手中购买【【微信】】的3亿美元股份。
一路押注【【微信】】的微软也有望获得大额利润。但受制于“利润上限”模式,其收益将阶段性递减。
据Semafor称,在【【微信】】优先偿还完马斯克在内的第一批投资后,微软将获得75%的利润,直到收回投资本金。随后,微软将持有【【微信】】 49%的股份,其他投资者持有49%的股份,【【微信】】的非营利实体将获得2%的股份。该股权结构将持续至投资方收益达到利润上限。据悉,每一轮投资者的限制不同,但最高为100倍。《财富》表示,在利润达到1500亿美元后,微软和其他风险投资者的股份将无偿转让给目前负责【【微信】】 LP投资管理的普通合伙人――【【微信】】 Nonprofit。
Foley & Lardner律师事务所合伙人路易斯・莱霍特Louis Lehot接受《The Information》采访时曾评价称,这样的交易结构意味着【【微信】】的投资者认为该公司可能永远不会上市,因此需要通过提取未来现金流的一部分来收回他们的投资。
“确实是非典型而且有趣的交易结构设计,整体是双方共赢但更有利于【【微信】】的融资策略。【【微信】】能在相当长的时间内获得微软足够充裕的资金进行研发,以及取得微软直接相关的上下游生态支持,但同时也为未来保留独立性留下可能。”线性资本资深总监白则人告诉《中国新闻周刊》。
至于这种融资模式是否有机会能在国内初创企业中落地,白则人表示“可能会相对困难”。
“【【微信】】此次融资的谈判筹码很大程度依赖其在领域内头把交椅的地位。此外,‘有限利润’不太符合早期资本投资本质,微软能够达成这个协议,背后更多考量的是长期绑定的战略协同价值,甚至可能远比资本回报更重要。”白则人说。
也有声音指出,【【微信】】这种做法就像是把公司出租给微软。期限由【【微信】】的盈利速度决定。据路透社报道,【【微信】】最近向投资者宣称,预计今年将获得2亿美元收入,到2024年将上升至10亿美元。
尽管成立之初,【【微信】】就强调【【微信】】 LP由其非营利实体董事会控制,受其监督。但仍有质疑声指出,【【微信】】已经更改过一次制度,如何防止100倍的投资回报上限变成1000倍上限或任何其他任意数字?
现在看来,担忧有可能成为现实。据《The Information》援引知情人士称,【【微信】】可能从2025年左右取消对投资回报的100倍固定上限,改为每年上限提高20%。有投资者称,如果规定落地,将使【【微信】】更具吸引力。
谁也不想掉队
ChatGPT产生的影响远不止让大众担心工作何时被替代,它就像一个开关,触发了科技巨头们的“竞争欲”,毕竟谁也不想掉队。
谷歌是最先感受到威胁的巨头之一。谷歌长期占据近90%的搜索引擎市场,2022年搜索业务及其他营收达到1625亿美元,占母公司Alphabet总营收的64%――十足的“铁饭碗”。由于担心市场份额被蚕食,ChatGPT引发了谷歌内部“红色代码”紧急情况,谷歌联合创始人拉里・佩奇和谢尔盖・布林被请回公司商讨对策。
1月,在微软宣布继续投资【【微信】】后,谷歌火速行动,宣布向【【微信】】竞争对手、人工智能初创公司Anthropic投资3亿美元。该公司由【【微信】】前员工创建,正在研发ChatGPT的竞品Claude,但目前处在测试阶段,并未公开发布。
此外,谷歌也想在产品上瓜分ChatGPT的市场关注度。北京时间2月7日凌晨,谷歌CEO 桑达尔・皮查伊(Sundar Pichai)宣布,推出一款名为“Bard”的对话式人工智能服务。Bard基于谷歌2021年推出的语言学习模型LaMDA,能从互联网接收最新信息,而ChatGPT提供的信息只停留在2021年。不过,谷歌并没有提到将 Bard 整合到搜索之中,但计划在搜索中增添AI功能。
同一天上午11时,360在互动平台回复投资者提问时披露,集团正计划尽快推出类ChatGPT技术的demo(试用版本)应用。3个小时后,百度高调宣布,类ChatGPT应用文心一言(ERNIE Bot)正在做上线前的冲刺,预计3月份完成内测,面向公众开放。
一天后,2月8日,微软宣布推出由【【微信】】提供技术支持的最新版Bing(中文名“必应”)搜索引擎和Edge浏览器。技术使用了比ChatGPT更先进的【【微信】】语言模型。并准备将ChatGPT整合到Word、PowerPoint等Office办公套件中。
同一天,阿里巴巴也确认,阿里达摩院正在研发类ChatGPT对话机器人,目前处于内测阶段。
48小时内,海外巨头轮番过招,国内企业闻风而动。局面正如微软CEO萨提亚・纳德拉(Satya Nadella)在2月8日发布会上说的那样:“AI 将从根本上改变所有软件,并从搜索这个最大的类别开始,搜索引擎领域将迎来新的时代。”
ChatGPT让大企业感到紧张,但也让很多创业者看到了机会。2月13日,原美团联合创始人王慧文就在社交媒体上喊话“打造中国【【微信】】”,设立公司招聘研发人才,称下轮融资已有顶级VC认购2.3亿美元。
在AIGC技术应用方面,刘骏就是在使用ChatGPT后决定开发AI社交产品“爱化身”,对标Gemsouls。“我意识到底层 AI 技术在 2022 年已经到了关键时刻。自然语言识别的相关模型达到可以和人类交流的程度。因为ChatGPT对没有深刻了解的领域,也会靠编造信息来自圆其说。”
据《中国新闻周刊》了解,AIGC赛道已有许多初创公司冒头,正在寻找一级市场资金,不少投资人也开始积极入场。“因为这是一个非常热门的赛道,投资人都还是非常感兴趣。”正在寻求天使轮融资的刘骏谈道。
“过去几年,由于互联网及相关领域没有大的技术性突破,整个行业陷入了突破性革新的停滞中,出现了较多的内卷和重复开发。ChatGPT类底层大模型公司的出现,新一代大模型泛化出更多2C和2B场景的赋能,一定程度上会影响泛AI公司之前的商业模式――在自有模型下构建端到端的垂直场景解决方案。”王冰醒说。
王冰醒进一步表示,在过去一段时间内,资本市场底层基础学科科研导向公司的态度相对审慎,这类公司需要在没有明晰的商业化的前景下持续做巨量研发投入。ChatGPT快速增长的用户量级和商业前景让市场重新评估这类公司的潜能。
ChatGPT带火了AIGC赛道,但由于大部分企业还处在“讲故事”阶段,没有清晰的商业变现路径,也有投资人持谨慎态度,认为目前AIGC赛道已经开始出现泡沫。
“任何领域的创业都会出现泡沫,尤其‘风口’来时泡沫出现的概率会更大,因为市场对技术应用潜力的理解往往体现出短期高估长期低估的现象。”白则人说。
360集团创始人周鸿t在一场直播中表示,有泡沫不是坏事,未来将有更多人才和资金涌入。他分析,公司若想抓住风口,要看其过去十年有没有在服务器算力上投入,有没有做人工智能的团队,有没有大数据的存储。
这也道出了目前初创公司面临的普遍困境:没有前期沉淀。在应用端,底层大模型不能直接使用,需要根据行业需求调整和优化,而这需要耗费高昂成本。
刘骏告诉《中国新闻周刊》,在使用GPT模型中,最困难的还是需要算法工程师反复调整参数的过程,这会大量耗费算力和时间,这种调参也被行业人士戏称为“炼丹”。
以ChatGPT的API举例,会提供18美元限额,为期2个月的免费调试额度,后续按Token(代币)数量收费。刘骏测算,收费标准大约是三千字1元。这对于交互量更庞大的产品而言,一年成本能突破千亿元。
此外,刘骏认为,许多AIGC创业公司主要问题是底层技术大多是开源的或依赖于API接口,容易受到提供开源技术的公司影响。成立于2020年的Jasper是基于GPT-3的API为用户提供AI写作服务的初创公司,2022年估值达15亿美元。然而ChatGPT发布后,与Jasper有部分功能重合,一些客户开始转向【【微信】】寻求合作。
“从目前来看,受限于算力、历史投入、科技人才密度、数据规格、资金实力等方面,大型科技公司的优势比创业公司更明显。大模型通过被持续调用、‘喂养’新数据、训练,不断强化性能,并在应用场景上泛化,这导致大(公司)模型有较大可能挤压小模型闭环方案的一些创业公司的生存空间。”王冰醒说。
“目前来看,我们整体会更加关注国内外大型科技公司在底层模型上的研发动态,以及业务流可以集成基于大模型开发的新功能、或在垂类应用上构建出一定壁垒的创业公司。”王冰醒进一步表示。
这意味着,这是一门重资源、高资金投入的生意。创造壁垒才能让初创企业在巨头环伺的AIGC赛道获得一席之地。而ChatGPT仍存在作假、生硬、技术伦理风险等弊端,类ChatGPT产品能做的还有很多。
刘骏告诉《中国新闻周刊》,他认为目前所有的聊天机器人都太被动了,对人类发起主动沟通行为的产品逻辑并不多,说话也不够有趣。“得用产品逻辑去优化这个问题。如何利用好优势,避开它的局限性?可能就是胜负的关键。”
目前,无论是投资方还是企业,抑或是普通用户,大多数人和刘骏一样看好ChatGPT,认为AI和AIGC仍属于一片蓝海,机遇远大于挑战。
“AIGC会带来生产力范式级别的变化,但在各细分领域的落地和商业化还是需要一定时间。这个赛道未来会更看重产品层面的差异性,很可能会出现更多样化的细分场景玩家。”白则人说。
然而,《比较》杂志研究部主管陈永伟对正在进行的人工智能“军备竞赛”有些许担忧。“从正面的角度看,这场竞赛可能重新激活平静数年的人工智能市场,从而带动研发和投资,让人工智能市场进入一个新的高潮。与此同时,除了伦理方面之外,轻易将模型推向市场将容易招来知识产权纠纷,产生的风险可能更巨大。”陈永伟说。
陈永伟进一步表示,“军备竞赛”可能带来的另一个负面后果是技术进步停滞。“虽然ChatGPT在表现上要远胜其前辈,但从技术原理上讲,并没有什么突破,只能算是一个技术应用的成功案例。但是,随着各大公司不断将资源投入到这种工程产品上,整个业界更注重短期成败,这种内卷以及它带来的表面繁荣会不会成为未来人工智能发展的绊脚石呢?”
发于2023.2.20总第1080期《中国新闻周刊》杂志
杂志标题:ChatGPT背后的资本狂飙
记者:哈力克(【【邮箱】】)
责任编辑:刘德宾
AI与ChatGPT区别 从chatgpt看人工智能发展趋势
ai和at区别,ai和aiot,ai和cg,ai和auto区别正如 OpenAI 的 GPT-3 早在 2020 年中旬就发布了,为何当时没有引起轰动,有了 ChatGPT 才全民关注?就是 OpenAI 发现没人体会到其进步之处,只好自己做了层应用的壳,让大家开开眼。
开眼之后,若是再只看到聊天机器人这层价值,就叫人哭笑不得了。
正如 OpenAI 的 Sam Altman 自己说的,不喜欢 generative AI 这个词儿,它似乎暗示 AI 的目的只是做内容生产,这就忽视了其背后的价值。
就像他也不喜欢 Web3 一样。不要用概念蒙蔽了价值。
很多朋友的推演,是会成为谷歌和百度的替代品。这是很天然的想法,目前 ChatGPT 证明了信息获取和整合的效率是大于搜索引擎的,【【微信】】 也是真的 NB,想体验一票难求。不过这也未必是终局。
我从纯个人的视角,和过往对互联网的观察经验,自己捋了出来 AI 的 7 个可能性。它们代表的是不同市场中的价值,自然也代表着不同的红利机会。希望这些思考能对你有所启发。
另外,这个路径不存在时间关系,只是凭直觉做的影响面的排序。越往前,越已经在成为现实;越往后,则越有革命性。
1. AI as Chat B ot
聊天机器人是最直接的产品形态,它的价值自然是最低的。其实 Sam Altman 自己就说过,ChatGPT 是一个 horrible product,它有大量的错误信息,不是拿来做实际应用的。这就像是演示某个机器的 demo 一样,被很多人认为是唯一的产品形态了。
但哪怕聊天机器人,想象空间可能也比大多数人预期的要大。
ChatGPT 与小冰和百度 PLATO 比,并非只是显示出了更善谈、更体贴的能力提升,更重要是在此建模能力和计算能力基础上,可以做个性化的事情了。
这是脾气贼差的百度 PLATO,发布于 2021 年 10 月,参数量百亿,是 GPT-3 的 1/17。百度即将在 3 月发布的最新模型,可能参数量会翻倍。
对比而言,ChatGPT 如今体现出来的耐心、体贴和妥当,被网友们普遍称赞:
在个性化聊天机器人方面,推特上有一个很温暖的案例:@michelle huang 用 GPT-3 再造了一个童年的自己,并跟她对话。
以此类推,这样针对性的聊天机器人还可以用于很多陪伴的场景:
- 亲人去世,用亲人过往的语料生成一个很相似的数字人;
- 给抑郁症或自闭症患者,提供一位温柔健谈的朋友;
- 想要学习语言的朋友,有一个能够准确指出错误并认真指导的辅导(已经有了口语陪练教程:【【网址】】/video/【【微信】】);
- 让小朋友有一个不同于家长和老师的有耐心的无所不知的长辈;
- 在养老院或独居在家,没有亲人常伴的老人,有个倾诉对象(甚至帮着写一篇人生自传?);
- ......
这也不是天方夜谭,有一个产品叫 Replika,已经上线了,用的就是 ChatGPT 的技术。你可以根据自己的需求生成一个虚拟女友 or 男友 or 单纯的朋友。目前还引起了不少有关性骚扰、家暴、隐私等问题的争议,具体不展开说了,有兴趣可以自行搜下。
这些都是非常现实且有效的场景。焦虑的当代人面临孤独困境,聊天机器人能更好地完成陌生人交友的 APP 原本的任务。有反驳的声音会说,孤独困境应该用人与人真正的交往解决,机器是冰冷的。我不太同意这个观点。在社会结构性的困局还没有解开时,长夜漫漫的独身打工人、养老院里卧床的老人、父母在外留守在家的儿童,当下的需求仍需要解决。
说句题外话,AI 在未来各个场景下都会被戴上一个很虚无的帽子:「机器是冰冷的」「没有灵魂」「它并不是真正在思考」,这是历史上重现了无数次的了。回答这句话最好的方式,就是引用乔姆斯基老爷子的那句名言:
Thinking is a human feature. Will AI someday really think? That's like asking if submarines swim.
思考是人类特性。AI 有天会思考吗?那就像是在问潜水艇会不会游泳一样。
它们能跟人一样完成任务,那是怎样完成的,并不重要。
以上是第一大场景:陪伴型聊天机器人。如果要评估价值的话,也许是陌陌+Soul+心理疾病治疗工具+养老设施+.. 这么计算。看起来是百亿级的市场。
2. AI as Creator Tools
第二个场景,也是如今热议最多的话题之一,即成为创作工具。这也在成为现实,也是大家热议,也许会替代掉不少创作者的场景。
在插画领域,这是最明显的。很多图片都可以胜任。按照 Midjourney 的情况下,出图速度大约是 1 min 左右,出图价格大约是 0.4-0.5 元人民币。当然,不见得每张图都很理想,再加上还要 【【微信】】 的过程,凭我的经验, 10 min、10 元之内做出一张满意的插图,是可靠的。
各位可以感受下这个速度与价格,跟几千到上万报酬的画师的效率比。
这是最近一周我闲来用 Midjourney 做的一些图:
目前 Midjourney 还有些注册和使用上的麻烦。未来中国有自己的绘图工具,是必然的,可能今年就会出现。届时在插画师(专指按照甲方要求完成创作的,不算艺术家)领域会有一轮血腥的清洗。
插画之外,AI 做概念图也是好手艺。
虽说这些概念图显然没到可用的地步。但作为工业设计行业、互联网 UI 设计、游戏设计等等的参考,是完全没问题的,很好用的(再想想 10 min 、10 块钱是什么概念)。
说到游戏行业,似乎 AI 概念图带来的冲击是最大的。网游里大量的角色设定、装备、道具等等,都很擅长。这两张都是我用 Midjourney 做出来的示意图:
图的冲击是直观的。文字内容和视频内容也不是岁月静好。先感受下这样的文风模仿:
这里面有两点体会:
- ChatGPT 的模仿能力实在很强,写得像模像样;
- 由于是凭空去写,ChatGPT 的内容显得很空泛。
若是给出具体的内容,表现力就要强不少。
假如 ChatGPT 有更多的中文语料,或者干脆扔 100 篇知乎回答,或者 300 篇小红书笔记给它,结果肯定是不同的。专门的微博写作机器、知乎写作机器、小红书写作机器,都会应运而生。
用 AI 润色加工,成为绝大多数内容平台的必备流程,这也是会必然发生的。
同样的事情也会发生在音频领域。我自己一直在用微信读书,听书体验在几年内有肉耳可闻的变化。谈吐的流畅程度,重音的准确性,以及语气的恰到好处,在大多数语句里,跟过去的人工阅读差异不大了。
现在最新的 AI 能力,是可以根据你的声音,来定制生成任何语音片段的。以及有很多相关的工具,可以做视频操作。(更多可以参考这篇很好的整理文章:关于 AI 的 107 个人,61 个工具和 28 个通讯 )
闲话不多说了,还是跟 OpenAI 做 ChatGPT 一样,嗦这么久也许不如做一个有冲击力的实际的案例。各位感受一下吧。
这里的图片是 Midjourney 参考《狂飙》里的卖鱼仔老默做出来的;声音由 Ele【【微信】】 生成,取样是我过去录制的三期单口的播客;讲话内容是 ChatGPT 生成的对 AI 的看法;对口型生成视频是 D-ID 的 AI 产品做的。( 参考了@汗青、@Leo的思考笔记、@Szhans 提供的资料和方法。推荐去即刻社区关注他们。)
目前这些 AI 功能的成本并不高。整个制作成本按用户侧算约合 20 块钱,半个多小时搞定。可以猜想下对未来内容制作行业的影响。
还有一个有意思的案例,是可以进一步降低制作门槛的:
直观的感受是,抖音、视频号、小红书的内容,会很快有工业化生产替代机械劳动的机会,很多编辑、美工、剪辑会纷纷失业;知乎、豆瓣和公众号会慢些,也不远。
我脑海里总会浮现一个景象,就是一个视频账号的主理人,每天可以发 10 条高质量的内容,一人成团。他需要做的,就是设立主题、检查进度和斟酌内容的改进意见,剩下的,从取材、求证、编排、拍摄、制作、配音等等由 AI 搞定。
(用 Midjourney 绘制的场景)
这是第二个场景,内容创作的辅助工具。它带来的应该是目前所有内容工作室的基础工作的价值,估计也是百亿量级的市场,而能占领这个市场的,大概率还是目前的大型内容平台。
3. AI as Creator
接下来就需要一个思想实验了:推演一下内容创作的生态,如果 AI 足够强大,真的需要人的参与吗?会不会从选题,到迭代,AI 全部能包圆儿呢?
这里有三个命题,每个都会有不同的结局。
第一个命题是:AI 能不能选题并制作出好的内容?
这在某些品类下也许可以。拿搞笑类的视频举例子,我经常看到有些短视频,内容就是小时候看过的《故事会》里的那种袖珍小笑话。对于 AI 来讲,理论上是可以搜集人类历史上几乎所有信息的。那它可以设法翻遍的所有笑话,结合想象出来的场景,配适当的人物形象和台词,做成视频。
对于如何判断是否搞笑来说,AI 一开始未必能真正做好。不过互联网的内容平台,擅长的就是基于反馈快速迭代,这与 RLHF 的逻辑契合。AI 负责做抖音的短视频,它可以通过海量用户反馈去快速学习到底喜欢看什么。那前面说的一人成团,干脆就变成无人成团了。
抖音原来是圈养了一大批创作者作为佃农,这些佃农尚且有一定风险,也有管理成本( 抖音的赛博佃农逻辑 ),那干脆圈养永远不会反抗、老老实实听话的 AI 创作者就更理想了。AI 是没有感情的工作机器,放很多个模型互相去内卷,也不会有人上天台,不会有人闹仲裁。
第二个命题是:AI 能不能也产生情感链接,让人不会出戏?
AI 可以制作异步消费的视频、音频、文字和图像,但它能否更进一步,在直接与人互动方面,也有突破性进展,能让人不出戏,真正以为对方就是人?
前面我们聊到的 Chat Bot,还是在不得已的情况下,作为人的替代。若是身边真有亲人朋友,那不需要一个虚拟的陪伴;身边真有专家,也不需要数字人专家。而这里聊的,是假如可以选的话,AI 更受欢迎,会怎么样?
比如在直播领域,AI 也可以能言善辩,也可以讲历史谈文化,更可以跟某些评论区的网友互动(在判断跟谁互动效果最好这件事上,也能训练),对商家而言,调教一个自己的虚拟 AI,就很值得。这跟前两年流行的虚拟形象/数字人不同,那些形象都是真人外面包了一层皮,讲话都是写好的稿件、或者真人发声,背后都是收入微薄的运营。个性化的虚拟 AI 有价值的不是外部形象,而是 AI 的对话模型,和模型所带来的不同人格。
游戏直播也是如此。AI 也可以操纵游戏主角,尝试大量的可能性;可以尝试顶尖的手速,也可以模仿笨拙的新手;可以去做很多人不愿意做的事情,比如探索各种极端情况下游戏会怎么发展(很多游戏主播就是以此为主题的)。
色情行业也有这样的机会。在色情游戏里,捏出个性化的对象已经是刚需了。是不是可以有近似真人的体验?
这些都取决于一个大问题:普通人对 AI 是否真的能产生情感链接。意识到屏幕对面是个不存在的数字人,我们会不会真的投入情感?日本御宅族里有对二次元人物过度迷恋、甚至跟纸片人结婚的先例,会被认为是病态。未来社会是否能对此习以为常?这很难说。
第三个命题:个人 AI 内容的成本降到无限低。
刚刚说的还是创作者来捕捉用户的需求,那如果用户的需求可以精准实现呢?我们把 AI 想得再理想化一些、对计算性能的单位成本再低一些,就能推演出一个完全不同的生态。
在一百年前,电影已经诞生。那时候想要看到大屏幕上的内容,是富人的特权。跟当时的人说,未来每个人手里都会有块屏幕,而且这个屏幕的内容是个性化的,每个人可以自由选择做什么事情、看什么内容,当时的人一定会觉得奢侈。
那未来的 AI 制作内容,会不会成本低到,可以千人千面、真正个性化呢?比如设想这样的场景:
用户输入一段电影的需求:「我想看一部修仙小说,题材跟无间道类似,主角是梁朝伟和刘德华饰演的。他们分属不同的世仇门派。梁朝伟擅长的法术是火系的,刘德华擅长的法术是黑暗系的......」 接下来,AI 就会编排出一部按照要求制作的、剧情精彩画面出色的类型片电影。
如果这种能力在成本断崖下跌后真的实现,就会带来全新的体验差。小说、音乐、播客、电影、电视剧、动画,都可以以此类推。
电影一开始也许不满意,那用户可以自行修改:「这里的场面从峨眉山,改到夏威夷;那次的战斗里,不要让阿紫牺牲...... 」也许整个娱乐行业会变成互动为主的产业。并非是创作者单向输出,而是有一个谦和且耐心的 AI 创作者为用户服务。
这种生态下,如今我们在消费的大部分内容乃至娱乐产业都会由 AI 完成。人类就会集中去做更先锋的电影、音乐,那些 AI 用历史上的资料无法完成的内容。
这三个命题的成立与否,都会深刻改变内容娱乐行业,改变的程度不同。第一个命题,可能会产生新的抖音和 B 站,紧接着就是新的爱优腾芒;第二个命题,会产生新的直播行业,乃至新的内容电商;第三个命题,则是要产生新的内容和娱乐行业了。这三个变局里,也许新兴的内容平台就有从体验差带来的新机会,未必只是旧平台的独有优势,就充满了变数。
4. AI as Assistant
把 AI 当成内容创作者,那么 AI 的天花板就是内容娱乐产业。不过 AI 显然不止于此。
AI 在日常生活里其实已经很常见了,只不过都是无感知的、水下的,或者说更润物无声的。我们用的翻译工具,都是机器翻译技术支持的;我们打开淘宝,商品都是由个性化引擎的 AI 推荐的;刷门禁、打开手机和电脑的人脸识别、指纹识别也都是 AI。它们在替代掉一些过去人工的工作。
在更专业的专家(Expert System)领域,AI 的应用就更早了。1980 年代,CADUCEUS 就可以从血液里的细菌做一些特定疾病的诊断。这中间有大量的垂直领域专家系统的研究进展。到如今比较知名的,Deepmind 旗下的 AlphaFold,可以预测所有的蛋白质结构。
不过 ChatGPT 让很多人体会到,应用到日常工作里的可能性。
像这种演讲稿,虽是玩笑,但在很多场合下已经能帮我们完成文案工作了。类似的还有很多,我之前也提到过,OpenAI 官网的总结:
整理目录;
整理文章的关键词;
从产品描述得到广告语;
给产品起名;
根据主题列出推荐书单;
整理总结中心思想;
总结论文摘要;
撰写采访提纲;
自动代码注释;
bug fixer;
把 Java 改写为 【【微信】】;
......
整理目录;
整理文章的关键词;
从产品描述得到广告语;
给产品起名;
根据主题列出推荐书单;
整理总结中心思想;
总结论文摘要;
撰写采访提纲;
自动代码注释;
bug fixer;
把 Java 改写为 【【微信】】;
......
智能助理的概念出现很久了,现在才算是真正可用。对于工作中可能帮到什么,可以先看下 Notion AI 的体验。
这大概率就是未来在 Office 套件里我们用 Word 和 Excel 的体会。(有兴趣的可以直接参考下这个视频: 【【网址】】/video/【【微信】】)
它能够协助的方面还有很多想象空间。
比如有一个插件叫做 Bearly.ai,可以整理浏览器里看到的网页的核心思想,跟我们小时候做的阅读理解中心思想归纳差不多。
这里是一个示意,左下角是用另一个翻译插件得到的结论。
HyperWrite 可以依据你写的内容,提供写作建议,或直接帮你改稿,还可选随意一些的风格,还是严肃正式的风格。
像飞书妙记也是 AI 技术的辅助,会议记录或录音文件转成区分讲话人的文本,且可对应音频时点做调整处理。播客圈用过的朋友都说好。
更大的变化就在确定性更高的代码领域了。程序员们发现,ChatGPT 能很好地帮他们解决问题。并不仅仅是 debug 那么简单。
让代码更简化(ChatGPT应用场景 ):
找到一些配置问题:
确定性较高的场景,除了代码,就是各种考试。ChatGPT 通过了 Google 的18 万美元 L3 工程师考试之外,还通过了美国的司法考试(明尼苏达大学宪法、福利法、税法和侵权法)、商学院考试(沃顿商学院 MBA)、医师资格考试(USMLE)等等。
很自然,也变成了学生作弊的工具。美国教育界已经有很多学校禁止使用。这里不展开说了。
ChatGPT 的能力有很多想象空间,在细分的信息处理领域里。
比如这个 Snipd 的 APP,提供的是 AI 处理后的播客内容。跟一般的播客客户端不同,这里会根据时间轴有核心的观点总结。这样很好地解决了不少人觉得播客时间太长、听了半天才遇到对自己有帮助内容的问题。
以此类推,罗振宇和「得到」和不少知识相关的内容创作者们,长期致力做的事情就是信息的搜集和整合,这些是否也是 AI 能取代的?比如,整理哲学历史上的概念关系、人物图谱和相关书籍论文的摘要?
比如大家很痛苦的找 Excel 的公式语句(已经有人用ChatGPT做Excel报表了 ):
比如,Tome.app 这样的产品可以自动生成一套商务的 PPT:
(Tome.app这里有一个试用视频:【【网址】】/video/【【微信】】)
还有意想不到的应用方式,用 OpenAI 的 DALL-E 2 模型给犯罪嫌疑人画画像(https://www.vice.com/en/【【微信】】/qjk745/ai-police-sketches):
这些产品和能力,有的会进入办公套件,有的会在细分领域越来越方便,国内肯定也会雨后春笋。它们都会陆续成为「打工人」的标配。
说到这里,有年纪的朋友估计能想起时代的眼泪,预置在 Office 里的 Clippy, 可能会再次焕发青春(以不同的形态):
在辅助办公的领域,市场的价值应该至少是如今办公领域的半壁江山。也类似前文所说,若是以功能附加的形式加入原有的办公工具中,那机会还是在旧势力手上的。
5. AI as Worker
跟前面说的思想实验类似,如果办公辅助真的那么奏效,是不是 AI 也可以完全包圆儿了呢?
这里有一个命题是: AI 能不能做出比打工人优质,或至少差不多水平的决策?
命题为真,白领人群就真的会比较危机。老板可以让 AI 安排行程、收发邮件,让 AI 做数据推演,让 AI 完成产品的大致设计和研发工作。AI 还能持续学习,了解老板的个人喜好,和企业经营策略。坊间唱衰数据分析师这样的岗位要被淘汰,也是基于这样的逻辑。
不过这点就当下看,并不乐观。有新的评论说,【【微信】】 发布会上看起来很惊艳的总结 Gap 第三季度财报的结果里,其实是有大量错误的。
「【【微信】】 给出了 Gap 调整