小 i 机器人登陆美股,乘 ChatGPT 的东风能走多远?
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
图片来源 @视觉中国
文|美股研究社,作者|坚白
近日,国内聊天机器人最早入局者小 i 机器人成功登陆美股,但上市首日便以大跌近 15% 惨淡收场,而历经 20 多年的发展,这家曾有过多次高光时刻的人工智能公司,目前市值仅为 4.2 亿美元。
小 i 机器人 10 几年前推出聊天机器人,借助于 QQ、MSN 等即时通讯平台,也曾风靡一时,与当下如日中天的 ChatGPT 颇有几分相似。然而放弃 C 端转型 B 端,多年来辗转多个行业之后,小 i 机器人又想重拾 C 端,声称要打造中国版 ChatGPT。它还有机会吗?
多年来辗转多个行业,艰难求生
时间维度上,小 i 机器人确实是中国人工智能行业的先驱。小 i 机器人成立于 2001 年,彼时中国互联网尚处于起步阶段,新浪、搜狐、网易也才雏形初现,从其跨度达 20 年的发展历程来看,小 i 机器人是典型的 " 起了个大早 "。
在成立之后近 8 年时间里,与现在不同,小 i 机器人一直专注于 C 端,而其产品形态与如今的 ChatGPT 很相似,也是以软件形态存在的聊天机器人。2004 年小 i 聊天机器人入驻 QQ、MSN,迎来了生命中第一个高光时刻。可以想象,在互联网尚处于构建人与人之间的连接的阶段,小 i 聊天机器人这种极具开创性的产品,将引发一阵追捧热潮。
尽管当时的小 i 机器人并不算智能,其实就是一个简单的关键词搜索引擎 + 话术库,但在那个阶段尚无产品可以与之相较。其风靡即时通信软件时,苹果标配 Siri 才刚刚成立。
随着在两大即时通讯软件的快速渗透,小 i 机器人的用户数量也爆发式增长,到 2008 年即突破了 1 亿规模。但尽管坐拥海量用户,却始终难以变现。再看 B 端,早在 2006 年小 i 机器人帮助上海科委做了一款客服机器人,这让其意识到,B 端定制型客服机器人是一个潜在的市场,商业模式清晰,客户的付费意愿强。
面对与日俱增的带宽、人工、服务器维护等无底洞般的投入,2009 年,小 i 机器人决定从 C 端撤退,转而进军 B 端,从 " 通用人工智能 " 转向 " 特定领域人工智能 ",主要为 B 端用户提供智能客服软件。而且携 C 端的盛名,B 端开局也非常高,小 i 机器人先后拿下建设银行、京东、招商银行等重量级客户。自此,小 i 机器人终于迎来了清晰的变现模式。
2009 年以来,小 i 机器人一直延续着这样的业务模式,截至目前,其服务过大量的头部企业,其中包括四大行、三大电信运营商、华为、东航、小米等,横跨通讯、金融、城市公共服务、建筑、元宇宙、制造和智能医疗等诸多行业。
不过,尽管号称覆盖近千家企业及政府部门,但事实上,小 i 机器人多年来的营收规模始终偏小且不稳定。公开信息显示,小 i 机器人 2015 年全年、2016 年全年及 2017 年上半年三个报告期内,小 i 机器人分别实现营收 4515 万元、8582 万元、6511 万元,同时对应亏损分别为 6079 万元、7335 万元、1048 万元;而 2020 年全年、2021 年全年及 2022 年上半年,则分别实现营收 1386 万美元、3252 万美元、1286 万美元,对应盈利则为 -706 万美元、368 万美元、59 万美元。
而且,其营收对于大客户的依赖程度极高,据招股书披露,2021 年小 i 机器人最大客户的收入占比为 41.2%,前五大客户的收入占比为 67.1%,2022 年上半年前五大客户收入占比提升至 71.8%。
营收困境主要源于小 i 机器人缺乏自有场景,且随着科大讯飞、阿里、百度等后来者纷纷入局,小 i 机器人面临激烈的竞争,其大客户也不断迁移。以科大讯飞为例,2013 年中国移动入股科大讯飞成为其第一股东,紧接着,中国移动的客服系统便切换为科大讯飞的智能云因系统,此前,中国移动也是小 i 机器人的大客户。
因此,尽管转型 B 端以来,小 i 机器人找到了明确的商业模式,多年来服务了很多行业和客户,但营收规模始终未见起色,且连年亏损靠融资补血,小 i 机器人实际上是辗转在多个行业之间,艰难求生。
曾登陆新三板,但近年来融资停滞
与业务上的高光时刻相呼应,在资本市场小 i 机器人也曾备受追捧。在登陆纳斯达克之前,长达 20 年的时间中,小 i 机器人有过多达 6 轮融资,其中不乏知名投资机构及巨头公司。
2007 年,在小 i 聊天机器人风靡即时通讯软件时,其爆发性增长的终端用户量,引来了资本的空前看好,这一年,小 i 机器人获得了数千美元的 B 轮融资,投资方包括 IDG 资本、英特尔投资、DFJ 德丰杰中国基金、清科创投、Militello Capital 等知名机构和基金。
而小 i 机器人不得不转向 B 端市场之后,资本对其仍然抱有很大期待。2013 年,小 i 机器人在转型 B 端 4 年后完成 C 轮融资,规模同样达到数千万美元,投资方包含阿里巴巴。C 轮融资的完成以及产业巨头的加持,对于小 i 机器人的意义不言而喻,标志着其 B 端战略成功得到认可。
此后,小 i 机器人进行了 D 轮和 E 轮融资,紧接着又于 2015 年在新三板挂牌。新三板期间,尽管其营收及盈利均不见起色,但仍然在 2017 年和 2018 年进行了两轮定向增发,两轮增发均由天堂硅谷领投,小 i 机器人分别募集了 2 亿元和 2.63 亿元。定增完成后,小 i 机器人市值达到 25 亿元。
然而,众所周知,烧钱是 AI 行业的 " 通病 ",高昂的研发开支,让小 i 基本一直处于亏损状态,新三板的融资效率,显然也已经跟不上小 i 机器人的烧钱速度,于是 2018 年小 i 机器人又从新三板退市,着手冲击港股 IPO。当年 7 月,小 i 机器人 CEO 朱频频在新品发布会上,高调宣布小 i 机器人 2017 年实现营收 2 个多亿、利润超过 4000 万,并声称 2018 年的营收将实现翻番,达到 5 亿收入和 1 亿利润,使市场对小 i 机器人登陆港股寄予厚望。
但剧情很快急转直下。一年后,CEO 朱频频突然辞职,一同离开的还有小 i 机器人的首席财务官。很快,在与投资方接洽的过程中,小 i 机器人又爆出财务造假问题,矛头直指朱频频曾经高调宣布的 2017 年 2 亿营收。也有传闻朱频频的离职源于内部的路线斗争,与财务造假无关,个中详情迄今仍不清楚。自此之后,小 i 机器人不仅未能冲击港股 IPO,而且融资活动也基本停滞。
值得一提的是,2012 年开始,小 i 机器人主动发起了针对苹果的专利战,双方之间的缠斗达 10 年之久。小 i 机器人认为苹果旗下的 Siri 侵犯了自己于 2004 年申请的专利――一种聊天机器人系统,而苹果认为该专利无效,诉讼一直打到最高人民法院,最终苹果败诉。名不见经传的小 i 机器人,敢于向苹果发起专利战,这对于小 i 机器人来说,无论结果如何都是稳赚不赔的事情,小 i 机器人也因此博得了更多的关注和曝光。然而,专利之战虽然有助于小 i 机器人塑造品牌形象,但始终未能提振融资及业务发展。登陆纳斯达克、打造中国版 ChatGPT,成为小 i 机器人下一个征程的开端。
打造中国版 ChatGPT 困难重重
当前,ChatGPT 在全球范围内爆火,微软、谷歌等巨头们纷纷出手布局,市场掀起了一阵 "AI 热潮 "。与此同时,小 i 机器人的 IPO 进程也枯木逢春,成功登陆美股。
而资本市场重新关注小 i 机器人,显然与 ChatGPT 有所关联。首先,小 i 机器人多年来专注于以自然语言处理为核心的认知智能技术和产品的研发,而 ChatGPT 同样是基于自然语言;另外,小 i 机器人在长达 20 多年的时间里,积累了庞大的中文语料库,以智能客服为例,小 i 机器人的中文语义库和领域知识库,是迄今为止全球最大的。在资本市场看来,这些优势都可以成为小 i 机器人发展 ChatGPT 的重要资源。
小 i 机器人也非常准确地抓住了资本心理,其创始人、董事长兼 CEO 袁辉在上市仪式上表示:" 小 i 的目标是打造中国版 ChatGPT,目前小 i 机器人拥有中国自主研发并具有自有知识产权的认知智能平台,并已实现大规模商业化变现。"
但很明显,小 i 机器人的产品现状,距离 ChatGPT 仍相当遥远。目前,小 i 机器人的竞争对手其实是一些传统的人工智能聊天玩家,包括苹果的 Siri、微软的 【【微信】】、阿里的天猫精灵和百度的小度等。而且各家产品大同小异,同质化非常严重,这从小 i 机器人可以就一个 2004 年的专利跟苹果缠斗 10 年之久就可以看出来。
此外,从小 i 机器人多年来走马灯似地游走于众多行业夹缝,便可看到,小 i 机器人并没有将自己的先发优势成功转化到商业上,与苹果、小米、百度等巨头相比,小 i 机器人缺乏自有场景,由此导致不仅原有客户规模被蚕食,自己不得不持续转换行业,而且随着竞争日益激烈,客单价也在快速下滑,据报道,小 i 机器人智能客服单价已经从 200 万元左右下降到 20-30 万元。
不可否认,小 i 机器人最初的 C 端产品――基于 " 通用人工智能 " 的聊天机器人,与如今的 ChatGPT,确实有几分形态上的相似,但两者的技术逻辑迥然不同。
以小 i 机器人的最初形态为例,本质上其实是一个问答库,其中最早的 300 条问答是其创始人冥思苦想出来的,与 ChatGPT 所运用的大模型和高强度训练相比,小 i 机器人自主学习能力、人工智能强度等方面还有很大的提升空间。具体而言,小 i 机器人属于封闭模式,通过独立的自洽逻辑,固定的问题对应标准的答案,而 ChatGPT 则是利用大模型去迭代优化。
由此可见,小 i 机器人如果要打造中国版 ChatGPT,本质上不亚于推倒重来,尽管小 i 机器人已经打出了这样的旗号,但其实际进度仍停留在讲故事层面。
总体而言,小 i 机器人是深耕行业 20 多年的先行者,服务各类客户和行业的经验十分丰富,但在行业竞争加剧的形势下,基于原有技术的业务难以突破且无法造血,而转型 ChatGPT 又缺乏必要的资源支持,小 i 机器人登陆美股后,想要进一步突围仍然困难重重。
更多精彩内容,关注钛媒体微信号(ID:【【微信】】),或者下载钛媒体 App
transformer 文心大模型 文心大模型用了多少gpu
transform,transformative,transformer模型,transferred南方财经全媒体 记者冯恋阁 21世纪经济报道 记者郭美婷广州报道
没人能否认,这周是大型语言模型历史上不可忽视的一周。一天前,大洋彼岸的OpenAI发布GPT-4,今天下午百度则正式发布中文大语言模型“文心一言”。百度创始人、董事长兼首席执行官李彦宏在发布会现场表示,“文心一言”发布的核心目的,是响应市场的强烈需求。而大语言模型落地将带来新型云计算、行业模型精调和应用开发三大产业机会。
然而,虽然发布会前有许多期待和想象,但大幕拉开后,百度集团股价却开始出现下跌,跌幅一度达到9%。截至收盘,百度跌幅为6.36%,报125.1港元,总市值3458亿。
“十月怀胎,一朝分娩”,文心一言落地后,如何走好中文大模型之后的路?未来国内哪些场景、应用最有可能先与它们深度融合,带来新的产业突破?实际落地过程中,是否还有需要关注的重难点?
文心一言正式发布
3月16日14:00,在北京总部举行的发布会上,百度正式发布知识增强大语言模型“文心一言”。
据悉,这是百度文心大模型系列的又一新成员。在此次发布会上,百度创始人、董事长兼首席执行官李彦宏演示了文心一言在文学创作、商业文案创作、数理逻辑推理、中文理解、多模态生成场景下的具体应用实例,以期展现模型对文本的理解、推理、表达和创作能力。
在演示中,值得注意的是,由于训练数据主要基于中文,文心一言在中文理解能力上表现得较为突出。能够解释“洛阳纸贵”的含义、衍生意义,甚至基于这一成语创作藏头诗。
多模态生成功能也是发布会介绍的重点之一。用户输入文本后,应用可以即时生成文本、图片甚至视频。在现场演示中,经过多轮对话,文心一言可以生成创造性内容,并记住自己在前几轮的 回复,根据回答内容生成视频。
人工智能技术带来的惊喜背后是算法、算力和数据的辅助。
“基于庞大的数据库,文心一言能做到‘智能涌现’。”李彦宏解释道,在多种技术的加持下,文心一言能够回答以前在训练中未曾出现过的问题。
据悉,百度的训练数据库内包含万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱,作为模型训练过程中的特有的知识增强、检索增强和对话增强技术的“材料”。
百度首席技术官王海峰指出,文心一言的研发基于百度的ERNIE及PLATO系列模型进行。训练技术上,除了前文提到的三项增强技术,还包括监督精调、人类反馈的强化学习、提示技术。
在“亲笔写就”的邀请函中,文心一言介绍道,自己的主要功能是通过人机对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。
不过,目前并非所有人都能响应这一邀请。据悉,3 月 16 日起,首批用户可以通过邀请测试码,文心一言官网体验产品,后续的体验机会将陆续开放;多模态生成中的视频生成内容也暂未所有文心一言的用户开放。针对企业用户,百度智能云开放了文心一言API接口调用服务的申请通道,将在之后开放接入。
“可以预见,AIGC将成为下一代的高效的内容生产工具。”硅基智能科技有限公司CEO司马华鹏认为,信息技术不断发展,算力、数据与核心算法都各有积累和突破,人工智能生成内容(AIGC)终于从量变走向质变。随着大型语言模型的不断研究和落地,图像生成、视频生成、语音生成、数字人等场景应用都会逐渐普及。
司马华鹏还补充道,不同于以前的单一模态模型,未来,多模态的模型将会不断出现。“类似于人类的五官,人工智能也将模仿人类的视觉(CV)、听觉(ASR、TTS)、大脑(NLP)、形象(数字人)等方面,这些方面会有机结合并自然地与人类进行紧密交互。”
百度集团股价在发布会开始后出现下跌,跌幅一度达到9%。截至收盘,百度跌幅为6.36%,报125.1港元,总市值3458亿。
“这可能是对这场发布会失望情绪的一个体现。”一名人工智能行业创业者向南方财经全媒体记者表示,发布会上没有实时演示,结束后并未全面开放体验,且目前只是公开了一个测试版本。“这些都与市场的预期有很大差距。”他直言。
AI市场即将迎来爆发性需求增长
尽管文心一言未达业内预期,李彦宏亦承认其发展远未完善,但不可否认其在引领产业变革上的重要性。
“AI市场即将迎来爆发性的需求增长。”李彦宏指出,自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。
他在会上预测,大语言模型将带来三大产业机会:新型云计算、行业模型精调和应用开发。
云计算方面,其主流商业模式从IaaS变为MaaS。文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。
行业模型精调方面,这类公司是通用大模型和企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。这方面,百度文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型。
应用开发方面,李彦宏断言,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。
东方证券认为,随着文心一言的首批生态企业应用逐步落地,百度将建立起开发者及用户调用和模型迭代之间的飞轮,加速构建开放繁荣的技术生态。
同时,大模型的应用落地有望带来产业智能化变革。东方证券指出,目前,基础大模型距离大规模产业应用并成为产业基座还有很长的一段路要走,需要“大模型+接口平台+生态应用”三层协同共建来促进AI和产业共同发展。“未来几年是大模型的快速发展窗口期,相关的大模型算法、算力基础设施、下游B端通用应用软件和垂直行业领域都有望迎来加速增长。”
然而, 大语言模型的发展还处于初级阶段,关键技术仍有待进一步成熟与完善。司马华鹏指出,算法以海量数据为原料,在初始使用时,如不慎将有偏差的数据混入训练,无形中将影响算法运行结果,特别是在垂直领域,当训练数据量不足的情况下,很可能受到数据影响而导致模型给出错误的结论。同时,大模型、大数据、大算力是未来的发展趋势,早期投入的数据、算力等成本巨大,也是阻碍AIGC落地的重要方面。
司马华鹏进一步补充,AIGC发展过程中,还可能产生内容审核、生成内容的版权问题不清、伦理及政策监管等风险,同样值得关注。“随着人工智能技术不断的进步和发展,人工智能生成的内容越发逼真,能够达到以假乱真的地步。虽然公司内部尽力做到防止产品或服务被不法分子乱用,但是对于可能被乱用造成的后果,仍然存在伦理与法律的风险,后续是否会出台 AIGC 作品相关知识版权或其他法律监管条款尚不明确。”他表示。
竞天公诚律师事务所合伙人袁立志也提出了谨慎对待人工智能所面临数据、技术和应用等多层面的风险。单就数据层面的风险而言,有数据来源不合法、收集使用数据未获个人同意、隐私数据泄露、数据质量缺陷、数据偏见、数据投毒、数据逆向还原等,这些风险既需要通过技术措施解决,也是法律合规关注的重点和难点。