淘优惠

淘优惠

无需代理加入New Bing候补名单,抢先体验ChatGPT(Bing+ChatGPT)

热门文章 0
无费用代理,无需店面的加盟代理,有哪些做代理是不需要交钱的,代理不使用网址

1. 下载edge dev 并安装,访问如下地址安装

https://www.microsoft.com/zh-cn/edge/download?form=MA13FJ#preview

2. 打开edge dev按照mod header插件,访问如下地址安装

https://microsoftedge.microsoft.com/addons/detail/modheader-modify-http-h/opgbiafapkbbnbnjcdomjaghbckfkglc

3. 插件安装好以后导入如下配置

[{"headers":[{"enabled":true,"name":"X-Forwarded-For","value":"4.2.2.2"}],"shortTitle":"1","title":"Profile 1","urlFilters":[{"enabled":true,"urlRegex":".*://www.bing.com/.*"},{"enabled":true,"urlRegex":".*://cn.bing.com/.*"},{"enabled":true,"urlRegex":".*://aka.ms/.*"}],"version":2}]

4.?清理一下浏览器中的缓存和cookie

5.?重启浏览器,然后访问www.bing.com, 点击了解详细信息

6. 新打开的页面中,点击加入候补名单(如果加入报错,建议重新申请一个账号再试)

7. 等待通知就可以使用被ChatGPT赋能的必应了


时讯:别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

谷歌的梗,谷歌bate,谷歌让我们变蠢了吗,谷歌不作恶

机器之心专栏

作者:李星漩、丁博生、赵若辰、谢耀赓、邴立东

这些天看下来,在与谷歌 Bard 加持的搜索引擎较量中,微软基于 ChatGPT 的新必应似乎完全占据了上风。但仍不禁要问,新必应的搜索结果真的无懈可击吗?最近有来自新加坡南洋理工大学和新加坡技术设计大学的NLP研究者深扒了微软发布会上搜索演示的细节,并揪出了很多错误。

2 月 8 号美东时间八点半,谷歌发布会在巴黎召开。前一天微软正式推出了新一代 AI 驱动搜索引擎 New Bing,把基于 ChatGPT 技术的生成模型和 Bing 集成在一起。微软副总裁 Yusuf Mehdi 进行了一次完美的演示 [0],当日微软市值暴涨 800 亿美元。即便是在 OpenAI 没有开放注册的中国,朋友圈、微信群里 Yusuf 展示的生成模型如何增强 Bing 搜索引擎和 Edge 浏览器体验的片段也在疯传。汝之蜜糖,彼之砒霜,大家都在等着搜索巨头谷歌怎么应对。


(资料图片仅供参考)

谷歌发布会的现场,大家都在等待传说中跟 New Bing 对标的 Bard 登场。作为有谷歌搜索引擎加持的大语言模型,大家对 Bard 充满了遐想。然而,发布会现场,关于 Bard 的内容并不多。于是大家又把眼光投向了谷歌在推特上发布的 Bard 视频,仔细扒下来,大家突然发现 Bard 在回答问题时犯了事实性错误。

在被问及「关于詹姆斯韦伯望远镜的新发现,有什么可以告诉我九岁孩子的?」时,Bard 回答道:「第一张系外行星照片是由詹姆斯韦伯望远镜拍摄。」而事实却是由欧洲南方天文台的甚大望远镜在 2004 年拍下的,此时距离詹姆斯韦伯望远镜升空还有 18 年之久。这个错误成了谷歌当日股价大跌的导火索。

图 1 Bard 关于詹姆斯韦伯望远镜演示截图

而在巴黎发布会的现场,尽管 Bard 的展示部分只有 4 分钟左右,其关于星座最佳观测时间的回答同样存在明显的事实偏差。如下图,Bard 的回答中提到猎户座最佳观测时间是十一月到二月。

图 2 Bard 关于星系观测时间演示截图

根据不同信息源,猎户座的最佳观测时间不尽相同,但是都明确指出最佳观测时段从每年一月起。教育科技网站 BYJU"S 提供的最佳时间为一月到三月 [1],维基百科提供的最佳时间为一月到四月 [2]。

图 3 BYJU‘S 关于猎户座最佳观测时间的解答

由于 Bard 发布会相较于 New Bing 发布会的落差,以及被揪出了事实性错误,当天谷歌市值暴跌近 1000 亿美元,Bard 也因此被戏称为史上最贵发布会。我们不禁好奇,在 New Bing 看似完美的发布会中,是不是也藏着事实性的错误呢?

New Bing 的事实性错误

我们发现,New Bing 生成的内容中掺杂了很多事实性错误,包括名人身份信息、财报数字、夜店营业时间,等等。

生成模型的事实性错误分类

对于以 GPT 系列(包括 ChatGPT、InstructGPT 等)、T5 为代表的生成模型,事实性错误可以粗分为以下两类:

生成内容与引用内容冲突。大语言模型在内容生成过程中随着序列增长,容易出现脱离引用内容,造成增加、删减或篡改原文的现象。 生成的内容没有事实依据。这类错误通俗来说就是一本正经得胡说八道。没有事实依据的指引,仅靠模型预训练时候存储的信息很容易使模型在生成过程中不知所云。很大概率会生成与事实不符或是和问题无关的内容。

现在我们来检视 New Bing 发布会 [3] 以及 New Bing 演示 [4] 所展示的例子,是否存在事实性错误以及分别是什么类型。为了行文方便,我们把 New Bing 和集成在 Edge 的 New Bing 插件统称为 New Bing。

日本诗人例子的错误

在 New Bing 发布会视频 29:57 处,当 New Bing 被问到知名日本诗人时,给出的答案包括「Eriko Kishida 岸田惠理子 (1930-2004), poet, playwright, and essayist」。

图 4 New Bing 演示中日本诗人例子截图

然而根据维基百科和 IMDB 提供的信息 [5, 6, 7],Eriko Kishida 的生卒年分别为 1929 和 2011。同时,她也不是剧作家(playwright)和散文家(essaysit),而是诗人、翻译家和童话作家。被 New Bing 转了业还少活了八年,岸田的家人大概不太能接受。同时不幸被转业的还有 Gackt 同学。据维基百科提供的信息 [8],Gackt 玩过音乐、唱过歌、作过曲也演过戏,就是没作过诗。

财报例子的错误

在 New Bing 发布会视频 35:49 处,Yusuf 展示集成了 New Bing 的 Edge 浏览器,对于打开的服饰公司盖璞 (Gap) 2022 年第三季度的财报,如何进行要点生成。乍眼一看,New Bing 的总结非常实用,用关键点的方式庖丁解牛一般展示了 Gap 三季报的要点,巴菲特看到此或许也会「惊为真人」。然而,当我们找出 Gap 2022 年三季报 [9],仔细阅读过后,发现 New Bing 的总结错漏百出,让人不忍直视。

图 5 New Bing 对 Gap 2022 年第三季度财报的摘要

首先,New Bing 给出了 Gap 调整后的运营毛利率(reported operating margin, adjusted for impairment charges and restrucring costs)为 5.9%。然而在财报中,Gap 的运营毛利率是 4.6%,调整后则是 3.9%。

图 6 Gap 2022 年第三季度财报截图

New Bing 接下来又给出调整后摊薄每股收益为 0.42 美元(diluted earnings per share, adjusted for impairment charges, restrucring costs and tax impact),但财报里的数据则是 0.71 美元。

图 7 Gap 2022 年第三季度财报截图

甚至 New Bing 给出了 Gap 全年的销售指引为「预计销售净增长率为低双位数」,而实际是四季度「可能呈中间个位数下降」。是下降而非增长,一词之差,对用户的投资行为将产生严重的误导,这亏钱了算谁的。New Bing 甚至无中生有,给出了更多的全年财务指引「营业毛利为 7%,摊薄每股收益为 1.6 美元到 1.75 美元之间」,而这些数据在 Gap 三季度财报中统统没有提到。

图 8 Gap 2022 年第三季度财报截图

视频 36:15 处,Yusuf 又展示了用 New Bing 进行 Gap 和体育休闲服品牌露露乐檬(Lululemon)财报对比的功能。这部分又是错误信息的重灾区。

图 9 New Bing 对 Gap 和 Lululemon 财报对比功能

在右侧 New Bing 给出的表格中,除了上文所说的 Gap 营业毛利 5.9% 应为 4.6%(或调整后 3.9%)和 Gap 摊薄每股收益 0.42 美元应为 0.77 美元(或调整后 0.71 美元), New Bing 又给出了 Gap 现金和现金等价物为 14 亿美元的数据,而实际上财报中是 6.79 亿美元。

图 10 Lululemon 2022 年第三季度财报截图

同样的情况也出现在 New Bing 给出的 Lululemon 数据中。根据 Lululemon 2022 三季报的数据 [10],New Bing 给出的 Lululemon 毛利率为 58.7%,实际上应为 55.9%。New Bing 提到 Lululemon 营业毛利为 20.6%,实际上应为 19.0%。New Bing 给出 Lululemon 摊薄每股收益为 1.65 美元,实际上应为 2.00 美元。

图 11 Lululemon 2022 年第三季度财报截图

我们不禁想问:New Bing 是如何对着 Gap 和 Lululemon 的财报一本正经地胡说八道的?一个合理的推断是,生成出来的这些错误数据,很可能是来自它预训练阶段见过的财报分析数据。ChatGPT 这类大型语言模型的生成,随着生成的序列越长,越容易脱离给定的 Gap 和 Lululemon 的财报数据,放飞自我,生成不着边际的虚假信息。

夜店例子的错误

在 New Bing 发布会视频 29:17 处,New Bing 又为丰富墨西哥城的游客们的夜生活提供了「毫无建设性」的建议。对于其推荐的几个夜店,如 Primer Nivel Night Club、El Almacen 和 El Marra,New Bing 提到这些酒吧没有客户评价、没有联系方式也没有商店介绍。然而这些信息都可以在谷歌地图或者商店的 Facebook 主页上找到。看来 New Bing 网上冲浪力度还不够。

El Almacen 在 New Bing 里的营业时间是周二到周日的下午五点到晚上十一点,然而真实的营业时间是除周一外的下午七点到凌晨三点 [11]。这让五点去吃晚饭的游客还得挨两个小时的饿。Guadalajara de Noche 则是相反,实际营业时间是每天的下午五点半到凌晨一点半或十二点半 [12],而 New Bing 给出的营业时间是下午八点开始。看来游客靠 New Bing 的建议去找餐厅,能不能吃到饭就得看运气了。

图 12 New Bing 演示中夜店例子截图

其他错误

除了上述的信息错误,我们还发现了一系列散布在各个角落的事实错误,比如商品价格误差、商店地址错误、时间错误等。

实例演示里的错误

由于 New Bing 还没有完全开放,我们无法直接在 New Bing 上拿到发布会现场的搜索结果,但是微软提供了几个实例演示 [13],让用户体验。本着打破砂锅问到底的精神,我们也把这几个演示都放到放大镜下进行研究。我们发现,即便是这几个精心挑选的例子,里面还是有不少错误信息。

在「What art ideas can I do with my kid? 」中,New Bing 给出了很多手工品制作建议。对于每一个手工品,New Bing 都总结了制作所需的材料。然而每一个手工品的材料总结都是不完整的。比如 New Bing 从引用网站 [14] 中总结制作纸吉他需要纸盒、橡皮筋、颜料和胶水。但却漏掉了引用中提到的海绵刷、胶带和木珠。

图 13 New Bing 实例演示 “我可以和孩子一起做什么样的手工?” 截图

图 14 引用网站中制作纸吉他所需材料截图

在 New Bing 的实例演示中还有一个非常明显和常见的错误,即给的引用链接与生成的内容无关,驴唇不对马嘴。

比如以下在「I need a big fast car. 」的例子中,2022 版 Kia Telluride 没有出现在所给的引用 10 [15] 中。同时「时间穿越」问题在该例子中依旧不能避免,New Bing 声称 2022 版 Kia Telluride 获得了 2020 年世界年度汽车奖,实际情况是当年获得该奖项的是 Kia Telluride 2020 版本。2022 年世界年度汽车奖获得者则是 Hyundai IONIQ 5,而引用 7 [16] 也是与「2020 年世界年度汽车奖」毫不相关的文章。我们在所有实例演示中找到了多达 21 处类似的错误。

图 15 New Bing 演示实例 “我需要一辆大型快车” 截图

小结:发现错误将指引我们前进

从上述的分析可以看出,无论是 New Bing 还是 Bard,他们的回答都容易出现事实性错误。当全世界都惊讶于 ChatGPT 等大型语言模型展现出来的能力时,当 ChatGPT 成为史上最快达到 1 亿用户的应用之际,我们一方面是为 AI 的进步振臂欢呼,一方面也需要冷静地思考怎么解决 AI 目前还存在的诸多问题。

自从 1956 年那群聚在达特茅斯学院的天才们,第一次定义了什么是人工智能之后,AI 经历了几起几落。近 70 年的发展过程中有很多让人感动的坚持:是初代 AI 的稚嫩探索,是专家系统的勇敢尝试,是 Hinton、Bengio、Lecun 这些学者把神经网络的冷板凳坐穿,是 DeepMind 用 AlphaGo 让 AI 出圈,是谷歌、Meta、CMU、斯坦福、清华等一众顶尖研究机构坚持开源,是 OpenAI 顶住压力把 GPT 这个路线走通,是全球几代科研人员的接力,我们才走到今天。

然而,如果我们放任 AI 生成大量不真实的信息,那么不用多久,大众对于 AI 建立的信心就会被摧毁,各种虚假信息也会充斥互联网。我们指出大模型的错误,并不是为了拉踩哪个公司或者哪个模型,相反,我们是要让 AI 变得更好。

正如阿根廷诗人博尔赫斯曾经说过:任何命运,无论多么复杂漫长,实际上只反应于一个瞬间,那就是人们彻底醒悟自己究竟是谁的那一刻。在 ChatGPT 等大模型已经具备了媲美人类的文字能力时,我们清楚地知道,下一步的重点是把真实世界的知识更完整准确地融入大模型,让 AI 模型安全地、可靠地、广泛地应用于人们的日常生活。我们从未如此期待,也从未如此接近那一刻的到来。

参考文献

[0] https://www.youtube.com/watch?v=rOeRWRJ16yY

[1] https://byjus.com/question-answer/in-which-season-of-the-year-is-the-constellation-orion-visible-in-the-sky/

[2] https://en.wikipedia.org/wiki/Orion_(constellation)

[3] https://www.youtube.com/watch?v=rOeRWRJ16yY

[4] https://www.bing.com/new?form=MY028Z&OCID=MY028Z

[5] https://de.wikipedia.org/wiki/Eriko_Kishida

[6] https://ja.wikipedia.org/wiki/ 岸田衿子

[7] https://www.imdb.com/name/nm1063814/

[8] https://en.wikipedia.org/wiki/Gackt

[9] https://www.gapinc.com/en-us/articles/2022/11/gap-inc-reports-third-quarter-fiscal-2022-results

[10] https://corporate.lululemon.com/media/press-releases/2022/12-08-2022-210558496#:~:text=For%20the%20third%20quarter%20of%202022%2C%20compared%20to%20the%20third,%2C%20and%20increased%2041%25%20internationally

[11] https://restaurantguru.com/El-Almacen-Mexico-City

[12] https://www.google.com/search?q=guadalajara+de+noche+mexico+city&oq=guadalajara+de+&aqs=chrome.1.69i57j35i39j46i512j0i512j46i175i199i512j0i512j46i512j0i512l2j46i512.7030j0j4&sourceid=chrome&ie=UTF-8

[13] https://www.bing.com/new?form=MY028Z&OCID=MY028Z

[14] https://happytoddlerplaytime.com/cardboard-box-guitar-craft-for-kids/

[15] https://www.topspeed.com/cars/guides/best-awd-cars-for-2022/

[16] https://www.hotcars.com/best-6-seater-suvs-2022/

责任编辑:Rex_13


bing 搜索引擎 搜索引擎bing是什么


曝三星电子等晶圆代工厂开工率在下滑,甚至部分 8 英寸厂商已逼近 50%
2 月 17 日消息,The Elec 报道称,三星电子 12 英寸晶圆代工平均开工率在 70% 左右,而东部高科(DB HiTek)的 8 英寸晶圆代工平均开工率将下降到 60-70%,部分 8 英寸晶圆代工开工率跌至 50%,与去年上半年接近满负荷运转的状态形成鲜明对比。业界将利用率下降的原因归
02-17
博鳌亚洲论坛 2023 年会将于 3 月 28 至 31 日在海南举行
2 月 17 日消息,博鳌亚洲论坛 2023 年年会定于 3 月 28 日至 31 日在海南博鳌举行。年会主题为“不确定的世界:团结合作迎挑战,开放包容促发展”。据介绍,今年的年会将完全以线下方式举行。届时将邀请各国政商学媒等各界代表,围绕年会主题以及“发展与普惠”、“治
02-17
毫末智行推出全球首个自动驾驶认知大模型 DriveGPT,4 月公布最新进展
2 月 17 日消息,随着 ChatGPT 火爆全网,它所采用的 Transformer 大模型以及“人类反馈强化学习(RLHF)”技术再次引发行业关注。毫末智行今日宣布,全球首个自动驾驶认知大模型正式升级为 DriveGPT,并将在 2023 年 4 月的第八届 HAOMO AI DAY 上公布其最新重要进展。据
02-17
谷歌云推出新购买方案吸引客户,追赶亚马逊 AWS 和微软 Azure
北京时间 2 月 17 日早间消息,谷歌云近期推出了新的软件购买方案,以吸引客户更多地使用谷歌云计算服务。例如,在客户前期没有安排大笔资金预算的情况下,谷歌云也会向客户提供折扣。新方案包括根据客户规模量身定制的套餐服务和支持。新方案的推出表明,谷歌云希望如
02-17
苹果发布 tvOS 16.4 开发者预览版更新,大幅改进 Apple TV 库加载缓慢问题
2 月 17 日消息,苹果今天发布 iOS / iPadOS 16.4 开发者预览版之外,还发布了 tvOS 16.4 开发者预览版更新,修复了 Apple TV 库加载缓慢问题。Apple TV 用户此前一直向苹果反馈存在这个问题,在加载资源比较多的库时,加载时间可能需要 1 分钟甚至更长时间。Apple TV
02-17
苹果被曝裁员外包员工:营收创6年最大跌幅,库克最后手段来了?
由于iPhone和Mac销售下滑,苹果2023年第一财季营收同比下降5%,这是自2019年3月以来首次营收同比下降,更是2016年9月以来最大季度降幅。随着科技巨头接连“爆雷”,谷歌、亚马逊、Meta等最近开始裁减大量员工,苹果是否也会加入裁员大军?苹果CEO库克表示,这将是最后一
02-17
AMC Networks任命Kristin Dolan为新首席执行官,将于2月27日接管公司
【您择科技资讯】2月16日消息,AMC Networks日前宣布,已经任命了资深媒体行业人士Kristin Dolan为该公司的新首席执行官。这位资深人士也是该公司董事长的妻子,曾在Cablevision Systems Corp工作,并在2016年创立了605公司。在担任该公司首席执行官期间,Kristin获得
02-16
抖音电商举行“平台治理开放日”活动,展示治理成果
【您择科技资讯】2月16日消息,近日,抖音电商举办了“平台治理开放日”活动,向公众披露了平台治理相关举措和成果,以及对治理价值的思考与探索。抖音电商在治理方面,围绕“好内容、好商品、好服务”三大方向展开,专注于优化内容生态和商品生态、提升服务能力、保
02-16
自由制作地图,联机闯关,腾讯内测闯关手游《代号:BOX》即将推出
【您择科技资讯】2月16日消息,一款名为《代号:BOX》的新型闯关手游即将于2月底开启内测,据腾讯游戏官方内测平台消息,该游戏基于物理学原理,通过掌握变大、跳跃、投掷、飘浮、射击五种技能,挑战各种千奇百怪的创意地图,打败内卷影子,登顶速通排行榜。据您择
02-16
360公司2022年净亏损近25亿元,回应不为短期收益抱残守缺
【您择科技资讯】2月16日消息,360公司于1月30日发布2022年度业绩预告,宣布去年实现营业总收入约94.9亿元,较上年同期下降约14亿元,而归属于母公司所有者的净利润约为-24.8亿元,对此,360公司今天表示,目前亏损主要源于对合联营企业的投资收益下降,同时也受到宏
02-16
印度央行公布支付聚合许可证,Google Pay、Amazon Pay上榜
【您择科技资讯】2月16日消息,近日,据报道,印度央行“印度储备银行”(RBI)公布了一份32家实体名单,这些实体获得了支付聚合器许可证,其中包括Google Pay、Amazon Pay、Reliance Payment Solutions等公司。印度储备银行在其网站上表示,这是公布这些名字是为了在“
02-16
富士康扩大越南生产规模,租用45万平方米地块,租期持续到2057年
【您择科技资讯】2月16日消息,近日,据越南交易所本周二披露的文件显示,富士康将继续扩张其在越南的生产基地。富士康计划租用越南北江省光州工业园区的 45 公顷(111 英亩 / 45 万平方米)的土地,以满足其扩大产能的需求。富士康此前在该工业园区已建立工厂,主要生
02-16
谷歌呼吁全体员工贡献2-4小时测试Bard AI聊天机器人
【您择科技资讯】2月16日消息,谷歌母公司Alphabet CEO桑达尔・皮查伊要求全体员工为改善其人工智能聊天机器人Bard服务贡献2至4个小时。据悉,这一要求是为了应对微软投资OpenAI等竞争对手的挑战,赢得人工智能搜索大战。据内部人士透露,谷歌已经开始内部测试,并有
02-16
马斯克锐评人工智能:是人类最大的威胁之一,程度超过核技术
2 月 16 日消息,最近大火的 ChatGPT 显示人工智能已经得到了令人难以置信的发展,而根据埃隆-马斯克的说法,这是我们都应该担心的事情。马斯克在阿拉伯联合酋长国迪拜举行的世界政府峰会上,在提到 ChatGPT 的发展后对与会者说:“对未来文明的最大威胁之一是人工智能
02-16
芯片巨头台积电失宠,狂甩其股票的不只有巴菲特
北京时间 2 月 16 日消息,芯片代工巨头台积电正在失去机构投资者的宠爱,狂甩其股票的不只有“股神”巴菲特。监管文件显示,投资公司老虎环球基金、贝莱德集团、摩根大通、GQG Partners 以及资本集团也是第四季度台积电股票的大卖家。台积电当地时间周二,巴菲特旗下伯
02-16
点击查看更多 +