ChatGPT-4震撼发布!能识图和逻辑推理,靠自己考上斯坦福
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
一觉醒来,GPT-4突然间就来了,而这距离【【微信】】的发布,才仅仅过去了四个多月。
此前,曾传闻GPT-4有100万亿参数,比现在的【【微信】】强大500多倍,不过这一说法很快被辟谣。近日,OpenAI的CTO曾经对媒体表示,让大家“少一些关于GPT-4的炒作会更好”,而从今天发布的GPT-4来看,这句话多少带点欲扬先抑的意味。在发布的博文中,OpenAI这样表示:
GPT-4是OpenAI努力扩展深度学习的最新里程碑,它是一个大型多模态模型(接受图像和文本输入,提供文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平。
GPT-4都强在哪里?
加入图片识别功能和外界此前的猜测一样,GPT-4是一个多模态大型语言模型,不再仅仅处理文本数据,对图片也有了理解能力。但相比于此前各大科技公司推出的多模态模型,GPT-4可以说是遥遥领先。虽然官方表示,GPT-4现在只开放了文字输入的功能,图片输入功能还在加紧开发中。但在官方的文章中,OpenAI给出了几个使用范例,如说明图片的内容、分析图表、解答图片内的考题、找出图片不寻常的原因等,已经让人大开眼界。
在OpenAI官方发布的视频中,GPT-4通过识别上图中随便画出的草图,就识别出了这是一个关于网站的草图,然后“顺手”生成了建成这个网页的全部代码,再然后...一个网站就这样建成了。
强大的推理能力
还有一个官方示例也值得一提,当被问到下图的笑点在哪里时,GPT-4的回答更是让人惊叹:“这张图片中的幽默来自于将过时的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法”,从这一回答中可以看出,GPT-4所具备的推理能力已经有了大幅度提高。
一直以来,人工智能虽然表现出了强大的能力,但逻辑推理依然是人类区别于AI的最显著特征,而GPT-4表现出的逻辑和推理能力,需要所有人开始重新思考人类区别于AI的本质到底是什么。
支持更长的输入和输出相比于【【微信】】,GPT-4可接受的文字输入长度增加到3.2万个Token,约2.4万单词,同时也支持更长的输出,大约能处理长达25000字的文本,这使得更多的应用场景变为可能,例如长文本的创建、超长对话和文档的搜寻和分析等,仅需一次对话,就足够写一部剧本或者短篇小说了。
考试能力超过90%人类对于GPT-4来说,最强的并不是视觉能力的加入,因为很多的多模态模型早就已经做出了类似的功能,其最亮眼的功能是它所表现出的推理能力,在GRE、SAT和美国法学院考试等我们较为熟悉的美国考试中,GPT-4的得分几乎和人类考生没有区别了,其中,GPT-4在模拟律师考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。在GRE考试中的数学部分,满分是170分,GPT-4获得163分,而上一代GPT-3.5得分为147分,在GRE语言部分,GPT-4得分为169分,GPT-3.5得分为154分。
也就是说,GPT-4已经可以靠自己考上斯坦福大学。
从下图中也可以看出,GPT-4相比于GPT-3.5,在多项专业考试中都有了巨大的提升(绿色部分为GPT-4提升的部分)。不过,OpenAI官方也警告说,新版本还不完美,在许多情况下,它的能力不如人类。
支持更多语言许多现有的机器翻译的基准测试都是用英语编写的。而为了初步了解 GPT-4 在其他语言上的能力,OpenAI的研究团队还使用Azure Translate将MMLU基准翻译成多种语言,这套基准涵盖了57个主题的14000个多项选择题 ,在测试的26种语言的24种中,GPT-4全部优于GPT-3.5和其他大语言模型。
以上这些也仅仅只是OpenAI官方示例的一小部分,OpenAI的总裁和联合创始人还展示了GPT-4有关总结文章、写代码、报税、写诗等一系列能,可以说GPT-3.5做不到的, GPT-4大都可以轻松解决。
微软新必应早已用上GPT-4
GPT-4发布之后,微软在第一时间表示:“如果你在过去五周内的任何时候使用过新的 Bing 预览版,你就已经提前了解了 OpenAI 最新模型的强大功能”。是的,新版必应搜索早已经用上了GPT-4,在过去五周中,很多人体验的必应就是GPT-4加强过的,只不过仅仅开放使用了文字能力而已。虽然微软没有用全球首发的字眼来描述,毕竟微软在【【微信】】上已经投入了130亿美元(约合人民币900亿元),换来的这样的待遇也是情理之中。
在搜索上,微软的必应长期以来都无法跟谷歌相竞争,市场份额更是差了一个量级,但是随着【【微信】】的问世,微软率先接入使用,CEO纳德拉表示他们的搜索已经优于谷歌了。而这次GPT-4也被曝用在了必应搜索中,不知道谷歌方面是否依然还能“坐怀不乱”。
可以说,微软是【【微信】】和GPT-4的最大赢家。在过去的两年里,OpenAI重建了整个深度学习堆栈,并利用微软的Azure设计了一台超级计算机,以便于应对他们超高的工作负载,通过此前获得的经验,GPT-4才能快速而稳定的完成了GPT-4的训练,也为微软的云服务赢得了更多的业务。
如何才能用上GPT-4
目前,如果想要体验GPT-4的强大功能,有三种方式可以选择:
1.花费每月20美元订阅【【微信】】 Plus直接体验
2.加入等候列表排队申请内测,等待API开放
3.申请加入开源的【【微信】】,共同参与改进GPT-4的效果
同时,OpenAI表示已经与许多公司进行了深度合作,将GPT-4并入它们的产品中,包括Duolingo,Stripe,Khan Academy等,有科学上网方式的用户,未来也可以在更多的产品中直接体验到GPT-4。当前,使用GPT-4的定价是每1k prompt tokens 0.03美元,每1k completion tokens 0.06美元,默认速率限制在每分钟40k tokens和每分钟200个请求,价格虽然有所上升,但相比于【【微信】】来说,返回文本的速度也有了大幅度提高。
此外,OpenAI表示, 在比较简单的对话中,GPT-4的表现和之前的【【微信】】相比不会差太多,但在复杂的问题上,答案的合理性、正确性等方面都更加优秀。因为GPT-4至少经过了6个月的“安全训练”,目前相比于GPT-3.5,有82%的可能性不会对不允许的内容进行回应,40%的可能性会提供基于事实的回应。也就是说,相比于此前对于某些问题一本正经的胡说八道,GPT-4“幻想”出来的内容的少了很多,但依然有可能会出现。因此,强烈建议在使用GPT-4的服务时,如果是重要性较高的内容,最好还是把GPT-4作为辅助,同时加以人工校对。
写在最后
这次,OpenAI并没有公布具体模型大小的细节,也没有公布用来训练模型的硬件,理由是出于“竞争原因”。没有了数据、模型和算力的对外参考,OpenAI已经构建起了自己更宽更深的“护城河”能力,也侧面说明了新一轮的科技军备竞赛已经打响。
当国内各大企业还在抢发“中国版【【微信】】”的时候,GPT-4的突然发布,让复现GPT-3.5和【【微信】】的各类工作都在瞬间黯然失色。在这个时候,不仅谷歌等科技大厂需要思考为什么会落后于仅有三百多名员工的OpenAI,每个人也都需要思考未来的创新到底是什么样子。返回搜狐,查看更多
责任编辑:
ChatGPT-4发布,OpenAI CEO的“另一个儿子”Worldcoin也有新动作
chatgpt,chatgpt官网,chatgpt国内能用吗,chatgpt在线原文:《OpenAI CEO和a16z投资的Worldcoin,今日入局身份协议层》
作者:念银思唐
伴随着 ChatGPT 的火爆,其背后开发公司 OpenAI 的 CEO Sam Altman 名声大噪。而他在 2021 年联合创立的一个加密货币项目也于近期再次活跃起来,并于今日公布了最新进展。
首次亮相,志在实现“全民基本收入”
这个名为“Worldcoin”的项目在2021年6月首次向大众公开,并宣布完成2500万美元融资,获得了a16z、Coinbase 【【微信】】、LinkedIn创始人Reid Hoffman、Day One 【【微信】】等多位知名投资方的支持。
报道称,Worldcoin计划发行一种全球性的数字货币,通过其开发的一种状似篮球的银色装置(Orb)扫描虹膜来形成独特的个人识别码,以确定个人身份。据介绍,虹膜扫描可防止用户重复注册,但为了保证隐私性,Worldcoin将尽量使数据使用方式透明化,在完成扫描后相关图像将被永久删除。
当时,Worldcoin已经开始在多个城市小规模测试该装置,因为还未正式发行,Worldcoin向志愿者支付比特币等加密货币来换取一些使用反馈。据称,该装置原型机不到20台,当前成本为5000美元,但随着工艺改进,成本将大幅下降。
Altman接受采访时表示,他是在2019年底受到流行经济理论“全民基本收入”(uni【【微信】】,简称UBI)的启发而产生了这一想法,即使用加密货币公平地分配资金。Altman是Worldcoin的第一位投资者,但他表示自己不参与公司的日常运营,主要是在需要时担任公司的顾问。
该项目的实际负责人是Alexander 【【微信】】,他与Altman和Max No【【微信】】共同创立了Worldcoin。Altman和Max No【【微信】】曾在Ray Dalio的投资机构Bridgewater Associates LP和转账初创公司Wave工作。【【微信】】表示,公司正在评估如何才能有一天让尽可能多的人使用加密货币:“世界上还有很多人还没有进入金融系统,而加密货币有机会让我们实现这一点。”
当年 10月,Worldcoin称正在部分地区进行实地测试,当时项目估值已经达到10亿美元。
理想丰满现实骨感,后续发展困难重重
然而该项目的后续发展并不顺利。2022年3月,在当地承包商离开及因法规禁止开展业务后,Worldcoin暂停了在多个国家/地区的运营计划,而且一再推迟其目标发布日期。
当时该公司已经收集大约20个国家数十万人的眼睛图像,但这一过程一直受到各地智能手机使用情况参差不齐、用户困惑和欺诈企图等问题的困扰。
尽管如此,Worldcoin仍然试图筹集更多资金以推进其计划。有报道称,该公司当时正以30亿美元估值进行1亿美元代币融资。
同年8月,Worldcoin联合创始人兼首席执行官Max No【【微信】】离职,并创办初创公司Mana,旨在建立链上自主运行的AI风险投资协议。
之后Worldcoin便一直保持沉默――无论是项目开发进展还是融资进程。
几乎快要被遗忘的时候,Worldcoin今年再次出来发声了。2月上旬有报道称,它正在与包括主权财富基金在内的投资者讨论新一轮融资事宜。Worldcoin希望以30亿美元估值筹集至多1.2亿美元――这一估值与去年相同,本轮融资将包括股权和代币融资。在当前市场环境下,这一融资规模无疑令人瞩目。
再启航,向协议层扎根
在寻求融资的消息披露后一个月,Worldcoin便公布了项目的最新进展,包括World ID协议和软件开发工具包(SDK)。
World ID被描述为Worldcoin的“底层身份协议”,由零知识加密技术提供支持,是一种移动工具,人们可以用来证明自己的身份而无需牺牲匿名性。虹膜扫描硬件Orb是用户获得验证的主要方法,不过,他们也可以使用电话号码验证等工具,但后者的准确性较低。
“这是一个去中心化和隐私优先的协议,”Worldcoin主要软件贡献者Tools For Humanity的产品、工程和设计主管Tiago Sada在接受采访时表示,“就像人们可以拥有自托管的钱包一样,有了它,人们可以拥有自我保管的ID,任何信息都在设备上,它通过零知识证明来对自己进行验证。”
用户可以在任何兼容的移动钱包上获得World ID。其中一个选择是World App,目前该程序仍处于测试阶段。
Orb验证现主要局限于阿根廷、智利、印度、肯尼亚、葡萄牙和西班牙,今年晚些时候将会更广泛地推广该设备。与此同时,大多数国家都可以使用移动验证。
World ID最简单的用例是登陆(也就是身份验证)。该技术的其他潜在用例还包括社交网络中的机器人保护和审核、在DAO中投票、支持无抵押贷款、忠诚度计划和优惠券、市场评论还有福利分配。该技术的首次展示将集中于对Discord的验证。
“这可能需要更多人的想象力来思考你可以用它做什么。当iPhone问世时,你根本想不到Uber。”Sada补充说,“这是一种基本的原语。它会一直存在。而Worldcoin就是要确保它以一种去中心化和保护隐私的方式存在。”
至于SDK,开发者已被邀请注册加入一个等待列表,以便尽早访问该产品的测试版,该测试版对任何人开放,包括一个微件、开发者门户、开发模拟器、示例和指南。
在争议中行进
一旦跟用户身份扯上关系,隐私就必然会成为头号担忧。Orb在2021年6月的发布引起了主要隐私倡导者的强烈反对,包括爱德华・*登(Edward Snowden),他警告人们不要将生物识别数据用于任何事情,并补充说人体不是“打票机”。
Worldcoin后来试图通过使用零知识证明技术消除生物识别注册阶段和钱包之间的联系来缓解这些担忧。然而,Sada认为对该项目的担忧仍然存在。
“还是有很多误解,”他说,“很多人不知道你的生物特征数据会在Orb中被销毁。”也就是说,除非用户选择存储自己的生物特征数据――尽管这有助于改进协议,但Worldcoin并未鼓励用户这样做。
“虹膜代码是唯一离开设备的东西,”Sada继续说道,“虽然这听起来有点令人生疑,但World ID确实是最私密的身份。我认为它在许多方面也是最具包容性和可扩展性的。”
Sada还表示,如果有更好的工具来证明一个人的独特性,考虑到制造硬件的限制,Worldcoin也会二话不说放弃Orb。事实上,Tools for Humanity有一个团队正在积极寻找这样的解决方案。
但就目前而言,Orb的开发仍在继续。Worldcoin正在通过一个提供奖励的运营商程序加大Orb的分发力度。根据官方今日发布的公告,目前Worldcoin已有130万注册用户。
不过,Sam Altman作为Worldcoin的最大“光环”,尚未有任何表态。如前所述,Altman已经表示自己不参与公司的日常运营,主要是在需要时担任公司的顾问。但他的存在还是会让人们抱有期待:一旦Worldcoin与AI结合,势必能迸发新的火花。
伴随着这次项目的重大进展公布,Worldcoin是否能够顺利完成融资乃至正式发布,我们不妨拭目以待――眼下的加密行业亟需这样的好消息。