openai公司总共多少个人 OpenAI创始人
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
本文来自微信公众号“硅星人”(guixingren123),作者:光谱 杜晨
硅星人的读者应该都对 OpenAI 比较熟悉了。这家总部位于旧金山的实验室,是 AI 基础科研领域的全球领导者之一。它开发的 GPT 语言生成模型,一次又一次刷新人们对于深度学习能力的认知。OpenAI 原是非营利机构,但为了更好地实现产研结合,用期权留住员工,之前也成立了有限营利的公司。
不过在去年12月,OpenAI 一批早期/核心员工集体离职,在领域内引起了不小的轰动。这次“出 OpenAI 记”并非普通的跳槽,相关离职人员也保持了很长时间的缄默,以至于圈内人士都不知道他们接下来有何打算。
最近,这批 OpenAI 前核心员工终于宣布了他们前所未有的伟大计划:解决长久以来神经网络的“黑盒子”问题,为研究者们开发能够解释 AI 真正工作原理的工具。
他们创办了一家新公司 Anthropic,致力于提高 AI 安全和可解释性。这些创始成员相信,“通用人工智能” (artificial general intelligence) 不久后即将到来,而 AI 安全将会成为日最重要的研究方向。
这家新公司也被投资者赋予了极大的期待。据了解,其 A 轮融资已经完成,规模高达1.24亿美元,投资人包括 Skype 创始人 杨・塔林(领投)、 埃里克・施密特、达斯汀・莫斯科维兹等。
Anthropic 到底是一家怎样的机构?它的创始成员都有谁?它在做的事情对于整个 AI 基础和应用领域有何重大意义?让我们走近这家最近刚刚离开隐形状态的全新机构,一探它的真相。
AI 一直是一个“黑盒子”。尽管人们形容神经网络是按照人脑神经工作原理设计的,它具体怎么工作,输入的数据是如何转化成输出的,具体的原理和各环的作用,一直很难被真正解释。
在一小部分研究者看来,考虑到 AI 正在被应用到越来越高风险的系统当中,比如自动驾驶、医疗诊断、药物发现,甚至军事当中……它的不可解释性将会阻挡技术的真正进步,并且如果被持续忽视的话,甚至可能会引发不可逆转的严重恶果。
不过,自从深度学习在十年前左右取得重要突破,这项技术已经成为了 AI 技术进步的根基。越来越大的模型、更强的算力,让 AI 变得似乎“无所不能”,而不可解释性一直没有被公众看作是大问题――这也是为什么虽然目前 AI 领域内很多人,特别是那些从事应用领域的,并没有关注 AI 的黑盒子问题。
2015年底成立的 OpenAI,其使命是实现通用人工智能,打造一个能够像人的心智那样,具有学习和推理能力的机器系统。成立以来,OpenAI 一直从事 AI 基础研究,主要以 GPT 语言生成模型(特别是 GPT-3)被人们所熟知。
但其实,增强 AI 的可解释性,让它能够更加安全地应用,也是 OpenAI 的研究方向之一。只不过,这部分工作在名气更大的 GPT-3 的面前,似乎显得没有那么重要。
而在去年年底离职的这一批员工,认为随着模型变大、算力变强,通用人工智能离我们越来越近,在可预见的未来就有可能实现――而在这样的前提下,AI 可解释性和安全性变得无比重要。这批员工,被认为是AI领域的“有效利他主义者”。简单来说,他们不仅认为应该投入重金进行 AI 基础研究让世界变得更好,并且也要注重实际功效。
他们的理念和 OpenAI 并没有本质上的冲突,但是 OpenAI 变得越来越不透明,且逐渐功利化的趋势,令他们感到担忧。一个最直接的例子,就是 OpenAI 尚未解决偏见和安全问题,就把 GPT-3 开发成了商用化的 API,提供给行业里的大公司使用。
最终,这批核心员工在去年年底集体离职。其中不少人,都参与到了今天硅星人介绍的这家 Anthropic 公司当中。
所以其实这样解释 Anthropic 可或许更准确一些:一家重拾 OpenAI 慢慢忘却的初心的“正统” AI 基础科研机构。
Anthropic 的官网这样介绍自己:我们是一家AI 安全和研究公司,致力于开发可靠、可解释和可调整的 AI 系统。“今天的大规模的通用(AI)系统能够带来很高的收益,但他们同时却是不可预测、不可靠,和不透明的。我们的使命是在这些问题上做出进步。”
“Anthropic 的使命是从事基础科研,让我们可以打造能力更强、更通用、更可靠的 AI 系统,并且应用这些系统从而让人类获益,”Anthropic 联合创始人兼 CEO Dario Amodei 表示。
对于“神经网络到底是什么”这类问题,通常的白话答案是“一种模仿人脑神经工作方式的计算系统”。然而很多专业人士都不愿意提及的是:我们对人脑的工作原理至今并未完全了解。
而深度学习领域的现状是:我们正在疯狂地把这些“一知半解”的知识用于神经网络,并且把这样开发出来的 AI 系统用于越来越高风险的场景,却又缺乏对可解释性,对安全的思考。
比如,我们知道一个神经网络的参数量越大、泛用性似乎就越强,但无法解释某几个参数之间的关系到底是什么,进行怎样的调整会导致输出结果怎样变化;再比如,我们知道偏见在社会中客观存在,也必然会投射到社会资料聚合而成的数据集当中,而为数据集是 AI 系统带有偏见的重要原因,但除了低效地改善数据集之外,我们对于消除 AI 系统的偏见暂时别无他法。
Amodei 接受美国媒体 Vox 旗下 Future Perfect 采访时表示,AI 研究人员应该增加对机器学习系统内在工作原理的了解,并且用这些知识来开发更安全的系统,而不是执迷于“放卫星”似的盲目开发越来越大的神经网络。
为什么呢?举个例子:深度学习有一个经典的激励“扭曲”现象,比如你想让机器 agent 走出迷宫,设计分数(豆子)激励它――结果它执迷于获得更高的分数,遍历了每一条错误的路,吃掉了所有的豆子,却从未将走出迷宫当作真正目标。
当神经网络变得更大、更强,如果中间出现了某种主观或客观导致的激励扭曲,它真正做的事情和它的设计初衷之间的差距只会越来越大,应用在现实场景中,有可能导致严重后果。
如果我们能够获得一种工具,能够更清楚直白地了解神经网络的工作原理,知道如何调整网络的哪个部分,能够避免此类情况,对于接下来的 AI 进步将有很大帮助。所有研究者都希望掌握这个工具,但问题就在于,我们现在并没有这样的工具。
而 Anthropic 的任务就是开发出这样的工具,并把它送到更多 AI 研究者的手上。
去年年底从 OpenAI 离职的核心员工当中就包括 Dario Amodei 和他的同胞姐妹 Daniela。LinkedIn 资料显示,他们于今年2月创办了 Anthropic 公司,Dario 任 CEO,Daniela 任总裁。
Dario是 OpenAI 的早期员工之一,曾发表多篇 AI 可解释性、安全等方面的论文,离职前在 OpenAI 担任研究 VP。在此之前,Dario 还曾在百度担任研究员,在前首席科学家吴恩达手下工作。他博士毕业于普林斯顿大学,后回到本科毕业的斯坦福大学担任博士后学者。他是 OpenAI 的前核心成员,也被认为是深度学习领域最为前沿的研究员之一。
Dario 的胞妹 Daniela Amodei 之前也在 OpenAI 从事和 Dario 相同方向的工作,曾担任安全和政策 VP。Daniela 过往的任职经历包括 Stripe(其创始人是 OpenAI 投资人之一)、美国国会等。
Anthropic 的创始团队成员,大多为 OpenAI 的重要员工或关联成员,包括(排名不分先后)Jared Kaplan、Sam McCandlish、Tom Brown、Gabriel Goh、Kamal Ndousse、Jack Clark、Ben Mann、Chris Olah 等。
这些研究员曾参与 OpenAI 其多项重要课题研究,包括 GPT-3、“显微镜”神经元可视化工具、神经网络里的多模态神经元、AI 模型安全设计事故分析、引入人类偏好的强化学习等――失去这些关键人员,OpenAI 未来在相关课题上或将略显颓势。
举一个例子:Chris Olah 是 OpenAI 多模态神经元论文的作者之一。他是领域里小有名气的“怪胎”,曾经拒绝 Yoshua Bengio 的研究生邀请,而是去了 Google Brain 团队。他在谷歌带过博士生,论文的引用数量甚至超过拥有博士学位的研究者,自己却连本科都没毕业……
简单介绍一下 Olah 参与的 OpenAI 多模态神经元论文:多年以前有研究者发现,大脑中的一些神经元可以对模态不同但概念相同的触发条件产生反应,比如当提到“哈莉・贝瑞”的名字、照片、简笔画像的时候,同一个神经元都可以产生反应。
OpenAI 的多模态神经元研究,基于该机构今年发布的 CLIP 泛用性视觉系统。论文作者发现在 CLIP 的神经网络倒数第二层也存在这样的一颗“神经元” (Neuron 244)。这项研究预示着,“抽象”这一自然视觉领域的概念,很可能在计算机合成视觉领域同样存在。
有着如此强大团队,Anthropic 成为了投资者眼中的最新热门标的。目前该公司已经完成了规模高达1.24亿美元的 A 轮融资,并正式走出隐形状态。
A 轮的领投者是 Jaan Tallinn,原 Skype 的联合创始人。Tallinn 还是 DeepMind 的早期投资人。
(他能“击败”一众其它科技大佬/大牌投资人,拿到领投资格,一个重要原因应该是他和 Anthropic 创始团队哲学理念一致,是“有效利他主义”运动的主要资助者之一。)
Anthropic 的其它投资人还包括 Dustin Moskovitz(Asana CEO、Facebook 联合创始人)、埃里克・施密特(谷歌前董事长、CEO)、詹姆斯・麦克雷夫等,绝对是相当豪华的投资人阵容了。
Anthropic 表示公司的钱主要花在计算密集型的基础科研上,虽然未来也有商业化的打算,短期内不会作为主要目标。但不管怎样,A 轮 1.24亿美元的融资规模,足以表明 Anthropic 的投资人预期它的估值完全有追赶 OpenAI 的希望。
在这个 AI 基础科研得到比以往更多关注的时代,Anthropic 无疑将成为 OpenAI、DeepMind 的有力“竞争者”,和一家值得继续密切关注的研究型公司。
openai商业化 openai创始人
openai是哪个公司的,openai和chatGPT什么关系,openai在您所在的国家不可用,openai services are not available近日,谷歌已向生成式人工智能公司Anthropic投资约3亿美元(约20亿人民币),并获得该公司10%股份。据香港IDC新天域互联了解,Anthropic被认为是OpenAI的竞争对手之一,该公司由前OpenAI研究人员于2021年创立。目前,Anthropic正在开发名为“Claude”的生成式AI聊天机器人。虽然它仍旧在开发阶段,但似乎是作为OpenAI ChatGPT替代品来设计的。
在谷歌对Anthropic进行投资之前,该公司已经募资超过7亿美元(约47亿人民币),其中它最大的投资者为FTX创始人Sam Bankman-Fried所创立的加密对冲基金Alameda Research,投资金额达5亿美元(约33亿人民币)。通过此次合作,使谷歌这样的大规模企业接触到最前沿、最知名的人工智能系统,也能使作为初创公司的Anthropic获取谷歌所提供的一流金融和云计算资源。谷歌云还可为Anthropic即将推出的人工智能产品提供先进的人工智能芯片和计算能力。上个月,微软证实将对OpenAI进行“多年、数十亿美元的投资”。两者最早在2019年已有合作,微软在2021年还对其进行了第二次投资。
openai创始人 openai 团队创立经历
openai和chatGPT什么关系,openai services are not available,openai 百度百科,openai为什么在中国用不了本文经O'Reilly授权发布
大数据文摘字幕组作品
翻译:虫2、大力、DollyShi
监制:钱天培
1901年,天文学家、数学家Simon Newcomb表示,人类不可能造出比空气更轻的飞机。1908年,莱特兄弟的飞机试飞成功。
二战过后,美国人公开表示,长距离火箭遥不可及。没过多久,俄罗斯的巨型火箭率先进入了外太空。
时间转到今天。当AI浸入各行各业的同时,对AI的质疑也纷至沓来。AI寒冬是否又会再次到来呢?OpenAI的联合创始人兼CTO Greg Brockman在近日的一次演讲中发表了他的看法:
不想看视频的同学,可以阅读下面的文字哟~~~
“AI最终能达到什么样的高度,我现在还无法下一个定论。但目前的质疑呢,我看大多是不靠谱的!”
他从“科学发展史”、“AI发展史”、“深度学习的极限”和“算力极限”四个方面阐释了他的论点。
科学发展史
有啥疑问,直接找专家呀!他们的观点大多错不了。
但历史一遍遍证明,专家们错得可是太离谱了。
在1901年天文学家、数学家Simon Newcomb表示,比空气更重的飞机是完全不可能的。于是在1908年 他知道了莱特兄弟的飞机。
没关系,他承认这是可能的,但是他认为,这永远不可能商业化,因为这样的飞机不可能扩大到可以容下一个乘客和一个飞行员。于是又被啪啪打脸了。
二战后,美国人和俄罗斯人都关注了德国的V-2科技,这两国都想做同一件事那就是建立ICBM(An intercontinental ballistic missile,洲际弹道导弹),这意味着他们要扩大原本V-2火箭的规模十倍以上,造一个200吨的火箭。
美国人看到这,认识这完全不可能,就在接下来的五年里完全放弃了长距离火箭。
俄罗斯人说,可以没问题,因为我们就是要造一个巨型火箭。当太空比赛开始时,俄罗斯人说,看吧,我们已经有这个巨型火箭了!于是,俄罗斯人率先进入了外太空。
专家们在很多方面确实有很多先见之明,但是不能因为有人说了一些什么,就终止了某一领域的研究。
AI发展史
接下来,让我们来回顾一下AI发展史。
AI是一个讲究潮流的领域,这个领域里有多种多样的潮流。比如,某一个十年非常流行SVM(支持向量机),下一个十年,又流行别的模型了。
现在我们正处于最新潮流中,下一个十年又会流行别的。这话没错,这个过程是持续的,目前看不到尽头。那就让我们来挖一挖,这几十年AI到底经历了哪些潮流。
1959年,perceptron(感知机)被公开发表了。不止科学杂志疯狂报道,连纽约时报也写到:“像感知机这样神奇的东西,有一天它能识别人叫出他们的名字,并且在多种语言间实时翻译。”
1960年代,以Marvin Minsky和Papert为代表的人强烈反对感知机,发起各种运动,并且最终成功了。
在1969年他们表了一本书,里面证明了多种感知机无法解决的基本问题。
因此所有研究经费断供,所有基金断供。AI第一次寒冬来临。
这一波经费究竟被用到了哪里了?很大一部分其实被用来构建更大的电脑了。
二十年后的80年代,反向传播开始流行。
有趣得是,反向传播吸引来的人不是计算机科学家,而是认知科学家。他们真正激动的不是关于如何建造大型系统,如何拓宽这些技术的边界,而是关于理解大脑。他们非常乐意接受这样一种人造的系统,能够对他们的研究有那么一点关联。
由于算力的限制,反向传播一度也经历了大量质疑。但今天,在空前算力的支持下,反向传播将AI带到了全新高度。
深度学习的极限
所以,深度学习发展的极限是什么呢?
有很多人已经对此发表过看法了。一个很好的例子是,去年一位杰出的深度学习评论家说:深度学习模型将永远不能学会长距离规划,不论你用多少数据去训练它。
今年,我们在Dota比赛里展示了OpenAI Five,也就是Dota系统的长期规划能力。
一个月后,那个评论家又说,你可以用足够密集的空间样本来解决任何问题,但只有当你的数据量很小的时候才有趣。
我认为,看看过去几年结果的具体例子是很有启发性的,然后让我们想想:人们对之前的深度学习的局限性有什么看法,对之后的又有什么看法?
在深度Q学习出现之前,我们感觉深度学习仅仅是关于静态数据集的。突然,我们把神经网络投射到屏幕上面,然后给出一个分数,然后它开始能够玩转这些简单的游戏。
再举个例子。之前人们说,深度学习只会感知,永远也做不到最难的自然语言处理任务比如翻译。结果又被打脸了。
我们也许可以得出这样的结论,深度学习会取代所有的监督学习,并且在这些特定的领域内胜过人类的聪明才智。比如AlphaGo,比如我们的Dota工作。强化学习仅通过自身就能解决这个难以置信的难题。
当然,你仍然可能会产生这样的质疑:我们如何把这个东西应用到现实世界中去?强化学习是不是只会玩游戏呢?无论任务是怎么样的,我们都需要有一个完美的模拟器吧。
今年,我们用Dota系统训练了一个机器人,真的就是用Dota系统来指向这个环境。然后,我们可以教会这个机械手臂操纵小方块,这是一个人类程序员无法完成的任务――制造这种机械手的公司做这个已经有20年了,现在每年大概才卖出10个,因为没有程序员能实现这样的功能。
所以,你甚至不需要一个完美的模拟器,你只需要一个刚好能够完成手头上任务的模拟器。
我想我们都听过这个说法,人工智能的进步有三大支柱:计算、算法和标记数据。
但是现在,如果你再看一遍这个说法,你会发现“标记数据”其实也不是必要的。
比如今年,自然语言处理(NLP)领域最新研究表明,你可以让一个模型在大量无监督文本上学习,然后使用非常少量的监督数据进行了微调,这样你就能够在各种各样的NLP任务之间设置最先进的技术水平。
所以说,深度学习的极限真的很难被定义。
算力极限
最后,我们再来看看算力极限,这大概是近年来限制AI发展的关键要素之一。
如果我们看看过去六年里发生了什么,就会发现计算经过了一个疯狂爆炸式的增长。每三个半月,我们的算力就会翻一倍。
怎么理解增长速度呢?就像在2012年的时候,你的手机电池只能坚持一天。在2018,它就能坚持800年的时间,到2023年,它能坚持一亿年的时间。
再换一种方式来理解,一个2023年的未来系统在30秒内消耗的计算量,将会相当于我们今天的Dota系统一个月的计算量。
这个数字太疯狂了,看起来有点不可理喻,但是这样的事情其实已经发生了。20世纪90年代的大规模成果之一TD GAM,在一个现代的GPU上计算大约只需要5秒钟。
所以我们把这些事情合起来看,可以得到的结论是:我们也很难去界定算力的极限。
我们真的很难说有什么是做不成的,这意味着我们需要开始积极主动的思考,这些系统将会给世界带来什么样的影响?
在畅想人工智能时,我们应该少依靠直觉,多依靠证据和假设。
我们都在创造自己认为的会对未来产生巨大影响的技术,所以我们要对这事情好好负责!
还没看够?明年的O'Reilly和Intel AI Conference将于2019年6月18-21日登陆北京!
大数据文摘作为O'Reilly官方媒体合作伙伴,火热开启征集讲师和议题,想要加入这场全球最IN的AI盛会吗?点击阅读原文了解如何成为大会讲师。
征集截止在即,跑步入场还不晚哦。(报名咨询电话:010-88097476)