开普云发布平台开普云代码

张朝阳、周鸿祎、王慧文高手过招，有人扬言要“打造中国OpenAI”，你更看好谁？

周鸿祎张朝阳,周鸿祎说张朝阳有很多90后女朋友,周鸿祎说张朝阳

总有人愿意将中国互联网企业之间的博弈斗比喻为江湖上的高手过招，而那张拍摄于2017年的乌镇，史称“东兴饭局”的照片，更是形象地记录下了中国互联网最鼎盛时期的明争暗斗。

照片里，马化腾位居主位，刘强东、王兴分居两侧，彼时，号称“美团二号人物”的王慧文在照片的右下角，旁边紧挨着摩拜创始人王晓峰和知乎创始人周源。“东兴饭局”六年之后，互联网江湖地覆天翻，有人急流勇退，有人再度走向浪尖。

2023年，因为ChatGPT，故事忽然有了续集。2月13日，已经退休两年的王慧文带着一纸“AI英雄榜”重回大众视野，自称中国互联网化石的张朝阳和低调已久的周鸿t也开始畅聊ChatGPT的出圈，百度、京东、阿里纷纷入局，中国互联网，似乎因ChatGPT而掀起了一场久违的狂欢。

6天，5条AI朋友圈

“即便只有一个人，我也要出发。”

2月13日上午9点13分，王慧文在自己的朋友圈写下了这样一段话，配图是一张名为AI英雄榜的招聘贴，王惠文说，要“打造中国OpenAI”。

这是王慧文6天、5条AI朋友圈之一，也是这些“AI宣言”中比较具体的一条。“关于人工智能，到现在为止，我只有一个判断，必须参与”“大人虎变，君子豹变，小人革面，理个发，作为革面，迎接AI新时代”。

这次复出，王慧文很急，也很亢奋。

2月8日-13日，王慧文几乎保持着日更的频率，对于AI的态度，从8日的“迎接新时代”，到9日的“必须参与”，到10日的“5000万美元带资进组求组队”，再到12日的“想法前进一步，应该匹配一个全新生命体”，光速转变。直到13日，“AI英雄榜”成型。

近期，美国人工智能研究公司Open AI旗下的智能聊天工具ChatGPT风靡全球，惊动科技圈，也惊动了“退休”的王慧文。

2020年12月18日，王慧文选择以退休的方式离开美团。那一年，王慧文42岁。

王慧文的身上，有撇不去的美团标签。与王兴联手打造美团的十年里，王慧文曾带领美团从血雨腥风的“千团大战”中突围，组织了外卖大战史上有名的“抢滩会”，攻下本地生活、探索网约车等，成为中国互联网创业史上浓墨重彩的一笔。

王慧文是王兴清华大学同宿舍的同学，2010年12月18日，王慧文加入美团，也开启了后者的“狂奔十年”，二人一度被称为美团的“二王”。

十年后的同一天，仿佛为了一场仪式感，王慧文选择了离开。在双方的告别信里，王兴管王慧文叫“老王”，王慧文则称王兴为“兴哥”。

“老王”把自己的退休归因于个人的散乱不稳的兴趣，不希望人生被惯性主导，怠于熟悉的环境而错过了不同的精彩。

如今看来，不安分的性格注定了其与AI的不期而遇。退休的两年时间里，王慧文或许一直在寻找他所认为的精彩。

“AI英雄榜”首发于社交媒体即刻，在即刻上，王慧文介绍自己的签名是“正在学习人工智能”。据悉，在这之前，王慧文的签名是“正在学习Crypto”。

Crypto即加密货币，王慧文对于Crypto的讨论主要集中在2022年4-11月，期间还穿插了对Web3的评论，而他最新加入的圈子也叫做“Web3研究所”。

在发布“AI英雄榜”之前，王慧文在即刻的最新一条帖子停留在2022年11月，内容是对于Crypto下个周期的探讨。但在微信的朋友圈里，更能直观地感受到王慧文对于拥抱AI的激动。

光年之外，不是意料之外

王慧文回来了，只是回的不是美团，而是科技圈。根据“AI英雄帖”的内容，王慧文要出资5000万美元设立北京光年之外科技有限公司（以下简称“光年之外”），公司估值2亿美元。王慧文不占股份，资金占股25%，75%的股份用于邀请顶级研发人才。

天眼查显示，光年之外成立于2018年7月，是一家以从事科技推广和应用服务业为主的企业，注册资本100万元，王慧文100%持股。2022年4月，光年之外还进行了简易注销的申请。

看得出来围绕“光年之外”的创业王慧文早有准备，而与AI的不期而遇则是说干就干。

脾气火爆，直来直去，曾是人们给这位“美团二号”人物贴上的标签，在美团的具体业务中，人们通常将他与王兴的这对组合概括为王兴思考战略，王慧文负责落地。

这种开门见山的打法贯穿到了如今的AI领域。

王慧文一方面坦言“当前不懂AI技术，正在努力学习”，一方面又直接亮出王牌“下轮融资已有顶级VC认购2.3亿美元”“各位大牛不必为资金有心，放心施展你的才华，杂事交给我来打理”。

此轮招聘只限于研发，王慧文对“英雄”开出了三个要求：业界公认顶级研发人才，狂热相信AI改变世界，坚定确保AI造福人类。

但即便是王慧文，进军AI也容易招来非议，有人看到了希望，有人则泼了一盆冷水。比如海通证券科技行业首席分析师郑宏达直言，“大模型训练一次就花500万美元”。

浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林认为，ChatGPT是大势所趋，但王慧文投资的目标是不是大势所趋就不一定了，因为AI领域关键是使用，产品出来后用户口碑是硬道理，这方面光年之外有没有能力还有待观察。

想跟上风口的，不止有王慧文。2月7日，百度官宣其类ChatGPT大模型新项目“文心一言”预计3月完成内测，面向公众开放。此后，阿里、京东、腾讯等大厂皆透露了相应的进展。

“ChatGPT的产生是从量变到质变的长期积累过程”，不久之前，搜狐创始人、董事局主席张朝阳在与三六零创始人周鸿t的一场对话中表示做出了这样的概括。

互联网圈又“卷”起来了

ChatGPT或许是一个契机，让退隐了一段时间的大佬重新回到了人们的视野，也让互联网圈又“卷”起来了。

在盘古智库高级研究员江瀚看来，ChatGPT要分几个层面去理解，首先是硬件层面，需要更多与算力相关的硬件支撑，其次数据库的建设也是必然的。从市场的角度来看，软件服务的提供商可能会出现大规模的崛起，此外，一些具体落地的应用也值得市场关注。

但互联网的世界里，从来不缺少故事。当人们在热烈地讨论着ChatGPT，讨论着AIGC的时候，似乎已经忘记了，上一个经此盛况的元宇宙已经偃旗息鼓。

而再提起区块链、NFT，更有种“时代的眼泪”一样的错觉。断定一个风口究竟是对是错很难，但跟上一个风口却很简单。毕竟谁也不能保证，错过的风口不会成为下一个时代的入口。

对于ChatGPT，有人看好，也有人看衰。独立经济学家王赤坤认为，ChatGPT的爆火出圈，为本地和全球机器学习、商业智能、自然语言处理等领域带来了大量发展机会。

由于ChatGPT有着好的自然语言理解能力和表示能

强化学习系列2：Open AI的gym框架、baselines和Spinning Up

Openai gym 是openAI用于开发和比较强化学习算法的工具包。github地址点击这里。gym安装十分简单：

也可以下载后安装：

运行下面的python代码看是否安装成功：

首先看一个游戏例子，游戏AI采用随机策略，前进1000步，如果中间游戏结束则重新开始：

会出现如下的动画：

gym 的核心接口是 env，作为统一的环境接口。env.reset()的作用是重置环境到初始状态；env.step(action)的作用是推进一个时间步长，返回 observation，reward，done，info。其中done用于判断一轮迭代是否结束；env.render()函数进行图形渲染。函数推进的过程如下图。其中step函数相当于仿真器的物理引擎，输入行动a，输出observation、reward、done、info。

接下来看gym自带的小车模型，使用Q-learning方法进行学习。模型的Observation有4个维度：

编号	名称	最小值	最大值
小车的位置	-2.4	2.4
1	小车的速度	-inf	inf
2	木棒的角度	-41.8°	41.8°
3	木棒的速度	-inf	inf

Action有2种情形：0：小车往左移动；1：小车往右移动 Reward：木棒每保持平衡1个时间步，就得到1分。 Done：每一场游戏的结束条件为木棒倾斜角度大于41.8°或者已经达到200分最终目标：最近100场游戏的平均得分高于195。

代码如下：

程序输出如下，模型在经过大约835场的游戏后，平均分数能达到了195。

这个例子中用到的一些trick包括：

使用lookuptable（q_table）存储每个状态s对应的行动a；
采取了探索策略，以一定的概率epsilon随机选取行动；
随机概率随着时间推进会衰减；
错误行动会加上惩罚；
将状态和行动转化为数字索引，以提高查询的速度。

Baselines是一个传统强化学习的资源库，github地址为： Baselines需要python3的环境，建议使用3.6版本。安装openmpi和相关库(tensorflow、gym)，mac可以使用brew安装，ubuntu可以使用apt-get，centos可以使用pip安装。

用下面的语句检查是否安装成功。如果提示缺少某个库，安装即可

安装完可进行可视化：

根据官方文档，baselines实现的算法包括：

A2C
ACER
ACKTR
DDPG
DQN
GAIL
HER
PPO1
PPO2
TRPO

spinning up是一个深度强化学习的很好的资源，其网址是：首先需要python3.6环境，建议下载anaconda3~这里要注意安装版本问题，目前使用python3.5和python3.7都存在问题。然后安装openmpi和相关库(tensorflow、gym)，mac可以使用brew安装，ubuntu可以使用apt-get，centos可以使用pip安装。接下来执行下面的步骤：

用下面的语句检查是否安装成功。如果提示缺少某个库，安装即可

安装完可进行可视化：

根据官方文档，spinning up实现的算法包括：