从入门到进阶全覆盖,这本深度强化学习好书免费读!
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
深度强化学习结合深度学习与强化学习算法各自的优势解决复杂的决策任务。得益于DeepMind AlphaGo和OpenAI Five等成功的案例,深度强化学习受到大量的关注,相关技术广泛应用于不同的领域。但是,对于一名学习者来说,市面上很少有书籍或者教程能同时覆盖从「0 到 1」和「从 1 到 N」的深度强化学习内容,学习材料非常零散。
2020 年 6 月由 Springer 发行《Deep Reinforcement Learning: Foundamentals, Research and Applications》的英文书籍。这本以通俗易懂的方式讲解相关技术,并辅以实践教学,受到广大读者的热烈欢迎,电子版本下载量已经超过了 8 万册。很多读者都表示希望能有中文(简体)版本,作者团队把书翻译成了中文简体。
为什么这本书如此受欢迎?我们先来看一下它的内容。本书分为三大部分,覆盖深度强化学习的全部内容。
第一部分介绍深度学习和强化学习的入门知识、一些非常基础的深度强化学习算法及其实现细节,包括第 1~6 章。其中第 2 章是最关键、最基础的内容。如果您已经有深度学习基础,可以直接跳过第 1 章。第 3 章、附录 A 和附录 B 总结了不同的算法。
第二部分是一些精选的深度强化学习研究题目,这些内容对准备开展深度强化学习研究的读者非常有用,包括第 7~12 章。除了深度学习的基础内容,第 7 章介绍了当今强化学习技术发展遇到的各种挑战。您可以通过阅读第 8~12 章来进一步了解不同的研究方向。
第三部分提供了丰富的应用案例,包括 AlphaZero、让机器人学习跑步等,包括第 13~18 章。 如果您是工程师,希望快速地在产品中使用深度强化学习技术,您可以根据业务场景中的动作空间和观测种类来选择最相似的应用例子,然后运用到您的业务中。
1.
微信公众号后台【AIer Hub】后台回复关键词【1017深度强化学习】,即可获取电子书资源。
你的深度强化学习第一本书!
深度增强,增强 深度,深度强化算法深度强化学习结合深度学习与强化学习算法各自的优势解决复杂的决策任务。得益于DeepMind AlphaGo和OpenAI Five等成功的案例,深度强化学习受到大量的关注,相关技术广泛应用于不同的领域。但是,对于一名学习者来说,市面上很少有书籍或者教程能同时覆盖从「0 到 1」和「从 1 到 N」的深度强化学习内容,学习材料非常零散。
2020 年 6 月由 Springer 发行《Deep Reinforcement Learning: Foundamentals, Research and Applications》的英文书籍。这本以通俗易懂的方式讲解相关技术,并辅以实践教学,受到广大读者的热烈欢迎,电子版本下载量已经超过了 8 万册。很多读者都表示希望能有中文(简体)版本,作者团队把书翻译成了中文简体。
为什么这本书如此受欢迎?我们先来看一下它的内容。本书分为三大部分,覆盖深度强化学习的全部内容。
第一部分介绍深度学习和强化学习的入门知识、一些非常基础的深度强化学习算法及其实现细节,包括第 1~6 章。其中第 2 章是最关键、最基础的内容。如果您已经有深度学习基础,可以直接跳过第 1 章。第 3 章、附录 A 和附录 B 总结了不同的算法。
第二部分是一些精选的深度强化学习研究题目,这些内容对准备开展深度强化学习研究的读者非常有用,包括第 7~12 章。除了深度学习的基础内容,第 7 章介绍了当今强化学习技术发展遇到的各种挑战。您可以通过阅读第 8~12 章来进一步了解不同的研究方向。
第三部分提供了丰富的应用案例,包括 AlphaZero、让机器人学习跑步等,包括第 13~18 章。 如果您是工程师,希望快速地在产品中使用深度强化学习技术,您可以根据业务场景中的动作空间和观测种类来选择最相似的应用例子,然后运用到您的业务中。
1.
本文由mdnice多平台发布
你能跟AI聊天机器人「ChatGPT」玩TRPG,或问他柯南是不是死神
ai语音聊天机器人app,ai聊天机器人app,ai人工智能聊天机器人,智能的聊天ai机器人 12 月1 日,OpenAI 推出一个人工智慧聊天AI 原型「ChatGPT」,再次为学术界引发了类似AI 绘图冲击艺术界的话题,你能跟 ChatGPT 进行即时对谈,而他则会流畅地回覆你任何问题。短短5 天,ChatGPT 吸引了超过100 万使用者,同时也在各大SNS 也开始流传各种神奇的对话纪录。ChatGPT 是基于「GPT-3.5」(Generative Pre-trained Transformer 3.5)架构开发的AI,本身使用深度学习训练的大型语言模型数据,提供即时的问答,同时在对话过程中它还会记忆先前使用者的对话讯息,更能回答某些假设性的问题,或是为你所指定的主题进行创作,例如写诗。ChatGPT 之所以在短时间影响到全球使用者,是因为它能切换语言,你用中文询问,它便会以中文回答你,或者你用中文询问让AI 以另一种语言回答你,它也能办得到,这也表示它能作为翻译机器人使用。虽然对于翻译的精确度来说(尤其是中文与人名音译)离完美尚还有一段距离,不过在文字流畅度以及可辨识特定人名来说,与其他网路翻译工具相近。如果问它程式码,它甚至能够帮忙抓错。基于ChatGPT 是一个大型语言模型,本身没有网路搜寻功能,因此它只能利用2021 年所拥有的数据进行回答,2022 年世界杯发生什么事它一概不知。然而,即便知识有极限,ChatGPT 还是能回答脑洞大开的人类许多奇葩问题。有日本使用者甚至输入了十天美元的汇率变化,让 ChatGPT 来判断下一次的汇率升降,据称他因此赚了 37,629 日元,也算是非常大胆的操作。将AI 用来赚钱,对人类来说不寒掺,因为科技始终来自于人性。当然,你也能问它ACG 或游戏产业相关的话题,即便打错字它也能辨识,并给予解释。如果进一步追问,它会继续原本的话题来向你说明。在 ChatGPT 解释下,明确地剖析目前「独立游戏」模糊的定义,并达成一段有意义的对话,同时,它也认真回答了名侦探柯南是不是死神的网路迷因。不过说到底,ChatGPT 设计的目的仍然是聊天机器人,因为连续对话才是它被设计出来的主因。经友人测试下,他实现了与 ChatGPT 一起玩TRPG 的过程,AI 会自己设定角色,自行取名,决定个性与装备,也能因应你所设下的游戏状况来反应。有关于ChatGPT 的报导已在近日广泛流传,虽然仍有人普遍质疑AI 的应用能力,但它带来的影响力已在网际网路成为新的热点,如同网路迷因一样,AI 只会变得更加普及,且不断扩散至现今人类的生活每一个角落。 |