作者 |
伊庭齐志 小川雄太郎 |
丛书名 |
轻松上手IT技术日文译丛 |
出版社 |
机械工业出版社 |
ISBN |
9782108191028 |
简要 |
简介 |
内容简介书籍计算机书籍 ---------------------------8083255 - AI游戏开发和深度学习进阶--------------------------- 本书以各种各样的实例剖析游戏AI手法,并以此为目标,帮助读者学习构筑游戏AI的技术。另外,也阐述了游戏AI中的深层学习、机械学习、强化学习技术。 ---------------------------8068663 - 边做边学深度强化学习:PyTorch程序设计实践--------------------------- Pytorch是基于python且具备强大GPU加速的张量和动态神经网络,更是Python中优先的深度学习框架,它使用强大的 GPU 能力,提供最大的灵活性和速度。本书指导读者以Pytorch为工具在Python中学习深层强化学习(DQN)。主要内容包括:强化学习概述及分类、强化学习的算法和实施方法、在Pytorch中实施深度规划与实现。、“实施深层强化学习DQN”、理解并实施新的深层强化学习方法(Double-DQN、Dueling Network、Prioritized Experience Replay、A3C、A2C)。 |
目录 |
[套装书具体书目] 8068663 - 边做边学深度强化学习:PyTorch程序设计实践 - 9787111650140 - 机械工业出版社 - 定价 69 8083255 - AI游戏开发和深度学习进阶 - 9787111688464 - 机械工业出版社 - 定价 79 ---------------------------8083255 - AI游戏开发和深度学习进阶--------------------------- 译者序 前言 第1章 谜题与游戏AI的过去和现在 1 1.1 关于AI的预言成真了吗 1 1.2 游戏AI的历史和背景 2 1.3 游戏AI是否会剥夺人类的乐趣 7 1.4 游戏AI的意义 9 1.5 游戏的深奥程度与“先下手为强”定理 10 第2章 解谜的AI 14 2.1 搜索树 14 2.1.1 树的构造和图形表达 14 2.1.2 深度优先搜索 21 2.1.3 宽度优先搜索 28 2.1.4 A*搜索 32 2.2 推箱子 40 2.3 数字连线 43 2.4 日式华容道 46 2.5 孔明棋 48 2.6 尝试用数学知识解决数独问题 51 第3章 依赖约束的谜题和非单调推理 58 3.1 纵向搜索与回溯 58 3.2 数学家弄错的国际象棋谜题 58 3.3 线条图的解释与错觉画 63 3.4 ATMS与四色问题 71 3.5 解开国际象棋谜题 83 3.5.1 尽可能放置多个棋子 84 3.5.2 尽可能攻击多个区域 86 3.6 Knuth的谜题与位棋盘 88 第4章 会玩游戏的AI 90 4.1 井字棋与树 90 4.2 游戏的树搜索 91 4.3 黑白棋与Fool’s mate 104 4.4 A*马里奥 110 4.5 蒙特卡罗树搜索 114 4.6 立体四子棋 118 4.7 黑白棋的蒙特卡罗算法和NegaScout算法 123 4.8 如何赢得博弈 124 4.9 消灭幽灵:AI吃豆人 132 第5章 学习、进化和游戏AI 140 5.1 来自AlphaGo的震撼 140 5.2 DQN和街机游戏 151 5.3 进化的马里奥 155 5.4 神经进化 158 5.5 吃豆人的神经进化 161 5.6 充满好奇心的马里奥 166 第6章 游戏AI与类人化 174 6.1 为什么需要类人化的AI 174 6.2 通用游戏是什么 175 6.3 图灵测试和最类人化的AI 178 6.4 不使用“类人化”函数的类人化游戏AI 182 6.5 使用“类人化”函数的类人化游戏AI 190 参考文献 199 ---------------------------8068663 - 边做边学深度强化学习:PyTorch程序设计实践--------------------------- 译者序 前言 第1章 强化学习概述 1 1.1 机器学习的分类(监督学习、非监督学习、强化学习) 1 1.2 强化学习、深度强化学习的历史 6 1.3 深度强化学习的应用实例 11 参考文献 14 第2章 在走迷宫任务中实现强化学习 16 2.1 Try Jupyter的使用方法 16 2.2 迷宫和智能体的实现 23 2.3 策略迭代法的实现 31 2.4 价值迭代法的术语整理 41 2.5 Sarsa的实现 46 2.6 实现Q学习 52 参考文献 57 第3章 在倒立摆任务中实现强化学习 59 3.1 在本地PC上准备强化学习的实现和执行环境 59 3.2 倒立摆任务“CartPole” 64 3.3 由多变量连续值表示的状态的表格表示 69 3.4 Q学习的实现 72 参考文献 80 第4章 使用PyTorch实现深度学习 81 4.1 神经网络和深度学习的历史 81 4.2 深度学习的计算方法 89 4.3 使用PyTorch实现MNIST手写数字分类任务 94 参考文献 107 第5章 深度强化学习DQN的实现 108 5.1 深度强化学习DQN(深度Q网络)的说明 108 5.2 实现DQN的四个要点 111 5.3 实现DQN(上) 113 5.4 实现DQN(下) 123 参考文献 127 第6章 实现深度强化学习的改进版 128 6.1 深度强化学习算法发展图 128 6.2 DDQN的实现 132 6.3 Dueling Network的实现 141 6.4 优先经验回放的实现 145 6.5 A2C的实现 157 参考文献 168 第7章 在AWS GPU环境中实现消砖块游戏 169 7.1 消砖块游戏“Breakout”的描述 169 7.2 准备在AWS上使用GPU所需要的深度学习执行环境 174 7.3 学习Breakout的四个关键思想 187 7.4 A2C的实现(上) 193 7.5 A2C的实现(下) 203 参考文献 212 后记 214 |