作者 |
赵宏 于刚 吴美学 张浩然 屈芳瑜 王鹏 参 刘驰 王占健 戴子彭 |
丛书名 |
人工智能技术丛书 |
出版社 |
机械工业出版社 |
ISBN |
9782108119232 |
简要 |
简介 |
内容简介书籍计算机书籍 ---------------------------8082987 - 深度学习基础教程--------------------------- 深度学习是当前的人工智能领域的技术热点。本书面向高等院校理工科专业学生的需求,介绍深度学习相关概念,培养学生研究、利用基于各类深度学习架构的人工智能算法来分析和解决相关专业问题的能力。本书内容包括深度学习概述、人工神经网络基础、卷积神经网络和循环神经网络、生成对抗网络和深度强化学习、计算机视觉以及自然语言处理。本书适合作为高校理工科相关专业深度学习、人工智能相关课程的教材,也适合作为技术人员的参考书或自学读物。 ---------------------------8067636 - 深度强化学习:学术前沿与实战应用--------------------------- 着重介绍深度强化学习的学术界前沿进展与核心代码分析的书籍。对深度强化学习方面的重要学术进展按照单智能体深度强化学习、多智能体深度强化学习、多任务深度强化学习三个方向梳理,介绍其核心算法,以及算法的代码实现示例。 |
目录 |
[套装书具体书目] 8067636 - 深度强化学习:学术前沿与实战应用 - 9787111646648 - 机械工业出版社 - 定价 99 8082987 - 深度学习基础教程 - 9787111687320 - 机械工业出版社 - 定价 59 ---------------------------8082987 - 深度学习基础教程--------------------------- 前言 第1章 深度学习概述 1 1.1 深度学习的发展历程 1 1.1.1 深度学习的历史 1 1.1.2 深度学习领域的重要人物 5 1.2 深度学习的关键技术 7 1.2.1 深度学习的机理 7 1.2.2 深度学习的三要素 8 1.2.3 数据的特征 9 1.2.4 深度学习的主要模型 10 1.2.5 深度学习模型的训练过程 11 1.2.6 深度学习模型的学习方式 12 1.2.7 深度学习的常用框架 14 1.3 深度学习网络的发展脉络及应用领域 18 1.3.1 深度学习网络的发展脉络 18 1.3.2 深度学习的应用领域 19 课后习题 21 参考文献 22 第2章 人工神经网络基础 24 2.1 人工神经网络的生物学基础 24 2.1.1 神经元的基本模型 24 2.1.2 突触的结构 26 2.2 人工神经元模型 26 2.2.1 人工神经元的数学模型 26 2.2.2 常见的人工神经元模型 30 2.3 人工神经网络模型 34 2.3.1 神经网络的基本结构 34 2.3.2 神经网络的分类 36 2.4 神经网络的前向传播机制 39 2.5 神经网络的反向传播机制 40 2.6 基于反向传播算法的神经网络设计流程 43 2.7 人工神经网络的参数优化问题 45 2.7.1 神经网络层数的优化问题 45 2.7.2 归一化指数函数softmax 47 2.7.3 学习率 49 2.7.4 欠拟合和过拟合问题 50 课后习题 52 参考文献 53 第3章 卷积神经网络和循环神经网络 54 3.1 卷积神经网络 54 3.1.1 卷积神经网络的基本概念 54 3.1.2 卷积神经网络的结构 58 3.1.3 卷积神经网络的常用架构 65 3.2 循环神经网络 72 3.2.1 循环神经网络的基本概念 72 3.2.2 循环神经网络的应用——语言模型 77 3.2.3 循环神经网络的梯度问题及解决方法 80 3.2.4 循环神经网络的改进 84 课后习题 87 参考文献 89 第4章 生成对抗网络和深度强化学习 92 4.1 生成对抗网络 92 4.1.1 生成对抗网络概述 92 4.1.2 生成对抗网络的基本原理 94 4.1.3 几种改进的生成对抗网络模型 99 4.1.4 生成对抗网络的应用 103 4.2 强化学习 106 4.2.1 强化学习概述 106 4.2.2 强化学习的决策过程 108 4.2.3 Q-Learning算法 111 4.2.4 深度强化学习 112 课后习题 118 参考文献 119 第5章 计算机视觉 121 5.1 计算机视觉概述 121 5.1.1 计算机视觉的历史 122 5.1.2 计算机视觉的挑战与机遇 123 5.1.3 计算机视觉常见的数据集 125 5.1.4 计算机视觉处理的基本流程 130 5.2 图像预处理 131 5.2.1 图像去噪 131 5.2.2 图像归一化 133 5.2.3 图像分割技术 134 5.3 计算机视觉常用的网络结构 136 5.3.1 图像分类常用的深度学习网络结构 136 5.3.2 视频分类常用的深度学习网络结构 140 5.3.3 目标检测常用的深度学习网络结构 144 课后习题 152 参考文献 154 第6章 自然语言处理 156 6.1 自然语言处理概述 156 6.1.1 发展历史 157 6.1.2 自然语言处理的过程 158 6.1.3 基础技术 160 6.1.4 词嵌入算法 162 6.1.5 N-gram语言模型 166 6.1.6 注意力机制 167 6.2 自然语言处理的应用模型 171 6.2.1 文本分类 171 6.2.2 自动文本摘要 175 6.2.3 自动问答系统 178 6.2.4 触发字检测 181 课后习题 182 参考文献 183 ---------------------------8067636 - 深度强化学习:学术前沿与实战应用--------------------------- 前言 致谢 数学符号 第一篇 深度强化学习 第1章 深度强化学习基础 2 1.1 强化学习 2 1.1.1 强化学习的发展历史 2 1.1.2 强化学习简介 4 1.1.3 深度强化学习简介 6 1.2 马尔可夫属性和决策过程 9 1.2.1 马尔可夫属性 9 1.2.2 马尔可夫决策过程 11 1.3 强化学习核心概念 12 1.3.1 值函数 12 1.3.2 动态规划 14 1.3.3 时间(序)差分 15 1.3.4 策略梯度 16 1.3.5 actor-critic方法 17 1.4 Q-learning 18 1.4.1 Q-learning简介 18 1.4.2 算法 19 1.4.3 相关变量及影响 20 1.4.4 实现方法 21 第2章 深度强化学习算法 22 2.1 基于值的深度强化学习算法 22 2.1.1 深度Q网络 22 2.1.2 深度双Q网络 27 2.1.3 竞争网络架构 31 2.1.4 平均值DQN 33 2.1.5 多DQN变种结合体:Rainbow 37 2.1.6 基于动作排除的DQN 42 2.2 基于策略的深度强化学习算法 46 2.2.1 循环确定性策略梯度 46 2.2.2 深度确定性策略梯度 55 2.2.3 信赖域策略优化 62 2.2.4 近端策略优化 68 2.3 基于模型的深度强化学习算法 73 2.3.1 基于模型加速的连续深度Q-learning 73 2.3.2 范例模型探索 80 2.3.3 基于模型集成的信赖域策略优化 88 2.3.4 时间差分模型 95 2.4 基于分层的深度强化学习算法 102 2.4.1 分层深度强化学习 102 2.4.2 基于封建网络的分层强化学习 109 2.4.3 基于随机神经网络的分层强化学习 116 第3章 分布式深度强化学习 123 3.1 分布式系统 123 3.1.1 分布式系统简介 123 3.1.2 分布式系统的发展历史 124 3.1.3 架构演进 125 3.1.4 主流分布式系统框架 128 3.2 分布式深度强化学习算法 129 3.2.1 分布式近端策略优化 129 3.2.2 分布式深度确定性策略梯度 138 3.3 分布式深度强化学习框架 145 3.3.1 重要性加权Actor-Learner架构 145 3.3.2 分布式优先经验复用池 153 第二篇 多智能体深度强化学习 第4章 多智能体深度强化学习基础 162 4.1 多智能体强化学习 162 4.1.1 多智能体强化学习发展历史 162 4.1.2 多智能体强化学习简介 164 4.1.3 优势和挑战 166 4.2 部分可见马尔可夫决策过程 166 4.2.1 POMDP模型 166 4.2.2 POMDP相关研究 169 4.2.3 POMDP应用领域 170 第5章 多智能体深度强化学习算法 171 5.1 基于值函数的多智能体深度强化学习 171 5.1.1 基于DQN的多智能体网络 171 5.1.2 增强智能体间学习 174 5.1.3 协同多智能体学习的价值分解网络 178 5.1.4 多智能体深度强化学习的稳定经验复用池 182 5.1.5 单调值函数分解 187 5.1.6 深度强化学习中的对立智能体建模 190 5.1.7 平均场多智能体强化学习 193 5.2 基于策略的多智能体深度强化学习 197 5.2.1 基于自身策略的其他智能体行为预测 197 5.2.2 双重平均方案 201 5.2.3 多智能体深度强化学习的统一博弈论方法 208 5.3 基于AC框架的多智能体深度强化学习 212 5.3.1 多智能体深度确定性策略梯度 212 5.3.2 多智能体集中规划的价值函数策略梯度 220 5.3.3 多智能体系统的策略表示学习 227 5.3.4 部分可观察环境下的多智能体策略优化 231 5.3.5 基于联网智能体的完全去中心化MARL 236 第三篇 多任务深度强化学习 第6章 多任务深度强化学习基础 244 6.1 简介 244 6.1.1 理论概述 244 6.1.2 面临的挑战 247 6.2 策略蒸馏法 248 第7章 多任务深度强化学习算法 253 7.1 无监督强化与辅助学习 253 7.1.1 算法介绍 253 7.1.2 算法分析 255 7.1.3 使用场景与优势分析 261 7.2 使用渐进式神经网络解决任务的复杂序列 262 7.2.1 算法介绍 262 7.2.2 算法分析 262 7.2.3 使用场景与优势分析 266 7.3 基于单智能体的多任务共享模型 267 7.3.1 算法介绍 267 7.3.2 算法分析 268 7.3.3 使用场景与优势分析 272 7.4 使用PopArt归一化多任务更新幅度 273 7.4.1 算法介绍 273 7.4.2 算法分析 274 7.4.3 使用场景与优势分析 276 第四篇 深度强化学习的应用 第8章 游戏 278 8.1 Gym Retro游戏平台 278 8.1.1 平台简介 278 8.1.2 安装Gym Retro平台 281 8.1.3 安装Retro UI 282 8.1.4 Gym Retro主要函数说明 283 8.2 相关应用 285 8.2.1 Pong游戏 285 8.2.2 CartPole 291 8.2.3 Flappy Bird 298 8.2.4 Gradius 302 第9章 机器人控制 312 9.1 机器人导航 312 9.1.1 无地图导航 312 9.1.2 社会感知机器人导航 316 9.2 路径规划 321 9.3 机器人视觉 324 第10章 计算机视觉 327 10.1 图像 327 10.1.1 图像字幕 327 10.1.2 图像恢复 332 10.2 视频 337 10.2.1 视频字幕 337 10.2.2 视频快进 345 10.2.3 视觉跟踪 348 第11章 自然语言处理 354 11.1 与知识库交互的多轮对话智能体 354 11.1.1 概率KB查找 355 11.1.2 端到端KB-InfoBot 356 11.1.3 总结 359 11.2 鲁棒远程监督关系提取 359 11.2.1 问题表述 360 11.2.2 使用基于策略的智能体重新分配训练数据集 363 11.2.3 总结 363 11.3 非成对情感–情感翻译 363 11.3.1 问题表述 363 11.3.2 训练算法 366 11.3.3 总结 367 缩写参照表 368 常用词中英文对照 371 参考文献 374 |