作者:邹伟, 鬲玲, 刘昱杓著
出版社: 清华大学出版社
CIP号:2019205873
书号:978-7-302-53829-5
出版地:北京
出版时间:2019.11
定价:¥99.0
该书共14章,大致分为4个部分:第1部分介绍强化学习的基础知识,包括强化学习的定义,发展历程,以及要解决的问题。第2部分包括动态规划方法,蒙特卡罗方法,时间差分方法。第3部分通过集成多个基本算法,或者将值函数、策略做函数近似,第4部分使用强化学习解决两类博弈问题:完美信息博弈和不完美信息博弈。