计算机类 强化学习(第2版) 《强化学习(第2版)》作为强化学习思想的深度解剖之作,被业内公认为是一本强化学习基础理论的经典著作。它从强化学习的基本思想出发,深入浅出又严谨细致地介绍了马尔可夫决策过程、蒙特卡洛方法、时序差分方法、同轨离轨策略等强化学习的基本概念和方法,并以大量的实例帮助读者理解强化学习的问题建模过程以及核心的算法细节。 《强化学习(第2版)》适合所有对强化学习感兴趣的读者阅读、收藏。 ...标签:bartosutton作者简介大学学习强化计算机科学阿尔伯马萨诸塞