标签：强化

强化学习（第2版）

《强化学习（第2版）》作为强化学习思想的深度解剖之作，被业内公认为是一本强化学习基础理论的经典著作。它从强化学习的基本思想出发，深入浅出又严谨细致地介绍了马尔可夫决策过程、蒙特卡洛方法、时序差分方法、同轨离轨策略等强化学习的基本概念和方法，并以大量的实例帮助读者理解强化学习的问题建模过程以及核心的算法细节。《强化学习（第2版）》适合所有对强化学习感兴趣的读者阅读、收藏。 ...

标签：barto sutton 作者简介大学学习强化计算机科学阿尔伯马萨诸塞

计算机类

深入浅出强化学习：原理入门

《深入浅出强化学习：原理入门》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理，覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手，将强化学习问题纳入到严谨的数学框架中，接着阐述了解决此类问题最基本的方法——动态规划方法，并从中总结出解决强化学习问题的基本思路：交互迭代策略评估和策略改善。基于这个思路，分别介绍了基于值函数的强化学习方法和...

标签：入门基于学习强化方法深入浅出策略算法迭代

计算机类

强化学习：原理与Python实现

本书理论完备，涵盖主流经典强化学习算法和深度强化学习算法；实战性强，基于Python、Gym、TensorFlow 2、AlphaZero等构建，配套代码与综合案例。全书共12章，主要内容如下。第1章：介绍强化学习的基础知识与强化学习环境库Gym的使用，并给出完整的编程实例。第2～9章：介绍强化学习的理论知识。以Markov决策过程为基础模型，覆盖了所有主流强化学习理论...

标签：gym Python tensorflow 学习强化深度算法肖智清

计算机类

强化学习精要

《强化学习精要：核心算法与TensorFlow 实现》用通俗幽默的语言深入浅出地介绍了强化学习的基本算法与代码实现，为读者构建了一个完整的强化学习知识体系，同时介绍了这些算法的具体实现方式。从基本的马尔可夫决策过程，到各种复杂的强化学习算法，读者都可以从本书中学习到。本书除了介绍这些算法的原理，还深入分析了算法之间的内在联系，可以帮助读者举一反三，掌握算法精髓。书中介绍的代码可以帮助读...

标签：tensorflow 介绍学习强化算法精要线性代数读者針對

计算机类

多智能体机器学习–强化学习方法

本书主要介绍了多智能体机器人强化学习的相关内容。全书共6章，首先介绍了几种常用的监督式学习方法，在此基础上，介绍了单智能体强化学习中的学习结构、值函数、马尔科夫决策过程、策略迭代、时间差分学习、Q学习和资格迹等概念和方法。然后，介绍了双人矩阵博弈问题、多人随机博弈学习问题，并通过3种博弈游戏详细介绍了纳什均衡、学习算法、学习自动机、滞后锚算法等内容，并提出LR-I滞后锚算法和指数移动平...

标签：介绍博弈学习强化方法智能算法系统纳什

计算机类

强化学习/智能科学与技术丛书

本书共有19章，分为六大部分，详细介绍了强化学习中各领域的基本理论和新进展，内容包括：MDP、动态规划、蒙特卡罗方法、批处理强化学习、TD学习、Q学习、策略迭代的小二乘法、迁移学习、贝叶斯强化学习、、一阶逻辑MDP、层次式强化学习、演化计算、预测性定义状态表示、去中心化的部分可观察MDP、博弈论和多学习器强化学习等内容，并阐述强化学习与心理和神经科学、游戏领域、机器人领域的关系和应用，...

标签：mdp 一帮人工智能垃圾学习强化翻译译者领域

标签：强化

添加微信公众号:“好书天下”获取书籍