阅读时间约 1 分钟

动手学强化学习

课程与资料导航

Posted by LuckyE on June 30, 2025

动手学强化学习

初探强化学习

动手学强化学习– 张伟楠,沈键,俞勇北京 Beijing, 2022 – 人民邮电出版社.pdf

王树森_强化学习

强化学习简介

书本部分

第 1 章初探强化学习

第 2 章多臂老虎机

第 3 章马尔可夫决策过程

第 4 章动态规划算法

第 5 章时序差分算法

第 6 章 Dyna-Q 算法

第 7 章 DQN 算法

第 8 章 DQN 改进算法

第 9 章策略梯度算法

第 10 章 Actor-Critic 算法

第 11 章 TRPO 算法