这是我的强化学习笔记
This is my reinforcement learning study note
Non-CS background for both Bachelor's and Master's. Studying Reinforcement Learning myself. Feel free to comment and exchange ideas. Thank you for your criticism and correction!
| 序号 | 资料名称 | 链接 |
|---|---|---|
| 1 | 吴恩达机器学习 | 视频 |
| 2 | 西湖大学赵世钰《强化学习的数学原理》 | 视频 资料 |
| 3 | 上海交通大学张伟楠《动手学强化学习》 | 资料 |
| 4 | 蘑菇书强化学习 | 资料 |
| 章节 | 内容 | 参考资料 | 链接 |
|---|---|---|---|
| 第一章 | Basic | 笔记 | |
| 第二章 | Dynamic Programming | 笔记 | |
| 第三章 | Monte Carlo | 笔记 | |
| 第四章 | Stochastic Approximation | ||
| 第五章 | Temporal Difference | 笔记 | |
| 第六章 | Dyna-Q | ||
| 第七章 | DQN | 笔记 | |
| 第八章 | Improved DQN | 笔记 | |
| 第九章 | Policy Gradient | 笔记 | |
| 第十章 | Actor-Critic | 笔记 | |
| 第十一章 | Trust Region Policy Optimization | ||
| 第十二章 | Proximal Policy Optimization | 笔记 | |
| 第十三章 | Deep Deterministic Policy Gradient | 笔记 | |
| 第十四章 | Soft Actor-Critic | ||
| 第十五章 | Imitation Learning | 笔记 | |
| 第十六章 | Model Predicted Control | 笔记 |