[WIP]强化学习的学习仓库

这是我个人学习强化学习的时候收集的比较经典的学习资料、笔记和代码，分享给所有人。

为了直接在GitHub上用markdown文件看公式，推荐安装chrome插件：MathJax Plugin for Github

入门指南

所有的实验源代码都在lib目录下，来自dennybritz。在原先代码的基础上，增加了对实验背景的具体介绍、代码和公式的对照。

Gridworld：对应MDP的Dynamic Programming
Blackjack：对应Model Free的Monte Carlo的Planning和Controlling
Windy Gridworld：对应Model Free的Temporal Difference的On-Policy Controlling：SARSA。
Cliff Walking：对应Model Free的Temporal Difference的Off-Policy Controlling：Q-learning。
Mountain Car：对应Q表格很大无法处理（state空间连续）的Q-Learning with Linear Function Approximation。
Atari：对应Deep-Q Learning。

Name		Name	Last commit message	Last commit date
Latest commit History 68 Commits
book		book
exp		exp
lib		lib
notes		notes
res		res
slides		slides
.gitignore		.gitignore
README.md		README.md
class_note.ipynb		class_note.ipynb
learning_route.ipynb		learning_route.ipynb
learning_route.md		learning_route.md
reinforcement_learning.ipynb		reinforcement_learning.ipynb
reinforcement_learning_exercise_solution.ipynb		reinforcement_learning_exercise_solution.ipynb