包含了几个外部的项目,它们分别是:
Tensorflow:https://github.com/tensorflow/tensorflow(主要使用的框架)
Gym:https://github.com/openai/gym(强化学习环境平台)
Baselines:https://github.com/openai/baselines(强化学习算法)
Inverse-Reinforcement-Learning:https://github.com/MatthewJA/Inverse-Reinforcement-Learning(反向强化学习)
-
snake.py:蛇棋环境
-
policy_iter.py:策略迭代法实现
-
value_iter.py:价值迭代法实现
-
generalized.py:泛化迭代法实现
-
monte_carlo.py:蒙特卡罗法实现
-
sarsa.py:SARSA法实现
-
qlearning.py:Q-Learning实现