Skip to content

Latest commit

 

History

History
 
 

tutorials

《PARL强化学习入门实践》课程示例

针对强化学习初学者,PARL提供了入门课程,展示最基础的5个强化学习算法代码示例(注意:本课程示例均基于静态图框架编写)。

News:

  • [2021.12.06] 应广大学员的要求,我们提供了课程配套代码的(lesson3-lesson5)的动态图框架版本,见 链接。lesson1-lesson2不涉及神经网络,可沿用本目录下的代码。

课程大纲

  • 一、强化学习(RL)初印象
    • RL概述、入门路线
    • 实践:环境搭建(lesson1 的代码提供了格子环境世界的渲染封装)
  • 二、基于表格型方法求解RL
  • 三、基于神经网络方法求解RL
    • 函数逼近方法
    • 实践:DQN
  • 四、基于策略梯度求解RL
  • 五、连续动作空间上求解RL

使用说明

安装依赖(注意:请务必安装对应的版本)

  • Python 3.6/3.7
  • paddlepaddle==1.6.3
  • parl==1.3.1 或者 parl==1.4
  • gym==0.18.0
  • atari-py==0.2.6 (仅 lesson4 的 homework 需要安装)
  • rlschool==0.3.1 (仅 lesson5 的 homework 需要安装)

可以直接安装本目录下的 requirements.txt 来完成以上依赖版本的适配。

pip install -r requirements.txt

运行示例

进入每个示例对应的代码文件夹中,运行

python train.py