Reinforcement_Learning_BIT

Project for Reinforcement Learning class (BIT北理工，强化学习)

文件夹结构

├──work1(第一次实验：gym的CartPole&Cliffwalking)
│   ├── CartPole-v0.ipynb(based on Q-Learning/SARSA)
│   ├── CartPole_DQN.ipynb(based on DQN)
│   ├── Cliffwalking-v0.ipynb(based on Q-Learning/SARSA/expected SARSA)
├──work2(第一次实验：rainbow)
│   ├── 实验报告.pdf
│   ├── rainbow
│   │   ├── common（具体各层的细节）
│   │   ├── Agent.py
│   │   ├── Network.py（网络结构）
│   │   ├── train_ll.py（训练文件）
│   ├── Ablation
│   │   ├── no_ddqn
│   │   ├── no_duelingdqn
│   │   ├── no_noise
│   │   ├── no_per
│   ├── 其他网络模型
│   │   ├── atari_dqn
│   │   ├── atari_ddqn
│   │   ├── atari_distributed
│   │   ├── atari_duelingdqn
│   │   ├── atari_noisy
│   │   ├── atari_prioritized

结果展示

work1：使用Q-learning方法玩gym小游戏

以下横坐标为epoch数，纵坐标为reward

CartPole-v0

SARSA训练过程

Q-Learning训练过程

DQN训练过程

Cliffwalking-v0

训练过程

work2：复现Rainbow文章中的实验¹

7种强化学习网络模型试验结果

Rainbow消融实验结果

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
paper_reading		paper_reading
pic		pic
work1		work1
work2		work2
.DS_Store		.DS_Store
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reinforcement_Learning_BIT

文件夹结构

结果展示

work1：使用Q-learning方法玩gym小游戏

work2：复现Rainbow文章中的实验¹

About

Releases

Packages

Languages

llada60/Reinforcement_Learning_BIT

Folders and files

Latest commit

History

Repository files navigation

Reinforcement_Learning_BIT

文件夹结构

结果展示

work1：使用Q-learning方法玩gym小游戏

work2：复现Rainbow文章中的实验1

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

work2：复现Rainbow文章中的实验¹

Packages