Skip to content

Latest commit

 

History

History
2 lines (2 loc) · 274 Bytes

File metadata and controls

2 lines (2 loc) · 274 Bytes

Value-based Reinforcement Learning

关于value-based RL相关的slides,主要讲解了基于值的强化学习方法的几个重要理论方法,同时讲解了Q-learning作为off-policy方法在学习过程中产生的bias的来源已经如何减轻的几种方法。