Reverse Curriculum Generation for Reinforcement Learning #525

neka-nat · 2017-11-26T03:18:40Z

一言でいうと

迷路や鍵の差し込みのようなゴールまで到達しないと報酬を得られないようなタスクにおいて、スタート地点を学習の進みに応じて変化させることで効率的に強化学習を行う方法を提案。最初はゴール付近から開始し、付近の状態を探索しながら、学習時にとある範囲の報酬の総和が得られた状態のみを残していくことで、調度良い難しさのスタート地点から学習できるようにしている。

論文リンク

https://arxiv.org/abs/1707.05300

著者/所属機関

Carlos Florensa, David Held, Markus Wulfmeier, Michael Zhang, Pieter Abbeel

UC Berkeley

投稿日付(yyyy/MM/dd)

2017/11/26

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Reverse Curriculum Generation for Reinforcement Learning #525

Reverse Curriculum Generation for Reinforcement Learning #525

neka-nat commented Nov 26, 2017

icoxfog417 commented Jul 10, 2018

Reverse Curriculum Generation for Reinforcement Learning #525

Reverse Curriculum Generation for Reinforcement Learning #525

Comments

neka-nat commented Nov 26, 2017

一言でいうと

論文リンク

著者/所属機関

投稿日付(yyyy/MM/dd)

概要

新規性・差分

手法

結果

コメント

icoxfog417 commented Jul 10, 2018