Prioritized Double IQN #518

prabhatnagarajan · 2019-07-28T13:50:03Z

We should first merge Double IQN.

Here is a comparison against Double IQN

Game	DoubleIQN	Prioritized Double IQN
Asterix	507353.8	738166.66
Bowling	80.33	72.72
Hero	28564.58	35293.26
MontezumaRevenge	5.55	3.79
Qbert	29531.1	25763.95
Seaquest	30870.0	31905.0
Venture	719.51	1369.84
VideoPinball	731942.25	717376.0

Prioritized IQN wins on 5/7 domains and loses on 2/7!

prabhatnagarajan · 2019-09-03T09:33:48Z

/test

pfn-ci-bot · 2019-09-03T09:33:51Z

Successfully created a job for commit 6faf052:

Dashboard for commit 6faf052

chainerrl/agents/iqn.py

toslunar · 2019-10-31T05:26:41Z

examples/atari/train_double_iqn.py

+    if args.prioritized:
+        betasteps = args.steps / args.update_interval
+        rbuf = replay_buffer.PrioritizedReplayBuffer(
+            10 ** 6, alpha=0.5, beta0=0.4, betasteps=betasteps,


I didn't find alpha for prioritized replay in the paper https://arxiv.org/abs/1710.10044. Could you confirm where the hyperparameters came from?

The hyperparameters don't come from anywhere. Prioritized Double IQN is a new algorithm.

However, I could use alpha=0.2 and beta0=0.4, which appears to be the case here: https://github.com/valeoai/rainbow-iqn-apex/blob/master/rainbowiqn/args.py, which implements Rainbow IQN.

chainerrl/agents/iqn.py

…into pdiqn

toslunar

LGTM

toslunar · 2019-10-31T07:27:24Z

/test

pfn-ci-bot · 2019-10-31T07:27:28Z

Successfully created a job for commit a54f5d7:

Dashboard for commit a54f5d7

prabhatnagarajan · 2019-10-31T07:28:48Z

/test

pfn-ci-bot · 2019-10-31T07:28:52Z

Successfully created a job for commit a54f5d7:

Dashboard for commit a54f5d7

chainerrl/agents/iqn.py

toslunar · 2019-10-31T09:24:46Z

/test

pfn-ci-bot · 2019-10-31T09:24:50Z

Successfully created a job for commit 1a6abb7:

Dashboard for commit 1a6abb7

prabhatnagarajan · 2019-10-31T09:35:27Z

/test

pfn-ci-bot · 2019-10-31T09:35:30Z

Successfully created a job for commit 1a6abb7:

Dashboard for commit 1a6abb7

prabhatnagarajan added 7 commits July 28, 2019 08:49

adds Prioritized Double IQN

622dc5b

adds betasteps

e86051c

Merge branch 'master' into pdiqn

c944c19

Merge branch 'double_iqn' into pdiqn

346ebab

Merge branch 'master' into pdiqn

ff0f70f

address flake errors

8aa656f

Merge branch 'master' into pdiqn

aa26164

prabhatnagarajan requested a review from toslunar August 21, 2019 11:12

prabhatnagarajan added 5 commits August 26, 2019 23:27

Merge branch 'master' into pdiqn

43b28ee

applies autopep

e578e7f

Merge branch 'master' into pdiqn

bf7d6ed

addresses flakes

821c23c

Merge branch 'master' into pdiqn

6faf052

prabhatnagarajan changed the title ~~[WIP] Prioritized Double IQN~~ Prioritized Double IQN Sep 3, 2019

toslunar self-assigned this Sep 17, 2019

toslunar reviewed Oct 31, 2019

View reviewed changes

prabhatnagarajan added 3 commits October 31, 2019 15:28

Merge branch 'master' into pdiqn

be43348

minor fies

080d674

Merge branch 'pdiqn' of https://github.com/prabhatnagarajan/chainerrl …

eae06d5

…into pdiqn

prabhatnagarajan requested a review from toslunar October 31, 2019 06:49

fixes mistake

a54f5d7

toslunar approved these changes Oct 31, 2019

View reviewed changes

toslunar requested changes Oct 31, 2019

View reviewed changes

chainerrl/agents/iqn.py Show resolved Hide resolved

replaces np with xp

1a6abb7

toslunar approved these changes Oct 31, 2019

View reviewed changes

prabhatnagarajan merged commit c7452e9 into chainer:master Oct 31, 2019

prabhatnagarajan deleted the pdiqn branch October 31, 2019 10:13

muupan added this to the v0.8 milestone Feb 6, 2020

muupan added the enhancement label Feb 6, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Prioritized Double IQN #518

Prioritized Double IQN #518

prabhatnagarajan commented Jul 28, 2019 •

edited

prabhatnagarajan commented Sep 3, 2019

pfn-ci-bot commented Sep 3, 2019

toslunar Oct 31, 2019

prabhatnagarajan Oct 31, 2019

prabhatnagarajan Oct 31, 2019

toslunar left a comment

toslunar commented Oct 31, 2019

pfn-ci-bot commented Oct 31, 2019

prabhatnagarajan commented Oct 31, 2019

pfn-ci-bot commented Oct 31, 2019

toslunar commented Oct 31, 2019

pfn-ci-bot commented Oct 31, 2019

prabhatnagarajan commented Oct 31, 2019

pfn-ci-bot commented Oct 31, 2019

Prioritized Double IQN #518

Prioritized Double IQN #518

Conversation

prabhatnagarajan commented Jul 28, 2019 • edited

prabhatnagarajan commented Sep 3, 2019

pfn-ci-bot commented Sep 3, 2019

toslunar Oct 31, 2019

Choose a reason for hiding this comment

prabhatnagarajan Oct 31, 2019

Choose a reason for hiding this comment

prabhatnagarajan Oct 31, 2019

Choose a reason for hiding this comment

toslunar left a comment

Choose a reason for hiding this comment

toslunar commented Oct 31, 2019

pfn-ci-bot commented Oct 31, 2019

prabhatnagarajan commented Oct 31, 2019

pfn-ci-bot commented Oct 31, 2019

toslunar commented Oct 31, 2019

pfn-ci-bot commented Oct 31, 2019

prabhatnagarajan commented Oct 31, 2019

pfn-ci-bot commented Oct 31, 2019

prabhatnagarajan commented Jul 28, 2019 •

edited