Option 2:

Selecting Framework Architecture

It is time to make some wise design choices...

Option 1) Everything is one object
Option 2) Standard modular structure
Option 3) Yanush Version

Option 2:

DQN (no target)

DQN

НЕДОСТАТКИ:

очень громоздкая конструкция ради всего лишь таргет-сетки. Проблема в том, что это придётся прописывать в инициализации.
блок трейнера, разветвляюдего на два трейнера. Можно чтобы раннер запускал сразу несколько тренеров, но пользователь (!) должен убедиться, что они "независимые" - это плохо.

Rainbow

НЕДОСТАТКИ:

тройное наследование Noisy Dueling Categorical. Но это неизлечимая проблема, не связанная с выбором архитектуры... Здесь скорее всего так или иначе появятся фабрики классов.

Twin DQN (shared backbone)

Twin DQN

ПРОБЛЕМА:

в реплей буффер внезапно попадает сразу две копии каждого трашнзишна!..

A2C

ПРОБЛЕМА:

лоссы не обмениваются информацией. То есть Policy Gradient Loss придётся заново прогонять сеть-критика, а энтропийному лоссу - заново прогонять политику.

QAC

ПРОБЛЕМА:

внезапно требует ОСОБОГО трейнера, работающего сразу с двумя буфферами. Как приоритизрованный реплей тогда сюда пихать?

Curiosity with A2C

НЕДОСТАТКИ:

повторное сэмплирование батча из реплей буффера для обновления сетки для любопытства.
и наследование всех проблем от предыдущих пунктов.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
Design Choice		Design Choice
[Architecture option 1] LRL v.2		[Architecture option 1] LRL v.2
[Architecture option 2] LegoRL		[Architecture option 2] LegoRL
README.md		README.md
[tests] Проблемы архитектуры.ipynb		[tests] Проблемы архитектуры.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Design Choice

Design Choice

[Architecture option 1] LRL v.2

[Architecture option 1] LRL v.2

[Architecture option 2] LegoRL

[Architecture option 2] LegoRL

README.md

README.md

[tests] Проблемы архитектуры.ipynb

[tests] Проблемы архитектуры.ipynb

Repository files navigation

Selecting Framework Architecture

Option 2:

DQN (no target)

DQN

Rainbow

Twin DQN (shared backbone)

Twin DQN

A2C

QAC

Curiosity with A2C

About

Releases

Packages

Languages

FortsAndMills/Selecting-Framework-Architecture

Folders and files

Latest commit

History

Repository files navigation

Selecting Framework Architecture

Option 2:

DQN (no target)

DQN

Rainbow

Twin DQN (shared backbone)

Twin DQN

A2C

QAC

Curiosity with A2C

About

Resources

Stars

Watchers

Forks

Languages