Кажется что ошибка в главе 6 #9

nor-code · 2022-10-01T19:02:05Z

Там, где описывается полный алгоритм DDPG (в рамочке) https://github.com/FortsAndMills/RL-Theory-book/blob/main/src/6.ContinuousControl/6.1.DDPG.tex , то там такое условие, что если t mod K == 0то обновляем веса актора и критика по формуле скользящего среднего, но такого нет в оригинальной статье https://arxiv.org/pdf/1509.02971.pdf (стр. 5), там просто на каждом шаге происходит обновление.

The text was updated successfully, but these errors were encountered:

FortsAndMills · 2022-10-01T20:44:27Z

Да, и к тому же гиперпараметр K не определён. Это, конечно, опечатка.

FortsAndMills closed this as completed in 45fa597 Oct 1, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Кажется что ошибка в главе 6 #9

Кажется что ошибка в главе 6 #9

nor-code commented Oct 1, 2022

FortsAndMills commented Oct 1, 2022

Кажется что ошибка в главе 6 #9

Кажется что ошибка в главе 6 #9

Comments

nor-code commented Oct 1, 2022

FortsAndMills commented Oct 1, 2022