dqn算例中reward为什么要覆写呢？ #16

tsukiikekaoru · 2021-01-05T13:46:41Z

在dqn算例中第140行为什么要用 reward = -1 if done else 0.1重新覆写reward为1或者0.1呢？而不是用gym环境给出的reward。https://zhuanlan.zhihu.com/p/21477488 这篇文章中结构差不多，但没有覆写，而是一个新的变量reward_agent = -1 if done else 0.1，其他dqn变种的算例中也都同样如此。

The text was updated successfully, but these errors were encountered:

ljpzzz · 2021-01-06T01:40:44Z

你好，这里可以覆写，也可以不覆写。
如果你想自己设计下这个环境的奖励函数，重新设计奖励，看看有没有效果提升，那么就可以覆写。
如果仅仅是学习，跑一下即可，那么不用覆写。

ljpzzz closed this as completed Jan 6, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

dqn算例中reward为什么要覆写呢？ #16

dqn算例中reward为什么要覆写呢？ #16

tsukiikekaoru commented Jan 5, 2021 •

edited

ljpzzz commented Jan 6, 2021

dqn算例中reward为什么要覆写呢？ #16

dqn算例中reward为什么要覆写呢？ #16

Comments

tsukiikekaoru commented Jan 5, 2021 • edited

ljpzzz commented Jan 6, 2021

tsukiikekaoru commented Jan 5, 2021 •

edited