Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

有关于训练的一些疑惑 #37

Open
tongchangD opened this issue Aug 17, 2021 · 3 comments
Open

有关于训练的一些疑惑 #37

tongchangD opened this issue Aug 17, 2021 · 3 comments

Comments

@tongchangD
Copy link

我看了您的train.md文件,
有些疑惑,为什么要先训练 Real-ESRNet 然后 训练 Real-ESRGAN.
其中 Real-ESRGAN中修改判别器为 UNet和SN;优化器改为adam;将原本的L1 loss 增加为 L1loss + vgg19权重为{0.1,0.1,1,1,1}的12345层作为纹理损失 + 加入gan loss
请问为什么不直接训练 Real-ESRGAN ?
是因为直接训练 Real-ESRGAN 震荡比较厉害难以收敛,所以采用 先训练 Real-ESRNet 一次得到 已经收敛的模型,再训练一次进行参数调整吗

@xinntao
Copy link
Owner

xinntao commented Aug 18, 2021

  1. 先训练Real-ESRNet是为了 获得一个gen更好的初始化模型给Real-ESRGAN。 这样能够稳定训练,也使得效果有一定的提升。这是较为普遍的做法
  2. 直接训练Real-ESRGAN也是可以的,训练更多时间,也可以达到类似效果。但考虑到稳定性和效果,大家一般都采用先pre-train 一个MSE/L1 loss训练的模型

@sunyclj
Copy link

sunyclj commented Jan 12, 2022

@xinntao 请问两个阶段的训练iter/epoch分别设置多少呢?算力资源是怎样的?

@kl402401
Copy link

  1. 先训练Real-ESRNet是为了 获得一个gen更好的初始化模型给Real-ESRGAN。 这样能够稳定训练,也使得效果有一定的提升。这是较为普遍的做法

    1. 直接训练Real-ESRGAN也是可以的,训练更多时间,也可以达到类似效果。但考虑到稳定性和效果,大家一般都采用先pre-train 一个MSE/L1 loss训练的模型

训练好Real-ESRNet后,怎么用这个模型去辅助训练Real-ESRGAN模型?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants