-
Notifications
You must be signed in to change notification settings - Fork 5.8k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
使用checkpoint继续训练的bug #17
Comments
@JiaweiShiCV 这是basicsr的一个bug,你可以更新一下basicsr (v1.3.3.5): 具体问题原因是这个: XPixelGroup/BasicSR@4a96712 |
@xinntao pip install basicsr --upgrade 更新以后处理图片报错:
然后我尝试卸载basicsr, 加上环境变量重新安装 |
新版本(1.3.3.5)下,stylegan的fused_act_ext编译有问题,导致训练开始不了。 |
这个版本相关的代码没有修改过。 你可以使用 git clone 来编译, 能够更好定位问题
如果有问题,可以把输出贴一下, 1.3.3.5应该是没有影响的才对=-= |
@xinntao haha 我刚在两台机器上都试过了,无论是infer推演还是train,1.3.3.5都报错 关于1.3.3.5多卡训练报错(和推演一样):
|
@xinntao 使用你上面的编译方式好像解决了。。。 |
ok,可能是上面没有卸载干净 或者是 |
好的 thx! |
当我想要从断点继续训练,我修改了.yml文件以下内容:
我并没有修改pretrain_network_identity项。
但是随后报错:
一脸懵啊。。。
翻看log初始打印所有配置,此时pretrain_network_identity已经变了:
这。。。。
The text was updated successfully, but these errors were encountered: