-
Notifications
You must be signed in to change notification settings - Fork 42
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
将pytorch模型转化到tf,效果变差 #12
Comments
这个看结果不是变差了,是没转换对,肯定中间某些参数或步骤出问题了。 我的ipynb里面有一些其他的中间输出,可以尝试对照哪个中间输出是否和我现在的不一样,慢慢排查,具体原因我现在也无法判断 |
我再检查下,多谢 |
我这边这里加载出来的均为gpt2模型,而您那边均为gpt模型,怀疑是这里不一致导致后面转化出错的,但不知道原因,我这边CPM-distill模型来自官方下载
|
GPT模型的只能初始化一次,如果第二次运行出来的就是gpt_2 |
这样的呀,哈哈哈哈哈。初始化多次对CPM转换会有影响吗? |
如果你用notebook,就只能每次修改之后重启,保证只初始化一次 这部分当然也可以做一些冗余处理,其实只要保证weights都对上号就行,名字并不太重要 |
@Biaocsu 您好,请问原版的distill模型还在吗?官方链接失效了,如果大佬有留存可以分享一下吗? |
@xingyaoww @Biaocsu 原CPM模型能分享一下吗 这个链接打不开了呢 |
您好,如题按照您的脚本,对distill模型进行转化,pytorch到tf,怎么效果变差很多,您知道可能哪里出问题的吗?
脚本除了仍使用GPU加载模型,未作任何改变
The text was updated successfully, but these errors were encountered: