Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

BatchSize大于1无法预测 #41

Open
21978281 opened this issue Apr 18, 2024 · 6 comments
Open

BatchSize大于1无法预测 #41

21978281 opened this issue Apr 18, 2024 · 6 comments

Comments

@21978281
Copy link

现在训练中遇到的问题:

  1. 当设置BatchSize大于1后无法预测,需要设置BatchSize为1重新训练,想问问各位大佬这样重新训练后对模型的预测结果是否会有影响
  2. 当设置BatchSize大于1,比如512,1024后,多次训练会导致loss值为Nan的错误。
    望哪位大佬帮忙解答下。
@KittenCN
Copy link
Owner

  1. 理论上会有影响,解决方法也简单,就是存储模型权重的时候,不要存储batchsize就行了,你可以改改这段代码试试。
  2. 看上去好像是数据问题。而且一般情况下batchsize也不应该设置那么大。

@21978281
Copy link
Author

大神如何更改存储模型权重的是否不存储batchsize?

@KittenCN
Copy link
Owner

KittenCN commented Apr 20, 2024

大神如何更改存储模型权重的是否不存储batchsize?

只要修改session,不要包含整个graph就可以了呀,然后restore的时候,初始化一下相关的参数

@21978281
Copy link
Author

谢谢大神

@21978281
Copy link
Author

大神还有一个问题就是不保存整个Graph,恢复的时候初始化参数是使用默认值的值还是保存的参数值。另外如果使用保存的参数值,这个项目的代码怎么更改?谢谢大神给指点下。

@juanxincaitt
Copy link

@21978281 请问是否完成存储模型权重不存储batchsize更改,望指导?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants