怎样不冻结bert参数？ #4

VioletJKI · 2019-07-06T04:41:37Z

我把这儿 grads = tf.gradients(self.loss, train_vars) 的train_vars改成了tvars，但是出来的结果全是0

yumath · 2019-07-13T13:23:52Z

@VioletJKI 模型中已经冻结了参数

airship-explorer · 2019-11-12T07:28:01Z

我把这儿 grads = tf.gradients(self.loss, train_vars) 的train_vars改成了tvars，但是出来的结果全是0

我采取相同的方式想更新BERT参数，出来结果也全是0，请问你解决了吗？

yumath · 2019-11-12T08:09:40Z

@Guohai93 确实是这样，我的理解是bert的参数过多，无法在如此小的NER数据集上收敛。你如果需要更新bert参数的话，建议先对bert参数在自己数据集上进行训练，再拿来做NER

airship-explorer · 2019-11-12T13:03:32Z

@Guohai93 确实是这样，我的理解是bert的参数过多，无法在如此小的NER数据集上收敛。你如果需要更新bert参数的话，建议先对bert参数在自己数据集上进行训练，再拿来做NER

做了一点实验，发现采用训练LSTM的1e-3学习速率太大了，导致底层预训练的BERT被破坏了，如果采用小的学习速率比如1e-4或更小，结果不再是0了。

yumath · 2019-11-12T13:23:29Z

@Guohai93 👍

yumath closed this as completed Jul 18, 2019

yumath mentioned this issue Nov 12, 2019

如何不冻结BERT参数，即BERT也进行训练？ #10

Closed

Provide feedback