关于修改为tf.nn.ctc_loss后收敛变慢的问题 #34

phamhe · 2017-12-21T07:17:05Z

作者你好：
我在bete版本的代码中的build_loss部分做了如下修改：
1、重新定义labels为稀疏张量
2、在获得labels时将labels转换为稀疏矩阵
3、使用之前获得的time_step_batch作为tf.nn.ctc_loss的seq_len输入
然后我将源代码中的warpctc替换为tf.nn.ctc_loss并成功跑通了网络，但是收敛的很慢（从read.me图片来看你跑了20k次就达到了96%的准确率，而我跑了35k次才勉强上90%，loss没下0.1，我没有修改代码中的参数所以我们参数应该是一样的，样本我也用的是直接生成在内存中的样本）
我想问一下：
1、是不是我还有遗漏的地方没有修改？
2、我收敛的慢是不是使用了不同的ctc函数引起的（tf.nn.ctc_loss与warpctc）

ilovin · 2017-12-21T09:39:26Z

如此修改，应该是没什么问题。

本来standard和warp还有一个区别，blank label不同，但是因为我代码里"NCLASSES"是直接=len+2所以应该没问题
跑出来效果有差别，二者实现上是否存在区别，我想只能看源码才能知道了，但是原理上应该是通的，都用了log。ps: 讲道理，warp只是一个并行加速的实现。

也许你可以调调参，看看能不能有所改善

phamhe · 2017-12-25T02:28:07Z

谢谢回答，我训练完后最高的ac会在96左右，我再调调参试试，再次感谢。

frankenliu · 2018-04-03T09:29:28Z

@phamhe 请问这个问题解决了吗？我这边使用TensorFlow ctc loss也出现收敛很慢的情况，不知道替换warpctc能否有效？

ilovin mentioned this issue Jan 8, 2018

Using Tensorflow CTC on Dev and Beta instead of Warp CTC #36

Closed

ilovin closed this as completed Jan 11, 2018

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于修改为tf.nn.ctc_loss后收敛变慢的问题 #34

关于修改为tf.nn.ctc_loss后收敛变慢的问题 #34

phamhe commented Dec 21, 2017

ilovin commented Dec 21, 2017

phamhe commented Dec 25, 2017

frankenliu commented Apr 3, 2018

关于修改为tf.nn.ctc_loss后收敛变慢的问题 #34

关于修改为tf.nn.ctc_loss后收敛变慢的问题 #34

Comments

phamhe commented Dec 21, 2017

ilovin commented Dec 21, 2017

phamhe commented Dec 25, 2017

frankenliu commented Apr 3, 2018