您好,大佬问您一个问题,为什么attention解码训练的时候,都要重置 decoder_hidden = decoder.initHidden(b).cuda()参数呢,我的理解应该是编码层输出会有一个decoder_hidden 参数啊,大佬可以解答一下吗? @chenjun2hao