DIEN组网代码一点疑惑 #713

tz28 · 2022-02-23T03:26:59Z

DIEN组网代码中，下面这两行调用的add_sublayer()函数【self.add_sublayer('linear_%d' % i, linear)】，在传入的name都是'linear_%d' % i的情况下，是否会后面即L144里的覆盖L123里的，如果会覆盖，这么操作两遍add_sublayer()的目的是什么？
https://github.com/PaddlePaddle/PaddleRec/blob/master/models/rank/dien/net.py#L123
https://github.com/PaddlePaddle/PaddleRec/blob/master/models/rank/dien/net.py#L144

wangzhen38 · 2022-02-23T04:47:51Z

两个名字不该重复的，我们会尽快修改，感谢反馈～

tz28 · 2022-02-23T05:03:18Z

两个名字不该重复的，我们会尽快修改，感谢反馈～

好的，点赞

tz28 · 2022-02-24T09:42:50Z

两个名字不该重复的，我们会尽快修改，感谢反馈～

另外，还有两个问题，

DIEN论文中在Interest Evolving Layer（下图中粉红色部分）采用的是改造后的GRU，即AUGRU，其公式如下公式所示，而paddle实现的版本中直接用了最普通的GRU，然后把attention权重部分直接与输入做了点乘后输入到标注GRU中，显然与论文不符合，我看了论文作者开源的代码中自己实现了AUGRU，参见：https://github.com/mouna99/dien/blob/master/script/utils.py#L142 因此，paddle这种实现得到的结果，是不置信的。从paddle的宣传来看，这些模型是其宣传支持的重点，且不说要100%和原论文符合，起码论文的创新点实现要符合，否则就是个demo，与paddle的工业实践宣传不符合。

tz28 closed this as completed Mar 8, 2022

Provide feedback