论文中的网络结构与开源代码网络结构不同 #8

FunkyKoki · 2022-08-17T03:29:13Z

感谢作者！但是还有一个疑问想请教一下。
在论文中，特意列出了Table 5，以论证learned tokenizer是弱于atten-based tokenizer的，但是在代码中有query项，这个query就是自行学习的，这也使得最后的attention map也是基于query对原始特征的变换后得到的。这里面是否有论文与代码不一致的问题呢？

FunkyKoki · 2022-08-17T03:52:40Z

我大概理解了，query就是图片中conv2d的参数，只是变成了对序列做处理的形式

FunkyKoki closed this as completed Aug 17, 2022

FunkyKoki reopened this Aug 17, 2022

FunkyKoki closed this as completed Aug 17, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

论文中的网络结构与开源代码网络结构不同 #8

论文中的网络结构与开源代码网络结构不同 #8

FunkyKoki commented Aug 17, 2022 •

edited

FunkyKoki commented Aug 17, 2022 •

edited

论文中的网络结构与开源代码网络结构不同 #8

论文中的网络结构与开源代码网络结构不同 #8

Comments

FunkyKoki commented Aug 17, 2022 • edited

FunkyKoki commented Aug 17, 2022 • edited

FunkyKoki commented Aug 17, 2022 •

edited

FunkyKoki commented Aug 17, 2022 •

edited