想请教一下损失函数的计算问题 #3

workspace-for-cross-modality · 2021-03-17T13:27:57Z

您好，我在查看代码的时候，发现和moco相比，损失函数计算的label从全零变成了代码中的torch.arange，请问这样做是什么含义呢，期待您的解答。
labels = torch.arange(choose_match, choose_match + cur_batch_size, dtype=torch.long).cuda()

wang3702 · 2021-03-17T14:11:14Z

您好，这是因为我们同时也用了batch内的其他样本做了similarity calculation，所以如果您查看代码会发现在

AdCo/training/train.py

Line 31 in 57acbc3

k = concat_all_gather(k)

我们做了一个矩阵相乘，所以这会导致我们的对应label实际上是在这个矩阵的diagonal上。
另外希望下次用英文提问，这样其他研究者遇到同样的问题就可以直接查看issue曾经的问题了。

workspace-for-cross-modality · 2021-03-17T14:21:49Z

非常感谢您的回答，接受您的建议，以后会用英文提问。

LetheSec · 2021-04-17T16:13:25Z

您好，这是因为我们同时也用了batch内的其他样本做了similarity calculation，所以如果您查看代码会发现在

AdCo/training/train.py

Line 31 in 57acbc3

k = concat_all_gather(k)

我们做了一个矩阵相乘，所以这会导致我们的对应label实际上是在这个矩阵的diagonal上。
另外希望下次用英文提问，这样其他研究者遇到同样的问题就可以直接查看issue曾经的问题了。

Why to do a matrix multiplication here, rather than do like MoCo？

wang3702 · 2021-04-18T00:18:58Z

We found it's better to avoid collapsing.

workspace-for-cross-modality closed this as completed Mar 17, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

想请教一下损失函数的计算问题 #3

想请教一下损失函数的计算问题 #3

workspace-for-cross-modality commented Mar 17, 2021

wang3702 commented Mar 17, 2021 •

edited

Loading

workspace-for-cross-modality commented Mar 17, 2021

LetheSec commented Apr 17, 2021

wang3702 commented Apr 18, 2021

想请教一下损失函数的计算问题 #3

想请教一下损失函数的计算问题 #3

Comments

workspace-for-cross-modality commented Mar 17, 2021

wang3702 commented Mar 17, 2021 • edited Loading

workspace-for-cross-modality commented Mar 17, 2021

LetheSec commented Apr 17, 2021

wang3702 commented Apr 18, 2021

wang3702 commented Mar 17, 2021 •

edited

Loading