关于复现ESRF模型转为torch的问题 #200

happylee · 2020-12-18T07:06:14Z

于老师，您好！我最近在将ESRF的代码转为torch的版本，但是在计算可替代邻居的部分占用了太大的内存消耗，self.alternativeNeighborhood = tf.vectorized_map(fn=lambda em:getAlternativeNeighborhood(em),elems=user_features)，这句我转换为了循环函数，for elems in user_features: alternativeNeighborhood.append(getAlternativeNeighborhood(elems))，但是在用稍微大一点的数据集如Ciao时，都会内存溢出（如Ciao,7375个user，在为第700多个用户计算可替代邻居时内存就满了，8G的显存）。在打印GPU的使用情况发现，就是这句代码为每个用户计算时，占用了特别大内存消耗。然后我在这部分仅仅计算每个batch的users的可替代邻居，但是最后计算损失函数，又没有可替代邻居的embedding时，因此想请教老师，有什么能解决这句代码内存消耗的方法吗？

Coder-Yu · 2020-12-18T08:09:19Z

基于batch的优化可以缓解这个问题。之前我们实验的时候也使用了一些trick才完成。我们后续会尽快重构原来实验用的代码版本，争取几天内上线。可以稍待几天，目前这个版本的代码在2080上运行douban和lastfm是可以的，在更多用户的数据集上运行，需要将完整数据拆分卷积。

happylee · 2020-12-18T12:59:52Z

基于batch的优化可以缓解这个问题。之前我们实验的时候也使用了一些trick才完成。我们后续会尽快重构原来实验用的代码版本，争取几天内上线。可以稍待几天，目前这个版本的代码在2080上运行douban和lastfm是可以的，在更多用户的数据集上运行，需要将完整数据拆分卷积。

好的，谢谢于老师

Coder-Yu · 2020-12-21T11:07:35Z

Hi,
最近在忙另一篇文章，ESRF的代码重构过后我会at你的^_^

happylee · 2020-12-21T11:10:51Z

Hi,
最近在忙另一篇文章，ESRF的代码重构过后我会at你的^_^

好的

Coder-Yu · 2020-12-30T04:17:12Z

@happylee Hi, ESRF的114行代码我做了一些变动，每次只为100个用户生成alternative neighborhood，空间会节约很多。这个数字还可以变动以适应更大的数据集。感觉这个trick比之前我用的更方便，performance方面变化也不大。你可以在你的implementation里面用类似的方法。

happylee · 2020-12-30T07:12:42Z

@happylee Hi, ESRF的114行代码我做了一些变动，每次只为100个用户生成alternative neighborhood，空间会节约很多。这个数字还可以变动以适应更大的数据集。感觉这个trick比之前我用的更方便，performance方面变化也不大。你可以在你的implementation里面用类似的方法。

好的，非常感谢于老师

happylee closed this as completed Dec 21, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于复现ESRF模型转为torch的问题 #200

关于复现ESRF模型转为torch的问题 #200

happylee commented Dec 18, 2020

Coder-Yu commented Dec 18, 2020

happylee commented Dec 18, 2020

Coder-Yu commented Dec 21, 2020

happylee commented Dec 21, 2020

Coder-Yu commented Dec 30, 2020

happylee commented Dec 30, 2020

关于复现ESRF模型转为torch的问题 #200

关于复现ESRF模型转为torch的问题 #200

Comments

happylee commented Dec 18, 2020

Coder-Yu commented Dec 18, 2020

happylee commented Dec 18, 2020

Coder-Yu commented Dec 21, 2020

happylee commented Dec 21, 2020

Coder-Yu commented Dec 30, 2020

happylee commented Dec 30, 2020