用示例代码 + 单卡GPU，训练速度特别慢 #2

lcshr123 · 2020-11-07T07:24:04Z

你好，我用 Tesla P40 单卡来跑咱们的数据集，用到的参数都是论文里的设置
model_para = { 'item_size': len(items), 'dilated_channels': 256, 'dilations': [1, 2, 4, 8, 1, 2, 4, 8, 1, 2, 4, 8, 1, 2, 4, 8], 'kernel_size': 3, 'learning_rate':0.001, 'batch_size':32, 'iterations':400, 'is_negsample':True }
发现训练速度非常慢，要用 416分钟才能跑完一轮，默认的400轮跑完不知要猴年马月了。我用的是 coldrec2_pre.csv 这个数据集。请问这个训练速度很慢的问题有遇到过吗？
-------------------------------------------------------train1
LOSS: 5.77672100067 ITER: 0 BATCH_NO: 169 STEP:170 total_batches:23006
TIME FOR BATCH 1.08627700806
TIME FOR ITER (mins) 416.514814123

The text was updated successfully, but these errors were encountered:

yuan2961634811 · 2020-12-17T08:03:01Z

[1, 2, 4, 8, 1, 2, 4, 8, 1, 2, 4, 8, 1, 2, 4, 8] 是32层，1 4 means 1 2 4 8. 一般2 iterations 就收敛了，不用400的（请阅读readme里面哈，400不是默认设置）. 你用NextitNet_TF_Pretrain_topk.py .py试一下。另外用了很大的embedding和很高的层数，慢一些属于正常，如果改成把喂数据地方改一下，会快很多的，网络比transformer快很多的

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

用示例代码 + 单卡GPU，训练速度特别慢 #2

用示例代码 + 单卡GPU，训练速度特别慢 #2

lcshr123 commented Nov 7, 2020 •

edited

Loading

yuan2961634811 commented Dec 17, 2020 •

edited

Loading

用示例代码 + 单卡GPU，训练速度特别慢 #2

用示例代码 + 单卡GPU，训练速度特别慢 #2

Comments

lcshr123 commented Nov 7, 2020 • edited Loading

yuan2961634811 commented Dec 17, 2020 • edited Loading

lcshr123 commented Nov 7, 2020 •

edited

Loading

yuan2961634811 commented Dec 17, 2020 •

edited

Loading