Update knn_datastore.py #9

ZhaoQianfeng · 2022-12-26T04:36:06Z

change

chang torch.zeros(...).to(queries.device) to torch.zeros(..., device=queries.device)

reason

.to() is slow because it needs to transfer data from main memory to GPU memory. For large tensors, creating them directly in GPU memory is much faster.

result

After changing these two lines, knn-mt and adaptive knn-mt can be much faster(about 3x ~ 4x), and the inference speed will not differ much from NMT.

chang torch.zeros(...).to(queries.device) to torch.zeros(..., device=queries.device)

Update knn_datastore.py

9290a4f

chang torch.zeros(...).to(queries.device) to torch.zeros(..., device=queries.device)

zhengxxn merged commit 7997d11 into zhengxxn:main Dec 26, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Update knn_datastore.py #9

Update knn_datastore.py #9

ZhaoQianfeng commented Dec 26, 2022

Update knn_datastore.py #9

Update knn_datastore.py #9

Conversation

ZhaoQianfeng commented Dec 26, 2022

change

reason

result