在跑github下载已经转好的qwen-vl-chat-combine.bmodel模型时，会提示内存不足 #37

xuyang1102 · 2024-08-01T15:20:43Z

用bmrt_test --bmodel 测试模型时发现的这个问题

chuxiaoyi2023 · 2024-08-06T17:00:09Z

可以试试在bmrt_test的时候，观察bm-smi的变动情况，如果内存逐渐增加，并且到11711MB左右时快爆了，那说明可能需要调大内存

Q10这个问题

./memory_edit.sh -c -npu 7168 -vpu 3072 -vpp 4096

xuyang1102 · 2024-08-07T04:38:03Z

但目前看到的是，显存到了8.6G左右时，就报这个错误了，还没有达到我设置的11G

xuyang1102 · 2024-08-07T07:35:32Z

如果设置的11G，是NPU可用的总共11G吗

Provide feedback