Qwen1.5-72B-Chat-GPTQ-Int4 #16

ChuanhongLi · 2024-04-01T11:39:05Z

请问下，能直接跑 Qwen1.5-72B-Chat-GPTQ-Int4 模型吗？

guyan364 · 2024-04-02T02:34:50Z

你好，我使用 Qwen1.5-7B-Chat-GPTQ-Int4 测试可以推理。load model 的时候去掉 dtype=torch.bfloat16 即可。

huliangbing · 2024-04-22T14:49:15Z

您好！修改哪个文件？@guyan364

guyan364 closed this as completed Apr 2, 2024

ChuanhongLi mentioned this issue Apr 15, 2024

是否支持Qwen1.5-7B的量化版本？ #32

Closed

Provide feedback