[ROCm] Fixes for GPTQ on ROCm #2180

kliuae · 2023-12-18T15:15:05Z

Some minor fixes are applied to support GPTQ on ROCm. Tested with ROCm 5.7 environments and the Dockerfile.rocm can be built.
Loading of safetensors load format is enabled for ROCm as quite a few GPTQ models come with such weights.
The amd-installation doc is also updated to include hipBLAS as a prerequisite for GPTQ.

WoosukKwon

LGTM! Thanks for the quick fix!

kliuae added 5 commits December 18, 2023 08:49

Modified gptq to support ROCm build

cb76c85

Merge branch 'main' into vllm-gptq-rocm

a3629fe

Update amd installation guide

f7e89a1

Reverted the auto load_format strategy

ea40b37

Format code

c5928e3

WoosukKwon approved these changes Dec 18, 2023

View reviewed changes

WoosukKwon merged commit 1b7c791 into vllm-project:main Dec 18, 2023
2 checks passed

WoosukKwon added rocm quantization labels Dec 18, 2023

WoosukKwon mentioned this pull request Dec 19, 2023

Timeline on supporting Mixtral on ROCm? #2089

Closed

tjtanaa deleted the vllm-gptq-rocm branch December 19, 2023 06:58

hongxiayang pushed a commit to hongxiayang/vllm that referenced this pull request Feb 13, 2024

[ROCm] Fixes for GPTQ on ROCm (vllm-project#2180)

d901da7

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[ROCm] Fixes for GPTQ on ROCm #2180

[ROCm] Fixes for GPTQ on ROCm #2180

kliuae commented Dec 18, 2023

WoosukKwon left a comment

[ROCm] Fixes for GPTQ on ROCm #2180

[ROCm] Fixes for GPTQ on ROCm #2180

Conversation

kliuae commented Dec 18, 2023

WoosukKwon left a comment

Choose a reason for hiding this comment