AutoGPTQ · PanQiWei · Sep 14, 2023 · Sep 6, 2023 · Sep 6, 2023
diff --git a/auto_gptq/modeling/_const.py b/auto_gptq/modeling/_const.py
@@ -24,6 +24,8 @@
 ]
 if compare_transformers_version("v4.28.0", op="ge"):
     SUPPORTED_MODELS.append("llama")
+if compare_transformers_version("v4.33.0", op="ge"):
+    SUPPORTED_MODELS.append("falcon")
 
 EXLLAMA_DEFAULT_MAX_INPUT_LENGTH = 2048
 

diff --git a/auto_gptq/modeling/auto.py b/auto_gptq/modeling/auto.py
@@ -29,6 +29,7 @@
     "codegen": CodeGenGPTQForCausalLM,
     "RefinedWebModel": RWGPTQForCausalLM,
     "RefinedWeb": RWGPTQForCausalLM,
+    "falcon": RWGPTQForCausalLM,
     "baichuan": BaiChuanGPTQForCausalLM,
     "internlm": InternLMGPTQForCausalLM,
     "qwen": QwenGPTQForCausalLM,