AutoGPTQ · PanQiWei · Aug 4, 2023 · Aug 3, 2023
diff --git a/auto_gptq/nn_modules/qlinear/__init__.py b/auto_gptq/nn_modules/qlinear/__init__.py
@@ -8,7 +8,6 @@ def __init__(self, quant_linear_module):
             out_features=quant_linear_module.outfeatures,
             bias=True
         )
-
         self.infeatures = quant_linear_module.infeatures
         self.outfeatures = quant_linear_module.outfeatures
         self.bits = quant_linear_module.bits
@@ -18,15 +17,15 @@ def __init__(self, quant_linear_module):
         self.weight.requires_grad = False
 
         self.weight.data = quant_linear_module.qweight
-        self.qweight = self.weight
+        self.register_buffer('qweight', quant_linear_module.qweight)
         self.bias.data = quant_linear_module.bias
 
         self.qweight.requires_grad = False
         self.bias.requires_grad = False
 
-        self.qzeros = quant_linear_module.qzeros
-        self.scales = quant_linear_module.scales
-        self.g_idx = quant_linear_module.g_idx
+        self.register_buffer('qzeros', quant_linear_module.qzeros)
+        self.register_buffer('scales', quant_linear_module.scales)
+        self.register_buffer('g_idx', quant_linear_module.g_idx)
 
         if hasattr(quant_linear_module, "wf"):
             self.wf = quant_linear_module.wf