PaddlePaddle · EmmonsCurse · Oct 16, 2025 · Oct 15, 2025
diff --git a/custom_ops/xpu_ops/src/ops/moe_layer.cc b/custom_ops/xpu_ops/src/ops/moe_layer.cc
@@ -228,8 +228,9 @@ MoeLayer(const paddle::Tensor &x, const paddle::Tensor &gate_weight,
                quant_method == "weight_only_int4") {
         APPLY_MOE_LAYER_KERNEL(paddle::bfloat16, int4_t);
     } else {
-        PD_THROW("MoeLayer not support x_type==%d, w_type==%d",
-                 static_cast<int>(x_type), static_cast<int>(w_type));
+        PD_THROW("MoeLayer not support x_type=", static_cast<int>(x_type),
+                 ", w_type=", static_cast<int>(w_type),
+                 ", quant_method=", quant_method);
         return {};
     }
 #undef APPLY_MOE_LAYER_KERNEL

diff --git a/fastdeploy/model_executor/layers/backends/xpu/__init__.py b/fastdeploy/model_executor/layers/backends/xpu/__init__.py
@@ -16,16 +16,11 @@
 xpu backend methods
 """
 
-from .moe.fused_moe import (
-    XPUMoEMethod,
-    XPUWeightOnlyMoeEpMethod,
-    XPUWeightOnlyMoEMethod,
-)
+from .moe.fused_moe import XPUMoEMethod, XPUWeightOnlyMoEMethod
 from .quantization.weight_only import XPUWeightOnlyLinearMethod
 
 __all__ = [
     "XPUWeightOnlyLinearMethod",
     "XPUMoEMethod",
     "XPUWeightOnlyMoEMethod",
-    "XPUWeightOnlyMoeEpMethod",
 ]