Add lightning.KernelSVC (binary only) (#176)

BayesWitnesses · Mar 16, 2020 · b363f62 · b363f62
1 parent c342ca1
commit b363f62
Show file tree

Hide file tree

Showing 32 changed files with 396 additions and 50 deletions.
diff --git a/README.md b/README.md
@@ -43,7 +43,7 @@ pip install m2cgen
 |  | Classification | Regression |
 | --- | --- | --- |
 | **Linear** | <ul><li>scikit-learn<ul><li>LogisticRegression</li><li>LogisticRegressionCV</li><li>PassiveAggressiveClassifier</li><li>Perceptron</li><li>RidgeClassifier</li><li>RidgeClassifierCV</li><li>SGDClassifier</li></ul></li><li>lightning<ul><li>AdaGradClassifier</li><li>CDClassifier</li><li>FistaClassifier</li><li>SAGAClassifier</li><li>SAGClassifier</li><li>SDCAClassifier</li><li>SGDClassifier</li></ul></li></ul> | <ul><li>scikit-learn<ul><li>ARDRegression</li><li>BayesianRidge</li><li>ElasticNet</li><li>ElasticNetCV</li><li>HuberRegressor</li><li>Lars</li><li>LarsCV</li><li>Lasso</li><li>LassoCV</li><li>LassoLars</li><li>LassoLarsCV</li><li>LassoLarsIC</li><li>LinearRegression</li><li>OrthogonalMatchingPursuit</li><li>OrthogonalMatchingPursuitCV</li><li>PassiveAggressiveRegressor</li><li>RANSACRegressor(only supported regression estimators can be used as a base estimator)</li><li>Ridge</li><li>RidgeCV</li><li>SGDRegressor</li><li>TheilSenRegressor</li></ul><li>StatsModels<ul><li>Generalized Least Squares (GLS)</li><li>Generalized Least Squares with AR Errors (GLSAR)</li><li>Ordinary Least Squares (OLS)</li><li>Quantile Regression (QuantReg)</li><li>Weighted Least Squares (WLS)</li></ul><li>lightning<ul><li>AdaGradRegressor</li><li>CDRegressor</li><li>FistaRegressor</li><li>SAGARegressor</li><li>SAGRegressor</li><li>SDCARegressor</li></ul></li></ul> |
-| **SVM** | <ul><li>scikit-learn<ul><li>LinearSVC</li><li>NuSVC</li><li>SVC</li></ul></li><li>lightning<ul><li>LinearSVC</li></ul></li></ul> | <ul><li>scikit-learn<ul><li>LinearSVR</li><li>NuSVR</li><li>SVR</li></ul></li><li>lightning<ul><li>LinearSVR</li></ul></li></ul> |
+| **SVM** | <ul><li>scikit-learn<ul><li>LinearSVC</li><li>NuSVC</li><li>SVC</li></ul></li><li>lightning<ul><li>KernelSVC (binary only, multiclass is not supported yet)</li><li>LinearSVC</li></ul></li></ul> | <ul><li>scikit-learn<ul><li>LinearSVR</li><li>NuSVR</li><li>SVR</li></ul></li><li>lightning<ul><li>LinearSVR</li></ul></li></ul> |
 | **Tree** | <ul><li>DecisionTreeClassifier</li><li>ExtraTreeClassifier</li></ul> | <ul><li>DecisionTreeRegressor</li><li>ExtraTreeRegressor</li></ul> |
 | **Random Forest** | <ul><li>ExtraTreesClassifier</li><li>LGBMClassifier(rf booster only)</li><li>RandomForestClassifier</li><li>XGBRFClassifier(binary only, multiclass is not supported yet)</li></ul> | <ul><li>ExtraTreesRegressor</li><li>LGBMRegressor(rf booster only)</li><li>RandomForestRegressor</li><li>XGBRFRegressor</li></ul> |
 | **Boosting** | <ul><li>LGBMClassifier(gbdt/dart/goss booster only)</li><li>XGBClassifier(gbtree/gblinear booster only)</li><ul> | <ul><li>LGBMRegressor(gbdt/dart/goss booster only)</li><li>XGBRegressor(gbtree/gblinear booster only)</li></ul> |

diff --git a/m2cgen/assemblers/__init__.py b/m2cgen/assemblers/__init__.py
@@ -6,7 +6,7 @@
                        XGBoostTreeModelAssembler,
                        XGBoostLinearModelAssembler,
                        LightGBMModelAssembler)
-from .svm import SVMModelAssembler
+from .svm import SklearnSVMModelAssembler, LightningSVMModelAssembler
 from .meta import RANSACModelAssembler
 
 __all__ = [
@@ -19,7 +19,8 @@
     XGBoostTreeModelAssembler,
     XGBoostLinearModelAssembler,
     LightGBMModelAssembler,
-    SVMModelAssembler,
+    SklearnSVMModelAssembler,
+    LightningSVMModelAssembler,
 ]
 
 
@@ -37,12 +38,13 @@
     # Sklearn SVM
     "sklearn_LinearSVC": SklearnLinearModelAssembler,
     "sklearn_LinearSVR": SklearnLinearModelAssembler,
-    "sklearn_NuSVC": SVMModelAssembler,
-    "sklearn_NuSVR": SVMModelAssembler,
-    "sklearn_SVC": SVMModelAssembler,
-    "sklearn_SVR": SVMModelAssembler,
+    "sklearn_NuSVC": SklearnSVMModelAssembler,
+    "sklearn_NuSVR": SklearnSVMModelAssembler,
+    "sklearn_SVC": SklearnSVMModelAssembler,
+    "sklearn_SVR": SklearnSVMModelAssembler,
 
     # Lightning SVM
+    "lightning_KernelSVC": LightningSVMModelAssembler,
     "lightning_LinearSVC": SklearnLinearModelAssembler,
     "lightning_LinearSVR": SklearnLinearModelAssembler,
 

diff --git a/m2cgen/assemblers/boosting.py b/m2cgen/assemblers/boosting.py
@@ -1,5 +1,6 @@
 import json
 import numpy as np
+
 from m2cgen import ast
 from m2cgen.assemblers import utils
 from m2cgen.assemblers.base import ModelAssembler

diff --git a/m2cgen/assemblers/svm.py b/m2cgen/assemblers/svm.py
@@ -1,38 +1,27 @@
+import numpy as np
+
 from m2cgen import ast
 from m2cgen.assemblers import utils
 from m2cgen.assemblers.base import ModelAssembler
 
 
-class SVMModelAssembler(ModelAssembler):
+class BaseSVMModelAssembler(ModelAssembler):
 
     def __init__(self, model):
         super().__init__(model)
 
-        supported_kernels = {
-            "rbf": self._rbf_kernel,
-            "sigmoid": self._sigmoid_kernel,
-            "poly": self._poly_kernel,
-            "linear": self._linear_kernel
-        }
         kernel_type = model.kernel
+        supported_kernels = self._get_supported_kernels()
         if kernel_type not in supported_kernels:
             raise ValueError("Unsupported kernel type {}".format(kernel_type))
         self._kernel_fun = supported_kernels[kernel_type]
 
-        n_features = len(model.support_vectors_[0])
-
-        gamma = model.gamma
-        if gamma == "auto" or gamma == "auto_deprecated":
-            gamma = 1.0 / n_features
+        gamma = self._get_gamma()
         self._gamma_expr = ast.NumVal(gamma)
         self._neg_gamma_expr = utils.sub(ast.NumVal(0), ast.NumVal(gamma),
                                          to_reuse=True)
 
-        self._output_size = 1
-        if type(model).__name__ in ("SVC", "NuSVC"):
-            n_classes = len(model.n_support_)
-            if n_classes > 2:
-                self._output_size = n_classes
+        self._output_size = self._get_output_size()
 
     def assemble(self):
         if self._output_size > 1:
@@ -42,8 +31,8 @@ def assemble(self):
 
     def _assemble_single_output(self):
         support_vectors = self.model.support_vectors_
-        coef = self.model.dual_coef_[0]
-        intercept = self.model.intercept_[0]
+        coef = self._get_single_coef()
+        intercept = self._get_single_intercept()
 
         kernel_exprs = self._apply_kernel(support_vectors)
 
@@ -57,6 +46,50 @@ def _assemble_single_output(self):
             ast.NumVal(intercept),
             *kernel_weight_mul_ops)
 
+    def _apply_kernel(self, support_vectors, to_reuse=False):
+        kernel_exprs = []
+        for v in support_vectors:
+            kernel = self._kernel_fun(v)
+            kernel_exprs.append(ast.SubroutineExpr(kernel, to_reuse=to_reuse))
+        return kernel_exprs
+
+    def _get_supported_kernels(self):
+        return {
+            "rbf": self._rbf_kernel,
+            "sigmoid": self._sigmoid_kernel,
+            "poly": self._poly_kernel,
+            "linear": self._linear_kernel
+        }
+
+    def _get_gamma(self):
+        raise NotImplementedError
+
+    def _get_output_size(self):
+        raise NotImplementedError
+
+    def _assemble_multi_class_output(self):
+        raise NotImplementedError
+
+    def _get_single_coef(self):
+        raise NotImplementedError
+
+    def _get_single_intercept(self):
+        raise NotImplementedError
+
+
+class SklearnSVMModelAssembler(BaseSVMModelAssembler):
+
+    def _get_gamma(self):
+        return self.model._gamma
+
+    def _get_output_size(self):
+        output_size = 1
+        if type(self.model).__name__ in {"SVC", "NuSVC"}:
+            n_classes = len(self.model.n_support_)
+            if n_classes > 2:
+                output_size = n_classes
+        return output_size
+
     def _assemble_multi_class_output(self):
         support_vectors = self.model.support_vectors_
         coef = self.model.dual_coef_
@@ -96,12 +129,11 @@ def _assemble_multi_class_output(self):
 
         return ast.VectorVal(decisions)
 
-    def _apply_kernel(self, support_vectors, to_reuse=False):
-        kernel_exprs = []
-        for v in support_vectors:
-            kernel = self._kernel_fun(v)
-            kernel_exprs.append(ast.SubroutineExpr(kernel, to_reuse=to_reuse))
-        return kernel_exprs
+    def _get_single_coef(self):
+        return self.model.dual_coef_[0]
+
+    def _get_single_intercept(self):
+        return self.model.intercept_[0]
 
     def _rbf_kernel(self, support_vector):
         elem_wise = [
@@ -135,3 +167,41 @@ def _linear_kernel_with_gama_and_coef(self, support_vector):
         kernel = self._linear_kernel(support_vector)
         kernel = utils.mul(self._gamma_expr, kernel)
         return utils.add(kernel, ast.NumVal(self.model.coef0))
+
+
+class LightningSVMModelAssembler(SklearnSVMModelAssembler):
+
+    def _get_supported_kernels(self):
+        kernels = super()._get_supported_kernels()
+        kernels["cosine"] = self._cosine_kernel
+        return kernels
+
+    def _get_gamma(self):
+        return self.model.gamma
+
+    def _get_output_size(self):
+        return 1
+
+    def _assemble_multi_class_output(self):
+        raise NotImplementedError
+
+    def _get_single_coef(self):
+        return self.model.coef_[0]
+
+    def _cosine_kernel(self, support_vector):
+        support_vector_norm = np.linalg.norm(support_vector)
+        if support_vector_norm == 0.0:
+            support_vector_norm = 1.0
+        feature_norm = ast.SqrtExpr(
+            utils.apply_op_to_expressions(
+                ast.BinNumOpType.ADD,
+                *[utils.mul(ast.FeatureRef(i), ast.FeatureRef(i))
+                  for i in range(len(support_vector))]),
+            to_reuse=True)
+        safe_feature_norm = ast.IfExpr(
+            utils.eq(feature_norm, ast.NumVal(0.0)),
+            ast.NumVal(1.0),
+            feature_norm)
+        kernel = self._linear_kernel(support_vector / support_vector_norm)
+        kernel = utils.div(kernel, safe_feature_norm)
+        return kernel
diff --git a/m2cgen/assemblers/utils.py b/m2cgen/assemblers/utils.py
@@ -1,11 +1,16 @@
 import numpy as np
+
 from m2cgen import ast
 
 
 def mul(l, r, to_reuse=False):
     return ast.BinNumExpr(l, r, ast.BinNumOpType.MUL, to_reuse=to_reuse)
 
 
+def div(l, r, to_reuse=False):
+    return ast.BinNumExpr(l, r, ast.BinNumOpType.DIV, to_reuse=to_reuse)
+
+
 def add(l, r, to_reuse=False):
     return ast.BinNumExpr(l, r, ast.BinNumOpType.ADD, to_reuse=to_reuse)
 
@@ -18,6 +23,10 @@ def lte(l, r):
     return ast.CompExpr(l, r, ast.CompOpType.LTE)
 
 
+def eq(l, r):
+    return ast.CompExpr(l, r, ast.CompOpType.EQ)
+
+
 BIN_EXPR_CLASSES = {
     (False, False): ast.BinNumExpr,
     (True, True): ast.BinVectorExpr,

diff --git a/m2cgen/ast.py b/m2cgen/ast.py
@@ -49,6 +49,18 @@ def __str__(self):
         return "ExpExpr(" + args + ")"
 
 
+class SqrtExpr(NumExpr):
+    def __init__(self, expr, to_reuse=False):
+        assert expr.output_size == 1, "Only scalars are supported"
+
+        self.expr = expr
+        self.to_reuse = to_reuse
+
+    def __str__(self):
+        args = ",".join([str(self.expr), "to_reuse=" + str(self.to_reuse)])
+        return "SqrtExpr(" + args + ")"
+
+
 class TanhExpr(NumExpr):
     def __init__(self, expr, to_reuse=False):
         assert expr.output_size == 1, "Only scalars are supported"
@@ -237,7 +249,7 @@ def __str__(self):
     (PowExpr, lambda e: [e.base_expr, e.exp_expr]),
     (VectorVal, lambda e: e.exprs),
     (IfExpr, lambda e: [e.test, e.body, e.orelse]),
-    ((ExpExpr, TanhExpr, TransparentExpr), lambda e: [e.expr]),
+    ((ExpExpr, SqrtExpr, TanhExpr, TransparentExpr), lambda e: [e.expr]),
 ]
 
 

diff --git a/m2cgen/interpreters/c/interpreter.py b/m2cgen/interpreters/c/interpreter.py
@@ -19,6 +19,7 @@ class CInterpreter(ToCodeInterpreter,
 
     exponent_function_name = "exp"
     power_function_name = "pow"
+    sqrt_function_name = "sqrt"
     tanh_function_name = "tanh"
 
     def __init__(self, indent=4, function_name="score", *args, **kwargs):

diff --git a/m2cgen/interpreters/c_sharp/interpreter.py b/m2cgen/interpreters/c_sharp/interpreter.py
@@ -19,6 +19,7 @@ class CSharpInterpreter(ToCodeInterpreter, mixins.LinearAlgebraMixin):
 
     exponent_function_name = "Exp"
     power_function_name = "Pow"
+    sqrt_function_name = "Sqrt"
     tanh_function_name = "Tanh"
 
     def __init__(self, namespace="ML", class_name="Model", indent=4,

diff --git a/m2cgen/interpreters/dart/interpreter.py b/m2cgen/interpreters/dart/interpreter.py
@@ -23,6 +23,7 @@ class DartInterpreter(ToCodeInterpreter,
 
     exponent_function_name = "exp"
     power_function_name = "pow"
+    sqrt_function_name = "sqrt"
     tanh_function_name = "tanh"
 
     with_tanh_expr = False

diff --git a/m2cgen/interpreters/go/interpreter.py b/m2cgen/interpreters/go/interpreter.py
@@ -18,6 +18,7 @@ class GoInterpreter(ToCodeInterpreter,
 
     exponent_function_name = "math.Exp"
     power_function_name = "math.Pow"
+    sqrt_function_name = "math.Sqrt"
     tanh_function_name = "math.Tanh"
 
     def __init__(self, indent=4, function_name="score", *args, **kwargs):

diff --git a/m2cgen/interpreters/interpreter.py b/m2cgen/interpreters/interpreter.py
@@ -98,6 +98,7 @@ class ToCodeInterpreter(BaseToCodeInterpreter):
 
     exponent_function_name = NotImplemented
     power_function_name = NotImplemented
+    sqrt_function_name = NotImplemented
     tanh_function_name = NotImplemented
 
     def __init__(self, cg, feature_array_name="input"):
@@ -160,6 +161,13 @@ def interpret_exp_expr(self, expr, **kwargs):
         return self._cg.function_invocation(
             self.exponent_function_name, nested_result)
 
+    def interpret_sqrt_expr(self, expr, **kwargs):
+        assert self.sqrt_function_name, "Sqrt function is not provided"
+        self.with_math_module = True
+        nested_result = self._do_interpret(expr.expr, **kwargs)
+        return self._cg.function_invocation(
+            self.sqrt_function_name, nested_result)
+
     def interpret_tanh_expr(self, expr, **kwargs):
         assert self.tanh_function_name, "Tanh function is not provided"
         self.with_math_module = True

diff --git a/m2cgen/interpreters/java/interpreter.py b/m2cgen/interpreters/java/interpreter.py
@@ -28,6 +28,7 @@ class JavaInterpreter(ToCodeInterpreter,
 
     exponent_function_name = "Math.exp"
     power_function_name = "Math.pow"
+    sqrt_function_name = "Math.sqrt"
     tanh_function_name = "Math.tanh"
 
     def __init__(self, package_name=None, class_name="Model", indent=4,

diff --git a/m2cgen/interpreters/javascript/interpreter.py b/m2cgen/interpreters/javascript/interpreter.py
@@ -21,6 +21,7 @@ class JavascriptInterpreter(ToCodeInterpreter,
 
     exponent_function_name = "Math.exp"
     power_function_name = "Math.pow"
+    sqrt_function_name = "Math.sqrt"
     tanh_function_name = "Math.tanh"
 
     def __init__(self, indent=4, function_name="score",

diff --git a/m2cgen/interpreters/php/interpreter.py b/m2cgen/interpreters/php/interpreter.py
@@ -18,6 +18,7 @@ class PhpInterpreter(ToCodeInterpreter, mixins.LinearAlgebraMixin):
 
     exponent_function_name = "exp"
     power_function_name = "pow"
+    sqrt_function_name = "sqrt"
     tanh_function_name = "tanh"
 
     def __init__(self, indent=4, function_name="score", *args, **kwargs):

diff --git a/m2cgen/interpreters/powershell/interpreter.py b/m2cgen/interpreters/powershell/interpreter.py
@@ -20,6 +20,7 @@ class PowershellInterpreter(ToCodeInterpreter,
 
     exponent_function_name = "[math]::Exp"
     power_function_name = "[math]::Pow"
+    sqrt_function_name = "[math]::Sqrt"
     tanh_function_name = "[math]::Tanh"
 
     def __init__(self, indent=4, function_name="Score", *args, **kwargs):
@@ -52,6 +53,11 @@ def interpret_exp_expr(self, expr, **kwargs):
         return self._cg.math_function_invocation(
             self.exponent_function_name, nested_result)
 
+    def interpret_sqrt_expr(self, expr, **kwargs):
+        nested_result = self._do_interpret(expr.expr, **kwargs)
+        return self._cg.math_function_invocation(
+            self.sqrt_function_name, nested_result)
+
     def interpret_tanh_expr(self, expr, **kwargs):
         nested_result = self._do_interpret(expr.expr, **kwargs)
         return self._cg.math_function_invocation(

diff --git a/m2cgen/interpreters/python/interpreter.py b/m2cgen/interpreters/python/interpreter.py
@@ -12,6 +12,7 @@ class PythonInterpreter(ToCodeInterpreter,
 
     exponent_function_name = "math.exp"
     power_function_name = "math.pow"
+    sqrt_function_name = "math.sqrt"
     tanh_function_name = "math.tanh"
 
     def __init__(self, indent=4, function_name="score", *args, **kwargs):

diff --git a/m2cgen/interpreters/r/interpreter.py b/m2cgen/interpreters/r/interpreter.py
@@ -20,6 +20,7 @@ class RInterpreter(ToCodeInterpreter,
     bin_depth_threshold = 25
 
     exponent_function_name = "exp"
+    sqrt_function_name = "sqrt"
     tanh_function_name = "tanh"
 
     def __init__(self, indent=4, function_name="score", *args, **kwargs):