In [1]:
import numpy as np
import cvxopt
from sklearn.datasets.samples_generator import make_blobs
from sklearn.model_selection import train_test_split
from matplotlib import pyplot as plt
from sklearn.svm import LinearSVC
from sklearn.metrics import confusion_matrix


In [9]:
n_samples = 250
K = np.zeros((n_samples, n_samples))


In [10]:
class SVM:
    def fit(self, X, y):
        n_samples, n_features = X.shape
# P = X^T X
        K = np.zeros((n_samples, n_samples))
        for i in range(n_samples):
            for j in range(n_samples):
                K[i,j] = np.dot(X[i], X[j])
                
    P = cvxopt.matrix(np.outer(y, y) * K)
# q = -1 (1xN)
    q = cvxopt.matrix(np.ones(n_samples) * -1)
# A = y^T 
    A = cvxopt.matrix(y, (1, n_samples))
# b = 0 
    b = cvxopt.matrix(0.0)
# -1 (NxN)
    G = cvxopt.matrix(np.diag(np.ones(n_samples) * -1))
# 0 (1xN)
    h = cvxopt.matrix(np.zeros(n_samples))
    solution = cvxopt.solvers.qp(P, q, G, h, A, b)
# Lagrange multipliers
    a = np.ravel(solution['x'])
# Lagrange have non zero lagrange multipliers
    sv = a > 1e-5
    ind = np.arange(len(a))[sv]
    self.a = a[sv]
    self.sv = X[sv]
    self.sv_y = y[sv]
# Intercept
    self.b = 0
    for n in range(len(self.a)):
        self.b += self.sv_y[n]
        self.b -= np.sum(self.a * self.sv_y * K[ind[n], sv])
    self.b /= len(self.a)
# Weights
    self.w = np.zeros(n_features)
    for n in range(len(self.a)):
        self.w += self.a[n] * self.sv_y[n] * self.sv[n]

    def project(self, X):
        return np.dot(X, self.w) + self.b
    
    
    def predict(self, X):
        return np.sign(self.project(X))

     pcost       dcost       gap    pres   dres
 0: -2.5000e+02 -5.0000e+02  2e+02  0e+00  2e+00
 1: -6.2125e+02 -6.2746e+02  6e+00  9e-16  1e+00
 2: -6.2734e+04 -6.2740e+04  6e+00  4e-13  1e+00
 3: -6.2119e+08 -6.2119e+08  6e+02  7e-09  1e+00
 4: -6.1498e+14 -6.1498e+14  6e+06  0e+00  1e+00
 5: -6.0883e+22 -6.0883e+22  6e+12  7e+04  1e+00
 6: -6.0274e+32 -6.0274e+32  6e+20  1e+16  1e+00
 7: -5.9671e+44 -5.9671e+44  6e+30  5e+27  1e+00
 8: -5.8885e+58 -5.8885e+58  6e+42  1e+42  1e+00
 9: -5.8885e+90 -8.4405e+90  3e+90  6e+73  1e+00
10: -2.3406e+91 -2.3508e+91  1e+89  0e+00  1e+00
11: -5.3932e+93 -5.3934e+93  2e+89  2e+77  1e+00
12: -1.2321e+98 -1.2321e+98  5e+91  5e+81  1e+00
13: -2.8144e+104 -2.8144e+104  1e+96  5e+86  1e+00
14: -6.4289e+112 -6.4289e+112  3e+102  2e+96  1e+00
15: -1.4685e+123 -1.4685e+123  6e+110 6e+106  1e+00
16: -3.3508e+135 -3.3508e+135  1e+121 3e+119  1e+00
17: -7.1835e+149 -7.1835e+149  2e+134 4e+133  1e+00
18: -1.8236e+165 -1.8236e+165  2e+149  0e+00  1e+00
19: 

ValueError: domain error

In [7]:
X, y = make_blobs(n_samples=250, centers=2,
                  random_state=0, cluster_std=0.60)
y[y == 0] = -1
tmp = np.ones(len(X))
y = tmp * y


In [4]:
y

array([-1., -1.,  1.,  1.,  1.,  1.,  1., -1., -1.,  1., -1., -1., -1.,
       -1.,  1.,  1., -1., -1., -1.,  1.,  1.,  1., -1., -1., -1.,  1.,
       -1., -1.,  1.,  1., -1.,  1.,  1.,  1., -1., -1., -1.,  1., -1.,
       -1., -1., -1.,  1., -1.,  1.,  1., -1.,  1., -1., -1., -1., -1.,
        1.,  1., -1.,  1., -1., -1., -1.,  1.,  1., -1.,  1., -1., -1.,
       -1.,  1.,  1., -1.,  1., -1.,  1.,  1.,  1.,  1.,  1., -1., -1.,
       -1., -1.,  1.,  1.,  1., -1.,  1., -1., -1.,  1.,  1., -1., -1.,
       -1.,  1.,  1., -1., -1.,  1., -1., -1.,  1.,  1., -1., -1.,  1.,
        1.,  1., -1.,  1., -1., -1.,  1.,  1.,  1., -1., -1., -1.,  1.,
       -1., -1., -1.,  1.,  1.,  1., -1., -1.,  1., -1., -1., -1., -1.,
        1.,  1.,  1., -1., -1., -1.,  1., -1.,  1., -1., -1.,  1., -1.,
        1., -1.,  1.,  1.,  1.,  1.,  1.,  1.,  1., -1., -1.,  1.,  1.,
       -1.,  1., -1.,  1.,  1., -1.,  1.,  1.,  1., -1., -1., -1.,  1.,
        1.,  1., -1., -1.,  1.,  1.,  1.,  1., -1.,  1.,  1.,  1