In [11]:
import numpy as np
import pandas as pd
import random
import cvxopt
from cvxopt import matrix, solvers
from cvxopt.modeling import variable
from tqdm.notebook import tqdm

In [4]:
df = pd.read_csv('2019EE10577.csv',header=None)
X = []
y = []
for i,row in df.iterrows():
    xi = []
    for j in range(0,25):
        xi.append(row[j])
    X.append(xi)
    y.append(row[25])
    if i == 499:
        break

In [12]:
def linear_kernel(x1, x2):
    return np.dot(x1, x2)

def polynomial_kernel(x, y, p=3):
    return (1 + np.dot(x, y)) ** p

def gaussian_kernel(x, y, sigma=5.0):
    return np.exp(-linalg.norm(x-y)**2 / (2 * (sigma ** 2)))

class SVM(object):

    def __init__(self, kernel=linear_kernel, C=None):
        self.kernel = kernel
        self.C = C
        if self.C is not None: self.C = float(self.C)

    def fit(self, X, y):
        n_samples, n_features = X.shape

        # Gram matrix
        K = np.zeros((n_samples, n_samples))
        for i in range(n_samples):
            for j in range(n_samples):
                K[i,j] = self.kernel(X[i], X[j])

        P = cvxopt.matrix(np.outer(y,y) * K)
        q = cvxopt.matrix(np.ones(n_samples) * -1)
        A = cvxopt.matrix(y, (1,n_samples))
        b = cvxopt.matrix(0.0)

        if self.C is None:
            G = cvxopt.matrix(np.diag(np.ones(n_samples) * -1))
            h = cvxopt.matrix(np.zeros(n_samples))
        else:
            tmp1 = np.diag(np.ones(n_samples) * -1)
            tmp2 = np.identity(n_samples)
            G = cvxopt.matrix(np.vstack((tmp1, tmp2)))
            tmp1 = np.zeros(n_samples)
            tmp2 = np.ones(n_samples) * self.C
            h = cvxopt.matrix(np.hstack((tmp1, tmp2)))

        # solve QP problem
        solution = cvxopt.solvers.qp(P, q, G, h, A, b)

        # Lagrange multipliers
        a = np.ravel(solution['x'])

        # Support vectors have non zero lagrange multipliers
        sv = a > 1e-5
        ind = np.arange(len(a))[sv]
        self.a = a[sv]
        self.sv = X[sv]
        self.sv_y = y[sv]

        # Intercept
        self.b = 0
        for n in range(len(self.a)):
            self.b += self.sv_y[n]
            self.b -= np.sum(self.a * self.sv_y * K[ind[n],sv])
        self.b /= len(self.a)

        # Weight vector
        if self.kernel == linear_kernel:
            self.w = np.zeros(n_features)
            for n in range(len(self.a)):
                self.w += self.a[n] * self.sv_y[n] * self.sv[n]
        else:
            self.w = None

    def project(self, X):
        if self.w is not None:
            return np.dot(X, self.w) + self.b
        else:
            y_predict = np.zeros(len(X))
            for i in range(len(X)):
                s = 0
                for a, sv_y, sv in zip(self.a, self.sv_y, self.sv):
                    s += a * sv_y * self.kernel(X[i], sv)
                y_predict[i] = s
            return y_predict + self.b

    def predict(self, X):
        return np.sign(self.project(X))

In [13]:
np.array(X).shape

(500, 25)

In [27]:
cf = SVM()

In [28]:
cf.fit(np.array(X),np.array(y))

     pcost       dcost       gap    pres   dres
 0: -1.1371e+02 -2.2743e+02  2e+03  4e+01  2e+00
 1: -3.8373e+02 -3.8759e+02  9e+02  2e+01  1e+00
 2: -3.3172e+04 -3.3176e+04  9e+02  2e+01  1e+00
 3: -3.2791e+08 -3.2791e+08  1e+03  2e+01  1e+00
 4: -3.2463e+14 -3.2463e+14  3e+06  2e+01  1e+00
 5: -3.2139e+22 -3.2139e+22  3e+12  2e+01  1e+00
 6: -3.1817e+32 -3.1817e+32  3e+20  7e+15  1e+00
 7: -3.1498e+44 -3.1498e+44  3e+30  8e+27  1e+00
 8: -3.0986e+58 -3.0986e+58  3e+42  2e+01  1e+00
 9: -1.5311e+74 -1.5311e+74  2e+56  2e+01  1e+00
10: -1.7596e+104 -1.7596e+104  2e+86  2e+01  1e+00
11: -1.6943e+140 -1.6943e+140  2e+122  8e-01  3e-01
12: -1.3880e+156 -1.3880e+156  1e+136 4e+139  3e-01
13: -1.3313e+196 -1.3313e+196  1e+176  3e-02  3e-01
14: -1.3313e+196 -1.3313e+196  1e+176  3e-02  3e-01
15: -1.3313e+196 -1.3313e+196  1e+176  3e-02  3e-01
16: -1.3313e+196 -1.3313e+196  1e+176  3e-02  3e-01
17: -1.3313e+196 -1.3313e+196  1e+176  3e-02  3e-01
18: -1.3313e+196 -1.3313e+196  1e+176  3e-02  3

In [29]:
cf.sv_y

array([4., 1., 0., 5., 2., 3., 5., 1., 1., 2., 0., 1., 3., 3., 4., 3., 3.,
       4., 5., 1., 4., 2., 0., 2., 0., 1., 2., 2., 1., 2., 0., 4., 3., 0.,
       2., 3., 2., 2., 0., 2., 0., 5., 1., 4., 0., 3., 5., 2., 2., 2., 1.,
       0., 3., 3., 4., 4., 3., 4., 3., 0., 2., 5., 3., 5., 3., 1., 1., 3.,
       4., 1., 1., 1., 3., 2., 3., 1., 2., 5., 4., 4., 0., 4., 1., 3., 3.,
       3., 1., 0., 0., 4., 3., 4., 0., 3., 2., 0., 4., 3., 0., 5., 2., 2.,
       3., 3., 2., 1., 3., 2., 1., 0., 1., 1., 3., 4., 3., 3., 5., 1., 4.,
       5., 0., 3., 2., 0., 0., 3., 1., 3., 2., 1., 3., 3., 2., 2., 0., 1.,
       4., 0., 3., 2., 3., 3., 4., 0., 3., 0., 1., 0., 3., 1., 3., 2., 3.,
       1., 5., 2., 3., 1., 0., 1., 0., 1., 1., 3., 0., 1., 0., 3., 2., 1.,
       1., 2., 4., 0., 1., 3., 4., 4., 4., 3., 3., 2., 1., 3., 1., 3., 0.,
       2., 1., 5., 2., 3., 4., 3., 3., 3., 3., 2., 3., 3., 1., 2., 3., 0.,
       1., 3., 0., 0., 1., 4., 1., 3., 0., 3., 2., 3., 4., 0., 3., 0., 0.,
       2., 3., 2., 3., 4.

In [16]:
cf.sup_idx

AttributeError: 'SVM' object has no attribute 'sup_idx'