In [None]:
# Cargue de librerias

import numpy as np
import pandas as pd  
from sklearn import svm     #Import svm model
import matplotlib.pyplot as plt

In [None]:
# Lectura de datos de entrenamiento
# Estos datos fueron generados aleatoriamente para representar datos que fueran linealmente separables

dat = pd.read_csv(r'C:\Users\auditorio\datos\data1.csv')  # Cargar el dataset
dat.head()

In [None]:
plt.scatter(dat.x1, dat.x2, c=dat.y);

In [None]:
X = dat.drop('y', axis=1)
y = dat['y']

In [None]:
# Generación del modelo SVM
# Para este primer modelo usaremos un kernel lineal y un costo = 10000.  Estos parámetros serán explicados más adelante.
# Para datos linealmente separables, el parámetro de costo no incide, como lo veremos más adelante

from sklearn.svm import SVC
svclassifier = SVC(kernel='linear', C=1e5)
svclassifier.fit(X, y)

In [None]:
# Graficamos el SVM con el hiperplano de separación, y el margen

def plot_svc_decision_function(model, ax=None, plot_support=True):
    """Plot the decision function for a 2D SVC"""
    if ax is None:
        ax = plt.gca()
    xlim = ax.get_xlim()
    ylim = ax.get_ylim()
    
    # create grid to evaluate model
    x = np.linspace(xlim[0], xlim[1], 30)
    y = np.linspace(ylim[0], ylim[1], 30)
    Y, X = np.meshgrid(y, x)
    xy = np.vstack([X.ravel(), Y.ravel()]).T
    P = model.decision_function(xy).reshape(X.shape)
    
    # plot decision boundary and margins
    ax.contour(X, Y, P, colors='k',
               levels=[-1, 0, 1], alpha=0.5,
               linestyles=['--', '-', '--'])
    
    # plot support vectors
    if plot_support:
        ax.scatter(model.support_vectors_[:, 0],
                   model.support_vectors_[:, 1],
                   s=300, linewidth=1, facecolors='none');
    ax.set_xlim(xlim)
    ax.set_ylim(ylim)

In [None]:
plt.scatter(X.x1, X.x2, c=y, s=20, cmap=plt.cm.coolwarm)
plot_svc_decision_function(svclassifier);

In [None]:
# Observemos los vectores de soporte para este clasificador

svclassifier.support_vectors_

In [None]:
# Probemos ahora con un valor de costo mucho más pequeño

svclassifier10 = SVC(kernel='linear', C=10)
svclassifier10.fit(X, y)
svclassifier10.support_vectors_

In [None]:
# Vemos que los vectores de soporte son los mismos.  Grafiquemos el nuevo SVM.

plt.scatter(X.x1, X.x2, c=y, s=20, cmap=plt.cm.coolwarm)
plot_svc_decision_function(svclassifier10);

In [None]:
# Datos del hiperplano de separación

w = svclassifier10.coef_[0]
a = -w[0] / w[1]
xx = np.linspace(-5, 5)
yy = a * xx - (svclassifier10.intercept_[0]) / w[1]
print(w)
print(svclassifier10.intercept_[0])

In [None]:
#  Anchura del margen

import math
def mag(x): 
    return math.sqrt(sum(i**2 for i in x))
print(2/mag(w))

In [None]:
# Vamos ahora a probar el desempeño del modelo desarrollado.  
# Leeremos datos de prueba, los cuales también fueron generados aleatoriamente.

testdat = pd.read_csv(r'C:\Users\auditorio\datos\data2.csv')  # Cargar el dataset
testdat.head()

In [None]:
testdat.describe()

In [None]:
plt.scatter(testdat.x1, testdat.x2, c=testdat.y);

In [None]:
Xtest = testdat.drop('y', axis=1)
ytest = testdat['y']

In [None]:
ypred = svclassifier.predict(Xtest)

In [None]:
from sklearn.metrics import classification_report, confusion_matrix
print(confusion_matrix(ytest,ypred))
print(classification_report(ytest,ypred))