In [None]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import ipywidgets as widgets
%matplotlib widget
layout = widgets.Layout(align_items = 'center')

<h1>IMPLEMENTACIÓN CON LIBRERÍAS ESPECIALIZADAS</h1>

<h2>Ejemplo 1: DATOS SEPARABLES LINEALMENTE</h2>
<ol>
    <li>Se utiliza la librería <strong>scikit-learn</strong>:
        <ol>
            <li>El paquete <strong>svm</strong> para implementar SVM.</li>
            <li>El paquete <strong>datasets</strong> incluye distintos 
                funciones para cargar datasets existentes o generar nuevos.</li>
        </ol>
    </li>
</ol>

In [None]:
from sklearn import svm
from sklearn import datasets

<ol start="2">
    <li>Se hace uso de la función <strong>make_blobs</strong> 
        para generar los datos correspondientes 
        a las distintas clases que se usan para 
        el entrenamiento del modelo.
        <ul>
            <li><b>n_samples:</b> Número total de puntos dividido entre las 
                clases.</li>
            <li><b>n_features:</b> Número de features o variables para cada 
                muestra</li>
            <li><b>centers:</b> Número de puntos centrales alrededor de los 
                cuales se ubican las distintas muestras (número de clases).</li>
            <li><b>cluster_std:</b> Desviación estandar de la distribución de 
                los datos alrededor de los puntos centrales. Por defecto es 1.</li>
        </ul>
    </li>
</ol>

In [None]:
X_1, y_1 = datasets.make_blobs(n_samples = 100, centers = 2, n_features = 2)

In [None]:
data_1 = pd.DataFrame(dict(x1 = X_1[:,0], x2 = X_1[:,1], label = y_1))
colors = {0:'red', 1:'blue'}

fig_1_1, ax_1_1 = plt.subplots(figsize = (6,4),tight_layout = True)
fig_1_1.suptitle('Datos de entrenamiento')

grouped_1 = data_1.groupby('label')

for key, group in grouped_1:
    ax_1_1.scatter(group.x1, group.x2, label = f'Clase {key}', color=colors[key])

ax_1_1.set_xlabel('x1')
ax_1_1.set_ylabel('x2')  
ax_1_1.grid(True)
ax_1_1.legend();


<ol start="3">
    <li>Se crea una instancia de la clase <strong>SVC</strong>.
        <ul>
          <li><strong>kernel:</strong> Especifica el tipo de kernel a utilizar 
              en el algoritmo: 'linear', 'poly, 'bf', 'sigmoid', 'precomputed'.</li>
          <li><strong>degree:</strong> Especifica el grado de la función 
              kernel polinómica.</li>
            <li><strong>C:</strong> Parámetro de regularización, su valor es
                inversamente proporcional al nivel de regularización aplicado.
                Su valor debe ser siempre positivo, por defecto $C = 1$.</li>
        </ul>
    </li>
</ol>

In [None]:
svc_1 = svm.SVC(kernel = 'linear')

<ol start="4">
    <li>Se entrena el modelo.
    </li>
</ol>

In [None]:
svc_1.fit(X_1, y_1)

<ol start="5">
    <li>Se obtiene la recta umbral de decisión haciendo uso de los atributos 
        <strong>coef_</strong> y <strong>intercept_</strong>.
    </li>
</ol>

In [None]:
w =svc_1.coef_[0]
a = -w[0] / w[1]
xx = np.linspace(np.min(X_1[:,0]), np.max(X_1[:,0]))

yy_umbral = a * xx - (svc_1.intercept_[0]) / w[1]


<ol start="6">
    <li>Se obtienen las rectas paralelas al umbral que pasan por los vectores 
        soporte.
    </li>
</ol>

In [None]:
margin = 1 / np.sqrt(np.sum(svc_1.coef_ ** 2))

yy_down = yy_umbral - np.sqrt(1 + a ** 2) * margin
yy_up = yy_umbral + np.sqrt(1 + a ** 2) * margin

<ol start="7">
    <li>Se obtienen los vectores soporte haciendo uso del atributo 
        <strong>support_vectors_</strong>.
    </li>
</ol>

In [None]:
supVec_1 = svc_1.support_vectors_
supVec_1

In [None]:
svm_linear = widgets.Output()

with svm_linear:
    fig_2_1, ax_2_1 = plt.subplots(figsize = (6,4),tight_layout = True)
    fig_2_1.suptitle('Modelo generado')

    for key, group in grouped_1:
        ax_2_1.scatter(group.x1, group.x2, label= f'Clase {key}', color = colors[key])

    ax_2_1.plot(xx, yy_umbral,'k-', label = 'Umbral de decisión')
    ax_2_1.plot(xx, yy_down, 'k--')
    ax_2_1.plot(xx, yy_up, 'k--')

    ax_2_1.scatter(supVec_1[:, 0], supVec_1[:, 1], s=80, facecolors = "none", \
                   edgecolors = "k", label = 'Vectores soporte')

    ax_2_1.set_xlabel('x1')
    ax_2_1.set_ylabel('x2')  
    ax_2_1.grid(True)
    ax_2_1.legend();

In [None]:
choose_x1_1 = widgets.FloatText(
    value = 0.0,
    description = r'$x_1$'
)

choose_x2_1 = widgets.FloatText(
    value = 0.0,
    description = r'$x_2$'
)

In [None]:
x1_1 = choose_x1_1.value
x2_1 = choose_x2_1.value
predictedValue = svc_1.predict(np.array([x1_1,x2_1]).reshape(1, -1))
out_1 = widgets.HTMLMath(value = fr'El punto ({x1_1}, {x2_1}) pertenece a la clase: {predictedValue[0]}')

In [None]:
def update_out_1(change):
    x1_1 = choose_x1_1.value
    x2_1 = choose_x2_1.value
    predictedValue = svc_1.predict(np.array([x1_1,x2_1]).reshape(1, -1))
    out_1.value = fr'El punto ({x1_1}, {x2_1}) pertenece a la clase: {predictedValue[0]}'

In [None]:
choose_x1_1.observe(update_out_1,'value')
choose_x2_1.observe(update_out_1,'value')

In [None]:
widgets.VBox([svm_linear, choose_x1_1, choose_x2_1, out_1],layout = layout)

<hr>
<h2>Ejemplo 2: DATOS NO SEPARABLES LINEALMENTE</h2>

<ol>
    <li>Se utiliza la librería <strong>scikit-learn</strong>:
        <ol>
            <li>El paquete <strong>svm</strong>.</li>
            <li>El paquete <strong>datasets</strong>.</li>
        </ol>
    </li>
    <br>
    <li>Se hace uso de la función <strong>make_circles</strong> 
        para generar los datos correspondientes 
        a las 2 clases que se usan para 
        el entrenamiento del modelo. Las mismas tendrán la forma de un círculo grando con uno más pequeño adentro.
        <ul>
            <li><b>n_samples:</b> Número total de puntos dividido entre las 
                clases.</li>
            <li><b>noise:</b> Deviación estandar del ruido gaussiano adicionado a las muestras.</li>
            <li><b>factor:</b> Factor de escala entre el círculo interior y el exterior, en un rango de (0,1).</li>
        </ul>
    </li>
</ol>

In [None]:
X_2, y_2 = datasets.make_circles(n_samples = 100, noise=0.05)

In [None]:
data_2 = pd.DataFrame(dict(x1 = X_2[:,0], x2 = X_2[:,1], label = y_2))
colors = {0:'red', 1:'blue'}

fig_1_2, ax_1_2 = plt.subplots(figsize = (6,4),tight_layout = True)
fig_1_2.suptitle('Datos de entrenamiento')

grouped_2 = data_2.groupby('label')

for key, group in grouped_2:
    ax_1_2.scatter(group.x1, group.x2, label = f'Clase {key}', marker='.', color=colors[key])

ax_1_2.set_xlabel('x1')
ax_1_2.set_ylabel('x2')  
ax_1_2.grid(True)
ax_1_2.legend();


<ol start="3">
    <li>Se crea una instancia de la clase <strong>SVC</strong>.
    </li>
</ol>

In [None]:
svc_2 = svm.SVC(kernel='rbf')

<ol start="4">
    <li>Se entrena el modelo.
    </li>
</ol>

In [None]:
svc_2.fit(X_2, y_2)

<ol start="5">
    <li>Se obtiene la curva de nivel del plano de separación, haciendo uso de
        la función <strong>decision_function</strong>. Esta función brinda 
        información sobre de qué lado del hiperplano se encuentran las muestras
        y a qué distancia.
    </li>
</ol>

In [None]:
def getZ(model, XY, Xgrid):
    Z = model.decision_function(XY).reshape(Xgrid.shape)
    return Z

xlim = ax_1_2.get_xlim()
ylim = ax_1_2.get_ylim()

Ygrid, Xgrid = np.meshgrid(np.linspace(ylim[0], ylim[1], 30), \
                       np.linspace(xlim[0], xlim[1], 30))

XY = np.vstack([Xgrid.ravel(), Ygrid.ravel()]).T
    
Z = getZ(svc_2, XY, Xgrid)

<ol start="7">
    <li>Se obtienen los vectores soporte haciendo uso del atributo 
        <strong>support_vectors_</strong>.
    </li>
</ol>

In [None]:
def getSupVec(model):
    supVec_2 = model.support_vectors_
    return supVec_2

supVec_2 = getSupVec(svc_2)

In [None]:
svm_Nonlinear = widgets.Output()

with svm_Nonlinear:
    fig_2_2, ax_2_2 = plt.subplots(figsize = (6,4),tight_layout = True)
    fig_2_2.suptitle('Modelo generado')

    for key, group in grouped_2:
        ax_2_2.scatter(group.x1, group.x2, label = f'Clase {key}', marker='.', color=colors[key])
        
    ax_2_2.contour(Xgrid, Ygrid, Z, levels=[0], linestyles=['-'], colors ='black')
    
    ax_2_2.scatter(supVec_2[:, 0], supVec_2[:, 1], s=80, facecolors = "none", \
                   edgecolors = "k", label = 'Vectores soporte')
    
    ax_2_2.set_xlabel('x1')
    ax_2_2.set_ylabel('x2')  
    ax_2_2.grid(True)
    ax_2_2.legend();

In [None]:
choose_x1_2 = widgets.FloatText(
    value = 0.0,
    description = r'$x_1$'
)

choose_x2_2 = widgets.FloatText(
    value = 0.0,
    description = r'$x_2$'
)

In [None]:
x1_2 = choose_x1_2.value
x2_2 = choose_x2_2.value
predictedValue2 = svc_2.predict(np.array([x1_2,x2_2]).reshape(1, -1))
out_2 = widgets.HTMLMath(value = fr'El punto ({x1_2}, {x2_2}) pertenece a la clase: {predictedValue2[0]}')

kernel = widgets.Dropdown(
    options = ['Radial', 'Polinomial'],
    value = 'Radial',
    description = 'Kernel:',
    layout = {'width': 'max-content'}
)

degree = widgets.Dropdown(
    options = [1, 2, 3, 4, 5],
    value = 2,
    description = 'Degree:',
    layout = {'width': 'max-content'}
)

In [None]:
def update_out_2(change):
    if(kernel.value == 'Radial'):
        svc_2 = svm.SVC(kernel='rbf')
    else:
        svc_2 = svm.SVC(kernel='poly', degree = degree.value)
    
    svc_2.fit(X_2, y_2)
    Z = getZ(svc_2, XY, Xgrid)
    supVec_2 = getSupVec(svc_2)
    
    ax_2_2.cla()
    for key, group in grouped_2:
        ax_2_2.scatter(group.x1, group.x2, label = f'Clase {key}', marker='.', color=colors[key])
        
    ax_2_2.contour(Xgrid, Ygrid, Z, levels = [0], linestyles=['-'], colors ='black')
    
    ax_2_2.scatter(supVec_2[:, 0], supVec_2[:, 1], s = 80, facecolors = "none", \
                   edgecolors = "k", label = 'Vectores soporte')
    
    ax_2_2.set_xlabel('x1')
    ax_2_2.set_ylabel('x2')  
    ax_2_2.grid(True)
    ax_2_2.legend();
    
    x1_2 = choose_x1_2.value
    x2_2 = choose_x2_2.value
    predictedValue2 = svc_2.predict(np.array([x1_2,x2_2]).reshape(1, -1))
    out_2.value = fr'El punto ({x1_2}, {x2_2}) pertenece a la clase: {predictedValue2[0]}'

In [None]:
choose_x1_2.observe(update_out_2,'value')
choose_x2_2.observe(update_out_2,'value')
kernel.observe(update_out_2,'value')
degree.observe(update_out_2,'value')

In [None]:
widgets.VBox([svm_Nonlinear, widgets.HBox([kernel, degree]), choose_x1_2, choose_x2_2, out_2],layout = layout)

<hr>
<h2>Ejemplo 3: APLICACIÓN DE MÁRGENES SUAVES</h2>
<ol>
    <li>Se utiliza la librería <strong>scikit-learn</strong>:
        <ol>
            <li>El paquete <strong>svm</strong>.</li>
            <li>El paquete <strong>datasets</strong>.</li>
        </ol>
    </li>
    <br>
    <li>Se hace uso de la función <strong>make_blobs</strong> 
        para generar los datos correspondientes 
        a las distintas clases que se usan para 
        el entrenamiento del modelo.
    </li>
</ol>

In [None]:
X_3, y_3 = datasets.make_blobs(n_samples = 100, centers = 2, n_features = 2, cluster_std = 1.2)

In [None]:
data_3 = pd.DataFrame(dict(x1 = X_3[:,0], x2 = X_3[:,1], label = y_3))
colors = {0:'red', 1:'blue'}

fig_1_3, ax_1_3 = plt.subplots(figsize = (6,4),tight_layout = True)
fig_1_3.suptitle('Datos de entrenamiento')

grouped_3 = data_3.groupby('label')

for key, group in grouped_3:
    ax_1_3.scatter(group.x1, group.x2, label = f'Clase {key}', color = colors[key])

ax_1_3.set_xlabel('x1')
ax_1_3.set_ylabel('x2')  
ax_1_3.grid(True)
ax_1_3.legend();

<ol start="3">
    <li>Se crea una instancia de la clase <strong>SVC</strong>.
        El atributo <strong>C</strong> es un factor de modificación que 
        "suaviza" el margen, es decir, permite que algunos de los puntos 
        se introduzcan en el margen si eso permite un mejor ajuste. 
        <ul>
            <li>Para C muy grande, el margen es duro y los 
                puntos no pueden estar en él. </li>
            <li>Para C más pequeño, el margen es más 
                suave y puede crecer para abarcar algunos puntos.</li>
        </ul>
    </li>
</ol>

In [None]:
Cvalues = widgets.Dropdown(
    options = [0.01, 0.1,1, 10, 100, 1000, 10000],
    value = 10000,
    description = 'C:',
    layout = {'width': 'max-content'}
)

svc_3 = svm.SVC(kernel = 'linear', C = Cvalues.value)

<ol start="4">
    <li>Se entrena el modelo.
    </li>
</ol>

In [None]:
svc_3.fit(X_3, y_3)

<ol start="5">
    <li>Se obtiene la recta umbral de decisión y las rectas paralelas que pasan
        por los vectores soporte.
    </li>
</ol>

In [None]:
def get_umbral (model, x_range):
    w = model.coef_[0]
    a = -w[0] / w[1]

    y_umbral = a * x_range - (model.intercept_[0]) / w[1]
    
    margin = 1 / np.sqrt(np.sum(model.coef_ ** 2))

    y_down = y_umbral - np.sqrt(1 + a ** 2) * margin
    y_up = y_umbral + np.sqrt(1 + a ** 2) * margin
    
    return (y_umbral, y_down, y_up)

x_range = np.linspace(np.min(X_3[:,0]), np.max(X_3[:,0]))
y_umbral3, y_down3, y_up3 = get_umbral(svc_3, x_range) 

<ol start="6">
    <li>Se obtienen los vectores soporte.
    </li>
</ol>

In [None]:
supVec_3 = getSupVec(svc_3)

In [None]:
svm_C = widgets.Output()

with svm_C:
    fig_2_3, ax_2_3 = plt.subplots(figsize = (6,4),tight_layout = True)
    fig_2_3.suptitle('Modelo generado')

    for key, group in grouped_3:
        ax_2_3.scatter(group.x1, group.x2, label= f'Clase {key}', color = colors[key])

    ax_2_3.plot(x_range, y_umbral3,'k-', label='Umbral de decisión')
    ax_2_3.plot(x_range, y_down3, 'k--')
    ax_2_3.plot(x_range, y_up3, 'k--')

    ax_2_3.scatter(supVec_3[:, 0], supVec_3[:, 1], s=80, facecolors = "none", \
                   edgecolors = "k", label = 'Vectores soporte')

    ax_2_3.set_xlabel('x1')
    ax_2_3.set_ylabel('x2')  
    ax_2_3.grid(True)
    ax_2_3.legend();

In [None]:
choose_x1_3 = widgets.FloatText(
    value = 0.0,
    description = r'$x_1$'
)

choose_x2_3 = widgets.FloatText(
    value = 0.0,
    description = r'$x_2$'
)

In [None]:
x1_3 = choose_x1_3.value
x2_3 = choose_x2_3.value
predictedValue3 = svc_3.predict(np.array([x1_3,x2_3]).reshape(1, -1))
out_3 = widgets.HTMLMath(value = fr'El punto ({x1_3}, {x2_3}) pertenece a la clase: {predictedValue3[0]}')

In [None]:
def update_out_3(change):
    svc_3 = svm.SVC(kernel = 'linear', C = Cvalues.value)
    svc_3.fit(X_3, y_3)
    y_umbral3, y_down3, y_up3 = get_umbral(svc_3, x_range) 
    supVec_3 = getSupVec(svc_3)
        
    ax_2_3.cla()
    for key, group in grouped_3:
           ax_2_3.scatter(group.x1, group.x2, label= f'Clase {key}', color = colors[key])

    ax_2_3.plot(x_range, y_umbral3,'k-', label='Umbral de decisión')
    ax_2_3.plot(x_range, y_down3, 'k--')
    ax_2_3.plot(x_range, y_up3, 'k--')

    ax_2_3.scatter(supVec_3[:, 0], supVec_3[:, 1], s=80, facecolors = "none", \
                       edgecolors = "k", label = 'Vectores soporte')

    ax_2_3.set_xlabel('x1')
    ax_2_3.set_ylabel('x2')  
    ax_2_3.grid(True)
    ax_2_3.legend();
        
        
    x1_3 = choose_x1_3.value
    x2_3 = choose_x2_3.value
    predictedValue3 = svc_3.predict(np.array([x1_3,x2_3]).reshape(1, -1))
    out_3.value = fr'El punto ({x1_3}, {x2_3}) pertenece a la clase: {predictedValue3[0]}'

In [None]:
choose_x1_3.observe(update_out_3,'value')
choose_x2_3.observe(update_out_3,'value')
Cvalues.observe(update_out_3,'value')

In [None]:
widgets.VBox([svm_C, Cvalues, choose_x1_3, choose_x2_3, out_3],layout = layout)