[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/juansensio/elcursodeia-code/blob/master/ml/ejercicios/05_svmipynb)

# Ejercicio: *Batch Gradient Descent* para *SVM*


En este ejercicio implementarás el algoritmo de Descenso de Gradiente por Lotes (Batch Gradient Descent) para entrenar una Máquina de Vectores de Soporte (SVM) y utilizarla para clasificar imágenes en el conjunto de datos Iris.

In [1]:
# get the data

from sklearn import datasets
import numpy as np

iris = datasets.load_iris()

X = iris["data"][:, (2, 3)] # petal length, petal width
y = (iris["target"] == 2).astype(np.float64).reshape(-1, 1) # Iris virginica

In [2]:
def plot_svc_decision_boundary(svm_clf, xmin, xmax):
    w = svm_clf.coef_[0]
    b = svm_clf.intercept_[0]

    # At the decision boundary, w0*x0 + w1*x1 + b = 0
    # => x1 = -w0/w1 * x0 - b/w1
    x0 = np.linspace(xmin, xmax, 200)
    decision_boundary = -w[0]/w[1] * x0 - b/w[1]

    margin = 1/w[1]
    gutter_up = decision_boundary + margin
    gutter_down = decision_boundary - margin

    svs = svm_clf.support_vectors_
    plt.scatter(svs[:, 0], svs[:, 1], s=180, facecolors='#FFAAAA')
    plt.plot(x0, decision_boundary, "k-", linewidth=2)
    plt.plot(x0, gutter_up, "k--", linewidth=2)
    plt.plot(x0, gutter_down, "k--", linewidth=2)

# 1. Entrena un clasificador SVM

Entrena un clasificador SVM y visualiza las fronteras de decisión.

# 2. Entrena un SVM usando el SGDClassifier

Un método para implementar un clasificador SVM *online* es usar el Descenso de Gradiente (SGDClassifier) para minimizar la función de coste *hinge*

\begin{equation}
  J(\mathbf{w}, b) = \frac{1}{2} \mathbf{w}^T \mathbf{w} + C \sum_{j=1}^N max(0, 1 - t^{(j)}(\mathbf{w}^T \mathbf{x}+b))
\end{equation}

Utiliza el SGDClassifier para entrenar un SVM con el conjunto de datos Iris y compáralo con la solución SVC.

In [16]:
# CONSEJO:
# Necesitas traducir el vector de etiquetas a -1/1 (no 0/1)
# Recuerda añadir 1 para cada instancia en X para calcular el término de bias

# 3. Implementa *BGD* 

Implementa el algoritmo de Descenso de Gradiente por Lotes (Batch Gradient Descent) para entrenar una SVM y compara los resultados con los modelos anteriores.

In [18]:
from sklearn.base import BaseEstimator

class MyLinearSVC(BaseEstimator):
    def __init__(self, C=1, eta=0.1, n_epochs=1000):
        self.C = C
        self.eta = eta
        self.n_epochs = n_epochs      
        
    def fit(self, X, y):
		# tu código aquí
        
        # PASOS
        # 1 - Inicializar pesos aleatorios
        # 2 - Bucle de entrenamiento
        #   2.1 - Calcular los vectores de soporte
        #   2.2 - Calcular la función de pérdida (hinge loss)
        #   2.3 - Calcular el gradiente de la función de pérdida con respecto a los parámetros
        #   2.4 - Actualizar los parámetros
        # 3 - Guardar los resultados finales en el formato de sklearn

        return self

    def decision_function(self, X):
        # tu código aquí
        return 

    def predict(self, X):
        # tu código aquí
        return 

In [19]:
svm_clf = MyLinearSVC(C=100, eta = 0.0001, n_epochs=50000)
svm_clf.fit(X, y)