# Ejercicio de ejemplo: Máquinas de Vectores Soporte (SVM) con Iris

En este ejercicio vamos a trabajar con el dataset **Iris** usando **SVM**.

Objetivos:
- Visualizar el dataset Iris en 2D.
- Entrenar un SVM **lineal** (sin kernel no lineal) y ver su frontera de decisión.
- Entrenar un SVM con **kernel polinómico** y comparar las fronteras de decisión.


## 1. Carga y visualización del dataset

El dataset Iris contiene medidas de flores de tres especies distintas:
- *Setosa*
- *Versicolor*
- *Virginica*

Para simplificar la visualización usaremos solo **dos características**:
- Longitud del sépalo (`sepal length`)
- Anchura del sépalo (`sepal width`)


In [1]:
# Importaciones básicas
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline

%matplotlib inline


In [None]:
# Cargar el dataset Iris
iris = datasets.load_iris()

# Usamos solo las dos primeras características: sepal length y sepal width
X = iris.data[:, :2]
y = iris.target
target_names = iris.target_names

print('Shape de X:', X.shape)
print('Clases:', target_names)

# Gráfico de dispersión de las dos características
plt.figure(figsize=(6, 4))
for i, clase in enumerate(target_names):
    plt.scatter(
        X[y == i, 0], X[y == i, 1],
        label=clase
    )
plt.xlabel('sepal length (cm)')
plt.ylabel('sepal width (cm)')
plt.legend()
plt.title('Iris: sepal length vs sepal width')
plt.show()


## 2. Función auxiliar para dibujar la frontera de decisión

Crearemos una función que reciba un modelo SVM ya entrenado y pinte:
- La **región de decisión** (colores de fondo).
- Los **puntos reales** del dataset.


In [3]:
def plot_decision_regions(model, X, y, title='Frontera de decisión'):
    """Dibuja la frontera de decisión de un clasificador en 2D."""
    x_min, x_max = X[:, 0].min() - 0.5, X[:, 0].max() + 0.5
    y_min, y_max = X[:, 1].min() - 0.5, X[:, 1].max() + 0.5

    xx, yy = np.meshgrid(
        np.linspace(x_min, x_max, 300),
        np.linspace(y_min, y_max, 300)
    )

    # Predicciones del modelo para cada punto de la malla
    grid = np.c_[xx.ravel(), yy.ravel()]
    Z = model.predict(grid)
    Z = Z.reshape(xx.shape)

    plt.figure(figsize=(6, 4))
    plt.contourf(xx, yy, Z, alpha=0.3)

    # Puntos originales
    for i, clase in enumerate(np.unique(y)):
        plt.scatter(
            X[y == i, 0], X[y == i, 1],
            edgecolor='k', label=iris.target_names[i]
        )

    plt.xlabel('sepal length (cm)')
    plt.ylabel('sepal width (cm)')
    plt.title(title)
    plt.legend()
    plt.show()


## 3. SVM lineal (sin kernel no lineal)

Primero entrenamos un SVM con **kernel lineal**. Esto significa que la frontera de decisión
será una **línea recta** (o un hiperplano en dimensiones superiores).

Usaremos un `Pipeline` con:
- `StandardScaler` para escalar las características.
- `SVC(kernel='linear')` como clasificador.

**Ejercicio para el alumno:** después de ejecutar este bloque, prueba a cambiar el valor de `C`
para ver cómo cambia la frontera de decisión.


In [None]:
# Modelo SVM lineal
svm_linear = make_pipeline(
    StandardScaler(),
    SVC(kernel='linear', C=1.0)
)

# Entrenamos el modelo
svm_linear.fit(X, y)

# Dibujamos la frontera de decisión
plot_decision_regions(svm_linear, X, y, title="SVM con kernel lineal (C=1.0)")


## 4. SVM con kernel polinómico

Ahora entrenamos un SVM con **kernel polinómico**. Esto permite fronteras de decisión
curvas, más flexibles que la recta del caso lineal.

Parámetros importantes del kernel polinómico:
- `degree`: grado del polinomio (por ejemplo, 2, 3, 4...).
- `C`: controla la penalización por errores (como antes).

**Ejercicio para el alumno:**
- Cambia el `degree` (por ejemplo a 2, 4, 5...).
- Cambia `C` (0.1, 1, 10...).
- Observa cómo se hace la frontera de decisión más simple o más compleja.


In [None]:
# Modelo SVM con kernel polinómico
svm_poly = make_pipeline(
    StandardScaler(),
    SVC(kernel='poly', degree=3, C=1.0, gamma='auto')
)

svm_poly.fit(X, y)

plot_decision_regions(svm_poly, X, y, title="SVM con kernel polinómico (degree=3, C=1.0)")


## 5. Preguntas para reflexionar en clase

1. ¿Qué diferencias observas entre la frontera de decisión del SVM lineal y la del SVM con kernel polinómico?
2. ¿En qué zonas del gráfico parece que el modelo se equivoca más?
3. ¿Qué ocurre cuando haces el modelo **muy complejo** (degree alto, C alto)?
4. ¿Y qué pasa cuando haces el modelo **muy simple** (degree bajo, C bajo)?

Comenta con tus compañeros qué tipo de modelo crees que generalizará mejor a nuevos datos.
