<a href="https://colab.research.google.com/github/chema74/AI-Portfolio-2025/blob/main/06_SVM_Clasificacion.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ⚙️ Módulo 6: Máquinas de Vectores de Soporte (Support Vector Machines - SVM)

Las **Máquinas de Vectores de Soporte (SVM)** son un algoritmo de **Aprendizaje Supervisado** usado tanto para clasificación como para regresión, aunque es más popular en clasificación. Es especialmente efectivo en espacios de alta dimensión y donde los datos no son separables linealmente.

## Conceptos Clave de SVM

### 1. El Objetivo: Maximizar el Margen
El objetivo principal de SVM en clasificación binaria es encontrar el **hiperplano** (la línea, en 2D) que no solo separe las dos clases, sino que también tenga el **margen de separación más grande posible** entre los puntos de datos más cercanos de cada clase.

### 2. Vectores de Soporte
Los **Vectores de Soporte** son los puntos de datos de entrenamiento que están más cerca del hiperplano. Son los puntos cruciales que definen la posición y orientación del hiperplano; si se eliminan, el hiperplano podría cambiar.

### 3. El Truco del Kernel (Kernel Trick)
El gran poder de SVM reside en el **Truco del Kernel**. Este permite a SVM manejar conjuntos de datos donde las clases no pueden separarse con una línea recta (no lineales).
* El truco del kernel mapea los datos de entrada a un espacio de mayor dimensión donde la separación se vuelve lineal.
* **Kernels Comunes:**
    * **Lineal:** Para datos linealmente separables (similar a la Regresión Logística).
    * **Polinomial:** Para fronteras de decisión curvas.
    * **Radial Basis Function (RBF) / Gaussiano:** El más común y versátil, ideal para fronteras de decisión complejas.

In [1]:
# =======================================================
# PASO 1: Importar librerías
# =======================================================
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC # Importamos la Máquina de Vectores de Soporte para Clasificación
from sklearn.metrics import accuracy_score, confusion_matrix

print("✅ Librerías de SVM importadas.")
print("-" * 70)

# =======================================================
# PASO 2: Preparación de Datos (Reutilizando la variable objetivo binaria)
# =======================================================

# Usamos el DataFrame y la lógica de clasificación del Módulo 5.
datos = {
    'Precio_Unitario': [15.5, 15.5, 15.5, 22.0, 10.0, 15.5],
    'Dias_Envio': [5, 2, 5, 7, 1, 2],
    'Cantidad': [3, 1, 3, 2, 4, 1]
}
df = pd.DataFrame(datos)

# Creamos la variable objetivo binaria (Y): 1 si Cantidad > media, 0 si no.
media_cantidad = df['Cantidad'].mean()
df['Cantidad_Alta'] = np.where(df['Cantidad'] > media_cantidad, 1, 0)

# X (Predictor): Usaremos dos variables: Precio_Unitario y Días_Envio (mejor para SVM).
X = df[['Precio_Unitario', 'Dias_Envio']]
# Y (Objetivo/Target): La columna binaria
Y = df['Cantidad_Alta']

print(f"1. Usando {X.shape[1]} características (Precio y Días de Envío) para predecir Y.")
print("-" * 70)


# =======================================================
# PASO 3: División de Datos (Entrenamiento y Prueba)
# =======================================================

X_train, X_test, Y_train, Y_test = train_test_split(
    X, Y,
    test_size=0.2,
    random_state=42
)

print(f"2. Conjunto de Entrenamiento (X_train): {len(X_train)} muestras")
print(f"3. Conjunto de Prueba (X_test): {len(X_test)} muestras")
print("-" * 70)


# =======================================================
# PASO 4: Creación y Entrenamiento del Modelo SVM
# =======================================================

# 4a. Creamos el modelo SVC (Support Vector Classifier).
# Usamos el kernel más popular: RBF (Radial Basis Function)
modelo_svm = SVC(kernel='rbf', random_state=42)

# 4b. Entrenamos el modelo con los datos de ENTRENAMIENTO
modelo_svm.fit(X_train, Y_train)

print("4. Modelo de Máquinas de Vectores de Soporte (SVM con Kernel RBF) entrenado.")
print("-" * 70)


# =======================================================
# PASO 5: Predicción y Evaluación (Métricas de Clasificación)
# =======================================================

# 5a. Hacemos predicciones sobre el conjunto de PRUEBA
Y_pred = modelo_svm.predict(X_test)

# 5b. Evaluamos el rendimiento:

# Precisión (Accuracy): Porcentaje de predicciones correctas
precision = accuracy_score(Y_test, Y_pred)

# Matriz de Confusión: Nos dice dónde acertó y dónde falló
matriz = confusion_matrix(Y_test, Y_pred)


print("5. Evaluación del rendimiento en datos de PRUEBA:")
print(f"   Precisión (Accuracy): {precision:.4f}")
print("   Matriz de Confusión:")
print(matriz)
print("-" * 70)

✅ Librerías de SVM importadas.
----------------------------------------------------------------------
1. Usando 2 características (Precio y Días de Envío) para predecir Y.
----------------------------------------------------------------------
2. Conjunto de Entrenamiento (X_train): 4 muestras
3. Conjunto de Prueba (X_test): 2 muestras
----------------------------------------------------------------------
4. Modelo de Máquinas de Vectores de Soporte (SVM con Kernel RBF) entrenado.
----------------------------------------------------------------------
5. Evaluación del rendimiento en datos de PRUEBA:
   Precisión (Accuracy): 0.5000
   Matriz de Confusión:
[[0 1]
 [0 1]]
----------------------------------------------------------------------
