# Máquinas de soporte vectorial (SVM)

*¿Para qué se utiliza?*
Las Máquinas de Soporte Vectorial (SVM) son modelos de machine learning supervisado utilizados principalmente para clasificación y también para regresión (con variantes como SVR). Su objetivo es encontrar el hiperplano óptimo que separa las clases con el mayor margen posible. Las SVM son especialmente útiles cuando los datos no son linealmente separables, ya que permiten el uso de funciones kernel para proyectar los datos en espacios de mayor dimensión donde sí pueden separarse.

*¿Qué variables considera?*
Variable dependiente:
- En clasificación: variable categórica (2 clases o multiclase).
- En regresión: variable continua.
Variables independientes:
- Pueden ser numéricas o transformadas en numéricas (por ejemplo, mediante codificación one-hot para datos categóricos).
- El modelo aprende los vectores de soporte, que son los puntos clave cercanos a los límites de separación.

*¿Cómo funciona?*
SVM busca un hiperplano (una línea en 2D, un plano en 3D, etc.) que separe las clases con el máximo margen. Este margen es la distancia entre el hiperplano y los vectores más cercanos de cada clase. Si los datos no son linealmente separables, SVM usa kernels como lineal, polinomial o RBF (radial basis function, muy común). Estos permiten transformar los datos a espacios donde puedan separarse de forma más efectiva.

*Supuestos y recomendaciones*
- No requiere supuestos de normalidad ni homocedasticidad.
- Requiere que las variables estén escaladas para obtener buenos resultados.
- Es muy eficaz en espacios de alta dimensión y cuando hay una clara separación entre clases.
- Puede ser sensible al ruido o valores atípicos.
- Para datos grandes, puede ser computacionalmente costos.


In [None]:
import pandas as pd
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report, ConfusionMatrixDisplay
import matplotlib.pyplot as plt

# Suponemos que df tiene variables predictoras y una variable objetivo 'y'
X = df.drop(columns='y')
y = df['y']

# Escalar los datos (importante para SVM)
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# División en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, random_state=42)

# Crear y entrenar el modelo SVM
modelo = SVC(kernel='rbf', C=1.0, gamma='scale', probability=True)
modelo.fit(X_train, y_train)

# Evaluar el modelo
y_pred = modelo.predict(X_test)
print("Reporte de clasificación:")
print(classification_report(y_test, y_pred))

# Matriz de confusión
ConfusionMatrixDisplay.from_estimator(modelo, X_test, y_test, cmap='Blues')
plt.title("Matriz de Confusión - SVM")
plt.show()
