SVR
La Máquina de Soporte Vectorial para Regresión (SVR) es una variante de las Máquinas de Soporte Vectorial. A diferencia de los métodos de regresión tradicionales que buscan minimizar la suma de los errores cuadráticos, SVR se enfoca en minimizar el error dentro de un cierto margen alrededor de la línea de reresión.

Se suele utilizar cuando tenemos un conjunto de datos no linearmente separable. Es útil para problemas de regresión complejos donde las técnicas lineales simples no alcanzan.

Cuando se quiere predecir valores fuera del rango de los datos de entrenmiento. La SVR es capaz de predecir valores fuera del rango de los datos de entrenamiento, mientras que otros modelos de regresión no lineal pueden sufrir de sobreajuste.
Cuando se quiere minimizar el error de predicción en los valores atípicos. La SVR es capaz de minimizar el error de predicción en los valores atípicos, mientras que otros modelos de regresión no lineal pueden ser más sensibles a los valores atípicos.
¿Cómo funciona?
La SVR funciona mediante la transformación de los datos en un espacio de mayor dimensión (mediante el uso de una función de kernel) y la construcción de un hiperplano de regresión en ese espacio. La idea clave es encontrar el hiperplano que minimiza el error de predicción, permitiendo cierta flexibilidad alrededor de este hiperplano (margen de tolerancia).

La función de kernel juega un papel crucial en la SVR al permitir la representación de relaciones no lineales en el espacio transformado.

Ventajas y desventajas

Ventajas

Eficiente en espacios de alta dimensión: Puede manejar conjuntos de datos con un gran número de características (alta dimensión).

Robusto ante valores atípicos: La SVR es menos sensible a valores atípicos en comparación con algunos modelos de regresión.

Desventajas

La elección correcta del kernel: La elección del kernel y sus parámetros puede ser crítica y depende del problema específico.

Requiere ajuste de hiperparámetros: La SVR tiene hiperparámetros que deben ajustarse, como el ancho del margen y los parámetros del kernel.
Modelo menos intuitivo.


In [10]:
import pandas as pd

In [11]:
data = pd.read_csv('/content/Advertising.csv')
data = data.iloc[:, 1:]

In [12]:
from sklearn.svm import SVR
from sklearn.model_selection import train_test_split
from sklearn.metrics import r2_score

In [13]:
# TV - Newspaper
X = data.drop(['Radio', 'Sales'], axis=1).values
y = data['Sales'].values

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [14]:
svr = SVR(kernel='rbf')
svr.fit(X_train, y_train)

In [15]:
SVR()


In [16]:
y_pred = svr.predict(X_test)
print('Reales:', y_test[:4], 'Predicción:', y_pred[:4])

Reales: [16.9 22.4 21.4  7.3] Predicción: [15.92644542 17.19547972 18.032271    8.22924309]


In [17]:
r2_score(y_test, y_pred)

0.6656952068341743

In [18]:
# TV - Radio
X = data.drop(['Newspaper', 'Sales'], axis=1).values
y = data['Sales'].values

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [19]:

svr = SVR(kernel='rbf')
svr.fit(X_train, y_train)

In [20]:
SVR()

In [21]:
y_pred = svr.predict(X_test)
r2_score(y_test, y_pred)

0.8989271754336223