https://www.cienciadedatos.net/documentos/py24-svm-python.html

Las Máquinas de Vector Soporte se fundamentan en el *Maximal Margin Classifier*, que a su vez, se basa en el concepto de hiperplano.

-----------
**Hiperplano**

En un espacio p-dimensional, un hiperplano se define como un subespacio plano y afín de dimensiones *p − 1*. El término afín significa que el subespacio no tiene por qué pasar por el origen. En un espacio de dos dimensiones, el hiperplano es un subespacio de 1 dimensión, es decir, una recta. En un espacio tridimensional, un hiperplano es un subespacio de dos dimensiones, un plano convencional

La definición matemática de un hiperplano es bastante simple. En el caso de dos dimensiones, el hiperplano se describe acorde a la ecuación de una recta:

β0 + β1x1 + β2x2 = 0

Cuando *x* no satisface la ecuación:

β0 + β1x1 + β2x2 + ... + βpxp < 0
 
o bien

β0 + β1x1 + β2x2 + ... + βpxp > 0
 
el punto *x* cae a un lado o al otro del hiperplano. Así pues, se puede entender que un hiperplano divide un espacio p-dimensional en dos mitades. Para saber en qué lado del hiperplano se encuentra un determinado punto *x*, solo hay que calcular el signo de la ecuación.

-----------
**Clasificación binaria empleando un Hiperplano**

Cuando se dispone de *n* observaciones, cada una con *p* predictores y cuya variable respuesta tiene dos niveles (de aquí en adelante identificados como *+1* y *−1*), se pueden emplear hiperplanos para construir un clasificador que permita predecir a qué grupo pertenece una observación en función de sus predictores.

Si la distribución de las observaciones es tal que se pueden separar linealmente de forma perfecta en las dos clases (*+1* y *−1*), entonces, un hiperplano de separación cumple que:

β0 + β1x1 + β2x2 + ... + βpxp > 0, si yi = 1
 
β0 + β1x1 + β2x2 + ... + βpxp < 0, si yi = -1

La definición de hiperplano para casos perfectamente separables linealmente resulta en un número infinito de posibles hiperplanos, lo que hace necesario un método que permita seleccionar uno de ellos como clasificador óptimo.

![image.png](attachment:image.png)

La solución a este problema consiste en seleccionar como clasificador óptimo el hiperplano que se encuentra más alejado de todas las observaciones de entrenamiento. A este se le conoce como como *maximal margin hyperplane* o *hiperplano óptimo de separación*. Aunque esta idea suena razonable, no es posible aplicarla, ya que habría infinitos hiperplanos contra los que medir las distancias. En su lugar, se recurre a métodos de optimización dual.

![image.png](attachment:image.png)

La imagen anterior muestra el *maximal margin hyperplane*, formado por el hiperplano (línea negra continua y su margen (las dos líneas discontinuas). Las tres observaciones equidistantes respecto al *maximal margin hyperplane* que se encuentran a lo largo de las líneas discontinuas se les conoce como vectores soporte, ya que son vectores en un espacio p-dimensional y soportan (definen) el *maximal margin hyperplane*. Cualquier modificación en estas observaciones (vectores soporte) conlleva cambios en el *maximal margin hyperplane*. Sin embargo, modificaciones en observaciones que no son vector soporte no tienen impacto alguno en el hiperplano.

# Librerias

In [1]:
# Tratamiento de datos
# ==============================================================================
import pandas as pd
import numpy as np

# Gráficos
# ==============================================================================
import matplotlib.pyplot as plt
from matplotlib import style
import seaborn as sns
from mlxtend.plotting import plot_decision_regions

# Preprocesado y modelado
# ==============================================================================
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import accuracy_score

# Configuración matplotlib
# ==============================================================================
plt.rcParams['image.cmap'] = "bwr"
#plt.rcParams['figure.dpi'] = "100"
plt.rcParams['savefig.bbox'] = "tight"
style.use('ggplot') or plt.style.use('ggplot')

# Configuración warnings
# ==============================================================================
import warnings
warnings.filterwarnings('ignore')