# Prerequisitos

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [2]:
from sklearn import datasets

#Importacion de un solo flujo de datos
from sklearn.pipeline import Pipeline

# El SVM es sensible a datos no escalados
from sklearn.preprocessing import StandardScaler

## Vectores

Un vector es un elemento matemático que tiene tres características esenciales: módulo, dirección y sentido.

![image.png](attachment:image.png)

- Módulo. Está representado por el tamaño del vector, y hace referencia a la intensidad de la magnitud ( número). Se denota con la letra solamente $ \Vert{} A \Vert{} $

$$
    \left \| A \right \| = \sqrt{X_1^2 + ... + X_n^2}
$$

- Dirección. Corresponde a la inclinación de la recta, y representa al ángulo entre ella y un eje horizontal imaginario ( ver figura 2) . También se pueden utilizar los ejes de coordenadas cartesianas (x, y y z) como también los puntos cardinales para la dirección.

$$
    w = ( \frac{a_1}{\left \| a \right \|}, \frac{a_2}{\left \| a \right \|}) = (\cos{\theta}, \sin{\theta})
$$

- Sentido. está indicado por la punta de la flecha. (signo positivo que por lo general no se coloca, o un signo negativo). No corresponde comparar el sentido de dos vectores que no tienen la misma dirección, de modo que se habla solamente de vectores con el mismo sentido o con sentido opuesto. Tomar en cuenta los signos y combinaciones posibles en la dirección marcada por las funciones seno y coseno.

- Dimensión. Descripción del orden de dimensiones que representa el vector.

$$
    \bold{u} = (5, 3, 2)  \in \mathbb{R} ^ 3
$$

![image.png](attachment:image.png)

## Producto punto

Operación entre dos vectores que devuelve un número (escalar) tal que

$$
    A \cdot B = \left \| A \right \| \left \| B \right \| \cos{\alpha}
$$

Siendo $\alpha$ el ángulo que forman los vectores A y B.

Y 

$$
    A \cdot B = (A_x  B_x) + (A_y  B_y)
$$



![image.png](attachment:image.png)

Propiedades:

$$
    \cos{\alpha} = \frac{(A_x  B_x) + (A_y  B_y)}{\left \| A \right \|\left \| B \right \|} = \frac{A \cdot B}{\left \| A \right \|\left \| B \right \|}
$$

Se puede concluir que 
$$
    A \cdot B = \sum_{i = 1}^{n}(A_i B_i)
$$

Donde n es el número de dimensiones.

## Datos linealmente separables

![image.png](attachment:image.png)

![image.png](attachment:image.png)

## Hiperplanos

En un espacio p-dimensional, un hiperplano se define como un subespacio plano y afín (no necesariamente pasa por el origen) de dimensiones $ p-1 $

La definición matemática de un hiperplano es bastante simple. En el caso de dos dimensiones, el hiperplano se describe acorde a la ecuación de una recta:

$$
    \beta_0+\beta_1x_1+\beta_2x_2=0
$$

Dados los parámetros $ \beta $ todos los pares de valores $ x = (x_1, x_2) $ para los que se cumple la igualdad son puntos del hiperplano. Esta ecuación puede generalizarse para p-dimensiones:

$$
    \beta_0+\beta_1x_1+\beta_2x_2 + \dots + \beta_p x_p=0
$$

y de igual manera, todos los puntos definidos por el vector $ x = (x_1, x_2, \dots, x_n) $ ue cumplen la ecuación pertenecen al hiperplano.

Cuando x no satisface la ecuación:

$$
    \beta_0 + \beta_1x_1 + \beta_2x_2 + ... + \beta_px_p < 0
$$

O bien

$$
    \beta_0 + \beta_1x_1 + \beta_2x_2 + ... + \beta_px_p > 0
$$

el punto x cae a un lado o al otro del hiperplano. Así pues, se puede entender que un hiperplano divide un espacio p-dimensional en dos mitades. Para saber en qué lado del hiperplano se encuentra un determinado punto x, solo hay que calcular el signo de la ecuación.

Cuando se dispone de n observaciones, cada una con p predictores y cuya variable respuesta tiene dos niveles (de aquí en adelante identificados como +1 y −1), se pueden emplear hiperplanos para construir un clasificador que permita predecir a que grupo pertenece una observación en función de sus predictores. Este mismo problema puede abordarse también con otros métodos (regresión logística, LDA, árboles de clasificación…) cada uno con ventajas y desventajas. 

Si la distribución de las observaciones es tal que se pueden separar linealmente de forma perfecta en las dos clases (+1 y −1), entonces, un hiperplano de separación cumple que:
$$
    \beta_0 + \beta_1x_1 + \beta_2x_2 + ... + \beta_px_p > 0, \ si \ y_i=1
$$

$$
    \beta_0 + \beta_1x_1 + \beta_2x_2 + ... + \beta_px_p < 0, \ si \ y_i=-1
$$


Al identificar cada clase como +1 o −1, y dado que multiplicar dos valores negativos resultan en un valor positivo, las dos condiciones anteriores pueden simplificarse en una única:
$$
    y_i(\beta_0 + \beta_1x_1 + \beta_2x_2 + ... + \beta_px_p) > 0, \ \ para \ i = 1 ... n
$$



Bajo este escenario, el clasificador más sencillo consiste en asignar cada observación a una clase dependiendo del lado del hiperplano en el que se encuentre. Es decir, la observación $ \text{x *} $ se clasifica acorde al signo de la función

$$
    f(\textbf{x *}) = \beta_0 + \beta_1x^*_1 + \beta_2x^*_2 + ... + \beta_p x^*_p
$$

es positiva, la observación se asigna a la clase +1, si es negativa, a la clase −1. Además, la magnitud de $ f(x^*)$ permite saber cómo de lejos está la observación del hiperplano y con ello la confianza de la clasificación.

La definición de hiperplano para casos perfectamente separables linealmente resulta en un número infinito de posibles hiperplanos, lo que hace necesario un método que permita seleccionar uno de ellos como clasificador óptimo.

La solución a este problema consiste en seleccionar como clasificador óptimo al que se conoce como maximal margin hyperplane o hiperplano óptimo de separación, el cual se define como el hiperplano que consigue un mayor margen, es decir, que la distancia mínima entre el hiperplano y las observaciones es lo más grande posible. 

Aunque esta idea suena razonable, no es posible aplicarla, ya que habría infinitos hiperplanos contra los que medir las distancias. En su lugar, se recurre a métodos de optimización. 

Para encontrar una descripción más detallada de la solución por optimización consultar (Support Vector Machines Succinctly by Alexandre Kowalczyk).

![image.png](attachment:image.png)