## Ahora que ya sabemos para el algoritmo de PCA, ¿que otras alternativas tenemos?

Bueno, una alternativa son los Kernels. Un Kernel es una función matemática que toma mediciones que se comportan de manera no lineal y las proyecta en un espacio dimensional más grande en donde sen linealmente separables.

### Y, ¿esto para que puede servir?

![](./images/kernels.png)

Sirve para casos en donde no son linealmente separables. El la primera imagen no es posible separarlos con una linea y en la imagen 2 si lo podemos hacer mediante Kernels. Lo que hace la función de Kernels es proyectar los puntos en otra dimensión y así volver los datos linealmente separables.

### ¿Que tipo de funciones para Kernels nos podemos encontrar?

![](./images/funciones.png)

### Ejemplos de funciones de kernels en datasets aplicados a un clasificador:

![](./images/kernels_aplicados.png)

In [2]:
import pandas as pd 
import sklearn
import matplotlib.pyplot as plt 

from sklearn.decomposition import KernelPCA

from sklearn.linear_model import LogisticRegression

from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split

In [3]:
# Importando nuestro dataset
dt_heart = pd.read_csv('./documents/heart.csv')
dt_heart.head()

Unnamed: 0,age,sex,cp,trestbps,chol,fbs,restecg,thalach,exang,oldpeak,slope,ca,thal,target
0,52,1,0,125,212,0,1,168,0,1.0,2,2,3,0
1,53,1,0,140,203,1,0,155,1,3.1,0,0,3,0
2,70,1,0,145,174,0,1,125,1,2.6,0,0,3,0
3,61,1,0,148,203,0,1,161,0,0.0,2,1,3,0
4,62,0,0,138,294,1,1,106,0,1.9,1,3,2,0


In [4]:
# Dividir el dataset en features y target
dt_features = dt_heart.drop(['target'], axis=1)
dt_target = dt_heart['target']

In [5]:
# Normalizar datos con StandardScaler
dt_features = StandardScaler().fit_transform(dt_features)

In [6]:
# Dividr nuestro dataset en datos de entrenamiento y datos de test
X_train, X_test, Y_train, Y_test = train_test_split(dt_features, dt_target, test_size=0.3, random_state=2)

In [7]:
# Creamos nuestro KPCA
kpca = KernelPCA(n_components=4, kernel='poly')
kpca.fit(X_train)

KernelPCA(alpha=1.0, coef0=1, copy_X=True, degree=3, eigen_solver='auto',
          fit_inverse_transform=False, gamma=None, kernel='poly',
          kernel_params=None, max_iter=None, n_components=4, n_jobs=None,
          random_state=None, remove_zero_eig=False, tol=0)

In [8]:
# Aplicarndo el algoritmo de KPCA a nuestro datos
dt_train = kpca.transform(X_train)
dt_test = kpca.transform(X_test)

In [9]:
# Configurar regresion logistica
logistic = LogisticRegression(solver='lbfgs')

In [10]:
# Mandamos los data frames la la regresión logística
logistic.fit(dt_train, Y_train)

LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
                   intercept_scaling=1, l1_ratio=None, max_iter=100,
                   multi_class='warn', n_jobs=None, penalty='l2',
                   random_state=None, solver='lbfgs', tol=0.0001, verbose=0,
                   warm_start=False)

In [11]:
#Calculamos nuestra exactitud de nuestra predicción
print("SCORE PCA: ", logistic.score(dt_test, Y_test))

SCORE PCA:  0.8409090909090909
