# Segundo resumen sobre modelos de clasificación supervisada

En este capítulo, revisaremos los modelos de clasificación que no se vieron en el primer resumen. Veremos los siguientes modelos:

- Support Vector Machines (SVM)
- Naive Bayes 
- Gradient Boosting
- Redes Neuronales Artificiales

Como en el anterior capítulo, no solo cubriremos la teoría y la intuición detrás de Random Forest y otros métodos de clasificación supervisada, sino que también proporcionaremos ejemplos prácticos y ejercicios en Python. Utilizaremos librerías populares como scikit-learn, que ofrece implementaciones eficientes y fáciles de usar de una variedad de algoritmos de aprendizaje automático.

Cada uno de estos modelos tiene sus propias fortalezas y situaciones en las que es más adecuado. A lo largo de este capítulo, exploraremos en detalle cómo cada uno funciona, cómo se implementan en Python utilizando scikit-learn u otras bibliotecas relevantes, y en qué situaciones podrían ser la mejor opción para tus proyectos de clasificación supervisada.


Recordemos la estructura abstracta para entrenar modelos en scikit-learn:

```{note} Sintaxis General para Modelos de Clasificación en Scikit-learn

En scikit-learn, la implementación de modelos de clasificación supervisada sigue un patrón consistente, lo que facilita la experimentación con diferentes algoritmos. Este patrón se puede describir en unos pocos pasos generales aplicables a cualquier modelo de clasificación. Aquí te muestro cómo se ve esta sintaxis de manera abstracta:

### Pasos Generales

1. **Importar el Modelo:** Primero, se importa la clase correspondiente al modelo que deseas utilizar desde scikit-learn.

    ```python
    from sklearn.[modulo] import [Modelo]
    ```

2. **Instanciar el Modelo:** Creas una instancia del modelo, donde puedes especificar varios hiperparámetros según tus necesidades. Si no estás seguro, puedes empezar con los valores predeterminados.

    ```python
    modelo = [Modelo](hiperparametro1=valor1, hiperparametro2=valor2, ...)
    ```

3. **Entrenar el Modelo:** Utilizas el método `.fit()` para entrenar el modelo con tus datos de entrenamiento. Esto ajustará los parámetros del modelo para minimizar el error de predicción.

    ```python
    modelo.fit(X_train, y_train)
    ```

4. **Hacer Predicciones:** Una vez entrenado el modelo, puedes usar el método `.predict()` para hacer predicciones sobre nuevos datos.

    ```python
    y_pred = modelo.predict(X_test)
    ```

**Ejemplo Genérico**

Aquí tienes un ejemplo genérico que muestra cómo aplicar estos pasos:

```python
# Paso 1: Importar el modelo
from sklearn.[modulo] import [Modelo]

# Paso 2: Instanciar el modelo con los hiperparámetros deseados
modelo = [Modelo](hiperparametro1=valor1, hiperparametro2=valor2, ...)

# Paso 3: Entrenar el modelo
modelo.fit(X_train, y_train)

# Paso 4: Hacer predicciones
y_pred = modelo.predict(X_test)
```
Es importante recordar que `[modulo]`, `[Modelo]`, `hiperparametro1`, `valor1`, etc., son marcadores de posición. Deben reemplazarce con los nombres específicos y valores relevantes para el modelo que estás utilizando. Esta estructura te permite adaptar fácilmente el código para diferentes modelos de clasificación supervisada en scikit-learn.
```


## Cómo Funciona Support Vector Machines (SVM)

Support Vector Machines (SVM) representa uno de los algoritmos más robustos y precisos dentro del aprendizaje supervisado, especialmente utilizado para problemas de clasificación. Este algoritmo se basa en la idea de encontrar el mejor hiperplano que separa las distintas clases en el espacio de características.

```{note}
El hiperplano en el contexto de SVM es conceptualmente similar a una línea de división en 2D, pero extendido a espacios de mayor dimensión. Su objetivo es maximizar el margen entre las clases de datos, siendo este margen la distancia mínima entre el hiperplano y los puntos más cercanos de las clases (vectores de soporte).
```

### Principios Fundamentales de SVM

1. **Identificación del Mejor Hiperplano:** SVM comienza el proceso de clasificación buscando el hiperplano que ofrece la mayor separación (margen) entre las diferentes clases. En un espacio de dos dimensiones, este hiperplano puede visualizarse como una línea.

2. **Maximización del Margen:** El margen se define como la distancia entre el hiperplano y los vectores de soporte más cercanos. Los vectores de soporte son aquellos puntos de datos que están más cerca del hiperplano. SVM optimiza este margen para mejorar la capacidad del modelo para generalizar bien a nuevos datos.

3. **Uso del Truco del Kernel:** En situaciones donde los datos no son linealmente separables, SVM utiliza técnicas de kernel para transformar el espacio de entrada en un espacio de mayor dimensión donde los datos pueden ser separados linealmente. Esto permite a SVM manejar eficazmente relaciones complejas y no lineales entre las características.

```{note}
A través del truco del kernel, SVM es capaz de realizar clasificaciones complejas y no lineales utilizando espacios de características transformados, sin necesidad de calcular explícitamente las dimensiones adicionales.
```

### Visualización del Algoritmo SVM

Imagina que estás en un campo abierto donde se encuentran dispersos dos tipos de flores. Tu tarea es trazar una línea recta (en este caso, el hiperplano) que separe lo mejor posible estos dos tipos de flores. El enfoque de SVM no solo se centra en trazar esta línea sino en posicionarla de tal manera que la distancia (margen) entre la línea y las flores más cercanas a ella (de ambos tipos) sea la máxima posible. Esto es equivalente a maximizar la tolerancia al error en la clasificación de futuras muestras de flores.

```{image} images/SVM.png
:alt: Support Vector Machines
:align: center
```

```{image} images/SVM_2.png
:alt: Support Vector Machines Algorithm
:align: center
```

SVM se destaca por su efectividad en espacios de alta dimensión y su capacidad para manejar fronteras de decisión complejas y no lineales, gracias al uso de funciones kernel. Este enfoque, centrado en la maximización del margen y en la importancia crítica de los vectores de soporte, permite que SVM sea altamente efectivo y preciso en la clasificación, incluso en situaciones donde la relación entre las características no es inmediatamente evidente.

In [1]:
## Ejemplo sencillo 

## Dataset de prueba [Iris]

from sklearn import datasets
import pandas as pd
import numpy as np

iris = datasets.load_iris()
iris_df = pd.DataFrame(data= np.c_[iris['data'], iris['target'].astype(int)],
                        columns= iris['feature_names'] + ['target'])

iris_df.head()

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm),target
0,5.1,3.5,1.4,0.2,0.0
1,4.9,3.0,1.4,0.2,0.0
2,4.7,3.2,1.3,0.2,0.0
3,4.6,3.1,1.5,0.2,0.0
4,5.0,3.6,1.4,0.2,0.0


In [2]:
iris_df['target'].astype(int).value_counts()

target
0    50
1    50
2    50
Name: count, dtype: int64

In [3]:
## Dividir el dataset en entrenamiento y prueba

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(iris_df[iris['feature_names']], iris_df['target'], test_size=0.4, stratify=iris_df['target'].astype(int), random_state=0)

print('X train shape:', X_train.shape)
print('X test shape:', X_test.shape)

X train shape: (90, 4)
X test shape: (60, 4)


In [4]:
## Ahora clasificación con SVM

from sklearn.svm import SVC

clf = SVC(kernel='linear', C=1.0, random_state=0)
clf.fit(X_train, y_train)

## Predicción

y_pred = clf.predict(X_test)

## Evaluación

from sklearn.metrics import classification_report

print(classification_report(y_test, y_pred))


              precision    recall  f1-score   support

         0.0       1.00      1.00      1.00        20
         1.0       1.00      1.00      1.00        20
         2.0       1.00      1.00      1.00        20

    accuracy                           1.00        60
   macro avg       1.00      1.00      1.00        60
weighted avg       1.00      1.00      1.00        60



### Hipérparámetros Importantes de SVM

SVM tiene varios hiperparámetros que pueden ajustarse para mejorar el rendimiento del modelo. `scikit-learn` proporciona valores predeterminados razonables para estos hiperparámetros, pero es importante comprender cómo afectan al modelo. Algunos de los hiperparámetros más importantes de SVM son:

- **c:** Parámetro de regularización que controla la compensación entre la maximización del margen y la minimización de la clasificación incorrecta. Un valor más alto de `C` dará como resultado un margen más estrecho pero una clasificación más precisa.

- **kernel:** Especifica el tipo de kernel a utilizar en la transformación de los datos. Los kernels comunes incluyen `linear`, `poly`, `rbf` (radial basis function), y `sigmoid`.

- **gamma:** Coeficiente del kernel para los kernels `rbf`, `poly`, y `sigmoid`. Un valor más alto de `gamma` dará como resultado un ajuste más preciso a los datos de entrenamiento, pero puede llevar a un sobreajuste.


### Naive Bayes

**Naive Bayes** es un conjunto de algoritmos de clasificación supervisada basados en el teorema de Bayes con la "naive" suposición de independencia entre las características. A pesar de su simplicidad, Naive Bayes puede superar a modelos de clasificación más complejos.

- **Ventajas**: Simple, rápido y efectivo en conjuntos de datos de gran dimensión.
- **Desventajas**: La suposición de independencia entre características no siempre se cumple en datos reales.

**Ejemplo práctico**: Clasificación de especies de Iris basada en medidas de sus características.

**Más información**: [Scikit-learn Naive Bayes](https://scikit-learn.org/stable/modules/naive_bayes.html)
    

In [5]:
## Ejemplo sencillo 

## Dataset de prueba [Iris]

from sklearn import datasets
import pandas as pd
import numpy as np

iris = datasets.load_iris()
iris_df = pd.DataFrame(data= np.c_[iris['data'], iris['target'].astype(int)],
                        columns= iris['feature_names'] + ['target'])

iris_df.head()

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm),target
0,5.1,3.5,1.4,0.2,0.0
1,4.9,3.0,1.4,0.2,0.0
2,4.7,3.2,1.3,0.2,0.0
3,4.6,3.1,1.5,0.2,0.0
4,5.0,3.6,1.4,0.2,0.0


In [6]:
 iris_df['target'].astype(int).value_counts()

target
0    50
1    50
2    50
Name: count, dtype: int64

In [7]:
## Dividir el dataset en entrenamiento y prueba

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(iris_df[iris['feature_names']], iris_df['target'], test_size=0.4, stratify=iris_df['target'].astype(int), random_state=0)

print('X train shape:', X_train.shape)
print('X test shape:', X_test.shape)

X train shape: (90, 4)
X test shape: (60, 4)


In [8]:
## Ahora clasificación con Random Forest

from sklearn.ensemble import RandomForestClassifier

clf = RandomForestClassifier(n_estimators=100, random_state=0)
clf.fit(X_train, y_train)

## Predicción

y_pred = clf.predict(X_test)

## Evaluación

from sklearn.metrics import classification_report

print(classification_report(y_test, y_pred))


              precision    recall  f1-score   support

         0.0       1.00      1.00      1.00        20
         1.0       0.90      0.95      0.93        20
         2.0       0.95      0.90      0.92        20

    accuracy                           0.95        60
   macro avg       0.95      0.95      0.95        60
weighted avg       0.95      0.95      0.95        60



In [9]:

# Ejemplo de Implementación con Naive Bayes en scikit-learn
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score

# Cargar el conjunto de datos Iris
iris = datasets.load_iris()
X = iris.data
y = iris.target

# Dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Crear y entrenar el modelo Naive Bayes
gnb = GaussianNB()
gnb.fit(X_train, y_train)

# Realizar predicciones y evaluar el modelo
y_pred = gnb.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")
    

Accuracy: 0.9777777777777777
