# Actividad Práctica Experimental 8

## Librerías a utilizar

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import classification_report, confusion_matrix, ConfusionMatrixDisplay, f1_score

## Carga del dataset


Para la realización de esta actividad, se usará el dataset de vinos de SciKit-Learn para hacer uso del perceptrón multicapa (`MLPClassifier`)

In [None]:
data = load_wine()
df = pd.DataFrame(data.data, columns=data.feature_names)
df["class"] = data.target
df.head()

## Exploración breve de los datos

In [None]:
df.info()

In [None]:
df.shape

In [None]:
corr_matrix = df.corr()
plt.figure(figsize=(10, 10))
sns.heatmap(corr_matrix, annot=True, fmt=".2f", cmap="coolwarm", square=True, cbar_kws={"shrink": .8})
plt.title("Matriz de Correlación")
plt.show()

In [None]:
sns.scatterplot(x="alcohol", y="color_intensity", hue="class", data=df)

In [None]:
X = df.drop("class", axis=1)
y = df["class"]

## Divisón de datos de entrenamiento y prueba

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## Normalización de los datos

In [None]:
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

## Creación del modelo MLP

In [None]:
mlp = MLPClassifier(hidden_layer_sizes=(2,), max_iter=800, batch_size=32, random_state=42)
mlp.fit(X_train_scaled, y_train)

In [None]:
# Predicciones
y_pred = mlp.predict(X_test_scaled)

In [None]:
losses = mlp.loss_curve_

sns.lineplot(x=np.arange(len(losses)), y=losses)
plt.title("Curva de Pérdida del Modelo")
plt.xlabel("Épocas")
plt.ylabel("Pérdida")

El modelo converge después de 659 iteraciones o épocas

## Evaluación del modelo

In [None]:
print("accuracy:", mlp.score(X_test_scaled, y_test))
print("f1 score:", f1_score(y_test, y_pred, average='weighted'))

In [None]:
cm = ConfusionMatrixDisplay(confusion_matrix(y_test, y_pred, labels=[0, 1]), display_labels=data.target_names[:2])
cm.plot(cmap=plt.cm.Blues)

In [None]:
print(classification_report(y_test, y_pred, target_names=data.target_names, labels=[0, 1]))

## Usando 2 capas para el MLP


En este caso se probará usar un MLP de 2 capas ocultas de 6 y 3 neuronas respectivamente

In [None]:
mlp = MLPClassifier(hidden_layer_sizes=(6, 3), activation="relu", solver="adam", max_iter=800, batch_size=32, random_state=42)
mlp.fit(X_train_scaled, y_train)

In [None]:
y_pred = mlp.predict(X_test_scaled)

In [None]:
losses = mlp.loss_curve_

sns.lineplot(x=np.arange(len(losses)), y=losses)
plt.title("Curva de Pérdida del Modelo")
plt.xlabel("Épocas")
plt.ylabel("Pérdida")

El modelo converge a las 282 iteraciones o épocas

In [None]:
print("accuracy:", mlp.score(X_test_scaled, y_test))
print("f1 score:", f1_score(y_test, y_pred, average='weighted'))

In [None]:
cm = ConfusionMatrixDisplay(confusion_matrix(y_test, y_pred, labels=[0, 1]), display_labels=data.target_names[:2])
cm.plot(cmap=plt.cm.Blues)

In [None]:
print(classification_report(y_test, y_pred, target_names=data.target_names, labels=[0, 1]))

## Usando 3 capas


En este caso se probará usar un MLP de 3 capas ocultas de 16, 8 y 4 neuronas respectivamente

In [None]:
mlp = MLPClassifier(hidden_layer_sizes=(16, 8, 4), activation="relu", solver="adam", max_iter=800, batch_size=32, random_state=42)
mlp.fit(X_train_scaled, y_train)

In [None]:
y_pred = mlp.predict(X_test_scaled)

In [None]:
losses = mlp.loss_curve_

sns.lineplot(x=np.arange(len(losses)), y=losses)
plt.title("Curva de Pérdida del Modelo")
plt.xlabel("Épocas")
plt.ylabel("Pérdida")

In [None]:
cm = ConfusionMatrixDisplay(confusion_matrix(y_test, y_pred, labels=[0, 1]), display_labels=data.target_names[:2])
cm.plot(cmap=plt.cm.Blues)

In [None]:
print(classification_report(y_test, y_pred, target_names=data.target_names, labels=[0, 1]))

## Preguntas de Seguimiento



### ¿Qué efecto tiene la estandarización de datos en el rendimiento del modelo?

La estandarización de datos (usando `StandardScaler`) es crucial para el rendimiento del modelo `MLPClassifier`. Los modelos basados en redes neuronales, como el perceptrón multicapa, son sensibles a la escala de las características. Al estandarizar los datos, se asegura que todas las características tengan una media de 0 y una desviación estándar de 1, lo que ayuda a que el modelo converja más rápido durante el entrenamiento y evita que características con magnitudes mayores dominen el proceso de aprendizaje. Esto mejora la precisión y la estabilidad del modelo.

### ¿Qué arquitectura fue la más efectiva para este conjunto?

En este caso, se contruyeron dos modelos de perceptrón multicapa, uno con una capa oculta de 3 neuronas, otra con dos capas ocultas de 6 y 3 neuronas respectivamente y una con 3 capas con 16, 8 y 4 neuronas respectivamente. Todos los modelos lograron adaptarse al conjunto de datos, ambos alcanzando una precisión del 100% y un f1 score del 100%. La principal observación que podemos hacer es que el modelo de una capa requiere más iteraciones o épocas para converger(659 en total), el modelo con dos capas converge en menos de 300 épocas, y el modelo de 3 capas converge en menos de 200. Gracias a esto, podemos identificar que al aumentar el número de neuronas y capas, podemos obtener un modelo que aprenda más rápido, sin embargo, esto también puede traer como consecuencia un modelo más complejo y pesado, añadiendo que el entrenamiento se vuelve más complicado de realizar. Debido a que las arquitecturas en este caso no tienen un costo computacional tan alto, se recomienda el uso de la segunda alternativa

### ¿Qué ventajas y limitaciones tiene el uso de MLPClassifier frente a otros modelos?

#### Ventajas:

1. Capacidad para modelar relaciones no lineales complejas gracias a su estructura de capas ocultas.

2. Flexibilidad en la arquitectura (número de capas y neuronas).

3. Funciona bien con datos estandarizados y puede adaptarse a diversos problemas de clasificación.

#### Limitaciones:

1. Requiere ajuste cuidadoso de hiperparámetros (como el número de capas y neuronas).

2. Propenso a sobreajuste si no se usa regularización o si el conjunto de datos es pequeño.

3. Computacionalmente más costoso que modelos más simples (como regresión logística o SVM con kernels lineales).

4. Sensibilidad a la escala de los datos, lo que hace necesaria la estandarización previa.

Comparado con otros modelos como RandomForest o SVM, `MLPClassifier` puede ser más potente para problemas complejos, pero también más difícil de entrenar y ajustar. En el caso del conjunto de datos load_wine, que es relativamente pequeño y simple, otros modelos como SVM o RandomForest podrían ser igualmente efectivos con menos requerimientos computacionales