# Creación de un Perceptrón Multicapa de Tres Capas con `sklearn.neural_network`

En este notebook, aprenderás a crear un perceptrón multicapa (MLP, por sus siglas en inglés) de tres capas utilizando la librería `sklearn.neural_network`. Cubriremos todo el pipeline de la tarea de clasificación, desde la generación del dataset hasta la evaluación del modelo.

## Objetivos:
1. Generar un dataset sintético con al menos cinco variables independientes.
2. Dividir el dataset en conjuntos de entrenamiento y prueba.
3. Normalizar los datos.
4. Crear y entrenar un perceptrón multicapa de tres capas.
5. Evaluar el modelo utilizando la matriz de confusión y la curva de error.
6. Explicar cada función y sus argumentos.

## Paso 1: Importación de Librerías

Primero, importamos las librerías necesarias para el proyecto.

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
import seaborn as sns

## Paso 2: Generación del Dataset

Utilizamos la función `make_classification` de `sklearn` para generar un dataset sintético con cinco variables independientes y dos clases.

In [None]:
# Generar dataset sintético
X, y = make_classification(
    n_samples=1000,  # Número de muestras
    n_features=5,    # Número de características (variables independientes)
    n_classes=2,     # Número de clases
    n_informative=5, # Características informativas
    n_redundant=0,   # Características redundantes
    random_state=42  # Semilla para reproducibilidad
)

# Convertir a DataFrame para visualización
df = pd.DataFrame(X, columns=[f'Feature_{i+1}' for i in range(5)])
df['Target'] = y

# Mostrar las primeras filas del dataset
print("Primeras filas del dataset:")
df.head()

## Paso 3: División del Dataset

Dividimos el dataset en conjuntos de entrenamiento (70%) y prueba (30%).

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

print(f"Tamaño del conjunto de entrenamiento: {X_train.shape}")
print(f"Tamaño del conjunto de prueba: {X_test.shape}")

## Paso 4: Normalización de los Datos

Normalizamos los datos para que tengan media 0 y desviación estándar 1. Esto es importante para el entrenamiento de redes neuronales.

In [None]:
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

print("Datos normalizados:")
print(X_train[:5])

## Paso 5: Creación del Perceptrón Multicapa

Creamos un perceptrón multicapa de tres capas utilizando `MLPClassifier`. Las capas son:
- Capa oculta 1: 10 neuronas
- Capa oculta 2: 5 neuronas
- Capa de salida: 1 neurona (para clasificación binaria)

### Argumentos principales de `MLPClassifier`:
- `hidden_layer_sizes=(10, 5)`: Define dos capas ocultas con 10 y 5 neuronas, respectivamente.
- `activation='relu'`: Función de activación ReLU.
- `solver='adam'`: Optimizador Adam.
- `max_iter=1000`: Número máximo de iteraciones.
- `learning_rate_init=0.01`: Tasa de aprendizaje inicial.
- `random_state=42`: Semilla para reproducibilidad.

In [None]:
mlp = MLPClassifier(
    hidden_layer_sizes=(10, 5),  # Dos capas ocultas con 10 y 5 neuronas
    activation='relu',           # Función de activación ReLU
    solver='adam',               # Optimizador Adam
    max_iter=1000,               # Número máximo de iteraciones
    learning_rate_init=0.01,     # Tasa de aprendizaje inicial
    random_state=42              # Semilla para reproducibilidad
)

# Entrenar el modelo
mlp.fit(X_train, y_train)
print("Entrenamiento completado.")

## Paso 6: Predicciones y Evaluación

Realizamos predicciones en el conjunto de prueba y evaluamos el rendimiento del modelo.

In [None]:
# Predicciones
y_pred = mlp.predict(X_test)

# Precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
print(f"Precisión del modelo: {accuracy:.2f}")

## Paso 7: Matriz de Confusión

La **matriz de confusión** es una herramienta para evaluar el rendimiento de un modelo de clasificación. Muestra la cantidad de predicciones correctas e incorrectas para cada clase.

### Estructura:
|                     | Predicción: Clase 0 | Predicción: Clase 1 |
|---------------------|---------------------|---------------------|
| **Real: Clase 0**   | Verdaderos Negativos (TN) | Falsos Positivos (FP) |
| **Real: Clase 1**   | Falsos Negativos (FN) | Verdaderos Positivos (TP) |

### Métricas derivadas:
- **Precisión = TP / (TP + FP)**
- **Recall (Sensibilidad) = TP / (TP + FN)**
- **Exactitud = (TP + TN) / (TP + TN + FP + FN)**

In [None]:
# Matriz de confusión
conf_matrix = confusion_matrix(y_test, y_pred)

# Visualización
plt.figure(figsize=(6, 4))
sns.heatmap(conf_matrix, annot=True, fmt="d", cmap="Blues", xticklabels=["Clase 0", "Clase 1"], yticklabels=["Clase 0", "Clase 1"])
plt.xlabel("Predicción")
plt.ylabel("Real")
plt.title("Matriz de Confusión")
plt.show()

## Paso 8: Curva de Error

La **curva de error** muestra cómo disminuye el error durante el entrenamiento. Esto nos ayuda a verificar si el modelo está convergiendo correctamente.

In [None]:
# Curva de error
plt.plot(mlp.loss_curve_)
plt.xlabel("Iteraciones")
plt.ylabel("Error")
plt.title("Curva de Error durante el Entrenamiento")
plt.show()

## Paso 9: Reporte de Clasificación

El **reporte de clasificación** proporciona métricas detalladas como precisión, recall y F1-score para cada clase.

In [None]:
print("Reporte de clasificación:")
print(classification_report(y_test, y_pred))