# **Tutorial sobre Redes Neuronales Multicapa en Python con Scikit-learn**

## **1. Fundamentos Teóricos y Matemáticos**

### **¿Qué son las Redes Neuronales Multicapa (RNM)?**
Las Redes Neuronales Multicapa (MLP, por sus siglas en inglés) son modelos de aprendizaje automático inspirados en el funcionamiento del cerebro humano. Se componen de múltiples capas de neuronas artificiales organizadas en:
- **Capa de entrada**: Recibe las características del conjunto de datos.
- **Capas ocultas**: Procesan la información aplicando funciones de activación.
- **Capa de salida**: Genera la predicción final del modelo.

### **Backpropagation (Retropropagación del Error)**
El algoritmo de **Backpropagation** es fundamental para el entrenamiento de las redes neuronales. Consiste en:
1. **Forward Pass**: Se calcula la salida de la red con los pesos actuales.
2. **Cálculo del Error**: Se compara la salida con el valor real usando una función de pérdida (ej. entropía cruzada o MSE).
3. **Backward Pass**: Se propaga el error hacia atrás usando el **descenso de gradiente** para actualizar los pesos.
4. **Repetición** hasta minimizar la función de pérdida.

---

## **2. Implementación en Python con Scikit-learn**

### **Importación de librerías**
```python
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
```

---

## **3. Carga y Exploración del Dataset**
El dataset **Iris** es un conjunto de datos clásico en aprendizaje automático. Contiene 150 instancias de flores de tres especies (**Setosa, Versicolor y Virginica**) con cuatro características numéricas.

```python
# Cargar el dataset
iris = load_iris()
X = iris.data
y = iris.target

df = pd.DataFrame(X, columns=iris.feature_names)
df['target'] = y

# Visualización de las primeras filas
df.head()
```

---

## **4. Análisis Exploratorio y Feature Engineering**

### **Gráfico de Dispersión**
```python
sns.pairplot(df, hue='target', palette='Dark2')
plt.show()
```

### **Matriz de Correlación (Heatmap)**
```python
plt.figure(figsize=(8,6))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm', fmt='.2f')
plt.show()
```

---

## **5. Preprocesamiento de Datos**
Antes de entrenar la red neuronal, debemos **escalar los datos** para mejorar el rendimiento del modelo.

```python
# División en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Escalado de los datos
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
```

---

## **6. Entrenamiento del Modelo (MLPClassifier)**
```python
# Creación del modelo con dos capas ocultas de 10 neuronas cada una
mlp = MLPClassifier(hidden_layer_sizes=(10, 10), max_iter=1000, activation='relu', solver='adam', random_state=42)

# Entrenamiento del modelo
mlp.fit(X_train, y_train)
```

**Explicación de parámetros clave:**
- `hidden_layer_sizes=(10, 10)`: Define dos capas ocultas con 10 neuronas cada una.
- `max_iter=1000`: Número máximo de iteraciones en el entrenamiento.
- `activation='relu'`: Función de activación ReLU para las capas ocultas.
- `solver='adam'`: Algoritmo de optimización Adam.

---

## **7. Evaluación del Modelo**

### **Predicciones y Precisión**
```python
y_pred = mlp.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f'Accuracy: {accuracy:.2f}')
```

### **Matriz de Confusión**
```python
conf_matrix = confusion_matrix(y_test, y_pred)
sns.heatmap(conf_matrix, annot=True, cmap='Blues', fmt='d', xticklabels=iris.target_names, yticklabels=iris.target_names)
plt.xlabel('Predicted Label')
plt.ylabel('True Label')
plt.title('Matriz de Confusión')
plt.show()
```

### **Reporte de Clasificación**
```python
class_report = classification_report(y_test, y_pred, target_names=iris.target_names)
print('Classification Report:\n', class_report)
```

**Explicación de métricas:**
- `Accuracy`: Porcentaje de predicciones correctas.
- `Precision`: Qué proporción de positivos identificados es correcta.
- `Recall`: Cuántos positivos reales fueron identificados correctamente.
- `F1-score`: Media armónica entre precisión y recall.

---

## **Conclusión**
Este tutorial abordó el desarrollo de una Red Neuronal Multicapa en Python usando Scikit-learn, explorando desde la teoría hasta la implementación práctica. Se destacaron técnicas de preprocesamiento, entrenamiento y evaluación del modelo. La combinación de visualizaciones y métricas permitió validar la calidad del modelo en la tarea de clasificación del dataset Iris.
