# Prueba: Modelado de una Red Neuronal con MLPClassifier

## Instrucciones

Utiliza el lenguaje de programación **Python** y las bibliotecas **scikit-learn** y **pandas** para completar esta prueba.

Tu tarea es realizar los siguientes pasos:

1. **Cargar y explorar los datos**.
2. **Preparar los datos para el entrenamiento**.
3. **Construir y entrenar una red neuronal (Perceptrón Multicapa) utilizando `MLPClassifier`**.
4. **Evaluar el desempeño del modelo** utilizando métricas apropiadas.
5. **Analizar los resultados y proponer mejoras**.

**Nota**: Comenta tu código adecuadamente y muestra los resultados de cada paso.

## 1. Carga y exploración de datos

- Carga el conjunto de datos de cáncer de mama utilizando `load_breast_cancer` de scikit-learn.
- Convierte los datos en un DataFrame de pandas y asigna nombres a las columnas.
- Agrega una nueva columna `'target'` al DataFrame con las etiquetas de clasificación.
- Muestra las primeras 5 filas del DataFrame para verificar que los datos se han cargado correctamente.
- Explora el DataFrame para entender la distribución de las características y la variable objetivo.

In [None]:
# Tu código aquí
from sklearn.datasets import load_breast_cancer
import pandas as pd

# Cargamos el conjunto de datos de cáncer de mama
data = load_breast_cancer()

# Convertimos los datos en un DataFrame de pandas y asignamos nombres a las columnas
df = pd.DataFrame(data.data, columns=data.feature_names)

# Agregamos una nueva columna 'target' al DataFrame con las etiquetas de clasificación
df['target'] = data.target

# Mostramos las primeras 5 filas del DataFrame para verificar que los datos se han cargado correctamente


# Exploración adicional
# Por ejemplo, puedes mostrar información general del DataFrame


# Describir las estadísticas básicas


# Distribución de la variable objetivo


## 2. Preparación de los datos

- Verifica si hay datos faltantes y maneja cualquier dato faltante si es necesario.
- Divide los datos en conjuntos de **entrenamiento** y **prueba** (por ejemplo, 70% entrenamiento y 30% prueba) utilizando `train_test_split`.
- Escala las características utilizando una técnica de escalado apropiada (por ejemplo, `StandardScaler`) para mejorar el rendimiento del modelo.

In [None]:
# Tu código aquí
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Verificar si hay datos faltantes


# Separar características y variable objetivo
X = df.drop('target', axis=1)
y = df['target']

# Dividir los datos en conjuntos de entrenamiento y prueba


# Escalar las características


## 3. Construcción y entrenamiento del modelo

- Importa `MLPClassifier` de scikit-learn.
- Construye un modelo de Perceptrón Multicapa con una arquitectura de tu elección. Considera lo siguiente:
  - Número de capas ocultas y neuronas en cada capa.
  - Función de activación (por ejemplo, `'relu'`, `'tanh'`, `'logistic'`).
  - Parámetros como `solver`, `learning_rate`, y `max_iter`.
- Entrena el modelo utilizando el conjunto de entrenamiento.

In [None]:
# Tu código aquí
from sklearn.neural_network import MLPClassifier

# Crear el modelo


# Entrenar el modelo


## 4. Evaluación del modelo

- Utiliza el conjunto de prueba para evaluar el desempeño del modelo.
- Calcula métricas como:
  - **Precisión (accuracy)**
  - **Precisión (precision)**
  - **Exhaustividad (recall)**
  - **Puntuación F1 (F1-score)**
- Genera y presenta la **matriz de confusión**.
- Si es posible, muestra el **informe de clasificación** (`classification_report`).

In [None]:
# Tu código aquí
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score, precision_score, recall_score, f1_score

# Realizar predicciones en el conjunto de prueba


# Calcular las métricas

# Matriz de confusión


# Informe de clasificación


## 5. Análisis de resultados y propuesta de mejoras

- Comenta sobre el desempeño del modelo. Considera:
  - ¿El modelo muestra buen rendimiento en términos de las métricas calculadas?
  - ¿Hay indicios de **sobreajuste** o **subajuste**?
- Propón al menos dos formas de mejorar el desempeño del modelo. Por ejemplo:
  - Ajuste de hiperparámetros utilizando **GridSearchCV** o **RandomizedSearchCV**.
  - Modificación de la arquitectura de la red (número de capas, neuronas, etc.).
  - Implementación de técnicas de regularización (por ejemplo, `alpha` en `MLPClassifier`).
  - Cambio en la función de activación o el optimizador (`solver`).

### Tu análisis aquí

- **Desempeño del modelo**:
  - *(Escribe aquí tus observaciones sobre el desempeño del modelo basándote en las métricas obtenidas y la matriz de confusión.)*

- **Posibles indicios de sobreajuste o subajuste**:
  - *(Comenta si el modelo está sobreajustando o subajustando, y cómo lo identificaste.)*

- **Propuestas de mejora**:
  1. *(Primera propuesta de mejora con su justificación.)*
  2. *(Segunda propuesta de mejora con su justificación.)*

## Recursos Adicionales

- [Documentación de scikit-learn sobre MLPClassifier](https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html)
- [Tutorial sobre cómo ajustar hiperparámetros](https://scikit-learn.org/stable/modules/grid_search.html)
- [Guía sobre métricas de evaluación](https://scikit-learn.org/stable/modules/model_evaluation.html)

## Conclusiones

- *(Escribe aquí tus conclusiones finales sobre el ejercicio, lo que aprendiste y cualquier observación adicional.)*