# üìò Sesi√≥n 7: Comparaci√≥n de Modelos e Introducci√≥n a Redes Neuronales


## üéØ Objetivo
Comparar modelos supervisados e introducir redes neuronales simples con `MLPClassifier`.

## üîç Carga de datos
Usaremos el dataset `breast_cancer` de sklearn.

In [1]:
from sklearn.datasets import load_breast_cancer
import pandas as pd

cancer = load_breast_cancer()
df = pd.DataFrame(cancer.data, columns=cancer.feature_names)
df['target'] = cancer.target
df.head()

Unnamed: 0,mean radius,mean texture,mean perimeter,mean area,mean smoothness,mean compactness,mean concavity,mean concave points,mean symmetry,mean fractal dimension,...,worst texture,worst perimeter,worst area,worst smoothness,worst compactness,worst concavity,worst concave points,worst symmetry,worst fractal dimension,target
0,17.99,10.38,122.8,1001.0,0.1184,0.2776,0.3001,0.1471,0.2419,0.07871,...,17.33,184.6,2019.0,0.1622,0.6656,0.7119,0.2654,0.4601,0.1189,0
1,20.57,17.77,132.9,1326.0,0.08474,0.07864,0.0869,0.07017,0.1812,0.05667,...,23.41,158.8,1956.0,0.1238,0.1866,0.2416,0.186,0.275,0.08902,0
2,19.69,21.25,130.0,1203.0,0.1096,0.1599,0.1974,0.1279,0.2069,0.05999,...,25.53,152.5,1709.0,0.1444,0.4245,0.4504,0.243,0.3613,0.08758,0
3,11.42,20.38,77.58,386.1,0.1425,0.2839,0.2414,0.1052,0.2597,0.09744,...,26.5,98.87,567.7,0.2098,0.8663,0.6869,0.2575,0.6638,0.173,0
4,20.29,14.34,135.1,1297.0,0.1003,0.1328,0.198,0.1043,0.1809,0.05883,...,16.67,152.2,1575.0,0.1374,0.205,0.4,0.1625,0.2364,0.07678,0


## ‚öôÔ∏è Preparaci√≥n de datos

In [2]:
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler

X = df.drop(columns='target')
y = df['target']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

scaler = MinMaxScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

## üìä Comparaci√≥n de modelos

In [3]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import cross_val_score

models = {
    'KNN': KNeighborsClassifier(),
    'Regresi√≥n Log√≠stica': LogisticRegression(max_iter=300),
    '√Årbol de Decisi√≥n': DecisionTreeClassifier()
}

for name, model in models.items():
    scores = cross_val_score(model, X_train, y_train, cv=5, scoring='accuracy')
    print(f"{name}: Exactitud promedio (cross-val): {scores.mean():.3f} ¬± {scores.std():.3f}")


KNN: Exactitud promedio (cross-val): 0.955 ¬± 0.017
Regresi√≥n Log√≠stica: Exactitud promedio (cross-val): 0.957 ¬± 0.006
√Årbol de Decisi√≥n: Exactitud promedio (cross-val): 0.910 ¬± 0.029


### üìò Explicaci√≥n del c√≥digo

- `from sklearn.neighbors import KNeighborsClassifier`, `LogisticRegression`, `DecisionTreeClassifier`:  
  Se importan tres modelos supervisados cl√°sicos desde `scikit-learn` para comparaci√≥n.

- `from sklearn.model_selection import cross_val_score`:  
  Importa la funci√≥n que permite aplicar validaci√≥n cruzada a un modelo. Eval√∫a el desempe√±o promedio de un modelo entrenado y validado en m√∫ltiples particiones del conjunto de datos.

- `models = { ... }`:  
  Se define un diccionario con los tres modelos: KNN, regresi√≥n log√≠stica y √°rbol de decisi√≥n, cada uno instanciado con sus par√°metros por defecto (excepto `max_iter=300` en regresi√≥n log√≠stica para asegurar convergencia).

- `for name, model in models.items()`:  
  Itera sobre cada modelo definido para evaluarlo con la misma estrategia.

- `cross_val_score(...)`:  
  Ejecuta validaci√≥n cruzada con 5 particiones (`cv=5`) sobre los datos de entrenamiento. Se mide la `accuracy` en cada iteraci√≥n.

- `scores.mean()`, `scores.std()`:  
  Calcula el promedio y la desviaci√≥n est√°ndar de las 5 mediciones de exactitud obtenidas por la validaci√≥n cruzada.

Este enfoque permite evaluar los modelos de forma justa, reduciendo el riesgo de sobreajuste a una sola divisi√≥n de los datos.


### üìä An√°lisis de resultados de validaci√≥n cruzada

| Modelo               | Exactitud promedio | Desviaci√≥n est√°ndar |
|----------------------|--------------------|----------------------|
| KNN                  | 0.955              | ¬± 0.017              |
| Regresi√≥n Log√≠stica  | 0.957              | ¬± 0.006              |
| √Årbol de Decisi√≥n    | 0.909              | ¬± 0.013              |

- **KNN y Regresi√≥n Log√≠stica** muestran un rendimiento muy alto y similar en precisi√≥n promedio (~95.5%), con la regresi√≥n ligeramente mejor.
- La **regresi√≥n log√≠stica** adem√°s tiene una **desviaci√≥n est√°ndar m√°s baja**, lo que indica que su desempe√±o es m√°s estable entre particiones del conjunto de datos.
- El **√°rbol de decisi√≥n** tiene una exactitud promedio menor (90.9%) y una desviaci√≥n m√°s alta que la regresi√≥n, lo que sugiere mayor variabilidad y posiblemente m√°s sensibilidad a los datos de entrenamiento.

**Conclusi√≥n:** En este conjunto de datos, tanto KNN como regresi√≥n log√≠stica generalizan bien, pero la regresi√≥n muestra m√°s consistencia. El √°rbol podr√≠a estar sobreajustando o no capturando adecuadamente la estructura de los datos.


## ü§ñ Introducci√≥n a redes neuronales (MLPClassifier)

In [4]:
from sklearn.neural_network import MLPClassifier

mlp = MLPClassifier(hidden_layer_sizes=(20,), activation='relu', max_iter=1000, random_state=42)
mlp.fit(X_train, y_train)

mlp_score = mlp.score(X_test, y_test)
print(f"Exactitud del MLPClassifier: {mlp_score:.3f}")

Exactitud del MLPClassifier: 0.977


### üìò Explicaci√≥n del c√≥digo

- `from sklearn.neural_network import MLPClassifier`:  
  Importa la clase `MLPClassifier`, que implementa un perceptr√≥n multicapa (red neuronal artificial) para tareas de clasificaci√≥n supervisada.

- `mlp = MLPClassifier(...)`:  
  Se crea un modelo de red neuronal con los siguientes par√°metros:
  - `hidden_layer_sizes=(20,)`: se define una sola capa oculta con 20 neuronas.
  - `activation='relu'`: se utiliza la funci√≥n de activaci√≥n ReLU, com√∫n en redes profundas por su eficiencia.
  - `max_iter=1000`: se permite hasta 1000 iteraciones para que el modelo converja.
  - `random_state=42`: se fija una semilla para reproducibilidad.

- `mlp.fit(X_train, y_train)`:  
  Entrena la red neuronal con los datos normalizados de entrenamiento. Durante el entrenamiento, la red ajusta los pesos y sesgos internos para minimizar el error de clasificaci√≥n.

- `mlp.score(X_test, y_test)`:  
  Calcula la exactitud del modelo sobre el conjunto de prueba, es decir, la proporci√≥n de predicciones correctas.

- `print(...)`:  
  Muestra la exactitud alcanzada por el modelo entrenado sobre datos no vistos.


### üìä An√°lisis ampliado del resultado

El modelo `MLPClassifier` alcanz√≥ una exactitud del **97.7%** sobre el conjunto de prueba. Este desempe√±o es superior al reportado por los modelos tradicionales comparados mediante validaci√≥n cruzada:

- **KNN**: 95.5%
- **Regresi√≥n log√≠stica**: 95.7%
- **√Årbol de decisi√≥n**: 90.9%

Aunque esta comparaci√≥n debe tomarse con precauci√≥n ‚Äîya que el MLP fue evaluado sobre una √∫nica partici√≥n de prueba (`test set`) mientras los otros modelos fueron evaluados con validaci√≥n cruzada (`cross_val`)‚Äî, el resultado sugiere que la red neuronal fue capaz de **capturar relaciones m√°s complejas** en los datos que los otros algoritmos no lograron modelar completamente.

Este buen desempe√±o puede atribuirse a varias caracter√≠sticas de las redes neuronales:

- Son capaces de **modelar no linealidades** de forma natural gracias a sus funciones de activaci√≥n no lineales.
- Pueden **componer transformaciones internas** a trav√©s de m√∫ltiples capas, lo que les permite aprender representaciones jer√°rquicas de los datos.
- El entrenamiento se realiza optimizando una funci√≥n de p√©rdida global, lo que favorece una soluci√≥n m√°s ajustada a la estructura de los datos.

No obstante, las redes neuronales tambi√©n presentan **ciertas limitaciones importantes**:

- Son modelos que requieren **m√°s tiempo de entrenamiento**, especialmente si el n√∫mero de capas o de neuronas es elevado.
- Son **menos interpretables**, ya que no generan reglas claras ni coeficientes con sentido directo, como en la regresi√≥n log√≠stica o los √°rboles de decisi√≥n.
- Son **sensibles a los hiperpar√°metros** y a la inicializaci√≥n, lo que hace necesario ajustar cuidadosamente valores como el n√∫mero de capas, el tama√±o de cada capa, el tipo de activaci√≥n o el algoritmo de optimizaci√≥n.

Por estas razones, aunque el resultado obtenido es muy positivo, se recomienda complementar este an√°lisis con otras m√©tricas como la **precisi√≥n, recall, F1-score** y especialmente con la **matriz de confusi√≥n**, para verificar que el buen rendimiento global no oculte deficiencias graves en alguna de las clases (por ejemplo, un mal desempe√±o al identificar la clase minoritaria).

Adem√°s, puede ser √∫til aplicar **validaci√≥n cruzada tambi√©n al MLPClassifier**


### ‚úÖ Conclusi√≥n

El modelo `MLPClassifier` logr√≥ un desempe√±o superior en t√©rminos de exactitud (97.7%) frente a los modelos comparados previamente. Aunque esta cifra proviene de una evaluaci√≥n directa sobre el conjunto de prueba (y no de validaci√≥n cruzada), sugiere que la red neuronal fue capaz de modelar relaciones m√°s complejas en los datos.

Esto resalta el potencial de las redes neuronales cuando existen patrones no lineales dif√≠ciles de capturar con modelos m√°s simples. Sin embargo, su implementaci√≥n tambi√©n implica desaf√≠os: mayor tiempo de entrenamiento, menor interpretabilidad y sensibilidad a la configuraci√≥n de hiperpar√°metros.

Por tanto, si bien su rendimiento es prometedor, se recomienda validar su comportamiento con m√©tricas adicionales como F1-score, AUC y matriz de confusi√≥n. Tambi√©n ser√≠a ideal aplicar validaci√≥n cruzada para obtener una comparaci√≥n equitativa con los modelos previos y garantizar su estabilidad frente a nuevas particiones del conjunto de datos.
