# Redes neuronales

La red neuronal es como un gran juego de conexiones donde cada pieza (o “neurona”) ayuda a tomar decisiones para predecir algo, como el precio de una casa. Cada vez que entrenamos la red neuronal, hacemos que estas conexiones se vuelvan más inteligentes al ajustar los hiperparámetros, que son como las reglas que nos dicen cómo aprender mejor.

## Paso 1: Preparación del dataset

Para esta demostración, usaremos el dataset ```fetch_california_housing```, que se puede cargar directamente con scikit-learn. Este dataset tiene datos sobre varias casas en California, como el tamaño de la casa, el número de habitaciones, el vecindario, etc. Vamos a entrenar la red neuronal para que aprenda a predecir el precio de una casa basado en estas características.

Primero, cargamos los datos y separamos nuestro conjunto en datos de entrenamiento y prueba:

In [1]:
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPRegressor

# Cargar datos
data = fetch_california_housing()
X = data.data  # Características (como tamaño de la casa, número de habitaciones, etc.)
y = data.target  # Precios de las casas

# Separar datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## Paso 2: Crear el modelo de red neuronal

La clase ```MLPRegressor``` de scikit-learn es la red neuronal que vamos a usar. Este modelo tiene varios hiperparámetros que podemos ajustar para mejorar su rendimiento. Vamos a crear el modelo y luego ver cada hiperparámetro en detalle.

In [2]:
model = MLPRegressor(hidden_layer_sizes=(50, 30, 10), activation='relu', solver='adam', alpha=0.0001, max_iter=500, random_state=42)

### Explicación de los Hiperparámetros

1. **hidden_layer_sizes**

Este hiperparámetro define cuántas “neuronas” tiene cada capa oculta de la red. En este caso, **(50, 30, 10)** significa que tenemos tres capas ocultas:

* La primera capa tiene 50 neuronas.
* La segunda capa tiene 30 neuronas.
* La tercera capa tiene 10 neuronas.

Las “neuronas” son como pequeñas piezas de un rompecabezas. Cuantas más piezas tengas, más detalles podrás capturar sobre el precio de una casa. Sin embargo, si tienes muchas neuronas, tu red se puede volver lenta o complicada.

2. **activation**

Este hiperparámetro define cómo las neuronas deciden si "pasan" información a la siguiente neurona o no. Aquí hemos elegido 'relu', que significa *Rectified Linear Unit* o, en palabras simples, “paso la información si es positiva y cero si es negativa”.

Es como si cada neurona viera un número. Si el número es bueno (positivo), lo pasa; si es malo (negativo), lo ignora. Esto ayuda a que la red aprenda más rápido y evite problemas cuando tenemos muchas capas.

3. **solver**

El “solver” es quien se encarga de ajustar la red para aprender, y aquí usamos 'adam', que es como un “amigo inteligente” que aprende de los datos. Adam ajusta las conexiones de las neuronas de una manera eficiente, asegurando que la red aprenda de los ejemplos de entrenamiento de una forma balanceada.

Existen otros “solvers”, como 'sgd' y 'lbfgs', pero 'adam' suele ser rápido y confiable para conjuntos de datos grandes.

4. **alpha**

Este es el valor de regularización y controla cuánto queremos que la red sea flexible. Si alpha es muy bajo, la red puede ser muy específica y aprenderse de memoria los datos, lo cual es malo si luego queremos hacer predicciones con datos nuevos.

Cuando alpha es un poco más alto (como 0.0001 en este caso), la red es más general y hace que el modelo se ajuste mejor en general. Piensa en alpha como el "nivel de disciplina" de la red: si es demasiado alta, será muy estricta y no aprenderá bien; si es muy baja, será desordenada y se memorizará los ejemplos en vez de aprender.

5. **max_iter**

Este valor es el número máximo de veces que la red intentará aprender del conjunto de entrenamiento. Si es muy bajo, puede que la red no tenga suficiente tiempo para aprender bien, pero si es muy alto, puede que se tarde demasiado.

Aquí, ```max_iter=500``` significa que la red intentará aprender hasta 500 veces o épocas. Es como darle a la red una cantidad máxima de intentos para aprender antes de que nos cansemos y le digamos que pare.

6. **random_state**

Esto solo fija la semilla aleatoria. Si usamos random_state=42, nos aseguramos de que obtengamos los mismos resultados cada vez que ejecutemos el código, lo que es útil para reproducir resultados en pruebas o ejemplos.

## Paso 3: Entrenamiento del modelo

Ahora que tenemos el modelo configurado con nuestros hiperparámetros, entrenemos la red neuronal para que aprenda a predecir precios de casas.

In [3]:
model.fit(X_train, y_train)

Esto hace que el modelo “mire” todos los ejemplos de casas en el conjunto de entrenamiento y aprenda a relacionar las características con los precios.

## Paso 4: Evaluación del modelo

Después del entrenamiento, probaremos cómo de bien ha aprendido el modelo utilizando los datos de prueba.

In [4]:
score = model.score(X_test, y_test)
print("Precisión del modelo en los datos de prueba:", score)

Precisión del modelo en los datos de prueba: 0.6022031574404823


El valor de score nos indica qué tan bien ha aprendido el modelo. Si es cercano a 1, el modelo ha aprendido bastante bien. Un valor bajo indicaría que debemos revisar los hiperparámetros.

## Recapitulación

En resumen, hemos creado una red neuronal para predecir precios de casas usando varios hiperparámetros importantes. Ajustar estos hiperparámetros es como darle instrucciones al modelo sobre cómo aprender:

* **hidden_layer_sizes** define la cantidad y tamaño de capas ocultas.
* **activation** decide cómo pasar información entre neuronas.
* **solver** elige cómo ajustar la red para aprender.
* **alpha** controla la flexibilidad de la red.
* **max_iter** le dice al modelo cuántos intentos puede hacer para aprender.
* **random_state** fija la semilla aleatoria para obtener siempre el mismo resultado.

Con esta configuración, hemos construido un modelo sencillo para que aprenda a predecir precios de casas en un contexto supervisado.