### Redes Neuronales con Capas Ocultas.

Situación: Quieres predecir si un estudiante aprueba (1) o no (0) basado en horas de estudio y horas de sueño.

Usarás una red neuronal con una capa oculta.

In [5]:
import numpy as np

# Datos: [horas_estudio, horas_sueño]
X = np.array([[2, 8], [3, 7], [4, 6], [5, 5], [6, 4]])
y = np.array([0, 0, 1, 1, 1]) # 0 = No aprueba, 1 = Aprueba

# Hiperparámetros.
tasa_aprendizaje = 0.1
epocas = 10000

# Inicializar pesos y sesgos (aleatorios)
# Capa oculta: 2 neuronas
pesos_entrada_oculta = np.random.randn(2, 2) # 2 entradas, 2 neuronas ocultas.
bias_ocultas = np.random.randn(2)

# Capa salida: 1 neurona.
pesos_oculta_salida = np.random.randn(2, 1)
bias_salida = np.random.randn(1)

# Función de activación sigmoide
def sigmoide(x):
    return 1 / (1 + np.exp(-x))

# Derivada de la sigmoide (para backpropagation)
def derivada_sigmoide(x):
    return x * (1 - x)

# Entrenamiento
for epoch in range(epocas):
    # Forward propagation
    # Capa oculta
    z_oculta = np.dot(X, pesos_entrada_oculta) + bias_ocultas
    activacion_oculta = sigmoide(z_oculta)

    # Capa salida
    z_salida = np.dot(activacion_oculta, pesos_oculta_salida) + bias_salida
    activacion_salida = sigmoide(z_salida)

    # Backpropagation
    error = activacion_salida - y.reshape(-1, 1)

    # Gradientes capa salida
    delta_salida = error * derivada_sigmoide(activacion_salida)

    # Gradientes capa oculta
    error_oculta = delta_salida.dot(pesos_oculta_salida.T)
    delta_oculta = error_oculta * derivada_sigmoide(activacion_oculta)

    # Actualizar pesos y sesgos
    pesos_oculta_salida -= tasa_aprendizaje * activacion_oculta.T.dot(delta_salida)
    bias_salida -= tasa_aprendizaje * np.sum(delta_salida, axis = 0)

    pesos_entrada_oculta -= tasa_aprendizaje * X.T.dot(delta_oculta)
    bias_ocultas -= tasa_aprendizaje * np.sum(delta_oculta, axis = 0)

# Predicción final
predicciones = sigmoide(np.dot(sigmoide(np.dot(X, pesos_entrada_oculta) + bias_ocultas), pesos_oculta_salida) + bias_salida)
print("Predicciones finales:", predicciones.flatten())

Predicciones finales: [0.02560257 0.0328198  0.97466088 0.98386983 0.98379552]


* Forward propagation: Calcula las actividades capa por capa.
* Backpropagation: Ajusta los pesos basado en el error.
* Derivada de la sigmoide: Crucial para calcular gradientes.

Modifica el código para tener:

1. 3 neuronas en la capa oculta.
2. Función de activación ReLU en la capa oculta (y su derivada).