In [None]:
import numpy as np

# Semilla para reproducibilidad
np.random.seed(42)

# ==========================================
# 1. PREPARACIÓN DE DATOS (XOR)
# ==========================================
# Inputs (4 ejemplos, 2 características cada uno)
X = np.array([[0, 0],
            [0, 1],
            [1, 0],
            [1, 1]])

# Targets (Lo que queremos que aprenda) - (4 ejemplos, 1 respuesta)
# XOR: 0, 1, 1, 0
y = np.array([[0], [1], [1], [0]])

# ==========================================
# 2. ARQUITECTURA DE LA RED
# ==========================================
# Definimos la Sigmoide y su derivada (para el Backpropagation)
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def sigmoid_derivative(x):
    return x * (1 - x)

# Inicialización de Pesos (Weights) y Sesgos (Biases)
input_neurons = 2
hidden_neurons = 2
output_neurons = 1

# Pesos capa 1 (Conectan Entrada -> Oculta)
# Matriz de 2x2
weights_input_hidden = np.random.uniform(size=(input_neurons, hidden_neurons))
bias_hidden = np.random.uniform(size=(1, hidden_neurons))

# Pesos capa 2 (Conectan Oculta -> Salida)
# Matriz de 2x1
weights_hidden_output = np.random.uniform(size=(hidden_neurons, output_neurons))
bias_output = np.random.uniform(size=(1, output_neurons))

learning_rate = 0.5  # Qué tan rápido aprendemos
epochs = 10000       # Cuántas veces vemos los datos

# ==========================================
# 3. EL BUCLE DE ENTRENAMIENTO
# ==========================================
print("Entrenando red neuronal...")

for epoch in range(epochs):
    # --- A. FORWARD PASS (La Predicción) ---
    # 1. Calcular entrada a la capa oculta
    # Math: z_h = X . W1 + b1
    hidden_layer_input = np.dot(X, weights_input_hidden) + bias_hidden
    # 2. Activar la capa oculta (Sigmoide)
    # Math: a_h = sigma(z_h)
    hidden_layer_output = sigmoid(hidden_layer_input)
    
    # 3. Calcular entrada a la capa de salida
    # Math: z_out = a_h . W2 + b2
    output_layer_input = np.dot(hidden_layer_output, weights_hidden_output) + bias_output
    # 4. Activar la salida (Predicción final)
    predicted_output = sigmoid(output_layer_input)

    # --- B. CÁLCULO DEL ERROR ---
    error = y - predicted_output
    
    # --- C. BACKPROPAGATION (La Magia) ---
    # Calculamos los gradientes usando la Regla de la Cadena
    # 1. Gradiente para la Capa de Salida
    # Math: delta_out = Error * derivada_sigmoide(prediccion)
    d_output = error * sigmoid_derivative(predicted_output)
    
    # 2. Gradiente para la Capa Oculta (El paso difícil)
    # Math: delta_h = (delta_out . W2_transpuesta) * derivada_sigmoide(a_h)
    # Aquí es donde el error viaja "hacia atrás" desde la salida a la oculta
    error_hidden_layer = d_output.dot(weights_hidden_output.T)
    d_hidden_layer = error_hidden_layer * sigmoid_derivative(hidden_layer_output)

    # --- D. OPTIMIZACIÓN (Actualización de Pesos) ---
    # Actualizamos Pesos Oculta -> Salida
    weights_hidden_output += hidden_layer_output.T.dot(d_output) * learning_rate
    bias_output += np.sum(d_output, axis=0, keepdims=True) * learning_rate
    
    # Actualizamos Pesos Entrada -> Oculta
    weights_input_hidden += X.T.dot(d_hidden_layer) * learning_rate
    bias_hidden += np.sum(d_hidden_layer, axis=0, keepdims=True) * learning_rate

    # Reporte de progreso cada 1000 épocas
    if epoch % 1000 == 0:
        loss = np.mean(np.square(error)) # Mean Squared Error
        print(f"Epoch {epoch}: Loss {loss:.5f}")

# ==========================================
# 4. RESULTADO FINAL
# ==========================================
print("\n--- Predicciones Finales (XOR) ---")
print(predicted_output)
print("\nRedondeado:")
print(np.round(predicted_output))