In [None]:
import numpy as np

# Función sigmoide y derivada
def sig(x):
    return 1/(1 + np.exp(-x))

def dsig(x):
    return sig(x)*(1 - sig(x))


# 2 entradas → 2 neuronas ocultas → 2 neuronas ocultas → 1 salida
n_in = 2
n_h1 = 2
n_h2 = 2
n_out = 1

# Inicialización de pesos
W1 = np.random.uniform(-1,1,(n_h1,n_in))
b1 = np.random.uniform(-1,1,(n_h1,1))

W2 = np.random.uniform(-1,1,(n_h2,n_h1))
b2 = np.random.uniform(-1,1,(n_h2,1))

W3 = np.random.uniform(-1,1,(n_out,n_h2))
b3 = np.random.uniform(-1,1,(n_out,1))

# Datos de entrenamiento para XOR
X = np.array([[0,0,1,1],
              [0,1,0,1]])

Y = np.array([[0,1,1,0]])

# Entrenamiento
eta = 0.5
epochs = 50000

for e in range(epochs):

    # FORWARD
    Z1 = W1 @ X + b1
    A1 = sig(Z1)

    Z2 = W2 @ A1 + b2
    A2 = sig(Z2)

    Z3 = W3 @ A2 + b3
    A3 = sig(Z3)

    # ERROR
    E = A3 - Y

    # BACKPROP
    dZ3 = E * dsig(Z3)
    dW3 = dZ3 @ A2.T
    db3 = np.sum(dZ3,axis=1,keepdims=True)

    dZ2 = (W3.T @ dZ3) * dsig(Z2)
    dW2 = dZ2 @ A1.T
    db2 = np.sum(dZ2,axis=1,keepdims=True)

    dZ1 = (W2.T @ dZ2) * dsig(Z1)
    dW1 = dZ1 @ X.T
    db1 = np.sum(dZ1,axis=1,keepdims=True)

    # Actualización
    W3 -= eta * dW3
    b3 -= eta * db3

    W2 -= eta * dW2
    b2 -= eta * db2

    W1 -= eta * dW1
    b1 -= eta * db1

# ---------------------------------------------------------
# PRUEBA FINAL
# ---------------------------------------------------------
print("\nRED XOR ENTRENADA\n")
for i in range(4):
    x = X[:,i].reshape(2,1)
    Z1 = W1@x + b1
    A1 = sig(Z1)

    Z2 = W2@A1 + b2
    A2 = sig(Z2)

    Z3 = W3@A2 + b3
    A3 = sig(Z3)

    print(f"{X[:,i]}  → {A3[0,0]:.4f}")



RED XOR ENTRENADA

[0 0]  → 0.0035
[0 1]  → 0.9949
[1 0]  → 0.9949
[1 1]  → 0.0043
