In [1]:
import numpy as np

# ---------------- Funciones básicas ----------------
def sig(x):
    return 1 / (1 + np.exp(-x))

def dSig(x):
    s = sig(x)
    return s * (1 - s)

def error(Y, Yd):
    return np.mean((Yd - Y)**2)

# ---------------- Inicialización ----------------
np.random.seed(42)
eta = 0.5
epochs = 10000

# Estructura de la red: 2-3-2-1
W1 = np.random.uniform(-1, 1, (3, 2))
b1 = np.random.uniform(-1, 1, (3, 1))
W2 = np.random.uniform(-1, 1, (2, 3))
b2 = np.random.uniform(-1, 1, (2, 1))
W3 = np.random.uniform(-1, 1, (1, 2))
b3 = np.random.uniform(-1, 1, (1, 1))

# Tabla NAND
X = np.array([[0,0,1,1],
              [0,1,0,1]])  # Entradas
Yd = np.array([[1,1,1,0]]) # Salidas deseadas

# ---------------- Entrenamiento ----------------
for epoch in range(epochs):
    # Propagación
    Z1 = np.dot(W1, X) + b1
    A1 = sig(Z1)
    Z2 = np.dot(W2, A1) + b2
    A2 = sig(Z2)
    Z3 = np.dot(W3, A2) + b3
    A3 = sig(Z3)
    
    # Error
    dE_dA3 = (A3 - Yd)
    
    # Retropropagación
    dZ3 = dE_dA3 * dSig(Z3)
    dW3 = np.dot(dZ3, A2.T)
    db3 = np.sum(dZ3, axis=1, keepdims=True)

    dZ2 = np.dot(W3.T, dZ3) * dSig(Z2)
    dW2 = np.dot(dZ2, A1.T)
    db2 = np.sum(dZ2, axis=1, keepdims=True)

    dZ1 = np.dot(W2.T, dZ2) * dSig(Z1)
    dW1 = np.dot(dZ1, X.T)
    db1 = np.sum(dZ1, axis=1, keepdims=True)
    
    # Actualización
    W3 -= eta * dW3
    b3 -= eta * db3
    W2 -= eta * dW2
    b2 -= eta * db2
    W1 -= eta * dW1
    b1 -= eta * db1

# ---------------- Resultados ----------------
print("Predicciones NAND:")
print(np.round(A3, 3))


Predicciones NAND:
[[0.998 0.992 0.992 0.012]]
