In [None]:
from michigrad.engine import Value
from michigrad.nn import Layer
from michigrad.visualize import show_graph

# XOR (⊕) es una función lógica que toma dos entradas, x_0 y x_1.
# Devuelve 0 si ambas son iguales (0,0 o 1,1) y devuelve 1 si
# son diferentes (0,1 o 1,0).

# Definimos el dataset que se usará para entrenar a la red.

# Entradas para cada caso de XOR:
entradas = [
    [
        Value(data=0),
        Value(data=0),
    ],  # 0 ⊕ 0
    [
        Value(data=0),
        Value(data=1),
    ], # 0 ⊕ 1
    [
        Value(data=1),
        Value(data=0),
    ], # 1 ⊕ 0
    [
        Value(data=1),
        Value(data=1),
    ], # 1 ⊕ 1
]

# Salidas esperadas para cada entrada:
salidas = [
    Value(data=0),  # 0 ⊕ 0 = 0
    Value(data=1),  # 0 ⊕ 1 = 1
    Value(data=1),  # 1 ⊕ 0 = 1
    Value(data=0),  # 1 ⊕ 1 = 0
]


# Definir la arquitectura de la red.
# Se pide una única capa con dos neuronas lineales sin ReLU.
# Se instancia Layer con:
# nin=2 porque cada neurona tiene dos entradas: la función XOR necesita
# dos valores para dar un resultado.
# nout=2 porque tenemos dos neuronas en la capa.
# nonlin=False porque se pide no usar ReLU.

capa = Layer(nin=2, nout=2, nonlin=False)


In [None]:
# Definir el learning rate
learning_rate = 0.05

# Bucle de entrenamiento
for i in range(50):
    # Reiniciar la pérdida total a 0
    perdida = Value(data=0)

    # Paso 1 y 2: Forward pass y cálculo de pérdida
    # Para cada entrada, calcular la salida predicha por la red
    # y compararla con la salida esperada para calcular la pérdida.
    for entrada, salida_esperada in zip(entradas, salidas):
        # Tenemos dos salidas porque la capa tiene dos neuronas.
        # La salida predicha será la suma de las salidas de ambas neuronas.
        salida_predicha = capa(x=entrada)
        salida_total = salida_predicha[0] + salida_predicha[1]
        perdida = perdida + ((salida_esperada - salida_total) ** 2)

    # Solo en la primer iteración, imprimir el grafo después del forward pass
    if i == 0:
        print("Grafo después del forward pass y antes del backward pass:")
        grafo = show_graph(root=perdida, format="png", rankdir="TB")
        display(grafo)

    # Paso 3: Zero grad (reiniciar gradientes)
    capa.zero_grad()

    # Paso 4: Backward pass
    perdida.backward()

    # Solo en la primer iteración, imprimir el grafo después del backward pass
    if i == 0:
        print("Grafo después del backward pass:")
        grafo = show_graph(root=perdida, format="png", rankdir="TB")
        display(grafo)

    # Paso 5: Update de parámetros
    for parametro in capa.parameters():
        parametro.data = parametro.data - (learning_rate * parametro.grad)

    if i % 2 == 0:
        print(f"Iteración {i}: pérdida = {perdida.data}")
