In [1]:
from michigrad.engine import Value
from michigrad.nn_modified import MLP_Modified
from michigrad.nn_modified import Linear
from michigrad.nn_modified import ReLU
from michigrad.nn_modified import Tanh
from michigrad.nn_modified import Sigmoid
from michigrad.visualize import show_graph

In [2]:
# Datos para entrenar al modelo

# 4 arreglos con 2 Value cada uno 
Xs = [
    [Value(0.0), Value(0.0)],
    [Value(1.0), Value(0.0)],
    [Value(0.0), Value(1.0)],
    [Value(1.0), Value(1.0)],
]

Ys = [
    Value(0.0),
    Value(1.0),
    Value(1.0),
    Value(0.0),
]

# Entrenamiento del modelo con ReLU

In [15]:
# Entrenamiento del modelo

layer_1 = Linear(2,2)
layer_2 = Linear(2,1)
activation_function = ReLU()

model = MLP_Modified([
    layer_1,
    activation_function,
    layer_2,
    activation_function
])

N = len(Ys)
learning_rate = 0.01
L_relu = Value(0)
yhat = []

for i in range(400):
    
    # Forward pass
    yhat = [model(x) for x in Xs]

    # Calculo Loss function
    L_relu = sum( (y - ypred)**2 for y, ypred in zip(Ys, yhat) ) * (Value(1) / Value(N))
    L_relu.name = "L_relu"
    
    # Gradiente en cero
    model.zero_grad()

    # Backpropagation
    L_relu.backward()

    # Update
    for p in model.parameters():
        p.data -= learning_rate * p.grad

    print(f'Iteracion={i}, L_relu={L_relu.data:.5f}')

Iteracion=0, L_relu=0.45656
Iteracion=1, L_relu=0.45143
Iteracion=2, L_relu=0.44183
Iteracion=3, L_relu=0.43262
Iteracion=4, L_relu=0.42378
Iteracion=5, L_relu=0.41529
Iteracion=6, L_relu=0.40716
Iteracion=7, L_relu=0.39935
Iteracion=8, L_relu=0.39186
Iteracion=9, L_relu=0.38468
Iteracion=10, L_relu=0.37778
Iteracion=11, L_relu=0.37117
Iteracion=12, L_relu=0.36483
Iteracion=13, L_relu=0.35874
Iteracion=14, L_relu=0.35291
Iteracion=15, L_relu=0.34731
Iteracion=16, L_relu=0.34193
Iteracion=17, L_relu=0.33678
Iteracion=18, L_relu=0.33184
Iteracion=19, L_relu=0.32710
Iteracion=20, L_relu=0.32255
Iteracion=21, L_relu=0.31818
Iteracion=22, L_relu=0.31400
Iteracion=23, L_relu=0.30998
Iteracion=24, L_relu=0.30613
Iteracion=25, L_relu=0.30243
Iteracion=26, L_relu=0.29889
Iteracion=27, L_relu=0.29548
Iteracion=28, L_relu=0.29222
Iteracion=29, L_relu=0.28909
Iteracion=30, L_relu=0.28608
Iteracion=31, L_relu=0.28320
Iteracion=32, L_relu=0.28043
Iteracion=33, L_relu=0.27777
Iteracion=34, L_relu=0.2

In [16]:
# Impresión de resultados

print(f"Valor final L_relu : {L_relu.data:.5f}")
print("Predicciones finales:", [y.data for y in yhat])
#show_graph(L_relu)

Valor final L_relu : 0.17859
Predicciones finales: [0.40389879070724505, 0.8189777197808756, 0.40389879070724505, 0.40389879070724505]


# Entrenamiento del modelo con Tanh

In [17]:
# Entrenamiento del modelo

layer_1 = Linear(2,2)
layer_2 = Linear(2,1)
activation_function = Tanh()

model = MLP_Modified([
    layer_1,
    activation_function,
    layer_2,
    activation_function
])

N = len(Ys)
learning_rate = 0.01
L_tanh = Value(0)
yhat = []

for i in range(400):
    
    # Forward pass
    yhat = [model(x) for x in Xs]

    # Calculo Loss function
    L_tanh = sum( (y - ypred)**2 for y, ypred in zip(Ys, yhat) ) * (Value(1) / Value(N))
    L_tanh.name = "L_tanh"
    
    # Gradiente en cero
    model.zero_grad()

    # Backpropagation
    L_tanh.backward()

    # Update
    for p in model.parameters():
        p.data -= learning_rate * p.grad

    print(f'Iteracion={i}, L_tanh={L_tanh.data:.5f}')

Iteracion=0, L_tanh=0.87247
Iteracion=1, L_tanh=0.84775
Iteracion=2, L_tanh=0.82370
Iteracion=3, L_tanh=0.80033
Iteracion=4, L_tanh=0.77766
Iteracion=5, L_tanh=0.75568
Iteracion=6, L_tanh=0.73441
Iteracion=7, L_tanh=0.71386
Iteracion=8, L_tanh=0.69402
Iteracion=9, L_tanh=0.67490
Iteracion=10, L_tanh=0.65650
Iteracion=11, L_tanh=0.63881
Iteracion=12, L_tanh=0.62183
Iteracion=13, L_tanh=0.60555
Iteracion=14, L_tanh=0.58996
Iteracion=15, L_tanh=0.57505
Iteracion=16, L_tanh=0.56081
Iteracion=17, L_tanh=0.54722
Iteracion=18, L_tanh=0.53426
Iteracion=19, L_tanh=0.52191
Iteracion=20, L_tanh=0.51016
Iteracion=21, L_tanh=0.49899
Iteracion=22, L_tanh=0.48836
Iteracion=23, L_tanh=0.47827
Iteracion=24, L_tanh=0.46869
Iteracion=25, L_tanh=0.45959
Iteracion=26, L_tanh=0.45095
Iteracion=27, L_tanh=0.44276
Iteracion=28, L_tanh=0.43499
Iteracion=29, L_tanh=0.42762
Iteracion=30, L_tanh=0.42063
Iteracion=31, L_tanh=0.41400
Iteracion=32, L_tanh=0.40771
Iteracion=33, L_tanh=0.40174
Iteracion=34, L_tanh=0.3

In [18]:
# Impresión de resultados

print(f"Valor final L_tanh : {L_tanh.data:.5f}")
print("Predicciones finales:", [y.data for y in yhat])
#show_graph(L_tanh)

Valor final L_tanh : 0.24703
Predicciones finales: [0.5774992326295295, 0.5437286579123115, 0.4614108141501618, 0.3953897789485372]


# Entrenamiento del modelo con Sigmoide

In [19]:
# Entrenamiento del modelo

layer_1 = Linear(2,2)
layer_2 = Linear(2,1)
activation_function = Sigmoid()

model = MLP_Modified([
    layer_1,
    activation_function,
    layer_2,
    activation_function
])

N = len(Ys)
learning_rate = 0.01
L_sigmoid = Value(0)
yhat = []

for i in range(400):
    
    # Forward pass
    yhat = [model(x) for x in Xs]

    # Calculo Loss function
    L_sigmoid = sum( (y - ypred)**2 for y, ypred in zip(Ys, yhat) ) * (Value(1) / Value(N))
    L_sigmoid.name = "L_sigmoid"
    
    # Gradiente en cero
    model.zero_grad()

    # Backpropagation
    L_sigmoid.backward()

    # Update
    for p in model.parameters():
        p.data -= learning_rate * p.grad

    print(f'Iteracion={i}, L_sigmoid={L_sigmoid.data:.5f}')

Iteracion=0, L_sigmoid=0.28164
Iteracion=1, L_sigmoid=0.28153
Iteracion=2, L_sigmoid=0.28142
Iteracion=3, L_sigmoid=0.28132
Iteracion=4, L_sigmoid=0.28121
Iteracion=5, L_sigmoid=0.28111
Iteracion=6, L_sigmoid=0.28100
Iteracion=7, L_sigmoid=0.28090
Iteracion=8, L_sigmoid=0.28079
Iteracion=9, L_sigmoid=0.28069
Iteracion=10, L_sigmoid=0.28058
Iteracion=11, L_sigmoid=0.28048
Iteracion=12, L_sigmoid=0.28037
Iteracion=13, L_sigmoid=0.28027
Iteracion=14, L_sigmoid=0.28017
Iteracion=15, L_sigmoid=0.28006
Iteracion=16, L_sigmoid=0.27996
Iteracion=17, L_sigmoid=0.27986
Iteracion=18, L_sigmoid=0.27976
Iteracion=19, L_sigmoid=0.27965
Iteracion=20, L_sigmoid=0.27955
Iteracion=21, L_sigmoid=0.27945
Iteracion=22, L_sigmoid=0.27935
Iteracion=23, L_sigmoid=0.27925
Iteracion=24, L_sigmoid=0.27915
Iteracion=25, L_sigmoid=0.27905
Iteracion=26, L_sigmoid=0.27895
Iteracion=27, L_sigmoid=0.27885
Iteracion=28, L_sigmoid=0.27875
Iteracion=29, L_sigmoid=0.27865
Iteracion=30, L_sigmoid=0.27855
Iteracion=31, L_si

In [20]:
# Impresión de resultados

print(f"Valor final L_sigmoid : {L_sigmoid.data:.5f}")
print("Predicciones finales:", [y.data for y in yhat])
#show_graph(L_sigmoid)

Valor final L_sigmoid : 0.25720
Predicciones finales: [0.4456926357985719, 0.4221483763018783, 0.41871924567122787, 0.3979561472146261]
