In [2]:
# --------------------------------------------------------------
# Entrenamiento de UNA neurona con 2 entradas (activación sigmoide)
# Comentado paso a paso mostrando la ecuación de entrenamiento:
#     W_(t+1) = W_t - eta * dL/dW
#     b_(t+1) = b_t - eta * dL/db
#
# Donde:
#   - eta es la TASA DE APRENDIZAJE (learning rate).
#   - dL/dW, dL/db son los gradientes obtenidos por backpropagation.
#
# Además, probamos distintos valores de 'eta' (0.01, 0.1, 0.5)
# para ver cómo cambian los valores y el error en 3 épocas.
# --------------------------------------------------------------

import numpy as np
import pandas as pd


def sigmoid(x):
    """Función de activación sigmoide."""
    return 1 / (1 + np.exp(-x))

def sigmoid_derivative(x):
    """Derivada de la sigmoide: s(x) * (1 - s(x))."""
    s = sigmoid(x)
    return s * (1 - s)

def train_one_neuron(x, y, W_init, b_init, eta, epochs=3):
    """
    Entrena una neurona por 'epochs' épocas usando descenso de gradiente.
    - x: vector de entradas (shape: [2])
    - y: valor objetivo escalar
    - W_init: pesos iniciales (shape: [2])
    - b_init: sesgo inicial (escalar)
    - eta: tasa de aprendizaje (learning rate)
    - epochs: número de iteraciones (por simplicidad, 3 como pidió el usuario)

    Devuelve un DataFrame con todos los valores por época.
    """
    # Copiamos para no mutar los originales
    W = W_init.astype(float).copy()
    b = float(b_init)

    history = []

    for t in range(1, epochs+1):
        # ---------- FORWARD ----------
        # z = W·x + b
        z = np.dot(W, x) + b

        # y_hat = sigma(z)
        y_hat = sigmoid(z)

        # Pérdida (MSE) L = 0.5 * (y - y_hat)^2
        L = 0.5 * (y - y_hat)**2

        # ---------- BACKWARD ----------
        # Derivada de la pérdida con respecto a z:
        # dL/dz = (y_hat - y) * sigma'(z)
        dz = (y_hat - y) * sigmoid_derivative(z)

        # Gradiente respecto a los pesos:
        # dL/dW = dL/dz * x
        dW = dz * x

        # Gradiente respecto al sesgo:
        # dL/db = dL/dz
        db = dz

        # ---------- ECUACIÓN DE ENTRENAMIENTO ----------
        # Actualización de parámetros con learning rate eta:
        # W_(t+1) = W_t - eta * dL/dW
        # b_(t+1) = b_t - eta * dL/db
        W = W - eta * dW
        b = b - eta * db

        # Guardamos todo para visualizar
        history.append({
            "Época": t,
            "eta (tasa aprendizaje)": eta,
            "z = W·x + b (antes de activar)": z,
            "y_hat = sigma(z)": y_hat,
            "Pérdida L": L,
            "dW": dW.copy(),
            "db": db,
            "W (actualizado)": W.copy(),
            "b (actualizado)": b
        })

    df = pd.DataFrame(history)
    return df

# ------------- Parámetros de la neurona (mismos que el ejemplo anterior) -------------
x = np.array([0.5, 0.8])
y = 1.0
W0 = np.array([0.1, -0.4])
b0 = 0.2
epochs = 3

# Probamos tres tasas de aprendizaje distintas:
etas = [0.01, 0.1, 0.5]

# Ejecutamos y mostramos los resultados en tablas separadas
for eta in etas:
    df_eta = train_one_neuron(x, y, W0, b0, eta, epochs=epochs)
    title = f"Entrenamiento con eta = {eta} (3 épocas)"
    print(title)
    display(df_eta)
    # También imprimimos un resumen final para ver el efecto en la pérdida
    print(title)
    print(df_eta[["Época", "eta (tasa aprendizaje)", "y_hat = sigma(z)", "Pérdida L"]])

Entrenamiento con eta = 0.01 (3 épocas)


Unnamed: 0,Época,eta (tasa aprendizaje),z = W·x + b (antes de activar),y_hat = sigma(z),Pérdida L,dW,db,W (actualizado),b (actualizado)
0,1,0.01,-0.07,0.482507,0.133899,"[-0.06460743078313518, -0.10337188925301628]",-0.129215,"[0.10064607430783136, -0.39896628110746984]",0.201292
1,2,0.01,-0.067558,0.483117,0.133584,"[-0.06453671447788985, -0.10325874316462376]",-0.129073,"[0.10129144145261026, -0.3979336936758236]",0.202583
2,3,0.01,-0.065118,0.483726,0.133269,"[-0.06446586528912147, -0.10314538446259436]",-0.128932,"[0.10193610010550148, -0.39690223983119766]",0.203872


Entrenamiento con eta = 0.01 (3 épocas)
   Época  eta (tasa aprendizaje)  y_hat = sigma(z)  Pérdida L
0      1                    0.01          0.482507   0.133899
1      2                    0.01          0.483117   0.133584
2      3                    0.01          0.483726   0.133269
Entrenamiento con eta = 0.1 (3 épocas)


Unnamed: 0,Época,eta (tasa aprendizaje),z = W·x + b (antes de activar),y_hat = sigma(z),Pérdida L,dW,db,W (actualizado),b (actualizado)
0,1,0.1,-0.07,0.482507,0.133899,"[-0.06460743078313518, -0.10337188925301628]",-0.129215,"[0.10646074307831352, -0.3896628110746984]",0.212921
1,2,0.1,-0.045578,0.488607,0.130761,"[-0.0638908908869837, -0.10222542541917393]",-0.127782,"[0.11284983216701189, -0.379440268532781]",0.2257
2,3,0.1,-0.021428,0.494643,0.127693,"[-0.06316233753387232, -0.10105974005419571]",-0.126325,"[0.11916606592039912, -0.36933429452736144]",0.238332


Entrenamiento con eta = 0.1 (3 épocas)
   Época  eta (tasa aprendizaje)  y_hat = sigma(z)  Pérdida L
0      1                     0.1          0.482507   0.133899
1      2                     0.1          0.488607   0.130761
2      3                     0.1          0.494643   0.127693
Entrenamiento con eta = 0.5 (3 épocas)


Unnamed: 0,Época,eta (tasa aprendizaje),z = W·x + b (antes de activar),y_hat = sigma(z),Pérdida L,dW,db,W (actualizado),b (actualizado)
0,1,0.5,-0.07,0.482507,0.133899,"[-0.06460743078313518, -0.10337188925301628]",-0.129215,"[0.1323037153915676, -0.34831405537349186]",0.264607
1,2,0.5,0.052108,0.513024,0.118573,"[-0.06083069002261212, -0.09732910403617939]",-0.121661,"[0.16271906040287365, -0.2996495033554022]",0.325438
2,3,0.5,0.167078,0.541673,0.105032,"[-0.05689295574967828, -0.09102872919948525]",-0.113786,"[0.1911655382777128, -0.2541351387556596]",0.382331


Entrenamiento con eta = 0.5 (3 épocas)
   Época  eta (tasa aprendizaje)  y_hat = sigma(z)  Pérdida L
0      1                     0.5          0.482507   0.133899
1      2                     0.5          0.513024   0.118573
2      3                     0.5          0.541673   0.105032
