In [1]:
import numpy as np
import math

# Entrada
entrada = np.array(
    [
        [2, 2, 3, 3],
        [1, 2, 3, 3],
        [2, 1, 4, 1],
        [1, 1, 4, 2],
        [1, 1, 3, 4],
        [1, 1, 3, 1],
        [1, 1, 3, 2]
    ]
)

# Salida
objetivo = np.array([0, 0, 1, 1, 0, 1, 1])

# Función sigmoidal
def sigmoid(x):
    return 1 / (1 + math.exp(-x))

sig = np.vectorize(sigmoid)

# Inicialización de pesos y sesgos en la capa oculta
w_oculta = np.array(
    [[0.05, 0.3, 0.55], [0.1, 0.35, 0.6], [0.15, 0.4, 0.65], [0.2, 0.45, 0.7]]
)

b_oculta = np.array([[0.25, 0.5, 0.75]])

# Inicialización de pesos y sesgos en la capa de salida
w_salida = np.array(
    [
        [0.8],
        [0.85],
        [0.9],
    ]
)

b_salida = np.array([[0.95]])

lr = 0.5  # Tasa de aprendizaje
epocas = 200  # Número de épocas de entrenamiento
a = 1  # Variable auxiliar para seguimiento de épocas

for epoca in range(epocas):
    print("época    : ", a)
    prediccion = np.zeros(objetivo.shape)

    for idx, inp in enumerate(entrada):
        # Alimentación hacia adelante (feedforward)

        o_oculta = np.matmul(entrada[idx], w_oculta) + b_oculta
        o_oculta = sig(o_oculta)

        o_salida = np.matmul(o_oculta, w_salida) + b_salida
        o_salida = sig(o_salida)

        error = (objetivo[idx] - o_salida) ** 2
        prediccion[idx] = o_salida.round()

        print(
            "Entrada    :",
            entrada[idx],
            "   || Objetivo    :",
            objetivo[idx],
            "   || Predicción     :",
            math.trunc(prediccion[idx]),
            "   || Error   :",
            error,
        )

        # Retropropagación (backpropagation)
        w_salida = w_salida - lr * (-2 * (objetivo[idx] - o_salida)) * (
            o_salida * (1 - o_salida)
        ) * (o_oculta.T)
        b_salida = b_salida - lr * (-2 * (objetivo[idx] - o_salida)) * (
            o_salida * (1 - o_salida)
        ) * (1)

        w_oculta = (
            w_oculta
            - lr
            * ((-2 * (objetivo[idx] - o_salida)) * (o_salida * (1 - o_salida)))
            * (w_salida.T)
            * (o_oculta * (1 - o_oculta))
            * entrada[idx][np.newaxis].T
        )

        b_oculta = b_oculta - lr * (
            (-2 * (objetivo[idx] - o_salida)) * (o_salida * (1 - o_salida))
        ) * (w_salida.T) * (o_oculta * (1 - o_oculta)) * (1)

    a = a + 1
    print("---\n")


época    :  1
Entrada    : [2 2 3 3]    || Objetivo    : 0    || Predicción     : 1    || Error   : [[0.93361382]]
Entrada    : [1 2 3 3]    || Objetivo    : 0    || Predicción     : 1    || Error   : [[0.9245646]]
Entrada    : [2 1 4 1]    || Objetivo    : 1    || Predicción     : 1    || Error   : [[0.00211643]]
Entrada    : [1 1 4 2]    || Objetivo    : 1    || Predicción     : 1    || Error   : [[0.00199799]]
Entrada    : [1 1 3 4]    || Objetivo    : 0    || Predicción     : 1    || Error   : [[0.91613682]]
Entrada    : [1 1 3 1]    || Objetivo    : 1    || Predicción     : 1    || Error   : [[0.00300904]]
Entrada    : [1 1 3 2]    || Objetivo    : 1    || Predicción     : 1    || Error   : [[0.00272118]]
---

época    :  2
Entrada    : [2 2 3 3]    || Objetivo    : 0    || Predicción     : 1    || Error   : [[0.90462646]]
Entrada    : [1 2 3 3]    || Objetivo    : 0    || Predicción     : 1    || Error   : [[0.88721723]]
Entrada    : [2 1 4 1]    || Objetivo    : 1    || Predicci