In [1]:
def compute_gradients(delta, a_prev):
    """
    Вычисляет градиенты dL/dW и dL/db для одного слоя.

    Параметры:
    - delta: список списков (вектор-столбец ошибок), размер: (m, 1) → m нейронов в текущем слое
    - a_prev: список списков (вход в слой), размер: (d, 1) → d признаков/нейронов предыдущего слоя

    Возвращает:
    - dW: градиент по весам, размер: (m, d)
    - db: градиент по смещениям, размер: (m, 1)
    """

    # delta: [[d1], [d2], ..., [m]] → m строк, 1 столбец
    # a_prev: [[a1], [a2], ..., [d]] → d строк, 1 столбец

    m = len(delta)    # число нейронов в текущем слое
    d = len(a_prev)   # число нейронов в предыдущем слое

    # --- Вычисление dW = delta @ a_prev.T (матричное умножение) ---
    dW = []
    for i in range(m):
        row = []
        for j in range(d):
            # Умножаем delta[i][0] на a_prev[j][0]
            grad = delta[i][0] * a_prev[j][0]
            row.append(grad)
        dW.append(row)

    # --- Вычисление db = delta ---
    # Просто копируем delta (градиент по b — это сама ошибка)
    db = [ [delta[i][0]] for i in range(m) ]

    return dW, db

In [2]:
a_prev = [
    [0.5],   # a1
    [0.8],   # a2
    [0.2]    # a3
]

delta = [
    [0.3],   # ошибка для нейрона 1
    [-0.1]   # ошибка для нейрона 2
]

# Вычисляем градиенты
dW, db = compute_gradients(delta, a_prev)

print("Градиент по весам (dW):")
for row in dW:
    print([round(x, 3) for x in row])

print("\nГрадиент по смещениям (db):")
for row in db:
    print([round(x, 3) for x in row])

Градиент по весам (dW):
[0.15, 0.24, 0.06]
[-0.05, -0.08, -0.02]

Градиент по смещениям (db):
[0.3]
[-0.1]


In [None]:
def backprop(W,b,a):
  o,b = compute_gradients()
  W = W - (a*o)
  b = b - (a*b)
  return W,b