Это код для создания и обучения двуслойной нейронной сети для задачи классификации, используя метод обратного распространения ошибки (backpropagation).

Функция `f(x)` - это функция активации (в данном случае используется гиперболический тангенс), которая будет использоваться для вычисления выходного сигнала каждого нейрона в сети.

Функция `df(x)` - это производная функции активации, необходимая для вычисления локального градиента при использовании метода обратного распространения ошибки.

Матрицы `W1` и `W2` представляют собой весовые коэффициенты сети. `W1` - это веса между входным слоем и скрытым слоем, а `W2` - это веса между скрытым слоем и выходным слоем.

Функция `go_forward(inp)` - это функция прямого прохода, которая принимает входной сигнал `inp` и возвращает выходной сигнал сети.

Функция `train(epoch)` - это функция обучения, которая использует обратное распространение для корректировки весов сети на каждой итерации. В цикле `for` происходит случайный выбор входного сигнала из обучающей выборки, прямой проход по НС и вычисление выходных значений нейронов. Затем с помощью локального градиента вычисляется ошибка и корректируются веса связей между нейронами.

Обучающая выборка содержит набор примеров, на основе которых сеть будет обучаться.

В конце скрипта происходит проверка работоспособности сети на каждом примере обучающей выборки.

Общий алгоритм заключается в многократном обучении сети на обучающей выборке до тех пор, пока градиент ошибки на всех примерах не станет меньше значения, заданного на пороге. Когда сеть была обучена, она может быть использована для решения задачи классификации на новых данных.

Как уже было сказано, представленный код решает задачу классификации, где нужно разделить данные на два класса: 1 и -1. Обучающая выборка содержит значения входных признаков и соответствующие им классы. Всего выборка содержит 8 примеров.

В функции `f(x)` используется гиперболический тангенс, который может принимать значения от -1 до 1. Преимущество использования именно этой функции активации заключается в том, что она очень схожа с функцией логистической регрессии. Кроме того, гиперболический тангенс более подходит для решения задач классификации, чем сигмоидальная функция, которая часто используется в нейронных сетях.

В функции `train(epoch)` используется метод обратного распространения ошибки (backpropagation). Этот метод заключается в том, что на каждой итерации обучения происходит прямой проход по сети, затем с помощью основанного на дифференцировании градиента вычисляется ошибка и корректируются веса связей между нейронами.

Цикл `for` внутри функции `train(epoch)` проходит через выборку `epoch` и на каждой итерации выбирается случайный пример. `go_forward(x[0:3])` вызывает функцию для прямого прохода по нейронной сети. `y` - это выходной сигнал сети, а `out` - это выходы скрытого слоя. Затем считается ошибка `e=y-x[-1]`, где `x[-1]` - это правильный ответ. Вектор из двух величин локальных градиентов `delta2` вычисляется как произведение матрицы весов `W2` на вектор, состоящий из ошибки `delta` и локального градиента `df(out)`. Далее веса корректируются с помощью вычитания произведения локального градиента на входные значения нейронов (в случае `W1`) и выходные значения скрытого слоя (в случае `W2`).

После того, как нейронная сеть была обучена на обучающей выборке, происходит проверка работы сети на каждом примере обучающей выборки. Нейронная сеть выдает предсказанные значения. Если они совпадают с правильными, то нейронная сеть дает правильный ответ.

Такой подход к решению задачи классификации довольно стандартен и может быть использован для обучения других архитектур нейронных сетей. Правда, стоит заметить, что в некоторых случаях может потребоваться использование более сложных сетей или других методов обучения.

In [2]:
import numpy as np

def f(x):
    return 2/(1 + np.exp(-x)) - 1

def df(x):
    return 0.5*(1 + x)*(1 - x)

W1 = np.array([[-0.2, 0.3, -0.4], [0.1, -0.3, -0.4]])
W2 = np.array([0.2, 0.3])

def go_forward(inp):
    sum = np.dot(W1, inp)
    out = np.array([f(x) for x in sum])

    sum = np.dot(W2, out)
    y = f(sum)
    return y, out

def train(epoch):
    global W2, W1
    lmd = 0.01          # шаг обучения
    N = 10000           # число итераций при обучении
    count = len(epoch)
    for k in range(N):
        x = epoch[np.random.randint(0, count)]  # случайных выбор входного сигнала из обучающей выборки
        y, out = go_forward(x[0:3])             # прямой проход по НС и вычисление выходных значений нейронов
        e = y - x[-1]                           # ошибка
        delta = e*df(y)                         # локальный градиент
        W2[0] = W2[0] - lmd * delta * out[0]    # корректировка веса первой связи
        W2[1] = W2[1] - lmd * delta * out[1]    # корректировка веса второй связи

        delta2 = W2*delta*df(out)               # вектор из 2-х величин локальных градиентов

        # корректировка связей первого слоя
        W1[0, :] = W1[0, :] - np.array(x[0:3]) * delta2[0] * lmd
        W1[1, :] = W1[1, :] - np.array(x[0:3]) * delta2[1] * lmd

# обучающая выборка (она же полная выборка)
epoch = [(-1, -1, -1, -1),
         (-1, -1, 1, 1),
         (-1, 1, -1, -1),
         (-1, 1, 1, 1),
         (1, -1, -1, -1),
         (1, -1, 1, 1),
         (1, 1, -1, -1),
         (1, 1, 1, -1)]

train(epoch)        # запуск обучения сети

# проверка полученных результатов
for x in epoch:
    y, out = go_forward(x[0:3])
    print(f"Выходное значение НС: {y} => {x[-1]}")

Выходное значение НС: 0.09757375061638385 => -1
Выходное значение НС: 0.9379945382203221 => 1
Выходное значение НС: -0.87185122260772 => -1
Выходное значение НС: 0.8784269878046129 => 1
Выходное значение НС: -0.8784269878046129 => -1
Выходное значение НС: 0.8718512226077197 => 1
Выходное значение НС: -0.937994538220322 => -1
Выходное значение НС: -0.09757375061638407 => -1
