## Этот код реализует обучение трёхслойной нейронной сети методом обратного распространения ошибки (Back Propagation) на задаче бинарной классификации.

### Код позволяет обучить трёхслойную нейронную сеть методом обратного распространения ошибки на задаче бинарной классификации, и получить выходное значение для набора тестовых данных, придельно близкое к правильному ответу.

### 1. Определяются функции активации f(x) и ее производная df(x). В данном случае используется логистическая функция:


In [33]:
# import needed libraries
import numpy as np

# add activation function
# logistic function
$$f(x) = \dfrac{1}{1+e^{-x}}$$

# Функция $df(x) = 0.5 \cdot (1+x) \cdot (1-x)$ является производной от логистической функции описанной выше

In [34]:
def f(x):
    return 2/(1 + np.exp(-x)) - 1

def df(x):
    return 0.5*(1 + x)*(1 - x)

In [35]:
### 2. Задаются веса связей между нейронами входного, скрытого и выходного слоёв:

In [36]:
W1 = np.array([[-0.2, 0.3, -0.4], [0.1, -0.3, -0.4]])
W2 = np.array([0.2, 0.3])

In [37]:
### 3. Функция go_forward(inp) осуществляет прямой проход (тоесть распространения вперед) по сети и вычисляет выходное значение:

In [38]:
def go_forward(inp): # пропускаем вектор наблюдений через NN
    sum = np.dot(W1, inp)
    out = np.array([f(x) for x in sum]) # для каждого нейрона запомним выходные значения

    sum = np.dot(W2, out)
    y = f(sum) # выход из NN
    return y, out

### 4. Функция train(epoch) реализует обратное распространение ошибки:
   * Последовательно прогоняет обучающую выборку через сеть, получает выходные значения и вычисляет ошибку (ошибка — это разница между правильным ответом и предсказанным ответом).
   * К выходному слою применяется локальный градиент, на основе которого обновляются веса входных связей скрытого и выходного слоев сети.

In [39]:
def train(epoch):
    global W2, W1
    lmd = 0.01          # шаг обучения
    N = 10000           # число итераций при обучении
    count = len(epoch)
    for k in range(N):
        x = epoch[np.random.randint(0, count)]  # случайный выбор входного сигнала из обучающей выборки
        y, out = go_forward(x[0:3]) # прямой проход по нейронной сети и вычисление выходных значений
        e = y - x[-1] # вычисление ошибки
        delta = e*df(y) # локальный градиент
        W2[0] = W2[0] - lmd * delta * out[0] # корректировка веса первой связи
        W2[1] = W2[1] - lmd * delta * out[1] # корректировка веса второй связи

        delta2 = W2*delta*df(out)# вектор из 2-х величин локальных градиентов

        # корректировка связей первого слоя
        W1[0, :] = W1[0, :] - np.array(x[0:3]) * delta2[0] * lmd
        W1[1, :] = W1[1, :] - np.array(x[0:3]) * delta2[1] * lmd



### 5. Обучающая выборка epoch содержит четыре признака и один выходной параметр (-1 или 1). Функция train(epoch) запускается для N=10000 итераций для случайно выбранных входных параметров из epoch(эпох).

In [40]:
epoch = [(-1, -1, -1, -1),
         (-1, -1, 1, 1),
         (-1, 1, -1, -1),
         (-1, 1, 1, 1),
         (1, -1, -1, -1),
         (1, -1, 1, 1),
         (1, 1, -1, -1),
         (1, 1, 1, -1)]

train(epoch)