# Простейшая нейронная сеть

Пример инспирирован: https://github.com/stmorgan/pythonNNexample

Видео: https://youtu.be/h3l4qz76JhQ.

## Функция активации и её производная

Производная для градиентного спуска

In [1]:
import numpy as np
from numpy import array as na

In [2]:
# Функции numpy и её операции покомпонентно работают с векторами

def σ(x):
    return 1 / (1 + np.exp(-x))

def dσdx(x):
    return x * (1- x)

learning_throttle = 1.0
iterations = 60000

Обучающие данные. Во входном слое также есть т.н. *нейрон смещения*, который всегда 1

In [3]:
# Входные данные
X = [
    na([[0],[0],[1]]),
    na([[0],[1],[1]]),
    na([[1],[0],[1]]),
    na([[1],[1],[1]])
]

# Выходные данные — XOR и =>
Z = [
    na([[0], [1]]),
    na([[1], [1]]),
    na([[1], [0]]),
    na([[0], [1]])
]

Инициализируем линейные операторы, имитирующие синапсы, случайными значениями. 

In [4]:
np.random.seed(1)

#synapses
s_0 = 2*np.random.random((4,3)) - 1  # 3x4 matrix of weights ((2 inputs + 1 bias) x 4 nodes in the hidden layer)
s_1 = 2*np.random.random((2,4)) - 1  # 4x2 matrix of weights. (4 nodes x 2 outputs) - no bias term in the hidden layer.

Запустим в цикле обучение, повторяя одни и те же обучающие примеры 

In [5]:
for j in range(iterations):
    for x, z in zip(X, Z):
    
        # Применим нейронную сеть
        l_0 = x
        l_1 = σ(s_0 @ l_0)
        l_2 = σ(s_1 @ l_1)
        
        # Обратное распространение ошибки 
        ε_l_2 = z - l_2
        Δ_l_2 = ε_l_2 * dσdx(l_2) * learning_throttle
        
        ε_l_1 = s_1.T @ Δ_l_2
        Δ_l_1 = ε_l_1 * dσdx(l_1) * learning_throttle
    
        # Коррекция весов
        s_1 += Δ_l_2 @ l_1.T
        s_0 += Δ_l_1 @ l_0.T
    
    if j % 10000 == 0:   # Only print the error every 10000 steps, to save time and limit the amount of output. 
        print("Error: " + str(np.max(np.abs(ε_l_2))))

    
print("Output after training")
print(l_2)    

Error: 0.6044998041745449
Error: 0.009578664905779232
Error: 0.006452649250187106
Error: 0.005148693269119228
Error: 0.004394195392512397
Error: 0.003889130768711994
Output after training
[[0.00352153]
 [0.99895198]]


А теперь давайте протестируем сеть...

In [6]:
def predict(arg):
    arg += [1]
    l_1 = σ(s_0 @ arg)
    l_2 = σ(s_1 @ l_1)
    return l_2

print(predict([0,0]))
print(predict([0,1]))
print(predict([1,0]))
print(predict([1,1]))

[0.00273101 0.99709937]
[0.99662297 0.99887719]
[0.99664211 0.00437073]
[0.00352123 0.99895205]
