## Функции активации

In [1]:
import numpy as np # 
from tensorflow.keras.models import Sequential # Подключаем класс модели Sequential
from tensorflow.keras.layers import Dense # Подключаем полносвязанные нейроны Dense
from tensorflow.keras.optimizers import Adam # Подключаем оптимизатор Adam

In [2]:
x1 = 7.2 # Установим значение x1
x2 = -5.8 # Установим значение x2
x_train = np.expand_dims(np.array([x1, x2]), 0) # Создадим набор данных для последующего обучения нейронной сети
x_train.shape

(1, 2)

In [3]:
w1 = 0.42 # Зададим коэф. w1 вручную
w2 = 0.15 # Зададим коэф. w2 вручную
w3 = -0.56 # Зададим коэф. w3 вручную
w4 = 0.83 # Зададим коэф. w4 вручную
w5 = 0.93 # Зададим коэф. w5 вручную
w6 = 0.02 # Зададим коэф. w6 вручную
new_weight = [np.array([[w1,w3],[w2,w4]]), np.array([[w5],[w6]])] # Сформируем список весов
print(new_weight) # Отобразим сформированный список весов

[array([[ 0.42, -0.56],
       [ 0.15,  0.83]]), array([[0.93],
       [0.02]])]


## sigmoid (сигмоид)

![alt text](https://wikimedia.org/api/rest_v1/media/math/render/svg/36f792c44c0a7069ad01386452569d6e34fe95d7) ![alt text](https://upload.wikimedia.org/wikipedia/commons/thumb/5/5b/Activation_logistic.svg/120px-Activation_logistic.svg.png)

In [3]:
def sigmoid(x): # Создадим фукцию для расчета сигмоиды
    return 1/(1+np.e ** (-x))

In [8]:
# Создадим нейронную сеть с функцией активации сигмоид
model_sigmoid = Sequential() # Создадим ящик для нейронов
model_sigmoid.add(Dense(2, input_dim = 2, activation = 'sigmoid', use_bias = False)) # Добавляем полносвязный слой с 2мя нейронами (указываем что на вход
# принимаем вектор из 2х елементов) активационная функция сигмоида, и отключаем функцию нейрона смещения
model_sigmoid.add(Dense(1, activation = 'sigmoid', use_bias = False)) # Добавляем полносвязный слой с 1 нейроном (выходной слойb нашей модели),
# здесь уже не требуется указывать размерность входных данных, функция активации сигмоид, и отключаем функцию смещения нейрона
model_sigmoid.summary() # Отобразим структуру созданной сети 
model_sigmoid.set_weights(new_weight) # Установим посчитанные ранее веса

In [11]:
# Выполним те же самые шаги что и в прошлый раз
y_sigmoid = model_sigmoid.predict(x_train) # получим значение выхода сети, передав на выход вектор из 2 элементов  [x1, x2]
print(y_sigmoid) # выведем результат работы сети

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 282ms/step
[[0.6970569]]


*Посчитаем значение выхода сети вручную*

In [12]:
H1_sigmoid = sigmoid(x1 * w1 + x2 * w2) # Получим значение скрыого нейрона H1
H2_sigmoid = sigmoid(x1 * w3 + x2 * w4) # Получим значение скрыого нейрона H2
print(H1_sigmoid) # Выведем значение нейрона H1
print(H2_sigmoid) # Выведем значение нейрона H2

0.8960419706149801
0.00014393569134056814


In [13]:
Y_sigmoid = sigmoid(H1_sigmoid * w5 + H2_sigmoid * w6) # Считаем выход сети
print(Y_sigmoid) # Выведем зачение выхода сети посчитанного вручную

0.6970568720142808


In [14]:
# Выведем сравнение модели посчитанного вручную, и предсказания модели
print('Значение предикта модели', round(y_sigmoid[0][0],6))
print('Значение посчитанное вручую', round(Y_sigmoid, 6))

Значение предикта модели 0.697057
Значение посчитанное вручую 0.697057


## relu (линейный выпрямитель)

![alt text](https://wikimedia.org/api/rest_v1/media/math/render/svg/f4353f4e3e484130504049599d2e7b040793e1eb) ![alt text](https://upload.wikimedia.org/wikipedia/commons/thumb/f/fe/Activation_rectified_linear.svg/120px-Activation_rectified_linear.svg.png)

In [15]:
def relu(x): # Зададим функцию расчета relu
    return np.clip(x, 0, np.inf)

In [16]:
# Пересоздадим нейронную сеть, указав в качестве функции активации relu
model_relu = Sequential() # Создаем пустую модель нейронной сети
model_relu.add(Dense(2, input_dim = 2, activation = 'relu', use_bias=False)) #  Добавлем полносвязный слой  2мя нейронами (указываем, что на вход принимаем вектор из двух элементов), функция активации - relu, и отключаем использование нейрона смещения
model_relu.add(Dense(1, activation = 'relu', use_bias=False)) # Добавляем полносвязный слой с 1 нейроном (выходной слой нашего предыдущего слоя модели), здесь уже не требуется указывать размерность входного слоя данных, функция активации relu, и отключам нейрон смещения
model_relu.summary() # Отобразим структуру созданной нейронной сети (должна совпадать с прошлой моделью)
model_relu.set_weights(new_weight) # Установим заданные ранее веса

In [19]:
# Получим предсказание модели
y_relu = model_relu.predict(x_train) # Полуим значение выхода сети, передав на вход вектор из двух элементов [x1, x2]
print(y_relu[0][0])

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 47ms/step
2.0032198


**Посчитаем значение выхода сети вручную**

In [20]:
H1_relu = relu(x1 * w1 + x2 * w2) # Получим зачение скрытого нейрона H1
H2_relu = relu(x1 * w3 + x2 * w4) # Получим зачение скрытого нейрона H2
print(H1_relu) # Выведем значение нейрона H1
print(H2_relu) # Выведем значение нейрона H2

2.154
0.0


In [21]:
Y_relu = relu(H1_relu * w5 + H2_relu * w6) # Считаем выход сети
print(Y_relu) # Отобразим результат ручного подсчета с активационной функцией relu

2.0032200000000002


In [22]:
# Выведем сравнение модели посчитанного вручную, и предсказания модели
print('Значение предикта модели', round(y_relu[0][0],6))
print('Значение посчитанное вручую', round(Y_relu, 6))

Значение предикта модели 2.00322
Значение посчитанное вручую 2.00322


## tanh (гиперболический тангенс)


![alt text](https://wikimedia.org/api/rest_v1/media/math/render/svg/5fd13a1c501e64926c12d52b620f1e656251fc15) ![alt text](https://upload.wikimedia.org/wikipedia/commons/thumb/c/cb/Activation_tanh.svg/120px-Activation_tanh.svg.png)

In [4]:
def th(x): # Зададим функцию расчета гиперболического тангенса
    return (np.e ** x - np.e ** (-x)) / (np.e **x + np.e ** (-x))

In [5]:
# Пересоздадим нейронную сеть, указав в качестве функции активации - tanh
model_th = Sequential() # Создаем пустую модель нейроной сети
model_th.add(Dense(2, input_dim = 2, activation = 'tanh', use_bias = False)) # Добавляем полносвязный слой с 2мя нейронами (указываем, что на вход принимаем вектор из двух елементов), фукция активации - tanh, использование нейрона смещения отключаем
model_th.add(Dense(1, activation = 'tanh', use_bias = False)) # Добавляем полносвязный слой с 1м нейроном (входные данные с нашего предидущего слоя) активационая функция 'tanh' и отключаем нейрон смещения
model_th.summary() # Отображаем структуру созданной сети (должна совпадать с предидущими моделями)
model_th.set_weights(new_weight) # Установим заданные ранее выше веса

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [6]:
# Выполним предсказание модели
y_th = model_th.predict(x_train) # Получаем значение выхода сети передав на вход вектор из двух элементов [x1, x2]
print(y_th) # Выведем результат предикта нейронки

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 162ms/step
[[0.70906264]]


In [7]:
H1_th = th(x1 * w1 + x2 * w2) # Получим значение скрытого нейрона H1
H2_th = th(x1 * w3 + x2 * w4) # Получим значение скрытого нейрона H2
print(H1_th) # Выводим значение нейрона H1
print(H2_th) # Выводим значение нейрона H2

0.9734366670870239
-0.9999999585531038


In [8]:
Y_th = th(H1_th * w5 + H2_th * w6) # Считаем выход сети
print(Y_th) # Выведем на экран значение посчитанное вручную

0.709062603515898


In [9]:
print('значение полученное пердиктом модели', round(y_th[0][0], 6))
print('значение посчитанное вручную', round(Y_th, 6))

значение полученное пердиктом модели 0.709063
значение посчитанное вручную 0.709063
