# Введение в искусственные нейронные сети
# Урок 4. Сверточные нейронные сети

## Пример создания сверточных и пуллинг слоев на Keras

In [2]:

import tensorflow as tf
from tensorflow.keras.models import Sequential, Model
from tensorflow.keras.layers import Conv2D, Input
from tensorflow.keras.layers import GlobalMaxPooling2D, MaxPooling2D, AveragePooling2D, GlobalAveragePooling2D 

## Нейронная сеть Lenet5.

Lenet5 - это одна из первых сверточных нейронных сетей и она отражает характерные для сверточных нейронных сетей набор элементов - сверточные слои, пуллинг слои и полносвязные слои на конце нейронной сети. Данная архитектура послужила основой для многих современных архитектур сверточных нейронных сетей.

In [24]:
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.utils import to_categorical

# загрузка тренировочных и тестовых данных
(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()

# конвертация чисел из uint8 в float32
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')

# нормализация данных [0, 1]
x_train /= 255 
x_test /= 255 

# трансформация лейблов в one-hot encoding
y_train = to_categorical(y_train, 10) 
y_test = to_categorical(y_test, 10) 

# изменение размерности массива в 4D массив
x_train = x_train.reshape(x_train.shape[0], 28,28,1)
x_test = x_test.reshape(x_test.shape[0], 28,28,1)

from tensorflow.keras.models import Sequential
from tensorflow.keras import models, layers
import tensorflow.keras as keras





In [25]:
import pandas as pd


In [30]:
df=pd.DataFrame(columns=['cores','layers','neurons','accuracy'])

In [31]:
cores=[3,6,9,12,24]
layers_list=[1,2,3]
neurons=[64,128,256]
num=0

In [32]:
for core in cores:
  for neuron in neurons:
    for layer in layers_list:
      for _ in range(3):
        
      # инициализация пустой модели

        model = Sequential()

        # первый сверточный слой
        model.add(layers.Conv2D(core, kernel_size=(5, 5), strides=(1, 1), activation='tanh', input_shape=(28,28,1), padding="same"))

        # второй пуллинговый слой
        model.add(layers.AveragePooling2D(pool_size=(2, 2), strides=(1, 1), padding='valid'))

        # третий сверточный слой
        model.add(layers.Conv2D(core*4, kernel_size=(5, 5), strides=(1, 1), activation='tanh', padding='valid'))

        # четвертый пуллинговый слой
        model.add(layers.AveragePooling2D(pool_size=(2, 2), strides=(2, 2), padding='valid'))

        # пятый полносвязный слой
        model.add(layers.Conv2D(core*20, kernel_size=(5, 5), strides=(1, 1), activation='tanh', padding='valid'))

        # сглаживание CNN выхода чтобы можно было его присоединить к полносвязногому слою
        model.add(layers.Flatten())
        n=neuron
        for _ in range(layer):
        # шестой полносвязный слой
          model.add(layers.Dense(n, activation='tanh'))
          n=n/2
        # выходной слой с функцией активации softmax
        model.add(layers.Dense(10, activation='softmax'))


        # компилияция модели
        model.compile(loss=keras.losses.categorical_crossentropy, optimizer='SGD', metrics=["accuracy"])


        hist = model.fit(x=x_train,y=y_train, epochs=4, batch_size=128, validation_data=(x_test, y_test), verbose=1)

        test_score = model.evaluate(x_test, y_test)
        print("Test loss {:.4f}, accuracy {:.2f}%".format(test_score[0], test_score[1] * 100))
        df.loc[num,'cores']=core
        df.loc[num,'layers']=layer
        df.loc[num,'neurons']=neuron
        df.loc[num,'accuracy']=test_score[1]
        num+=1

Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.5220, accuracy 81.23%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.5529, accuracy 79.73%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.5329, accuracy 80.74%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.5458, accuracy 80.47%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.5653, accuracy 79.52%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.5498, accuracy 80.29%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.5714, accuracy 80.47%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.5662, accuracy 80.61%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.6080, accuracy 78.79%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.5184, accuracy 81.72%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.5082, accuracy 82.08%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.5032, accuracy 81.59%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
Test loss 0.5281, accuracy 81.34%
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/

In [34]:
df['accuracy']=df['accuracy'].astype(float)

In [35]:
results=df.groupby(['cores','layers','neurons']).mean()
results

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,accuracy
cores,layers,neurons,Unnamed: 3_level_1
3,1,64,0.805667
3,1,128,0.817967
3,1,256,0.8114
3,2,64,0.800933
3,2,128,0.815667
3,2,256,0.814167
3,3,64,0.799567
3,3,128,0.8096
3,3,256,0.817767
6,1,64,0.8173


Увеличение кол-ва ядер в целом увеличивало точность сети. Количество слоев нейронов не оказывало значительного влияние на точность. Но вот количество нейронов в слое зачастую положительно влияло на качество обучения.
