In [37]:
import numpy as np
from tensorflow import keras
from tensorflow.keras import backend as K
from tensorflow.keras.models import Model, Sequential
from tensorflow.keras.layers import Dense, Dropout, Flatten, Convolution2D, MaxPooling2D, InputLayer, BatchNormalization
import tensorflow as tf
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
from sklearn.model_selection import train_test_split

In [5]:
from random import seed
seed(35)

In [6]:
test_set = pd.read_csv('path_to_file', low_memory=False) #Пожалуйста, вставьте путь скачанного файла fashion-mnist_test
train_set = pd.read_csv('path_to_file', low_memory=False) #Пожалуйста, вставьте путь скачанного файла fashion-mnist_train

In [7]:
x_train = train_set.loc[:, train_set.columns != 'label'] 
x_test = test_set.loc[:, test_set.columns != 'label']
y_train = train_set['label']
y_test = test_set['label']
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
# масштабируем интенсивности пикселей в диапазон [0, 1]
x_train /= 255
x_test /= 255
y_train = tf.keras.utils.to_categorical(y_train, num_classes=10)
y_test = tf.keras.utils.to_categorical(y_test, num_classes=10)

In [8]:
x_train.shape, x_test.shape, y_train.shape, y_test.shape

((60000, 784), (10000, 784), (60000, 10), (10000, 10))

In [9]:
x_train, x_val, y_train, y_val = train_test_split(x_train, y_train,
                                            test_size=0.2, random_state=35)

In [16]:
x_test = x_test.values.reshape(10000, 28, 28, 1)
x_train = x_train.values.reshape(48000, 28, 28, 1)
x_val = x_val.values.reshape(12000, 28, 28, 1)

Сравним, как зависит качество нейронной сети от количества сверточных слоев.

In [25]:
#Сеть с двумя сверточными слоями

model = Sequential()
model.add(InputLayer(input_shape=(28,28, 1)))
model.add(Convolution2D(32, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Convolution2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Flatten())
model.add(Dense(64, activation='relu'))
model.add(Dense(10, activation='softmax'))

In [26]:
model.compile(
  loss='categorical_crossentropy',
  optimizer=tf.keras.optimizers.Adam(),
  metrics=['accuracy']
)

In [29]:
batch_size = 128
epochs = 20

In [30]:
trHistory = model.fit(
  x_train, y_train,
  batch_size=batch_size,
  epochs=epochs,
  verbose=1,
  validation_data=(x_val, y_val)
)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [31]:
two_layers_loss, two_layers_accuracy = model.evaluate(x_test, y_test, verbose=0)
print('Two layers CNC test accuracy:', two_layers_accuracy)

Two layers CNC test accuracy: 0.914900004863739


Сверточная нейронная сеть из двух скрытых слоев показывает показывает результаты, превосходящие логистическую регрессию и полносвязную нейпронную сеть, так как сверточные сети отличаются очень высокой способностью к распознаванию паттернов на изображениях, являясь самый популярный вариант для их обработки.

Добавим еще один слой.

In [33]:
#Сеть с тремя сверточными слоями 
model = Sequential()
model.add(InputLayer(input_shape=(28,28, 1)))
model.add(Convolution2D(16, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Convolution2D(32, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Convolution2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Flatten())
model.add(Dense(64, activation='relu'))
model.add(Dense(10, activation='softmax'))


In [34]:
model.compile(
  loss='categorical_crossentropy',
  optimizer=tf.keras.optimizers.Adam(),
  metrics=['accuracy']
)

In [35]:
trHistory = model.fit(
  x_train, y_train,
  batch_size=batch_size,
  epochs=epochs,
  verbose=1,
  validation_data=(x_val, y_val)
)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [None]:
three_layer_loss, three_layer_accuracy = model.evaluate(x_test, y_test, verbose=0)
print('Three layer CNN Test accuracy :', three_laye_accuracy)

Качество на тестовой выборке значительно упало,так как модель переобучилась.

Добавим к сети из двух сверточных слоев BatchNormalization слои и посмотрим, улучшит ли это качество.


In [38]:
#Сеть с двуми серточными слоями и BatchNormalization слоями
#Сеть с двумя сверточными слоями

model = Sequential()
model.add(InputLayer(input_shape=(28,28, 1)))
model.add(Convolution2D(32, (3, 3), activation='relu'))
model.add(BatchNormalization())
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Convolution2D(64, (3, 3), activation='relu'))
model.add(BatchNormalization())
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Flatten())
model.add(Dense(64, activation='relu'))
model.add(Dense(10, activation='softmax'))


In [39]:
model.compile(
  loss='categorical_crossentropy',
  optimizer=tf.keras.optimizers.Adam(),
  metrics=['accuracy']
)

In [40]:
batch_size = 128
epochs = 20

In [42]:
trHistory = model.fit(
  x_train, y_train,
  batch_size=batch_size,
  epochs=epochs,
  verbose=1,
  validation_data=(x_val, y_val)
)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [43]:
batch_layer_loss, batch_layer_accuracy = model.evaluate(x_test, y_test, verbose=0)
print('Batch layer CNC Test Accuracy:', batch_layer_accuracy)

Batch layer CNC: 0.8830000162124634


In [45]:
print('Two layers CNC:', two_layers_accuracy)
print('Batch layer CNC:', batch_layer_accuracy)


Two layers CNC: 0.914900004863739
Batch layer CNC: 0.8830000162124634


Добавление BatchNormalization слоев не помогло улучшить качество, значит, мы получаем данные примерно одного порядка и нормализовать их дополнительно не требуется.