In [1]:
import tensorflow.keras as keras
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras import models, layers

In [2]:
# загрузка тренировочных и тестовых данных
(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()

# конвертация чисел из uint8 в float32
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')

# нормализация данных [0, 1]
x_train /= 255 
x_test /= 255 

# трансформация лейблов в one-hot encoding
y_train = to_categorical(y_train, 10) 
y_test = to_categorical(y_test, 10) 

# изменение размерности массива в 4D массив
x_train = x_train.reshape(x_train.shape[0], 28,28,1)
x_test = x_test.reshape(x_test.shape[0], 28,28,1)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [5]:
# Построим сеть и обучим ее
loss = 0
metrik = 0
for i in range(10):# инициализация пустой модели
  model = Sequential()

  # первый сверточный слой
  model.add(layers.Conv2D(6, kernel_size=(5, 5), strides=(1, 1), activation='tanh', input_shape=(28,28,1), padding="same"))

  # второй пуллинговый слой
  model.add(layers.AveragePooling2D(pool_size=(2, 2), strides=(1, 1), padding='valid'))

  # третий сверточный слой
  model.add(layers.Conv2D(16, kernel_size=(5, 5), strides=(1, 1), activation='tanh', padding='valid'))

  # четвертый пуллинговый слой
  model.add(layers.AveragePooling2D(pool_size=(2, 2), strides=(2, 2), padding='valid'))

  # пятый полносвязный слой
  model.add(layers.Conv2D(120, kernel_size=(5, 5), strides=(1, 1), activation='tanh', padding='valid'))

  # сглаживание CNN выхода чтобы можно было его присоединить к полносвязногому слою
  model.add(layers.Flatten())

  # шестой полносвязный слой
  model.add(layers.Dense(84, activation='tanh'))

  # выходной слой с функцией активации softmax
  model.add(layers.Dense(10, activation='softmax'))

  # компилияция модели
  model.compile(loss=keras.losses.categorical_crossentropy, optimizer='SGD', metrics=["accuracy"])


  hist = model.fit(x=x_train,y=y_train, epochs=1, batch_size=128, validation_data=(x_test, y_test), verbose=1)

  test_score = model.evaluate(x_test, y_test)
  loss += test_score[0]
  metrik += test_score[1]
  
print("Test loss {:.4f}, accuracy {:.2f}%".format(loss / 10, metrik / 10 * 100))

Test loss 0.6761, accuracy 74.97%


In [13]:
# увеличим количество ядер до 10

loss = 0
metrik = 0
for i in range(10):# инициализация пустой модели
  model = Sequential()

  # первый сверточный слой
  model.add(layers.Conv2D(6, kernel_size=(10, 10), strides=(1, 1), activation='tanh', input_shape=(28,28,1), padding="same"))

  # второй пуллинговый слой
  model.add(layers.AveragePooling2D(pool_size=(2, 2), strides=(1, 1), padding='same'))

  # третий сверточный слой
  model.add(layers.Conv2D(16, kernel_size=(10, 10), strides=(1, 1), activation='tanh', padding='same'))

  # четвертый пуллинговый слой
  model.add(layers.AveragePooling2D(pool_size=(2, 2), strides=(2, 2), padding='same'))

  # пятый полносвязный слой
  model.add(layers.Conv2D(120, kernel_size=(10, 10), strides=(1, 1), activation='tanh', padding='valid'))

  # сглаживание CNN выхода чтобы можно было его присоединить к полносвязногому слою
  model.add(layers.Flatten())

  # шестой полносвязный слой
  model.add(layers.Dense(84, activation='tanh'))

  # выходной слой с функцией активации softmax
  model.add(layers.Dense(10, activation='softmax'))

  # компилияция модели
  model.compile(loss=keras.losses.categorical_crossentropy, optimizer='SGD', metrics=["accuracy"])


  hist = model.fit(x=x_train,y=y_train, epochs=1, batch_size=128, validation_data=(x_test, y_test), verbose=1)

  test_score = model.evaluate(x_test, y_test)
  loss += test_score[0]
  metrik += test_score[1]
  
print("Test loss {:.4f}, accuracy {:.2f}%".format(loss / 10, metrik / 10 * 100))

Test loss 0.6029, accuracy 78.07%


При увеличении количества ядер с 5 до 10 и смене параметра padding c valid на same, точность сети возросла на 3 %.

In [22]:
# Попробуем добваить еще несколько слоев в нашу сеть.

loss = 0
metrik = 0
for i in range(10):# инициализация пустой модели
  model = Sequential()

  # первый сверточный слой
  model.add(layers.Conv2D(6, kernel_size=(10, 10), strides=(1, 1), activation='tanh', input_shape=(28,28,1), padding="same"))

  # второй пуллинговый слой
  model.add(layers.AveragePooling2D(pool_size=(2, 2), strides=(1, 1), padding='same'))

  # третий сверточный слой
  model.add(layers.Conv2D(16, kernel_size=(10, 10), strides=(1, 1), activation='tanh', padding='same'))

  # четвертый пуллинговый слой
  model.add(layers.AveragePooling2D(pool_size=(2, 2), strides=(2, 2), padding='same'))

  # пятый сверточный слой
  model.add(layers.Conv2D(32, kernel_size=(10, 10), strides=(1, 1), activation='tanh', padding='same'))

  # шестой пуллинговый слой
  model.add(layers.AveragePooling2D(pool_size=(2, 2), strides=(2, 2), padding='same'))

  # седьмой полносвязный слой
  model.add(layers.Conv2D(120, kernel_size=(7, 7), strides=(1, 1), activation='tanh', padding='valid'))

  # сглаживание CNN выхода чтобы можно было его присоединить к полносвязногому слою
  model.add(layers.Flatten())

  # восьмой полносвязный слой
  model.add(layers.Dense(84, activation='tanh'))

  # выходной слой с функцией активации softmax
  model.add(layers.Dense(10, activation='softmax'))

  # компилияция модели
  model.compile(loss=keras.losses.categorical_crossentropy, optimizer='SGD', metrics=["accuracy"])


  hist = model.fit(x=x_train,y=y_train, epochs=1, batch_size=128, validation_data=(x_test, y_test), verbose=1)

  test_score = model.evaluate(x_test, y_test)
  loss += test_score[0]
  metrik += test_score[1]
  
print("Test loss {:.4f}, accuracy {:.2f}%".format(loss / 10, metrik / 10 * 100))

Test loss 0.7082, accuracy 74.79%


При добавлении дополнительных слоев результат сети стал хуже. Я думаю, что это произошло из-за того, что мы вернули изображение слишком сильно и модели стало труднее определять его параметры. Дополнительные слои могли бы помочь улучшить качество сети, если бы наши изображения были больших размеров.