**Лабораторная работа №2. Реализация глубокой нейронной сети**

**Данные:** В работе предлагается использовать набор данных notMNIST, который состоит из изображений размерностью 28×28 первых 10 букв латинского алфавита (A … J, соответственно). Обучающая выборка содержит порядка 500 тыс. изображений, а тестовая – около 19 тыс.

Данные можно скачать по ссылке:

https://commondatastorage.googleapis.com/books1000/notMNIST_large.tar.gz (большой набор данных);

https://commondatastorage.googleapis.com/books1000/notMNIST_small.tar.gz (маленький набор данных);

Описание данных на английском языке доступно по ссылке:
http://yaroslavvb.blogspot.sg/2011/09/notmnist-dataset.html


In [1]:
import tensorflow as tf
from tensorflow import keras
import numpy as np
import matplotlib.pyplot as plt

from scipy.io import savemat
import numpy, glob, sys, os
from PIL import Image
from scipy.io import loadmat

In [2]:
def generateDataset(folder, target):
    max_count = 0
    for (root, dirs, files) in os.walk(folder):
        for f in files:
            if f.endswith('.png'):
                max_count += 1
    print('Found %s files' % (max_count,))
    data = numpy.zeros((28,28,max_count))
    labels = numpy.zeros((max_count,))
    count = 0
    for (root, dirs, files) in os.walk(folder):
        for f in files:
            if f.endswith('.png'):
                try:
                    img = Image.open(os.path.join(root,f));
                    data[:,:,count]=numpy.asarray(img)
                    surround_folder = os.path.split(root)[-1]
                    assert len(surround_folder)==1
                    labels[count]=ord(surround_folder)-ord('A')
                    count+=1
                except:
                    pass

    print('Saving to ', target)
    savemat(target,{'images': data[:,:,:count],'labels': labels[:count]})

In [3]:
generateDataset("notMNIST_small", "test_dataset.mat")
generateDataset("notMNIST_large", "train_dataset.mat")

Found 18726 files
Saving to  test_dataset.mat
Found 529119 files
Saving to  train_dataset.mat


In [4]:
def getDataset(file):
    matfile = loadmat(file)
    x = matfile['images'] / 255
    y = matfile['labels']
    return x.T, y.T
    
trainX, trainY = getDataset('train_dataset.mat')
print(trainX.shape, trainY.shape)

testX, testY = getDataset('test_dataset.mat')
print(testX.shape, testY.shape)

(529115, 28, 28) (529115, 1)
(18724, 28, 28) (18724, 1)


**Задание 1.
Р**еализуйте полносвязную нейронную сеть с помощью библиотеки Tensor Flow. В качестве алгоритма оптимизации можно использовать, например, стохастический градиент (Stochastic Gradient Descent, SGD). Определите количество скрытых слоев от 1 до 5, количество нейронов в каждом из слоев до нескольких сотен, а также их функции активации (кусочно-линейная, сигмоидная, гиперболический тангенс и т.д.).


In [5]:
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(256, activation='relu'),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(64, activation='relu'),
    keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(trainX, trainY, epochs=15)

Instructions for updating:
If using Keras pass *_constraint arguments to layers.
Train on 529115 samples
Epoch 1/15
Epoch 2/15
Epoch 3/15
Epoch 4/15
Epoch 5/15
Epoch 6/15
Epoch 7/15
Epoch 8/15
Epoch 9/15
Epoch 10/15
Epoch 11/15
Epoch 12/15
Epoch 13/15
Epoch 14/15
Epoch 15/15


<tensorflow.python.keras.callbacks.History at 0x13face4a8>

**Задание 2.**
Как улучшилась точность классификатора по сравнению с логистической регрессией?


In [8]:
testLoss, testAcc = model.evaluate(testX,  testY, verbose=2)
print('Точность на проверочных данных:', testAcc)

18724/18724 - 2s - loss: 0.1378 - acc: 0.9621
Точность на проверочных данных: 0.9621342


**Задание 3.**
Используйте регуляризацию и метод сброса нейронов (dropout) для борьбы с переобучением. Как улучшилось качество классификации?


In [9]:
regularizationModel = keras.models.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(256, kernel_regularizer=keras.regularizers.l2(0.001), activation='relu'),
    keras.layers.Dense(128, kernel_regularizer=keras.regularizers.l2(0.001), activation='relu'),
    keras.layers.Dense(64, kernel_regularizer=keras.regularizers.l2(0.001), activation='relu'),
    keras.layers.Dense(10, activation='softmax')
])

regularizationModel.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

regularizationModel.fit(trainX, trainY, epochs=15)

Train on 529115 samples
Epoch 1/15
Epoch 2/15
Epoch 3/15
Epoch 4/15
Epoch 5/15
Epoch 6/15
Epoch 7/15
Epoch 8/15
Epoch 9/15
Epoch 10/15
Epoch 11/15
Epoch 12/15
Epoch 13/15
Epoch 14/15
Epoch 15/15


<tensorflow.python.keras.callbacks.History at 0x65c8dde10>

In [11]:
testRegularizationLoss, testRegularizationAcc = regularizationModel.evaluate(testX,  testY, verbose=2)
print('Точность на проверочных данных c регуляризацией:', testRegularizationAcc)

18724/18724 - 3s - loss: 0.3101 - acc: 0.9301
Точность на проверочных данных c регуляризацией: 0.9300897


In [12]:
dropoutModel = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dropout(0.5),
    keras.layers.Dense(256, activation='relu'),
    keras.layers.Dropout(0.5),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dropout(0.5),
    keras.layers.Dense(64, activation='relu'),
    keras.layers.Dropout(0.5),
    keras.layers.Dense(10, activation='softmax')
])

dropoutModel.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

dropoutModel.fit(trainX, trainY, epochs=15)

Train on 529115 samples
Epoch 1/15
Epoch 2/15
Epoch 3/15
Epoch 4/15
Epoch 5/15
Epoch 6/15
Epoch 7/15
Epoch 8/15
Epoch 9/15
Epoch 10/15
Epoch 11/15
Epoch 12/15
Epoch 13/15
Epoch 14/15
Epoch 15/15


<tensorflow.python.keras.callbacks.History at 0x65c884fd0>

In [13]:
testDropoutLoss, testDropoutAcc = dropoutModel.evaluate(testX,  testY, verbose=2)
print('Точность на проверочных данных c dropout\'ом:', testDropoutAcc)

18724/18724 - 4s - loss: 0.2280 - acc: 0.9383
Точность на проверочных данных c dropout'ом: 0.93826103


**Задание 4.**
Воспользуйтесь динамически изменяемой скоростью обучения (learning rate). Наилучшая точность, достигнутая с помощью данной модели составляет 97.1%. Какую точность демонстрирует Ваша реализованная модель?


In [14]:
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(256, activation='relu'),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(64, activation='relu'),
    keras.layers.Dense(10, activation='softmax')
])

adamOptimizer = keras.optimizers.Adam(learning_rate=0.01)
model.compile(optimizer=adamOptimizer,
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(trainX, trainY, epochs=15)

Train on 529115 samples
Epoch 1/15
Epoch 2/15
Epoch 3/15
Epoch 4/15
Epoch 5/15
Epoch 6/15
Epoch 7/15
Epoch 8/15
Epoch 9/15
Epoch 10/15
Epoch 11/15
Epoch 12/15
Epoch 13/15
Epoch 14/15
Epoch 15/15


<tensorflow.python.keras.callbacks.History at 0x652009e10>

In [15]:
testDropoutLoss, testDropoutAcc = model.evaluate(testX,  testY, verbose=2)
print('Точность на проверочных данных c learning rate оптимизацией:', testDropoutAcc)

18724/18724 - 4s - loss: 0.2816 - acc: 0.9214
Точность на проверочных данных c learning rate оптимизацией: 0.92138433
