In [1]:
import numpy as np
import tensorflow as tf
from tensorflow import keras
import keras.layers as layers
from keras.layers import Dense, Conv2D, Activation, MaxPooling2D, Flatten, Dropout, BatchNormalization
from sklearn.model_selection import train_test_split
from keras.callbacks import ReduceLROnPlateau
import math
import albumentations as A

# Model

stworzony na podstawie modelu z poprzednich części zadania.

In [2]:
f_mnist_model = tf.keras.Sequential([
    Conv2D(16, 3, padding='same', activation='relu', input_shape=(28, 28 ,1)),
    MaxPooling2D(),
    Dropout(0.3),
    Conv2D(32, 3, padding='same', activation='relu'),
    MaxPooling2D(),
    Conv2D(64, 3, padding='same', activation='relu'),
    MaxPooling2D(),
    Dropout(0.5),
    layers.Flatten(),
    layers.Dense(350,activation='relu'),
    layers.Dense(150, activation='relu'),
    Dropout(0.25),
    layers.Dense(10, activation='softmax')
])

f_mnist_model.compile(
    loss='sparse_categorical_crossentropy',
    optimizer='adam',
    metrics=['accuracy']
)

reduce_lr = ReduceLROnPlateau(monitor='val_loss', factor=0.2,
                              patience=4, min_lr=0.00000001)

# Przygotowanie danych.
Dane Fashion_Mnist są stworzone następująco: 60 000 przykładów treningowych oraz 10 000 przykładów testowych.
Na zestawie treningowym (60 000) przeprowadzę technikę augmentacji. Stworzę dodatkowe dane (w sumie zbiór danych treningowych będzie 2 razy liczniejszy), które następnie podzielę na zbiór treningowy i walidacyjny w zadanym stosunku 0.9 do 0.1. Na podstawie tych danych wytrenuję model.
Zestaw testowy pozostawiam do testowania wytrenowanego modelu.

In [3]:
def augmentation (data):

    augmented_images = []

    for image in data:
      transform1 = A.HorizontalFlip(p=0.5)
      transform2 = A.RandomRotate90()
      transform3 = A.Transpose()
      transform4 = A.Blur(blur_limit=3)
      transform5 = A.OpticalDistortion()
      transform6 = A.GridDistortion()
      augmented_image = transform1(image=image)['image']
      augmented_image = transform2(image=image)['image']
      augmented_image = transform3(image=image)['image']
      augmented_image = transform4(image=image)['image']
      augmented_image = transform5(image=image)['image']
      augmented_image = transform6(image=image)['image']

      augmented_images.append(augmented_image)
    
    images = np.array(augmented_images)
    return images

In [4]:
train, test = tf.keras.datasets.fashion_mnist.load_data()
images, labels = train
images = images/255.0
labels = labels.astype(np.int32)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [5]:
images_aug = augmentation(images)

images_transformed = np.concatenate((images_aug, images), axis=0)
labels_transformed = np.concatenate((labels, labels), axis=None)

In [6]:
print(images_transformed.shape)
print(labels_transformed.shape)

(120000, 28, 28)
(120000,)


In [7]:
X_train, X_val, y_train, y_val = \
    train_test_split(images_transformed, labels_transformed, test_size=0.1, random_state=4321, stratify=labels_transformed)

train_ds = tf.data.Dataset.from_tensor_slices((X_train, y_train))
train_ds = train_ds.batch(128)

train_stats = f_mnist_model.fit(train_ds, epochs=85,callbacks=[reduce_lr],validation_data=(X_val, y_val))

Epoch 1/85
Epoch 2/85
Epoch 3/85
Epoch 4/85
Epoch 5/85
Epoch 6/85
Epoch 7/85
Epoch 8/85
Epoch 9/85
Epoch 10/85
Epoch 11/85
Epoch 12/85
Epoch 13/85
Epoch 14/85
Epoch 15/85
Epoch 16/85
Epoch 17/85
Epoch 18/85
Epoch 19/85
Epoch 20/85
Epoch 21/85
Epoch 22/85
Epoch 23/85
Epoch 24/85
Epoch 25/85
Epoch 26/85
Epoch 27/85
Epoch 28/85
Epoch 29/85
Epoch 30/85
Epoch 31/85
Epoch 32/85
Epoch 33/85
Epoch 34/85
Epoch 35/85
Epoch 36/85
Epoch 37/85
Epoch 38/85
Epoch 39/85
Epoch 40/85
Epoch 41/85
Epoch 42/85
Epoch 43/85
Epoch 44/85
Epoch 45/85
Epoch 46/85
Epoch 47/85
Epoch 48/85
Epoch 49/85
Epoch 50/85
Epoch 51/85
Epoch 52/85
Epoch 53/85
Epoch 54/85
Epoch 55/85
Epoch 56/85
Epoch 57/85
Epoch 58/85
Epoch 59/85
Epoch 60/85
Epoch 61/85
Epoch 62/85
Epoch 63/85
Epoch 64/85
Epoch 65/85
Epoch 66/85
Epoch 67/85
Epoch 68/85
Epoch 69/85
Epoch 70/85
Epoch 71/85
Epoch 72/85
Epoch 73/85
Epoch 74/85
Epoch 75/85
Epoch 76/85
Epoch 77/85
Epoch 78/85
Epoch 79/85
Epoch 80/85
Epoch 81/85
Epoch 82/85
Epoch 83/85
Epoch 84/85
E

# Dokładność modelu
Na podstawie danych testowych pochodzących z pierwotnego (bez augmentacji) zbioru danych Fashion_Mnist

In [8]:
train, test = tf.keras.datasets.fashion_mnist.load_data()
images, labels = test
images = images/255.0
labels = labels.astype(np.int32)
score = f_mnist_model.evaluate(images, labels)
score



[0.20314054191112518, 0.9302999973297119]

# Wnioski:

Uważam, że nie jest źle. Model bywał przetrenowywany, więc w celu złagodzenia tej sytuacji zastosowałam w modelu Dropout().

W internecie (przynajmniej tam, gdzie ja dotarłam) rzadko kto zwraca uwagę na accuracy na danych testowych. Wystarcza, że sam wytrenowany na danych treningowych model ma wysoką dokładność i nie zwraca się uwagi na przetrenowanie modelu. W tych okolicznościach osiągnięcie przez laika (czyli mnie) accuracy ~.93 na danych testowych uważam za sukces.