In [None]:
import pandas as pd
import tensorflow as tf
import numpy as np
import random
import os
from matplotlib import pyplot as plt
plt.rcParams['figure.figsize'] = [20, 10]

tf.__version__ 

Zanim zbudujemy CNN w Keras, musimy zrozumieć konwolucję i pooling. Załaduj obraz „data/zebra.jpg”

In [None]:
zebra = tf.keras.preprocessing.image.load_img("data/zebra.jpg", color_mode = "grayscale", target_size = (200, 300))
zebra

In [None]:
zebra_array = tf.keras.preprocessing.image.img_to_array(zebra) / 255
print(zebra_array.shape)

Teraz możemy zaimplementować prostą konwolucję:

In [None]:
sobel_filter_x = np.transpose(np.array([1, 2, 1, 0, 0, 0, -1, -2, -1]).reshape((3, 3)))
sobel_filter_x

In [None]:
kernel_shape = 3
padding = 0
stride = 1
input_height = zebra_array.shape[0]
input_width = zebra_array.shape[1]
activation_map_height = int((input_height + 2 * padding - kernel_shape) / stride + 1)
activation_map_width = int((input_width + 2 * padding - kernel_shape) / stride + 1)
activation_map = np.zeros((activation_map_height, activation_map_width))

In [None]:
for w in range(0, activation_map_width):
    for h in range(0, activation_map_height):
        activation_map[h, w] = np.sum(sobel_filter_x * zebra_array[h:(h + kernel_shape), w:(w + kernel_shape), 0])

In [None]:
plt.matshow(activation_map)

oraz pooling:

In [None]:
pool_shape = 2
pool_stride = 2
activation_map2_height = int(activation_map_height / pool_shape)
activation_map2_width = int(activation_map_width / pool_shape)
activation_map2 = np.zeros((activation_map2_height, activation_map2_width))

In [None]:
for w in range(0, activation_map2_width):
    for h in range(0, activation_map2_height):
        activation_map2[h, w] = np.max(activation_map[(2 * h):((2 * h) + pool_shape), (2 * w):((2 * w) + pool_shape)])

In [None]:
plt.matshow(activation_map2)

Zaczniemy od zbudowania prostego CNN dla zbioru danych dotyczących mody. Na pierwszym spotkaniu stworzyliśmy MLP do tego zadania. Załadujmy zbiór danych:

In [None]:
fashion_mnist_train_X = pd.read_csv("data/fashion_mnist_train_X", sep=" ").to_numpy()
fashion_mnist_test_X = pd.read_csv("data/fashion_mnist_test_X", sep=" ").to_numpy()
fashion_mnist_train_Y = pd.read_csv("data/fashion_mnist_train_Y", sep=" ").to_numpy()
fashion_mnist_test_Y = pd.read_csv("data/fashion_mnist_test_Y", sep=" ").to_numpy()

fashion_mnist_train_X = fashion_mnist_train_X / 255
fashion_mnist_test_X = fashion_mnist_test_X / 255

print(fashion_mnist_train_X.shape)
print(fashion_mnist_train_Y.shape)

In [None]:
plt.matshow(fashion_mnist_train_X[0,:].reshape((28,28)))

Aby przesłać dane do modelu CNN w keras, musimy przekształcić je w odpowiednie tensory. Podobnie jak w przypadku MLP musimy przekształcić wektor etykiet do macierzy z kodowaniem one-hot-encoding. W przypadku naszych obrazów musimy przedstawić je jako tensor 4-wymiarowy (próbki, wysokość, szerokość, kanały). Musimy również pamiętać o znormalizowaniu wartości pikseli:

In [None]:
fashion_mnist_train_Y = tf.keras.utils.to_categorical(fashion_mnist_train_Y, 10)
fashion_mnist_test_Y = tf.keras.utils.to_categorical(fashion_mnist_test_Y, 10)

fashion_mnist_train_X = fashion_mnist_train_X.reshape(-1, 28, 28, 1)
fashion_mnist_test_X = fashion_mnist_test_X.reshape(-1, 28, 28, 1)
print(fashion_mnist_train_X.shape)
print(fashion_mnist_train_Y.shape)

Dane są w poprawnej formie tensorowej, możemy przystąpić do budowy modelu. Jak zawsze będzie to model sekwencyjny. Jako pierwszą warstwę użyjemy warstwy konwolucyjnej:

In [None]:
fmnist_model1 = tf.keras.Sequential()

fmnist_model1.add(
    tf.keras.layers.Conv2D(filters = 32, # Liczba filtrów
                           kernel_size = (3, 3), # Wielkość filtrów
                           activation = 'relu',
                            input_shape = (28, 28, 1))
)
fmnist_model1.summary()

Dlaczego mamy do wytrenowania 320 parametrów?

In [None]:
32 * (3 * 3 * 1 + 1) # 32 filters of size 3x3(x1) + bias for each of them

Dlaczego output ma kształt (None, 26, 26, 32) ? 

In [None]:
((28 - 3 + 2 * 0) / 1) + 1 # 28 - input image size, 3 - kernsl size, 0 - padding, 1 - stride

Po warstwie konwolucyjnej możemy dodać kolejną. Użyjmy warstwy max pooling:

In [None]:
fmnist_model1.add(
    tf.keras.layers.MaxPool2D(pool_size = (2, 2))
)
fmnist_model1.summary()

Dlaczego output ma kształt (None, 12, 12, 32) ?

In [None]:
26 / 2 # 26 - input of the activation map shape, 2 - pool size

Powiedzmy, że chcemy dokończyć naszą architekturę i dodać warstwę wyjściową. zrobimy to w taki sam sposób jak w MLP, ale zanim to zrobimy, musimy spłaszczyć naszą ostatnią mapę aktywacji do wektora:

In [None]:
fmnist_model1.add(
    tf.keras.layers.Flatten()
)

fmnist_model1.add(
    tf.keras.layers.Dense(units = 10, activation = "softmax")
)
fmnist_model1.summary()

Dlaczego output ma kształt (None, 5408) ?

In [None]:
13 * 13 * 32 # Check dimmentions of previous layer

Dlaczego mamy 54090 parametrów do trenowania w warstwie wyjściowej?

In [None]:
5408 * 10 + 10 # 5408 - from layer_flatten * 10 neurons + biases

Architertura CNN jest ukończona, możemy teraz skompilować model:

In [None]:
fmnist_model1.compile(
    optimizer = "sgd",
    loss = "categorical_crossentropy",
    metrics = ("accuracy"))

i go wytrenować:

In [None]:
history = fmnist_model1.fit(
    x = fashion_mnist_train_X,
    y = fashion_mnist_train_Y,
    validation_split = 0.2, # 20% zbioru uczącego przeznaczonego na walidację
    epochs = 30, # Liczba "pętli/przejść" bo całym zbiorze treningowym
    batch_size = 128, # Wielkość próbki (batcha) dla jednej iteracji algorytmu SGD
    verbose = 1,
    callbacks = [tf.keras.callbacks.ModelCheckpoint(filepath = "models/fmnist_model1_best.hdf5",
                                                  monitor = "val_loss", save_best_only = True)])

In [None]:
plt.plot(history.history['accuracy'])
plt.plot(history.history['val_accuracy'])
plt.title('model Accuracy')
plt.ylabel('Accuracy')
plt.xlabel('epoch')
plt.legend(['train', 'val'], loc='upper left')
plt.show()

oraz zewaluować na zbiorze testowym:

In [None]:
fmnist_model1.evaluate(fashion_mnist_test_X, fashion_mnist_test_Y)

Czas na stworzenie bardziej zaawansowanej wersji tego modelu:

In [None]:
# Zainicjalizuj model
fmnist_model2 = tf.keras.Sequential()

# Dodaj warstwę konwolucyjną: 128 filtróœ, 3x3, liniowa aktywacja, padding "same"
___
# Dodaj BatchNormalization
___
# Dodaj aktywację ReLU
___
# Dodaj MaaxPooling 2x2, strides 2
___
# Dodaj dropout 25%
___
# Dodaj warstwę spłaszczającą
___
# Dodaj output
___

fmnist_model2.summary()

In [None]:
fmnist_model2.compile(
    optimizer = tf.keras.optimizers.Adadelta(lr = 0.01, decay = 1e-6),
    loss = "categorical_crossentropy",
    metrics = ("accuracy"))

In [None]:
if not os.path.exists("tensorboard"):
    os.mkdir("tensorboard")

history = fmnist_model1.fit(
    x = fashion_mnist_train_X,
    y = fashion_mnist_train_Y,
    validation_split = 0.2, # 20% zbioru uczącego przeznaczonego na walidację
    epochs = 30, # Liczba "pętli/przejść" bo całym zbiorze treningowym
    batch_size = 128, # Wielkość próbki (batcha) dla jednej iteracji algorytmu SGD
    verbose = 1,
    callbacks = [tf.keras.callbacks.EarlyStopping(monitor = 'val_accuracy', patience = 5),
                 tf.keras.callbacks.ModelCheckpoint(filepath = "models/fmnist_model2_best.hdf5",
                                                  monitor = "val_accuracy", save_best_only = True),
                tf.keras.callbacks.TensorBoard(log_dir = "tensorboard")])

In [None]:
plt.plot(history.history['accuracy'])
plt.plot(history.history['val_accuracy'])
plt.title('model Accuracy')
plt.ylabel('Accuracy')
plt.xlabel('epoch')
plt.legend(['train', 'val'], loc='upper left')
plt.show()

In [None]:
%load_ext tensorboard
%tensorboard --logdir tensorboard