#Klasyfikacja zbiorów: MNIST, CIFAR-10, CIFAR-100


In [None]:
from keras.datasets import mnist
from keras.datasets import cifar10

from keras import models
from keras import layers
from keras.utils import to_categorical

# MNIST

**Przygotowanie danych**

In [None]:
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
print('Train dataset')
print(train_images.shape)
print(len(train_labels))
print(train_labels)
print('Test dataset')
print(test_images.shape)
print(len(test_labels))
print(test_labels)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
Train dataset
(60000, 28, 28)
60000
[5 0 4 ... 5 6 8]
Test dataset
(10000, 28, 28)
10000
[7 2 1 ... 4 5 6]




*   Zbiór MNIST składa się z obrazów ręcznie zapisanych cyfr o 10 kategoriach 
(cyfry 0-9)
*   Zbiór treningowy składa się z 60000 obrazów o rozmiarze 28x28 
*   Zbiór testowy składa się z 10000 obrazów o rozmiarze 28x28 


Przygotowanie danych w postaci obrazów 

In [None]:
train_images = train_images.reshape((60000, 28*28))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28*28))
test_images = test_images.astype('float32') / 255

* Przeskalowanie pikseli z [0-255] do [0-1]
* Zmiana z typu uint8 na float32
* Wyjście w postaci 1 wymiarowego tensora: [60000, 28 28], [10000, 28 28]

Przygotowanie etykiet

In [None]:
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

Zamiana etykiet z wartości [0, 9] na 10 wymiarowy wektor który ma reprezentować cyfrę w postaci 'binarnej'

**Tworzenie sieci**

In [None]:
network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28*28,)))
network.add(layers.Dense(10, activation='softmax'))

* Sequential - model sieci z sekwencją warstw, z których każda stopniowo ekstraktuje dane w celu uzyskania pożądanego wyniku
* Dense - sieci połączone gęsto
* Relu - funkcja nieliniowa, dodatnie wejścia przechodzą bez zmian, jednocześnie ograniczając wszystko inne do zera
* Softmax - zamienia wektor liczb na wektor prawdopodobieństw
* Druga warstwa jest 10-elementową wartstwą zawracającą tablicę 10 wartości prawdopodbieństwa (których suma = 1), oznacza to prawdopodbienstwo wystapienia cyfry na obrazie

Kompilacja sieci

In [None]:
network.compile(optimizer='rmsprop',
                loss='categorical_crossentropy',
                metrics=['accuracy'])

*   Optymalizator - rmsprop   
*   Funkcja straty - 
*   Metryka - accuracy - liczba poprawnie zaklasyfikowanych obrazów



Trenowanie sieci

In [None]:
network.fit(train_images, train_labels, epochs=5, batch_size=128)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7fecfdedbe80>

In [None]:
test_loss, test_acc = network.evaluate(test_images, test_labels)
print('test_loss: ', test_loss)
print('test_acc: ', test_acc*100)

test_loss:  0.06939179450273514
test_acc:  97.79999852180481


# CIFAR-10

**Przygotowanie danych**

In [None]:
(train_images, train_labels), (test_images, test_labels) = cifar10.load_data()
print('Train dataset')
print(train_images.shape)
print(len(train_labels))
print(train_labels.shape)
print('Test dataset')
print(test_images.shape)
print(len(test_labels))
print(test_labels.shape)

Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
Train dataset
(50000, 32, 32, 3)
50000
(50000, 1)
Test dataset
(10000, 32, 32, 3)
10000
(10000, 1)


*   Zbiór CIFAR-10 składa się z  60000 kolorowych obrazów o wymiarach 32×32 w 10 klasach
*   Zbiór treningowy składa się z 50000 obrazów
*   Zbiór testowy składa się z 10000 obrazów

Przygotowanie danych w postaci obrazów

In [None]:
train_images = train_images.astype('float32') / 255
test_images = test_images.astype('float32') / 255

Przygotowanie etykiet

In [None]:
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

Tworzenie sieci

In [None]:
network = models.Sequential()

network.add(layers.Conv2D(32, (3,3), padding='same', activation='relu', input_shape=(32,32,3)))
network.add(layers.BatchNormalization())
network.add(layers.Conv2D(32, (3,3), padding='same', activation='relu'))
network.add(layers.BatchNormalization())
network.add(layers.MaxPooling2D(pool_size=(2,2)))
network.add(layers.Dropout(0.3))

network.add(layers.Conv2D(64, (3,3), padding='same', activation='relu'))
network.add(layers.BatchNormalization())
network.add(layers.Conv2D(64, (3,3), padding='same', activation='relu'))
network.add(layers.BatchNormalization())
network.add(layers.MaxPooling2D(pool_size=(2,2)))
network.add(layers.Dropout(0.5))

network.add(layers.Conv2D(128, (3,3), padding='same', activation='relu'))
network.add(layers.BatchNormalization())
network.add(layers.Conv2D(128, (3,3), padding='same', activation='relu'))
network.add(layers.BatchNormalization())
network.add(layers.MaxPooling2D(pool_size=(2,2)))
network.add(layers.Dropout(0.5))

network.add(layers.Flatten())
network.add(layers.Dense(128, activation='relu'))
network.add(layers.BatchNormalization())
network.add(layers.Dropout(0.5))
network.add(layers.Dense(10, activation='softmax'))    # num_classes = 10


Kompilacja sieci

In [None]:
network.compile(optimizer='adam', 
              loss='categorical_crossentropy', 
              metrics=['accuracy'])

Trenowanie sieci

In [None]:
history = network.fit(train_images, train_labels, batch_size=64, epochs=10,
                    validation_data=(test_images, test_labels))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [None]:
test_loss, test_acc = network.evaluate(test_images, test_labels)
print('test_loss: ', test_loss)
print('test_acc: ', test_acc*100)

test_loss:  0.6428285837173462
test_acc:  78.58999967575073
