In [0]:
!pip install -U tensorflow

In [0]:
import tensorflow as tf
import numpy as np

Będziemy korzystać z biblioteki do robienia wykresów (rysowania obrazków):

In [0]:
import matplotlib.pyplot as plt

Oraz skorzystamy z wysokopoziomowej biblioteki [Keras](https://www.tensorflow.org/guide/keras/overview) pomagającej tworzyc sieci neuronowe.

In [0]:
from tensorflow import keras

Wykonamy jedno z klasycznych zadań klasyfikacyjnych: rozpoznawanie ręcznie pisanych cyfr.

In [0]:
mnist = keras.datasets.mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()


Zacznijmy od przyjrzenia się jakies postaci są dane:

In [0]:
type(train_images)

#### Zadanie

- ile jest obrazków
- jaki jest rozmiar pojedynczego obrazku
- ile wartości ma "kolor" pojedynczego pixela?

w zbiorze treningowym i zbiorze testowym (osobno).

### Przykładowe liczby

Poniższy kod wyświetla pierwszych 25 przykładów cyfr:

In [0]:
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.imshow(train_images[i])
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(train_labels[i])
plt.show()

## Przygotowanie danych

Dane trzeba w pierwszej kolejności *znormalizować*:

In [0]:
train_images = train_images / 255
test_images = test_images / 255

Ważnym jest by tej samej transformacji poddać zarówno dane treningowe jak i testowe.

## Model

Zdefinijumy prosty model z jedną wartwą ukrytą:

In [0]:
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(10, activation='softmax')
])

In [0]:
model.summary()

Model przed trenowaniem musi zostać "skompilowany":

- wybieramy metodę optymalizacji (zmniejszania funkcji kosztu)
- funkcję kosztu
- metrykę (metryki), które pomogą śledzić proces uczenia

In [0]:
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [0]:
model.fit(train_images, train_labels, epochs=10)

In [0]:
test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)

print('\nTest accuracy:', test_acc)

In [0]:
predictions = model.predict(test_images)

In [0]:
predictions[0]

#### Zadanie

Napisz funkcję, która dla danego modelu i zbioru testowego, wyświetli 25
losowych przykładów testowych, z rzeczywistą etykietką i predykcją modelu.

#### Zadanie

Sprawdź co się stanie gdy nie przeprowadzi się normalizacji modelu.

#### Zadanie

Sprawdź jak zmieni się model przy większym rozmiarze warstwy ukrytej.
Co jeśli zastąpi się ją dwiema wartstwami ukrytymi?

Spróbuj uzyskać większą skuteczność.

# Inna architektura

Poniższa architektura ma skuteczność 99%! Jej trenowanie trwa jednak znacznie dłużej.

In [0]:
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

train_images = train_images.reshape(60000, 28, 28, 1)
test_images = test_images.reshape(10000, 28, 28, 1)

In [0]:
model_cnn = keras.Sequential([
    keras.layers.Conv2D(32, 3, activation="relu", input_shape=(28, 28, 1)),
    keras.layers.Conv2D(64, 3, activation="relu"),
    keras.layers.MaxPooling2D((2, 2)),
    keras.layers.Dropout(0.25),
    keras.layers.Flatten(),
    keras.layers.Dense(128, activation="relu"),
    keras.layers.Dropout(0.4),
    keras.layers.Dense(10, activation='softmax')
])
model_cnn.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])
model_cnn.summary()

In [0]:
model_cnn.fit(train_images, train_labels, validation_split=0.1, epochs=10)

In [0]:
test_loss, test_acc = model_cnn.evaluate(test_images,  test_labels, verbose=2)

print('\nTest accuracy:', test_acc)