# Płytka sieć w TensorFlow

Konstruowanie płytkiej sieci neuronowej klasyfikującej ręcznie pisane litery

### Import zależności

In [None]:
import tensorflow
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.optimizers import SGD
from matplotlib import pyplot as plt

### Wczytajmy obrazy ze zbioru MNIST

In [None]:
(X_train, y_train), (X_valid, y_valid) = mnist.load_data()

### Sprawdźmy podstawowe cechy zbioru danych

In [None]:
X_train.shape

In [None]:
y_train.shape

In [None]:
y_train[0:12]

In [None]:
X_valid.shape

In [None]:
y_valid.shape

### Przejrzyjmy konkretne elementy zbioru danych

In [None]:
plt.figure(figsize=(5,5))
for k in range(12):
    plt.subplot(3, 4, k+1)
    plt.imshow(X_train[k], cmap='Greys')
    plt.axis('off')
plt.tight_layout()
plt.show()

In [None]:
_ = plt.imshow(X_valid[0], cmap='Greys')

In [None]:
X_valid[0]

**Zadanie 1. Co reprezentują liczby w powyższej tablicy?**

tu odpowiedź

In [None]:
y_valid[0]

### Wykonajmy preprocessing danych

Dokonamy zmiany postaci każdego dwuwymiarowego obrazka w jednowymiarową tablicę o rozmiarze równym liczbie pikseli, jednocześnie zamienimy liczby całkowite z zadania 1 w liczby zmiennoprzecinkowe, by móc je następnie znormalizować (czyli by znajdowały się w przedziale <0,1>.

In [None]:
X_train = X_train.reshape(60000, 784).astype('float32')
X_valid = X_valid.reshape(10000, 784).astype('float32')

**Zadanie 2. Znormalizuj wartości w zbiorze uczącym X_train i zbiorze walidującym X_valid**

In [None]:
#tu odpowiedź

In [None]:
X_valid[0]

Następnie deklarujemy liczbę możliwych klas i konwertujemy etykiety na kategorie poprzez tzw. one-hot encoding

In [None]:
n_classes = 10
y_train = to_categorical(y_train, n_classes)
y_valid = to_categorical(y_valid, n_classes)

In [None]:
y_valid[0]

### Zaprojektujmy architekturę sieci

In [None]:
model = Sequential()
model.add(Dense(64, activation='sigmoid', input_shape=(784,)))
model.add(Dense(10, activation='softmax'))

Sieć ma 3 warstwy: 

    - wejściową o 784 neuronach, po jednym dla każdego piksela obrazu
    
    - ukrytą warstwą gęstą (inaczej mówiąc - w pełni połączoną, w której wszystkie neurony połączone są ze wszystkimi z warstwy wcześniejszej), zbudowaną z 64 neuronów sigmoidalnych
    
    - wyjściową, również gęstą, zbudowaną z 10-neuronowej warstwy softmax, po jednym dla każdej kategorii cyfr (0-9)

In [None]:
model.summary()

**Zadanie 3. Wyjaśnij podaną w podsumowaniu modelu liczbę parametrów warstw: 50240 i 650**

tu odpowiedź

### Skompilujmy i skonfigurujmy przygotowany model

In [None]:
lr = 0.01

In [None]:
model.compile(loss='mean_squared_error', optimizer=SGD(learning_rate=lr), metrics=['accuracy'])

Sieć będzie się uczyć na bazie średniokwadrartowej funkcji straty, a metodą minimalizacji funkcji kosztu będzie SGD

### W końcu nauczmy sieć

Wykorzystujemy dane wejściowe treningowe X_train i powiązane etykiety y_train, uczymy w 200 epokach (200 przejść przez wszystkie dane uczące), na 128-obrazkowych paczkach, skuteczność uczenia sprawdzamy już w trakcie uczenia poprzez podanie zbioru walidującego. Chcemy otrzymać wszystkie informacje w trakcie uczenia, stąd argument verbose otrzymuje wartość 1.

In [None]:
model.fit(X_train, y_train, batch_size=128, epochs=200, verbose=1, validation_data=(X_valid, y_valid))

### Dokonajmy ewaluacji modelu na zbiorze walidacyjnym

In [None]:
model.evaluate(X_valid, y_valid)

### Sprawdźmy jak dokładnie model działa na pojedynczych przypadkach

w tym celu wyciągamy jedną z próbek (jeden z obrazów) ze zbioru walidacyjnego i wykonujemy na niej metodę prognozującą predict

In [None]:
valid_0 = X_valid[0].reshape(1, 784)

In [None]:
model.predict(valid_0)

**Zadanie 4. Co oznaczają wartości znajdujące się w powyższej tablicy i jaka będzie w związku z tym prognoza co do cyfry na obrazie w tej próbce?**

tu odpowiedź

**Zadanie 5. Napisz kod sprawdzający jaką średnią pewność miała sieć co do poszczególnych cyfr, niezależnie od poprawności prognozy (nie musi być cały zbiór, wystarczy 500 pierwszych elementów)**

In [None]:
import numpy as np
for x in range(500):
    #tu odpowiedź