# Лабораторна робота №4
## Дровольського Ярослава, ПЗС 1 курс магістратури

**Завдання:** Реалізувати мережу (багатошаровий персептрон) з презентації

Будемо вирішувати задачу класифікації одягу на датасеті Fashion MNIST.

Всі дані (зображення одягу) в Fashion MNIST поділяються на 10 класів:

0. T-shirt / top (футболка / топ)
1. Trouser (брюки)
2. Pullover (пуловер)
3. Dress (плаття)
4. Coat (пальто)
5. Sandal (сандалі)
6. Shirt (сорочка)
7. Sneaker (кеди)
8. Bag (сумка)
9. Ankle boot (ботильйони).

- **Вхідні значення мережі:** інтенсивність пікселя (число в діапазоні 0-255). В зображені 784 (28*28) пікселів. Вхідний шар 784 нейрона.
- **Вихідний шар** 10 нейронів. Кожен нейрон повертає ймовірність (0-1) того, що на зображенні предмет одягу з певної категорії (10 категорій = 10 нейронів)

Імпортуємо необхідні бібліотеки

In [67]:
import numpy as np
import sklearn # algorithms for classical ML
import tensorflow as tf # build and train Neural network
from tensorflow import keras

Завантажимо датасет Fashion MNIST

In [68]:
from keras.datasets import mnist

(x_train, y_train), (x_val, y_val) = tf.keras.datasets.fashion_mnist.load_data()

# x_train, x_val - clothes images (28x28 px) for train and validation sample, correspondingly (sample - вибірка)
# y_train, y_val - correct answers for corresponding images

Центруємо і нормуємо вхідні дані, так, щоб значення змінювалися від `-0.5` до `+0.5`.

In [69]:
x_train_float = x_train.astype(np.float64) / 255 - 0.5
x_val_float = x_val.astype(np.float64) / 255 - 0.5

Перетворимо правильні відповіді `y_train` і `y_val` в one-hot encode.

Тобто у кожного об'єкта з `y_train` та `y_val` створюється 10 нових ознак (кожна відповідає за те, чи належать об'єкт певній категорії). Ознака, яка відповідає за ту категорію, якій належить об'єкт, дорівнює `1`, решта дорівнюють `0`.

In [70]:
y_train_oh = keras.utils.to_categorical(y_train, 10)
y_val_oh = keras.utils.to_categorical(y_val, 10)

**Тепер перейдемо до складання моделі**. Вхідні картинки витягнемо в вектор довжини 28 * 28 (= 784) і будемо подавати його на вхід. На виході маємо 10 вихідних нейронів за кількістю класів в нашій задачі. Задаємо ці та описані вище параметри.


Побудуємо модель багатошарового персептрона з двома прихованими шарами по 128 нейронів у кожному.

На прихованих шарах використовуватимемо функцію elu.

In [71]:
from keras import backend as K
from keras import layers as L

K.clear_session()

# create model
model = keras.Sequential()
model.add(L.Dense(128, input_dim=784, activation='relu')) # relu(x)=max(0,x)
model.add(L.Dense(128, activation='elu'))
model.add(L.Dense(10, activation='softmax'))

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Налаштуємо модель для тренування

In [72]:
# configure the model with losses and metrics

model.compile(
  loss='categorical_crossentropy', # minimize cross-entropy
  optimizer='adam',
  metrics=['accuracy'] # print % of correct answers
)

Навчимо модель, при цьому розмір міні батча візьмемо рівним 64 і встановимо
кількість епох навчання рівне 10.

In [73]:
model.fit(
    x_train_float.reshape(-1, 28*28),
    y_train_oh,
    batch_size=64, # 64 objects to count gradient on each step
    epochs=10,
    validation_data=(x_val_float.reshape(-1, 28*28), y_val_oh) # The model will not be trained on this data.
)

Epoch 1/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 4ms/step - accuracy: 0.7718 - loss: 0.6304 - val_accuracy: 0.8424 - val_loss: 0.4310
Epoch 2/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 6ms/step - accuracy: 0.8612 - loss: 0.3756 - val_accuracy: 0.8458 - val_loss: 0.4205
Epoch 3/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 4ms/step - accuracy: 0.8778 - loss: 0.3304 - val_accuracy: 0.8590 - val_loss: 0.3842
Epoch 4/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 4ms/step - accuracy: 0.8885 - loss: 0.2999 - val_accuracy: 0.8718 - val_loss: 0.3547
Epoch 5/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 6ms/step - accuracy: 0.8937 - loss: 0.2899 - val_accuracy: 0.8708 - val_loss: 0.3548
Epoch 6/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 4ms/step - accuracy: 0.8977 - loss: 0.2726 - val_accuracy: 0.8760 - val_loss: 0.3468
Epoch 7/10
[1m938/938[0m 

<keras.src.callbacks.history.History at 0x7d98ced23610>

Бачимо, що точність натренованої моделі на тренувальних даних становить приблизно `91.44%`. А точність на валідаційних даних - приблизно `88.16%`. Нас така точність влаштовує.

Використаємо модель в робочому режимі на деяких валідаційних даних:

**Приклад №1**

In [74]:
img1 = x_val[1]
img1

In [75]:
prediction1 = model.predict(x_val_float.reshape(-1, 28*28)[1:2])
print(prediction1)

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 78ms/step
[[1.9134568e-05 3.2572611e-08 9.9459934e-01 1.3977544e-08 5.3463625e-03
  1.0683106e-10 3.5192112e-05 1.7294555e-09 5.8869937e-10 3.9854289e-10]]


Отримали, що ця річ належить до категорії 2 (пуловер) з ймовірністю `99.95%`. Це відповідає дійсності, бо річ, що зображена на картинці, є пуловером.

**Приклад №2**

In [76]:
img2 = x_val[2]
img2

In [77]:
prediction2 = model.predict(x_val_float.reshape(-1, 28*28)[2:3])
print(prediction2)

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 27ms/step
[[2.0902320e-07 9.9999976e-01 7.2419441e-13 3.7943920e-08 1.0912722e-09
  1.1500436e-13 3.3212355e-10 2.8572221e-12 1.3641760e-11 5.0620528e-12]]


Отримали, що ця річ належить до категорії 1 (брюки) з ймовірністю `99.9%`. Це відповідає дійсності, бо річ, що зображена на картинці, є брюками.

**Приклад №3**

In [78]:
img3 = x_val[10]
img3

In [79]:
prediction3 = model.predict(x_val_float.reshape(-1, 28*28)[10:11])
print(prediction3)

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 28ms/step
[[2.62806047e-04 1.12096146e-04 2.72546057e-02 7.50381369e-05
  9.57740009e-01 2.13512726e-06 1.45142283e-02 2.70449419e-07
  3.34503125e-06 3.54642034e-05]]


Отримали, що ця річ належить до категорії 4 (пальто) з ймовірністю `95.77%`. Це відповідає дійсності, бо річ, що зображена на картинці, є пальто.