<a href="https://colab.research.google.com/github/YuriSerhiienko/data_science_hw10/blob/main/hw10.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [7]:
import cv2
import numpy as np
import tensorflow as tf
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.applications import VGG16
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.models import Model, Sequential
from sklearn.metrics import classification_report, confusion_matrix
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout, GlobalAveragePooling2D

In [8]:
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# Нормалізація зображень
train_images = train_images / 255.0
test_images = test_images / 255.0

# Зміна розмірів зображень для CNN
train_images = train_images.reshape((train_images.shape[0], 28, 28, 1))
test_images = test_images.reshape((test_images.shape[0], 28, 28, 1))

model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Flatten(),
    Dense(128, activation='relu'),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=10, validation_split=0.2)

test_loss, test_acc = model.evaluate(test_images, test_labels)
print('\nТочність на тестових даних:', test_acc)

predictions = model.predict(test_images)
y_pred = np.argmax(predictions, axis=1)

print("\nМатриця помилок:")
print(confusion_matrix(test_labels, y_pred))

print("\nКласифікаційний звіт:")
print(classification_report(test_labels, y_pred))


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10

Точність на тестових даних: 0.909600019454956

Матриця помилок:
[[854   0  20  13   1   1 108   0   3   0]
 [  3 977   0  10   3   0   5   0   2   0]
 [ 22   1 843   8  44   0  82   0   0   0]
 [ 23   4   7 911  19   0  34   0   2   0]
 [  0   0  46  28 846   1  76   0   3   0]
 [  0   0   0   0   0 987   0  11   0   2]
 [104   0  44  21  46   0 781   0   4   0]
 [  0   0   0   0   0  10   0 972   0  18]
 [  5   0   4   2   3   2  10   3 971   0]
 [  1   0   0   0   0   6   0  39   0 954]]

Класифікаційний звіт:
              precision    recall  f1-score   support

           0       0.84      0.85      0.85      1000
           1       0.99      0.98      0.99      1000
           2       0.87      0.84      0.86      1000
           3       0.92      0.91      0.91      1000
           4       0.88      0.85      0.86      1000
           5       0.98      0.99      0.98  

In [9]:
# Завантаження та підготовка датасету
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
train_images = train_images / 255.0
test_images = test_images / 255.0

# Зміна розмірів зображень для VGG16
def resize_images(images):
    images_resized = np.array([tf.image.resize(img, (32, 32)) for img in images])
    return images_resized

train_images_resized = resize_images(train_images[..., np.newaxis])
test_images_resized = resize_images(test_images[..., np.newaxis])

# Конвертація зображень у формат RGB
train_images_rgb = np.repeat(train_images_resized, 3, axis=-1)
test_images_rgb = np.repeat(test_images_resized, 3, axis=-1)

# Завантаження VGG16
vgg_base = VGG16(weights='imagenet', include_top=False, input_shape=(32, 32, 3))
vgg_base.trainable = False  # Заморожування ваг

# Створення моделі
model = tf.keras.Sequential([
    vgg_base,
    Flatten(),
    Dense(128, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# Навчання моделі
history = model.fit(train_images_rgb, train_labels, epochs=10, validation_split=0.2)

# Оцінка моделі
test_loss, test_acc = model.evaluate(test_images_rgb, test_labels)
print('\nТочність на тестових даних:', test_acc)

# Передбачення та метрики якості
predictions = model.predict(test_images_rgb)
y_pred = np.argmax(predictions, axis=1)

print("\nМатриця помилок:")
print(confusion_matrix(test_labels, y_pred))

print("\nКласифікаційний звіт:")
print(classification_report(test_labels, y_pred))


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10

Точність на тестових даних: 0.8633999824523926

Матриця помилок:
[[828   0  15  47   8   1  89   1  11   0]
 [  0 960   4  31   1   0   3   0   1   0]
 [ 12   0 761  14 106   0 102   0   5   0]
 [ 28   9  13 856  47   0  44   0   3   0]
 [  6   2  73  43 793   0  82   0   1   0]
 [  0   0   0   0   0 947   0  41   1  11]
 [139   2  62  45 116   0 622   0  14   0]
 [  0   0   0   0   0  26   0 951   0  23]
 [  6   1   3   7   6   5   3   1 967   1]
 [  0   0   1   0   0  10   0  40   0 949]]

Класифікаційний звіт:
              precision    recall  f1-score   support

           0       0.81      0.83      0.82      1000
           1       0.99      0.96      0.97      1000
           2       0.82      0.76      0.79      1000
           3       0.82      0.86      0.84      1000
           4       0.74      0.79      0.76      1000
           5       0.96      0.95      0.95 

Попередня робота (Багатошаровий перцептрон)

Архітектура: Базувалася на повнозв'язних шарах (Dense layers).

Точність на тестових даних: 88.08% у базовій моделі, 86.93% після оновлення архітектури.

Інші метрики: Висока точність (precision) та повнота (recall), особливо після оновлення архітектури.

Нинішня робота (Згорткова нейронна мережа, CNN)

Архітектура: Базувалася на згорткових шарах (Conv2D), що є типовим для задач обробки зображень.

Точність на тестових даних: 90.88%.

Інші метрики: Деталізовані метрики (матриця помилок, точність, повнота, F1-оцінка) показали високу ефективність моделі у класифікації зображень.

Висновки

Ефективність архітектури: Згорткова нейронна мережа (CNN) показала кращі результати для задачі класифікації зображень у порівнянні з багатошаровим перцептроном. Це очікувано, оскільки CNN краще адаптовані для виявлення шаблонів у зображеннях.

Підхід до обробки даних: CNN використовує просторові відносини між пікселями, що дозволяє ефективно виділяти особливості зображень, в той час як багатошаровий перцептрон обробляє дані як одновимірний масив.



In [10]:
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# Нормалізація зображень
train_images = train_images / 255.0
test_images = test_images / 255.0

# Перетворення міток у one-hot вектори
train_labels = to_categorical(train_labels, 10)
test_labels = to_categorical(test_labels, 10)

train_images = np.array([np.resize(img, (32, 32, 3)) for img in train_images])
test_images = np.array([np.resize(img, (32, 32, 3)) for img in test_images])

vgg_base = VGG16(weights='imagenet', include_top=False, input_shape=(32, 32, 3))
vgg_base.trainable = False  # Заморожування ваг VGG16

model = tf.keras.Sequential([
    vgg_base,
    Flatten(),
    Dense(128, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

history = model.fit(train_images, train_labels, epochs=10, validation_split=0.2)

test_loss, test_acc = model.evaluate(test_images, test_labels)
print('\nТочність на тестових даних:', test_acc)

predictions = model.predict(test_images)
y_pred = np.argmax(predictions, axis=1)
test_labels_argmax = np.argmax(test_labels, axis=1)

print("\nМатриця помилок:")
print(confusion_matrix(test_labels_argmax, y_pred))

print("\nКласифікаційний звіт:")
print(classification_report(test_labels_argmax, y_pred))


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10

Точність на тестових даних: 0.7562000155448914

Матриця помилок:
[[788   1  37  87   4  15  56   0  11   1]
 [ 13 876   6  93   2   1   4   0   3   2]
 [ 27   4 719  29  53   7 144   0  14   3]
 [ 62  16  12 840  11   9  41   0   5   4]
 [ 23   0 223  84 486  13 150   1  12   8]
 [ 11   1   9  15   1 828   9 102  12  12]
 [223   4 187  80  61  11 391   0  38   5]
 [  0   0   0   0   0  67   0 855   2  76]
 [  8   1  22   5   6  26  13  15 886  18]
 [ 21   0   3   9   6  15   5  44   4 893]]

Класифікаційний звіт:
              precision    recall  f1-score   support

           0       0.67      0.79      0.72      1000
           1       0.97      0.88      0.92      1000
           2       0.59      0.72      0.65      1000
           3       0.68      0.84      0.75      1000
           4       0.77      0.49      0.60      1000
           5       0.83      0.83      0.83 

In [11]:
# Завантаження та підготовка датасету
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# Зміна розміру зображень до 32x32 та конвертація у формат RGB
train_images_rgb = np.array([cv2.cvtColor(cv2.resize(img, (32, 32)), cv2.COLOR_GRAY2RGB) for img in train_images]) / 255.0
test_images_rgb = np.array([cv2.cvtColor(cv2.resize(img, (32, 32)), cv2.COLOR_GRAY2RGB) for img in test_images]) / 255.0

# Перетворення міток у one-hot вектори
train_labels = to_categorical(train_labels, 10)
test_labels = to_categorical(test_labels, 10)

# Завантаження VGG16
vgg_base = VGG16(weights='imagenet', include_top=False, input_shape=(32, 32, 3))

# Розморожування останніх шарів VGG16
for layer in vgg_base.layers[:-4]:
    layer.trainable = False

# Створення кастомізованої моделі
model = Sequential([
    vgg_base,
    GlobalAveragePooling2D(),
    Dense(1024, activation='relu'),
    Dropout(0.5),
    Dense(512, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

# Компіляція моделі
model.compile(optimizer=Adam(learning_rate=0.0001),
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Навчання моделі
history = model.fit(train_images_rgb, train_labels, epochs=20, batch_size=32, validation_split=0.2)

# Оцінка моделі
test_loss, test_acc = model.evaluate(test_images_rgb, test_labels)
print('\nТочність на тестових даних:', test_acc)

# Передбачення та отримання міток класів
predictions = model.predict(test_images_rgb)
predicted_classes = np.argmax(predictions, axis=1)
true_classes = np.argmax(test_labels, axis=1)

# Матриця помилок
from sklearn.metrics import confusion_matrix, classification_report
print("\nМатриця помилок:")
print(confusion_matrix(true_classes, predicted_classes))

# Класифікаційний звіт
print("\nКласифікаційний звіт:")
print(classification_report(true_classes, predicted_classes))


Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20

Точність на тестових даних: 0.9052000045776367

Матриця помилок:
[[825   0  26  32   1   0 101   0  15   0]
 [  1 970   3  20   1   0   4   0   1   0]
 [ 14   0 887  10  41   0  47   0   1   0]
 [ 21   1  14 899  34   0  25   0   6   0]
 [  0   0  79  29 844   0  46   0   2   0]
 [  0   0   0   0   0 986   0  12   1   1]
 [ 89   0  77  33  79   0 714   0   8   0]
 [  0   0   0   0   0  12   0 970   0  18]
 [  1   0   3   0   0   0   1   0 995   0]
 [  0   0   0   0   0   5   0  32   1 962]]

Класифікаційний звіт:
              precision    recall  f1-score   support

           0       0.87      0.82      0.85      1000
           1       1.00      0.97      0.98      1000
           2       0.81      0.89      0.85      1000
           3       0.88      0.9

CNN показала значно кращі результати в порівнянні з багатошаровою мережею. Точність CNN була вищою і становила близько 91%, в той час як точність багатошарової мережі була нижчою і становила близько 87%. Це означає, що згорткова мережа ефективніше впоралася з класифікацією зображень Fashion MNIST.

Висновок полягає в тому, що для обробки зображень, особливо для завдань класифікації зображень, CNN може бути кращим вибором порівняно з багатошаровими мережами. Використання згорткових шарів дозволяє моделі автоматично виявляти важливі ознаки на зображеннях і покращує її результати.