<a href="https://colab.research.google.com/github/YuriSerhiienko/data_science_hw10/blob/main/hw10.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [4]:
import tensorflow as tf
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.models import Sequential
from tensorflow.keras.datasets import fashion_mnist
from sklearn.metrics import classification_report, confusion_matrix
import numpy as np

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# Нормалізація зображень
train_images = train_images / 255.0
test_images = test_images / 255.0

# Зміна розмірів зображень для CNN
train_images = train_images.reshape((train_images.shape[0], 28, 28, 1))
test_images = test_images.reshape((test_images.shape[0], 28, 28, 1))

model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Flatten(),
    Dense(128, activation='relu'),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=10, validation_split=0.2)

test_loss, test_acc = model.evaluate(test_images, test_labels)
print('\nТочність на тестових даних:', test_acc)

predictions = model.predict(test_images)
y_pred = np.argmax(predictions, axis=1)

print("\nМатриця помилок:")
print(confusion_matrix(test_labels, y_pred))

print("\nКласифікаційний звіт:")
print(classification_report(test_labels, y_pred))


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10

Точність на тестових даних: 0.9088000059127808

Матриця помилок:
[[860   0  19  10   6   1 100   0   3   1]
 [  2 980   0  12   3   0   2   0   1   0]
 [ 19   0 884  10  38   0  49   0   0   0]
 [ 10   2   7 940  19   0  20   0   2   0]
 [  3   1  64  26 860   0  43   0   3   0]
 [  0   0   0   1   0 946   0  36   2  15]
 [111   0  78  23  69   0 712   1   6   0]
 [  0   0   0   0   0   3   0 988   0   9]
 [  5   0   6   2   3   3   4   4 973   0]
 [  1   0   0   0   0   1   0  53   0 945]]

Класифікаційний звіт:
              precision    recall  f1-score   support

           0       0.85      0.86      0.86      1000
           1       1.00      0.98      0.99      1000
           2       0.84      0.88      0.86      1000
           3       0.92      0.94      0.93      1000
           4       0.86      0.86      0.86      1000
           5       0.99      0.95      0.97 

In [1]:
import tensorflow as tf
from tensorflow.keras.applications import VGG16
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Dense, Dropout, Flatten
from tensorflow.keras.datasets import fashion_mnist
from sklearn.metrics import classification_report, confusion_matrix
import numpy as np

# Завантаження та підготовка датасету
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
train_images = train_images / 255.0
test_images = test_images / 255.0

# Зміна розмірів зображень для VGG16
def resize_images(images):
    images_resized = np.array([tf.image.resize(img, (32, 32)) for img in images])
    return images_resized

train_images_resized = resize_images(train_images[..., np.newaxis])
test_images_resized = resize_images(test_images[..., np.newaxis])

# Конвертація зображень у формат RGB
train_images_rgb = np.repeat(train_images_resized, 3, axis=-1)
test_images_rgb = np.repeat(test_images_resized, 3, axis=-1)

# Завантаження VGG16
vgg_base = VGG16(weights='imagenet', include_top=False, input_shape=(32, 32, 3))
vgg_base.trainable = False  # Заморожування ваг

# Створення моделі
model = tf.keras.Sequential([
    vgg_base,
    Flatten(),
    Dense(128, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# Навчання моделі
history = model.fit(train_images_rgb, train_labels, epochs=10, validation_split=0.2)

# Оцінка моделі
test_loss, test_acc = model.evaluate(test_images_rgb, test_labels)
print('\nТочність на тестових даних:', test_acc)

# Передбачення та метрики якості
predictions = model.predict(test_images_rgb)
y_pred = np.argmax(predictions, axis=1)

print("\nМатриця помилок:")
print(confusion_matrix(test_labels, y_pred))

print("\nКласифікаційний звіт:")
print(classification_report(test_labels, y_pred))


Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/vgg16/vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10

Точність на тестових даних: 0.859499990940094

Матриця помилок:
[[786   1  14  45   4   1 139   1   9   0]
 [  0 964   1  25   2   0   7   0   1   0]
 [  8   0 730  14 128   0 118   0   2   0]
 [ 25  11  13 845  48   0  55   0   3   0]
 [  4   1  71  40 793   0  90   0   1   0]
 [  0   0   0   0   0 950   0  36   

Попередня робота (Багатошаровий перцептрон)

Архітектура: Базувалася на повнозв'язних шарах (Dense layers).

Точність на тестових даних: 88.08% у базовій моделі, 86.93% після оновлення архітектури.

Інші метрики: Висока точність (precision) та повнота (recall), особливо після оновлення архітектури.

Нинішня робота (Згорткова нейронна мережа, CNN)

Архітектура: Базувалася на згорткових шарах (Conv2D), що є типовим для задач обробки зображень.

Точність на тестових даних: 90.88%.

Інші метрики: Деталізовані метрики (матриця помилок, точність, повнота, F1-оцінка) показали високу ефективність моделі у класифікації зображень.

Висновки

Ефективність архітектури: Згорткова нейронна мережа (CNN) показала кращі результати для задачі класифікації зображень у порівнянні з багатошаровим перцептроном. Це очікувано, оскільки CNN краще адаптовані для виявлення шаблонів у зображеннях.

Підхід до обробки даних: CNN використовує просторові відносини між пікселями, що дозволяє ефективно виділяти особливості зображень, в той час як багатошаровий перцептрон обробляє дані як одновимірний масив.



In [2]:
import tensorflow as tf
from tensorflow.keras.applications import VGG16
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Dense, Dropout, Flatten
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.utils import to_categorical
from sklearn.metrics import classification_report, confusion_matrix
import numpy as np

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# Нормалізація зображень
train_images = train_images / 255.0
test_images = test_images / 255.0

# Перетворення міток у one-hot вектори
train_labels = to_categorical(train_labels, 10)
test_labels = to_categorical(test_labels, 10)

train_images = np.array([np.resize(img, (32, 32, 3)) for img in train_images])
test_images = np.array([np.resize(img, (32, 32, 3)) for img in test_images])

vgg_base = VGG16(weights='imagenet', include_top=False, input_shape=(32, 32, 3))
vgg_base.trainable = False  # Заморожування ваг VGG16

model = tf.keras.Sequential([
    vgg_base,
    Flatten(),
    Dense(128, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

history = model.fit(train_images, train_labels, epochs=10, validation_split=0.2)

test_loss, test_acc = model.evaluate(test_images, test_labels)
print('\nТочність на тестових даних:', test_acc)

predictions = model.predict(test_images)
y_pred = np.argmax(predictions, axis=1)
test_labels_argmax = np.argmax(test_labels, axis=1)

print("\nМатриця помилок:")
print(confusion_matrix(test_labels_argmax, y_pred))

print("\nКласифікаційний звіт:")
print(classification_report(test_labels_argmax, y_pred))


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10

Точність на тестових даних: 0.7689999938011169

Матриця помилок:
[[703   5  64  87  21  21  83   0  13   3]
 [  6 902   6  69   3   3   5   0   3   3]
 [  9   3 701  13 160   5  88   0  16   5]
 [ 37  33  22 790  47  14  47   0   6   4]
 [  9   2 148  54 707  10  57   1   9   3]
 [  3   3   7   9   7 818  10 117  13  13]
 [151   4 170  63 170  12 389   0  34   7]
 [  0   0   0   0   0  54   0 898   3  45]
 [  3   1  19   5  23  15  10  15 899  10]
 [  6   0   5   5  17   9   3  59  13 883]]

Класифікаційний звіт:
              precision    recall  f1-score   support

           0       0.76      0.70      0.73      1000
           1       0.95      0.90      0.92      1000
           2       0.61      0.70      0.65      1000
           3       0.72      0.79      0.75      1000
           4       0.61      0.71      0.66      1000
           5       0.85      0.82      0.83 

In [6]:
import tensorflow as tf
import numpy as np
from tensorflow.keras.applications import VGG16
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Flatten, GlobalAveragePooling2D
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.optimizers import Adam
import cv2

# Завантаження та підготовка датасету
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# Зміна розміру зображень до 32x32 та конвертація у формат RGB
train_images_rgb = np.array([cv2.cvtColor(cv2.resize(img, (32, 32)), cv2.COLOR_GRAY2RGB) for img in train_images]) / 255.0
test_images_rgb = np.array([cv2.cvtColor(cv2.resize(img, (32, 32)), cv2.COLOR_GRAY2RGB) for img in test_images]) / 255.0

# Перетворення міток у one-hot вектори
train_labels = to_categorical(train_labels, 10)
test_labels = to_categorical(test_labels, 10)

# Завантаження VGG16
vgg_base = VGG16(weights='imagenet', include_top=False, input_shape=(32, 32, 3))

# Розморожування останніх шарів VGG16
for layer in vgg_base.layers[:-4]:
    layer.trainable = False

# Створення кастомізованої моделі
model = Sequential([
    vgg_base,
    GlobalAveragePooling2D(),
    Dense(1024, activation='relu'),
    Dropout(0.5),
    Dense(512, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

# Компіляція моделі
model.compile(optimizer=Adam(learning_rate=0.0001),
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Навчання моделі
history = model.fit(train_images_rgb, train_labels, epochs=20, batch_size=32, validation_split=0.2)

# Оцінка моделі
test_loss, test_acc = model.evaluate(test_images_rgb, test_labels)
print('\nТочність на тестових даних:', test_acc)

# Передбачення та отримання міток класів
predictions = model.predict(test_images_rgb)
predicted_classes = np.argmax(predictions, axis=1)
true_classes = np.argmax(test_labels, axis=1)

# Матриця помилок
from sklearn.metrics import confusion_matrix, classification_report
print("\nМатриця помилок:")
print(confusion_matrix(true_classes, predicted_classes))

# Класифікаційний звіт
print("\nКласифікаційний звіт:")
print(classification_report(true_classes, predicted_classes))


Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20

Точність на тестових даних: 0.9060999751091003

Матриця помилок:
[[847   3  23  26   3   1  91   0   6   0]
 [  1 979   0  14   1   0   3   0   2   0]
 [ 11   1 866  11  67   0  44   0   0   0]
 [ 26   5  11 901  32   0  22   0   3   0]
 [  1   1  44  28 879   0  47   0   0   0]
 [  0   0   0   0   0 974   0  14   1  11]
 [119   0  65  26  83   0 697   0  10   0]
 [  0   0   0   0   0   9   0 963   1  27]
 [  3   0   0   4   3   2   2   0 986   0]
 [  0   0   1   0   0   3   0  27   0 969]]

Класифікаційний звіт:
              precision    recall  f1-score   support

           0       0.84      0.85      0.84      1000
           1       0.99      0.98      0.98      1000
           2       0.86      0.87      0.86      1000
           3       0.89      0.9

CNN показала значно кращі результати в порівнянні з багатошаровою мережею. Точність CNN була вищою і становила близько 91%, в той час як точність багатошарової мережі була нижчою і становила близько 87%. Це означає, що згорткова мережа ефективніше впоралася з класифікацією зображень Fashion MNIST.

Висновок полягає в тому, що для обробки зображень, особливо для завдань класифікації зображень, CNN може бути кращим вибором порівняно з багатошаровими мережами. Використання згорткових шарів дозволяє моделі автоматично виявляти важливі ознаки на зображеннях і покращує її результати.