In [40]:
import numpy as np
import tensorflow as tf
from tensorflow.keras import datasets, layers, models
import matplotlib.pyplot as plt

In [41]:
(train_images, train_labels), (test_images, test_labels) = datasets.fashion_mnist.load_data()


In [42]:
train_images, test_images = train_images / 255.0, test_images / 255.0


In [43]:
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))


In [None]:
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

history = model.fit(train_images, train_labels, epochs=30,
                    validation_data=(test_images, test_labels))


In [None]:
test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)
print("\nTest accuracy:", test_acc)

# Графік точності та втрат під час навчання
plt.plot(history.history['accuracy'], label='accuracy')
plt.plot(history.history['val_accuracy'], label = 'val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.ylim([0, 1])
plt.legend(loc='lower right')
plt.show()


Згорткові мережі (CNNs) працюють добре: У вас є підтвердження того, що згорткові нейронні мережі (CNNs) добре працюють для завдань класифікації зображень, таких як Fashion MNIST. Їхні здатності до виділення ознак на різних рівнях абстракції роблять їх ефективними для аналізу текстур і форм одягу.

Архітектура мережі має значення: Оптимальна архітектура мережі може суттєво впливати на результати. Зазвичай починають з кількох згорткових і пулінгових шарів, додавання більше шарів або зменшення їх кількості може вплинути на точність.

Функції активації: Використання функції активації "relu" в згорткових шарах є популярним вибором, але можна спробувати інші функції активації, такі як "Leaky ReLU" або "ELU", щоб покращити результати.

Кількість фільтрів і розмір ядра: Зміна кількості фільтрів та розміру ядра згорткового шару може впливати на здатність мережі виділяти ознаки. Експериментуйте з цими параметрами, щоб підібрати їх оптимальні значення.

Пулінг: Додавання пулінгових шарів може допомогти зменшити кількість параметрів та обчислень у мережі, але не завжди є необхідним.

Регуляризація та викиди: Регуляризація, така як викиди і регуляризація ваг, може допомогти уникнути перенавчання моделі.

Оптимізатори та швидкість навчання: Вибір оптимізатора і рівня швидкості навчання може впливати на збіжність моделі. Adam часто є хорошим вибором, але інші оптимізатори, такі як RMSprop або SGD, також варто спробувати.

Збільшення даних: Збільшення навчальних даних за допомогою аугментації може покращити точність моделі.

Ансамблі моделей: Використання ансамблів декількох моделей (наприклад, згорткових мереж) може підвищити точність класифікації.

Гіперпараметри: Експериментуйте з іншими гіперпараметрами, такими як кількість епох навчання, розмір пакету (batch size) і так далі.

In [1]:
import numpy as np
import tensorflow as tf
from tensorflow.keras import datasets, layers, models
from tensorflow.keras.applications import VGG16
import matplotlib.pyplot as plt

In [3]:
# Завантаження та підготовка даних
(train_images, train_labels), (test_images, test_labels) = datasets.fashion_mnist.load_data()
train_images = np.expand_dims(train_images, axis=-1)
test_images = np.expand_dims(test_images, axis=-1)

In [4]:
# Збільшення розміру зображень з 28x28 до 48x48 та додавання каналу RGB
train_images = tf.image.grayscale_to_rgb(tf.image.resize(train_images, (48, 48)))
test_images = tf.image.grayscale_to_rgb(tf.image.resize(test_images, (48, 48)))

In [5]:
# Масштабування пікселів до діапазону [0, 1]
train_images, test_images = train_images / 255.0, test_images / 255.0

In [6]:
# Згорткова основа VGG16
vgg_base = VGG16(weights='imagenet',
                 include_top=False,
                 input_shape=(48, 48, 3))  # Змініть розмір входу на (48, 48, 3)

In [7]:
# Створення моделі
model = models.Sequential()
model.add(vgg_base)  # Додавання VGG16 як згорткової основи
model.add(layers.Flatten())
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(256, activation='relu'))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(10, activation='softmax'))

In [8]:
# Замороження згорткової основи (опціонально)
# vgg_base.trainable = False

In [9]:
# Компіляція моделі
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [10]:
# Навчання моделі з більшою кількістю епох
history = model.fit(train_images, train_labels, epochs=30,
                    validation_data=(test_images, test_labels))

Epoch 1/30
   3/1875 [..............................] - ETA: 1:30:07 - loss: 3.7297 - accuracy: 0.0938

KeyboardInterrupt: ignored

In [None]:
# Оцінка та візуалізація результатів
test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)
print("\nTest accuracy:", test_acc)

In [None]:
# Графік точності та втрат під час навчання

plt.plot(history.history['accuracy'], label='accuracy')
plt.plot(history.history['val_accuracy'], label='val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.ylim([0, 1])
plt.legend(loc='lower right')
plt.show()