Варіант 1. Перевірений, працює

In [None]:
import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.applications import DenseNet121
from tensorflow.keras.datasets import cifar10
import matplotlib.pyplot as plt
import numpy as np



In [None]:
# Завантаження та підготовка даних
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

# Перетворення даних у формат float32 і нормалізація
x_train = tf.cast(x_train, tf.float32) / 255.0
x_test = tf.cast(x_test, tf.float32) / 255.0



In [None]:
# Завантаження DenseNet121 без верхніх шарів
base_model = DenseNet121(weights='imagenet', include_top=False, input_shape=(32, 32, 3))

# Заморожування всіх шарів базової моделі
for layer in base_model.layers:
    layer.trainable = False

# Створення моделі
model = models.Sequential([
    layers.Resizing(32, 32, input_shape=(32, 32, 3)),  # Для роботи з розмірами зображень
    base_model,
    layers.GlobalAveragePooling2D(),
    layers.Dense(256, activation='relu'),
    layers.Dropout(0.3),
    layers.Dense(10, activation='softmax')  # Зміна активації на 'softmax' для класифікації з кількома класами
])



In [None]:
# Компіляція моделі
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001),
              loss='categorical_crossentropy',  # Зміна на 'categorical_crossentropy' для one-hot міток
              metrics=['accuracy'])

# Виведення структури моделі
model.summary()

# Колбеки для ранньої зупинки
early_stopping = tf.keras.callbacks.EarlyStopping(
    monitor='val_loss',  # Моніторинг втрат на валідаційних даних
    patience=10,         # Кількість епох для очікування без покращення
    restore_best_weights=True  # Відновлення найкращих ваг
)

# Перетворення міток у формат one-hot для 'categorical_crossentropy'
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_test = tf.keras.utils.to_categorical(y_test, 10)

# Тренування моделі
history = model.fit(
    x_train, y_train,
    validation_data=(x_test, y_test),
    epochs=50,
    batch_size=32,
    callbacks=[early_stopping]
)



In [None]:
# Візуалізація графіків тренування (опційно)
plt.plot(history.history['accuracy'], label='accuracy')
plt.plot(history.history['val_accuracy'], label = 'val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.ylim([0, 1])
plt.legend(loc='lower right')
plt.show()

Варіант 2. Замороження частини шарів

In [None]:
import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.applications import DenseNet121
from tensorflow.keras.datasets import cifar10
import matplotlib.pyplot as plt
import numpy as np

# Завантаження та підготовка даних
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

# Перетворення даних у формат float32 і нормалізація
x_train = tf.cast(x_train, tf.float32) / 255.0
x_test = tf.cast(x_test, tf.float32) / 255.0

# Завантаження DenseNet121 без верхніх шарів
base_model = DenseNet121(weights='imagenet', include_top=False, input_shape=(32, 32, 3))

# Визначення кількості шарів базової моделі
num_layers = len(base_model.layers)

# Заморожування всіх шарів, крім останніх 4
for layer in base_model.layers[:-4]:
    layer.trainable = False

# Створення моделі
model = models.Sequential([
    layers.Resizing(32, 32, input_shape=(32, 32, 3)),  # Для роботи з розмірами зображень
    base_model,
    layers.GlobalAveragePooling2D(),
    layers.Dense(256, activation='relu'),
    layers.Dropout(0.3),
    layers.Dense(10, activation='softmax')  # Зміна активації на 'softmax' для класифікації з кількома класами
])

# Компіляція моделі
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001),
              loss='categorical_crossentropy',  # Зміна на 'categorical_crossentropy' для one-hot міток
              metrics=['accuracy'])

# Виведення структури моделі
model.summary()

# Колбеки для ранньої зупинки
early_stopping = tf.keras.callbacks.EarlyStopping(
    monitor='val_loss',  # Моніторинг втрат на валідаційних даних
    patience=10,         # Кількість епох для очікування без покращення
    restore_best_weights=True  # Відновлення найкращих ваг
)

# Перетворення міток у формат one-hot для 'categorical_crossentropy'
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_test = tf.keras.utils.to_categorical(y_test, 10)

# Тренування моделі
history = model.fit(
    x_train, y_train,
    validation_data=(x_test, y_test),
    epochs=50,
    batch_size=32,
    callbacks=[early_stopping]
)

# Візуалізація графіків тренування (опційно)
plt.plot(history.history['accuracy'], label='accuracy')
plt.plot(history.history['val_accuracy'], label = 'val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.ylim([0, 1])
plt.legend(loc='lower right')
plt.show()


Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
[1m170498071/170498071[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/densenet/densenet121_weights_tf_dim_ordering_tf_kernels_notop.h5
[1m29084464/29084464[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step


  super().__init__(**kwargs)


Epoch 1/50
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m278s[0m 167ms/step - accuracy: 0.4617 - loss: 1.5586 - val_accuracy: 0.6199 - val_loss: 1.1060
Epoch 2/50
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m253s[0m 161ms/step - accuracy: 0.5942 - loss: 1.1478 - val_accuracy: 0.6347 - val_loss: 1.0400
Epoch 3/50
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m266s[0m 164ms/step - accuracy: 0.6258 - loss: 1.0608 - val_accuracy: 0.6450 - val_loss: 1.0079
Epoch 4/50
[1m 546/1563[0m [32m━━━━━━[0m[37m━━━━━━━━━━━━━━[0m [1m2:18[0m 136ms/step - accuracy: 0.6465 - loss: 0.9883