# Dog Breed Convolutional Classificator with TensorFlow

## Подключение GoogleDrive (Для Google Colab)

In [None]:
from google.colab import drive
import shutil
import zipfile
import os
import pathlib
from PIL import Image
import tensorflow as tf
import numpy as np
from tensorflow import keras
from matplotlib import pyplot as plt

tf.test.gpu_device_name()

## Подключение GoogleDrive (Для Google Colab)

In [None]:
drive.mount('/content/drive')

## Загрузка набора данных из GoogleDrive

In [None]:
zip_file_path = '/content/drive/MyDrive/Datasets/StanfordDogs.zip'
shutil.copy(zip_file_path, '/content/')

unzip_dir = '/content/DogsVsCats/'
with zipfile.ZipFile('/content/StanfordDogs.zip', 'r') as zip_ref:
    zip_ref.extractall(unzip_dir)

print(os.listdir(unzip_dir))

## Импорт библиотек

In [1]:
import tensorflow as tf
import numpy as np
from tensorflow import keras
from matplotlib import pyplot as plt

tf.test.gpu_device_name()

''

## Валидация данных

In [None]:
def check_images(directory):
    for root, dirs, files in os.walk(directory):
        for file in files:
            if file.endswith('.jpg'):
                filepath = os.path.join(root, file)
                try:
                    img_raw = tf.io.read_file(filepath)
                    img = tf.io.decode_image(img_raw, channels=3)
                    img_jpeg = tf.io.encode_jpeg(tf.cast(img, tf.uint8))
                except (tf.errors.InvalidArgumentError, ValueError) as e:
                    print(f'Ошибка с изображением {filepath}: {e}')
                    os.remove(filepath)  # Удаление проблемного изображения


check_images(unzip_dir)

## Построение модели

Модель будет дообучаться на модели VGG16, обученной на основе набора данных ImageNet.

In [4]:
conv_base = keras.applications.vgg16.VGG16(
    weights='imagenet',
    include_top=False,
    input_shape=(180, 180, 3)
)

conv_base.trainable = False  # Заморозка ранее обученных весов

data_augmentation = keras.Sequential([
    keras.layers.RandomFlip('horizontal'),
    keras.layers.RandomRotation(0.1),
    keras.layers.RandomZoom(0.2)
])

inputs = keras.Input(shape=(180, 180, 3))
x = data_augmentation(inputs)
x = keras.applications.vgg16.preprocess_input(x)
x = conv_base(x)
x = keras.layers.Flatten()(x)
x = keras.layers.Dense(256)(x)
x = keras.layers.Dropout(0.5)(x)
outputs = keras.layers.Dense(1, activation='softmax')(x)
model = keras.Model(inputs, outputs)

model.summary()

На этапе компиляции используем стандартный оптимизатор `RMSprop`. Так как модель должна однозначно предсказывать несколько классов, используем функцию потерь `categorical_crossentropy`.

In [None]:
model.compile(
    loss='categorical_crossentropy',
    optimizer='rmsprop',
    metrics=['accuracy']
)

## Загрузка данных

In [None]:
train_dataset = keras.utils.image_dataset_from_directory(
    '/content/Staford_dogs/preprocessed_images',
    image_size=(180, 180),
    batch_size=32,
    validation_split=0.2,
    subset='training',
)
validation_dataset = keras.utils.image_dataset_from_directory(
    '/content/Staford_dogs/preprocessed_images',
    image_size=(180, 180),
    batch_size=32,
    validation_split=0.2,
    subset='validation',
)
test_dataset = validation_dataset.take(50)
val_ds = validation_dataset.skip(50)

## Обучение модели с выделением признаков

Создадим обратный вызов, чтобы автоматически остановить обучение и сохранить лучший вариант модели. Далее обучим модель на ранее подготовленных данных.

In [None]:
callbacks = [
    keras.callbacks.ModelCheckpoint(
        filepath='/content/drive/dogbreeds.keras',
        save_best_only=True,
        monitor='val_loss'
    ),
    keras.callbacks.EarlyStopping(
        monitor='val_accuracy',
		patience=10
    )
]

history = model.fit(
    train_dataset,
    epochs=50,
    validation_data=validation_dataset,
    callbacks=callbacks
)

## Визуализация обучения с выделением признаков

Построим графики изменения потерь и точности в процессе обучения модели.

In [None]:
accuracy = history.history['accuracy']
val_accuracy = history.history['val_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']
epochs = range(1, len(accuracy) + 1)
plt.plot(epochs, accuracy, 'go', label='Точность на этапе обучения')
plt.plot(epochs, val_accuracy, 'g', label='Точность на этапе проверки')
plt.title('Точность на этапах обучения и проверки')
plt.legend()
plt.figure()
plt.plot(epochs, loss, 'ro', label='Потери на этапе обучения')
plt.plot(epochs, val_loss, 'r', label='Потери на этапе проверки')
plt.title('Потери на этапах обучения и проверки')
plt.legend()
plt.show()

## Дообучение с заморозкой определенных весов

In [None]:
conv_base.trainable = True
for layer in conv_base.layers[:-4]:
	layer.trainable = False

model.compile(
	loss='categorical_crossentropy',
	optimizer=keras.optimizers.RMSprop(learning_rate=1e-5),  # Низкая скорость обучения
	metrics=['accuracy']
)

history = model.fit(
    train_dataset,
	epochs=30,
	validation_data=validation_dataset,
	callbacks=callbacks
)

## Визуализация дообучения с заморозкой параметров

Построим графики изменения потерь и точности в процессе обучения модели.

In [None]:
accuracy = history.history['accuracy']
val_accuracy = history.history['val_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']
epochs = range(1, len(accuracy) + 1)

plt.clf()
plt.plot(epochs, accuracy, 'go', label='Точность на этапе обучения')
plt.plot(epochs, val_accuracy, 'g', label='Точность на этапе проверки')
plt.title('Точность на этапах обучения и проверки')
plt.legend()
plt.figure()
plt.plot(epochs, loss, 'ro', label='Потери на этапе обучения')
plt.plot(epochs, val_loss, 'r', label='Потери на этапе проверки')
plt.title('Потери на этапах обучения и проверки')
plt.legend()
plt.show()

## Тестирование модели

In [None]:
test_model = keras.models.load_model('/content/drive/dogbreeds.keras')
test_loss, test_acc = test_model.evaluate(test_dataset)
print(f'Test accuracy: {test_acc:.3f}')