# Классификация изображений (Car Classification)
## Unit 7 Project 5

### Основная идея решения: взять предобученую сеть и дообучить под задачу проекта; на основе рекомендаций улучшить качество модели. 

# Setup

In [None]:
# Проверяем GPU
!nvidia-smi

In [None]:
# Обновление pip
!pip install --upgrade pip
# Обновление tensorflow
!pip install tensorflow --upgrade
# Загрузка модели efficientnet
!pip install -q efficientnet
# Загружаем обвязку под keras для использования продвинутых библиотек аугментации, например, albuminations
!pip install git+https://github.com/mjkvaak/ImageDataAugmentor

In [None]:
# Загрузка необходимых библиотек
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import pickle
import zipfile
import csv
import sys
import os


import tensorflow as tf
import tensorflow.keras as keras
import tensorflow.keras.models as M
import tensorflow.keras.layers as L
import tensorflow.keras.backend as K
import tensorflow.keras.callbacks as C
from tensorflow.keras.preprocessing import image
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.callbacks import LearningRateScheduler, ModelCheckpoint, EarlyStopping
from tensorflow.keras.callbacks import Callback
from tensorflow.keras import optimizers
from tensorflow.keras.regularizers import l2
from tensorflow.keras.layers import *
from tensorflow.keras.models import Sequential
import efficientnet.tfkeras as efn


from ImageDataAugmentor.image_data_augmentor import *
import albumentations

from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

import PIL
from PIL import ImageOps, ImageFilter

# увеличим дефолтный размер графиков
from pylab import rcParams
rcParams['figure.figsize'] = 10, 5
# графики в svg выглядят более четкими
%config InlineBackend.figure_format = 'svg'
%matplotlib inline

print(os.listdir("../input"))
print('Python       :', sys.version.split('\n')[0])
print('Numpy        :', np.__version__)
print('Tensorflow   :', tf.__version__)
print('Keras        :', tf.keras.__version__)

In [None]:
!pip freeze > requirements.txt

In [None]:
# задаем настройки
EPOCHS = 20  # эпох на обучение 10
BATCH_SIZE = 8  # уменьшаем batch до 8 для работы с моделью EfficientNetB6
LR = 1e-4
VAL_SPLIT = 0.20  # сколько данных выделяем на тест = 20%

CLASS_NUM = 10  # количество классов в нашей задаче
IMG_SIZE = 320  # какого размера подаем изображения в сеть
IMG_CHANNELS = 3   # у RGB 3 канала
input_shape = (IMG_SIZE, IMG_SIZE, IMG_CHANNELS)

# пути актуальны для notebook в Kaggle
DATA_PATH = '../input/sf-dl-car-classification/'
PATH = "../working/car/"  # рабочая директория

In [None]:
# Устаналиваем конкретное значение random seed для воспроизводимости
# os.makedirs(PATH,exist_ok=False)

RANDOM_SEED = 42
np.random.seed(RANDOM_SEED)
PYTHONHASHSEED = 0

## EDA

In [None]:
train_df = pd.read_csv(DATA_PATH+"train.csv")
sample_submission = pd.read_csv(DATA_PATH+"sample-submission.csv")
train_df.head()

In [None]:
train_df.info()

In [None]:
train_df.Category.value_counts()
# распределение классов достаточно равномерное

In [None]:
# распаковывам исходные данные
print('Распаковываем картинки')
for data_zip in ['train.zip', 'test.zip']:
    with zipfile.ZipFile(DATA_PATH+data_zip, "r") as z:
        z.extractall(PATH)

print(os.listdir(PATH))

In [None]:
print('Пример картинок (random sample)')
plt.figure(figsize=(12, 8))

random_image = train_df.sample(n=9)
random_image_paths = random_image['Id'].values
random_image_cat = random_image['Category'].values

for index, path in enumerate(random_image_paths):
    im = PIL.Image.open(PATH+f'train/{random_image_cat[index]}/{path}')
    plt.subplot(3, 3, index+1)
    plt.imshow(im)
    plt.title('Class: '+str(random_image_cat[index]))
    plt.axis('off')
plt.show()

In [None]:
# образец изображения для анализа
# на основе данных образца определяем параметры изображений для дальнейшей обработки
image = PIL.Image.open(PATH+'/train/0/100380.jpg')
imgplot = plt.imshow(image)
plt.show()
image.size

# Подготовка данных

## Аугментация данных
В отличии от baseline используем более продвинутую библиотеку аугментации изображений
Параметны аугументации подбирались опытным путем в процессе работы над проектом

In [None]:
# после первых опытов был уменьшен лимит ротации и увеличены значеия кропа
AUGMENTATIONS = albumentations.Compose([
    albumentations.HorizontalFlip(p=0.5),
    albumentations.Rotate(limit=10, interpolation=1, border_mode=4,
                          value=None, mask_value=None, always_apply=False, p=0.5),
    albumentations.OneOf([
        albumentations.CenterCrop(height=240, width=320),
        albumentations.CenterCrop(height=320, width=240),
    ], p=0.5),
    albumentations.OneOf([
        albumentations.RandomBrightnessContrast(
            brightness_limit=0.3, contrast_limit=0.3),
        albumentations.RandomBrightnessContrast(
            brightness_limit=0.1, contrast_limit=0.1)
    ], p=0.5),
    albumentations.GaussianBlur(p=0.05),
    albumentations.HueSaturationValue(p=0.5),
    albumentations.RGBShift(p=0.5),
    albumentations.FancyPCA(alpha=0.1, always_apply=False, p=0.5),
    albumentations.Resize(IMG_SIZE, IMG_SIZE)
])

train_datagen = ImageDataAugmentor(
    rescale=1./255,
    augment=AUGMENTATIONS,
    validation_split=VAL_SPLIT,
)

test_datagen = ImageDataAugmentor(rescale=1./255)

## Generator's

In [None]:
# Завернем наши данные в генератор:

train_generator = train_datagen.flow_from_directory(
    PATH+'train/',      # директория где расположены папки с картинками
    target_size=(IMG_SIZE, IMG_SIZE),
    batch_size=BATCH_SIZE,
    class_mode='categorical',
    shuffle=True, seed=RANDOM_SEED,
    subset='training')  # set as training data

test_generator = train_datagen.flow_from_directory(
    PATH+'train/',
    target_size=(IMG_SIZE, IMG_SIZE),
    batch_size=BATCH_SIZE,
    class_mode='categorical',
    shuffle=True, seed=RANDOM_SEED,
    subset='validation')  # set as validation data

test_sub_generator = test_datagen.flow_from_dataframe(
    dataframe=sample_submission,
    directory=PATH+'test_upload/',
    x_col="Id",
    y_col=None,
    shuffle=False,
    class_mode=None,
    seed=RANDOM_SEED,
    target_size=(IMG_SIZE, IMG_SIZE),
    batch_size=BATCH_SIZE,)

In [None]:
# Пример изображений из генератора
from skimage import io


def imshow(image_RGB):
    io.imshow(image_RGB)
    io.show()


x, y = train_generator.next()
print('Пример картинок из train_generator')
plt.figure(figsize=(12, 8))

for i in range(0, 6):
    image = x[i]
    plt.subplot(3, 3, i+1)
    plt.imshow(image)
    #plt.title('Class: '+str(y[i]))
    # plt.axis('off')
plt.show()

## Model
За основу берем сеть EfficientNetB6

In [None]:
# строим модель на базе предобученной сети EfficientNetB6
base_model = efn.EfficientNetB6(
    weights='imagenet',
    include_top=False,
    input_shape=input_shape
)

In [None]:
base_model.summary()

In [None]:
# Заморозим веса imagenet в базовой модели, чтобы она работала в качестве feature extractor 
# и наша голова обучалась делать классификацию на наши 10 классов

base_model.trainable = False

Для повышения производительности и стабилизации работы добавляем в "новую голову" batch нормализацию

In [None]:
# Устанавливаем новую "голову" (head):
model = M.Sequential()
model.add(base_model)
model.add(L.GlobalAveragePooling2D(),)
model.add(L.Dense(512, activation='relu'))
model.add(L.BatchNormalization())  # добавляем Batch-нормализацию
model.add(L.Dropout(0.25))
model.add(L.Dense(CLASS_NUM, activation='softmax'))

In [None]:
model.summary()

In [None]:
# Check the trainable status of the individual layers
for layer in model.layers:
    print(layer, layer.trainable)

## Fit

In [None]:
LR = 1e-3
model.compile(loss="categorical_crossentropy",
              optimizer=optimizers.Adam(lr=LR), metrics=["accuracy"])

In [None]:
checkpoint = ModelCheckpoint('best_model.hdf5', monitor=[
                             'val_accuracy'], verbose=1, mode='max')
earlystop = EarlyStopping(monitor='val_accuracy',
                          patience=5, restore_best_weights=True)
callbacks_list = [checkpoint]

In [None]:
scores = model.evaluate_generator(test_generator, verbose=1)
print("Accuracy: %.2f%%" % (scores[1]*100))

###  Step1: Обучаем "голову"

In [None]:
history = model.fit_generator(
    train_generator,
    steps_per_epoch=len(train_generator),
    validation_data=test_generator,
    validation_steps=len(test_generator),
    epochs=EPOCHS,
    callbacks=callbacks_list
)

In [None]:
# сохраним итоговую сеть и подгрузим лучшую итерацию в обучении (best_model)
model.save('../working/model_step1.hdf5')
model.load_weights('best_model.hdf5')

In [None]:
scores = model.evaluate_generator(
    test_generator, steps=len(test_generator), verbose=1)
print("Accuracy: %.2f%%" % (scores[1]*100))

In [None]:
def plot_history(history):
    plt.figure(figsize=(10, 5))
    acc = history.history['accuracy']
    val_acc = history.history['val_accuracy']
    loss = history.history['loss']
    val_loss = history.history['val_loss']

    epochs = range(len(acc))

    plt.plot(epochs, acc, 'b', label='Training acc')
    plt.plot(epochs, val_acc, 'g', label='Validation acc')
    plt.title('Training and validation accuracy')
    plt.legend()

    # plt.figure()
    plt.figure(figsize=(10, 5))
    # plt.style.use('dark_background')
    plt.plot(epochs, loss, 'b', label='Training loss')
    plt.plot(epochs, val_loss, 'g', label='Validation loss')
    plt.title('Training and validation loss')
    plt.legend()

    plt.show()


plot_history(history)

### Step 2 : FineTuning, разморозка половины слоев базовой модели

In [None]:
print("Number of layers in the base model: ", len(base_model.layers))

In [None]:
base_model.trainable = True

# Fine-tune from this layer onwards
fine_tune_at = len(base_model.layers)//2

# Freeze all the layers before the `fine_tune_at` layer
for layer in base_model.layers[:fine_tune_at]:
    layer.trainable = False

In [None]:
len(base_model.trainable_variables)

In [None]:
# Check the trainable status of the individual layers
for layer in model.layers:
    print(layer, layer.trainable)

In [None]:
LR = 1e-4
model.compile(loss="categorical_crossentropy",
              optimizer=optimizers.Adam(lr=LR), metrics=["accuracy"])

In [None]:
model.summary()

In [None]:
scores = model.evaluate_generator(test_generator, verbose=1)
print("Accuracy: %.2f%%" % (scores[1]*100))

In [None]:
# Обучаем
history = model.fit_generator(
    train_generator,
    steps_per_epoch=train_generator.samples//train_generator.batch_size,
    validation_data=test_generator,
    validation_steps=test_generator.samples//test_generator.batch_size,
    epochs=EPOCHS,
    callbacks=callbacks_list
)

In [None]:
model.save('../working/model_step2.hdf5')
model.load_weights('best_model.hdf5')

In [None]:
scores = model.evaluate_generator(test_generator, verbose=1)
print("Accuracy: %.2f%%" % (scores[1]*100))

In [None]:
plot_history(history)

### Step 3 : размораживаем 75% базовой модели  
(на финише от этого этапа я отказался для оптизации времени исполнения notebook'а)

In [None]:
# base_model.trainable = True

In [None]:
# print("Number of layers in the base model: ", len(base_model.layers))

In [None]:
# base_model.trainable = True

# Fine-tune from this layer onwards
# fine_tune_at = len(base_model.layers)//4

# Freeze all the layers before the `fine_tune_at` layer
# for layer in base_model.layers[:fine_tune_at]:
#   layer.trainable =  False

In [None]:
# len(base_model.trainable_variables)

In [None]:
# LR = 1e-5
# model.compile(loss="categorical_crossentropy", optimizer=optimizers.Adam(lr=LR), metrics=["accuracy"])

In [None]:
# Обучаем
# history = model.fit_generator(
#        train_generator,
#        steps_per_epoch = train_generator.samples//train_generator.batch_size,
#        validation_data = test_generator,
#        validation_steps = test_generator.samples//test_generator.batch_size,
#        epochs = 10,
#        callbacks = callbacks_list
# )

In [None]:
# model.save('../working/model_step3.hdf5')
# model.load_weights('best_model.hdf5')

In [None]:
# scores = model.evaluate_generator(test_generator, verbose=1)
# print("Accuracy: %.2f%%" % (scores[1]*100))

In [None]:
# plot_history(history)

### Step 4: размораживаем базовую сеть полностью

In [None]:
base_model.trainable = True

In [None]:
len(base_model.trainable_variables)

In [None]:
LR = 1e-5
model.compile(loss="categorical_crossentropy",
              optimizer=optimizers.Adam(lr=LR), metrics=["accuracy"])

In [None]:
# Обучаем
history = model.fit_generator(
    train_generator,
    steps_per_epoch=train_generator.samples//train_generator.batch_size,
    validation_data=test_generator,
    validation_steps=test_generator.samples//test_generator.batch_size,
    epochs=EPOCHS,
    callbacks=callbacks_list
)

In [None]:
model.save('../working/model_step4.hdf5')
model.load_weights('best_model.hdf5')

In [None]:
scores = model.evaluate_generator(test_generator, verbose=1)
print("Accuracy: %.2f%%" % (scores[1]*100))

## Prediction

In [None]:
test_sub_generator = test_datagen.flow_from_dataframe(
    dataframe=sample_submission,
    directory=PATH+'test_upload/',
    x_col="Id",
    y_col=None,
    shuffle=False,
    class_mode=None,
    seed=RANDOM_SEED,
    target_size=(IMG_SIZE, IMG_SIZE),
    batch_size=BATCH_SIZE,)

In [None]:
test_sub_generator.samples

In [None]:
test_sub_generator.reset()
predictions = model.predict(
    test_sub_generator, steps=len(test_sub_generator), verbose=1)
predictions = np.argmax(predictions, axis=-1)  # multiple categories
label_map = (train_generator.class_indices)
label_map = dict((v, k) for k, v in label_map.items())  # flip k,v
predictions = [label_map[k] for k in predictions]

In [None]:
filenames_with_dir = test_sub_generator.filenames
submission = pd.DataFrame(
    {'Id': filenames_with_dir, 'Category': predictions}, columns=['Id', 'Category'])
submission['Id'] = submission['Id'].replace('test_upload/', '')
submission.to_csv('submission.csv', index=False)
print('Save submit')

##  TTA
Аугментируем тестовые изображения и сделаем несколько предсказаний одной картинки в разном виде. Взяв среднее значение из нескольких предсказаний получим итоговое предсказание(по факту результат с этой методикой получил хуже, поэтому в Kaggle были загружены результаты предыдущего этапа).

In [None]:
model.load_weights('best_model.hdf5')

In [None]:
test_datagen = ImageDataGenerator(
    rescale=1. / 255,
    rotation_range=30,
    shear_range=0.2,
    zoom_range=[0.75, 1.25],
    brightness_range=[0.5, 1.5],
    width_shift_range=0.1,
    height_shift_range=0.1,
    horizontal_flip=True
)

In [None]:
test_sub_generator = test_datagen.flow_from_dataframe(
    dataframe=sample_submission,
    directory=PATH+'test_upload/',
    x_col="Id",
    y_col=None,
    shuffle=False,
    class_mode=None,
    seed=RANDOM_SEED,
    target_size=(IMG_SIZE, IMG_SIZE),
    batch_size=BATCH_SIZE,)

In [None]:
tta_steps = 10
predictions = []

for i in range(tta_steps):
    preds = model.predict(test_sub_generator, steps=len(
        test_sub_generator), verbose=1)
    predictions.append(preds)

pred = np.mean(predictions, axis=0)

In [None]:
predictions = np.argmax(pred, axis=-1)  # multiple categories
label_map = (train_generator.class_indices)
label_map = dict((v, k) for k, v in label_map.items())  # flip k,v
predictions = [label_map[k] for k in predictions]

In [None]:
filenames_with_dir = test_sub_generator.filenames
submission = pd.DataFrame(
    {'Id': filenames_with_dir, 'Category': predictions}, columns=['Id', 'Category'])
submission['Id'] = submission['Id'].replace('test_upload/', '')
submission.to_csv('submission_tta.csv', index=False)
print('Save submit')

## Clean

In [None]:
# Clean PATH
import shutil
shutil.rmtree(PATH)

## Итоги:

1. Был применен transfer learning с fine-tuning.
2. Настройте LR.
3. При подготовке данных были подобраны: размер картинки, размер батча.
4. При обучение модели: была использована "другая сеть" EfficientNetB6, добавлена Batch Normalization, проведены эксперименты с архитектурой «головы», применена дополнительная функции callback в Keras, количество эпох увеличено до 20.
5. Добавлена TTA (Test Time Augmentation).
6. Добавлена более продвинутая библиотека аугментации изображений (albumentations). 
7. В соревновании Kaggle достигнут результат: 0.97393