$\color{ORANGE}{\text{U-NET IN STEEL   }}$

# Цели и задачи
**Описание ноутбука**
- В ноутбуке запустила небольшую сеть Unet и предобученную Small-YOLO. 
- Результаты фиксировала в https://wandb.ai/eliseeva/severstal

**Выводы**
- Базовая Unet дала лучший результат. 

**Что еще можно сделать**
- Можно попробовать улучшить, увеличив количество эпох.
- В дальнейшем можно добавить callbacks (ReduceLROnPlateau), определить lr (1e-3), добавить метрики (Dice Loss, IoU Loss, pixel_accuracy), поменять loss.
- Попробовать https://www.tensorflow.org/tutorials/keras/keras_tuner.
- Перенести DeeplabV3Plus и tiramisu, Unet('resnet34')

# Загружаем данные и необходимые модули

In [None]:
#добавляем библиотеки
import os
import json

import cv2
import keras
from keras import backend as K
from keras.models import Model
from keras.layers import Input
from keras.layers.convolutional import Conv2D, Conv2DTranspose
from keras.layers.pooling import MaxPooling2D
from keras.layers.merge import concatenate
from keras.losses import binary_crossentropy
from keras.callbacks import Callback, ModelCheckpoint
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from tqdm import tqdm
from sklearn.model_selection import train_test_split
from glob import glob

%matplotlib inline
import numpy as np
import pandas as pd
import cv2
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
import os
import keras
from keras.preprocessing.image import ImageDataGenerator
from keras import backend as K
from keras.layers import GlobalAveragePooling2D, Dense, Conv2D, BatchNormalization, Dropout
from keras.models import Model, load_model 
import gc
!pip install segmentation-models
!pip install git+https://github.com/qubvel/segmentation_models


In [2]:
# загружаем данные
trainImgPath = "/kaggle/input/severstal-steel-defect-detection/train_images/"
trainCsv = "/kaggle/input/severstal-steel-defect-detection/train.csv"
data=pd.read_csv(trainCsv)
data.ClassId=data.ClassId.astype(int)

train_Img_Id = []
train_class_Id = []
for i in os.listdir(trainImgPath):
    for j in range(1,5):
        train_Img_Id.append(i)
        train_class_Id.append(j)
train_Imgs = pd.DataFrame({'ImageId':train_Img_Id,'ClassId':train_class_Id})
train_Imgs.head(10)
 

# Подготовка к обучению

Так как одно изображение может использоваться для разных дефектов, то мы подготовим новую таблицу, в которой сделаем объединение по изображению и укажем координаты пискселей с дефектами.

In [3]:
train_data = pd.merge(train_Imgs,data ,how='outer', on=['ImageId','ClassId']) 
train_data = train_data.fillna('') 
train_data

In [4]:
train_data = pd.pivot_table(train_data, values='EncodedPixels', index='ImageId',columns='ClassId', aggfunc=np.sum).astype(str)
train_data = train_data.reset_index() # add Index column to one level with classID   
train_data.columns = ['ImageId','Defect_1','Defect_2','Defect_3','Defect_4'] 
has_defect = []
stratify = []
for index,row in train_data.iterrows():
    if row.Defect_1 or row.Defect_2 or row.Defect_3 or row.Defect_4: 
        has_defect.append(1)
    else:
        has_defect.append(0) 
    if row.Defect_1 != '':
        stratify.append(1)
    elif row.Defect_2 != '':
        stratify.append(2)
    elif row.Defect_3:
        stratify.append(3)
    elif row.Defect_4:
        stratify.append(4)
    else:
        stratify.append(0)
        
train_data["has_defect"] = has_defect 
train_data["stratify"] = stratify 

train_data.head(5) 

In [5]:
# вынести рандом стейт или сделать shuffle=True
WIDTH=288
HEIGHT=288
TRAINING_SIZE=7095

x_train, x_test = train_test_split(train_data, test_size = 0.1, stratify=train_data['stratify'], random_state=42)
x_train, x_val = train_test_split(x_train, test_size = 0.2, stratify = x_train['stratify'], random_state=42)
print(x_train.shape, x_val.shape, x_test.shape) 

In [6]:
# разделим выборку на тестовую, обучающую и валидационную
x_train_classification = x_train[['ImageId','has_defect']]
x_val_classification = x_val[['ImageId','has_defect']]
x_test_classification = x_test[['ImageId','has_defect']] 
print(x_train_classification.shape , x_val_classification.shape,x_test_classification.shape)
x_train_classification.head()

In [7]:
# подготовим генератор для аугментации данных
from keras.preprocessing.image import ImageDataGenerator 
train_datagen = ImageDataGenerator(rescale=1./255., shear_range=0.2, zoom_range=0.05, rotation_range=5,
                           width_shift_range=0.2, height_shift_range=0.2, horizontal_flip=True, vertical_flip=True)

test_datagen = ImageDataGenerator(rescale=1./255)

train_data_generator = train_datagen.flow_from_dataframe(
        dataframe=x_train_classification.astype(str),
        directory=trainImgPath,
        x_col="ImageId",
        y_col="has_defect",
        target_size=(WIDTH,HEIGHT),
        batch_size=16,
        class_mode='binary') 

valid_data_generator = test_datagen.flow_from_dataframe(
        dataframe=x_val_classification.astype(str),
        directory=trainImgPath,
        x_col="ImageId",
        y_col="has_defect",
        target_size=(WIDTH,HEIGHT),
        batch_size=16,
        class_mode='binary') 

# Обучение

## UNet

In [None]:
# импортируем wandb для наблюдения за обучением
import wandb
from wandb.keras import WandbCallback
wandb.init(project="severstal", entity="eliseeva")


In [None]:
wandb.config = {
#   "learning_rate": 0.001,
  "epochs": 30,
  "batch_size": 16
}

In [None]:
# загружаем модель
Classification_Model = keras.applications.xception.Xception(include_top = False, input_shape = (HEIGHT,WIDTH,3))

layer = Classification_Model.output
layer = GlobalAveragePooling2D()(layer)

layer = Dense(1024, activation='relu')(layer)
layer = BatchNormalization()(layer)
layer = Dropout(0.3)(layer)

layer = Dense(512, activation='relu')(layer)
layer = BatchNormalization()(layer)
layer = Dropout(0.3)(layer)

layer = Dense(64, activation='relu')(layer)
predictions = Dense(1, activation='sigmoid')(layer)
model = Model(inputs=Classification_Model.input, outputs=predictions)
model.summary()

In [None]:
model.compile(optimizer='adam', loss='binary_crossentropy',metrics=['accuracy'])
Training = model.fit(train_data_generator, validation_data = valid_data_generator, callbacks=[WandbCallback()], epochs = 30, verbose=1)

Результаты обучения можно посмотреть здесь - https://wandb.ai/eliseeva/severstal, кривая base-Xeption. Максимальный результат по accuracy - 0.9334. По графику кажется, что можно увеличить количество эпох для лучшего результата. 

В дальнейшем можно добавить callbacks (ReduceLROnPlateau), определить lr (1e-3), добавить метрики (Dice Loss, IoU Loss, pixel_accuracy), поменять loss.
Попробовать https://www.tensorflow.org/tutorials/keras/keras_tuner

## Small-YOLO


In [None]:
# загружаем модель
base_model = keras.applications.Xception(input_shape=(288,288,3),include_top=False,weights="imagenet")

In [None]:
# замораживаем слои
for layer in base_model.layers[:-5]:
    layer.trainable=False

In [None]:
# строим модель
from keras.models import Sequential
from tensorflow.keras.layers import InputLayer, BatchNormalization, Dropout, Flatten, Dense, Activation, MaxPool2D

model=Sequential()
model.add(base_model)
model.add(Dropout(0.5))
model.add(Flatten())
model.add(Dense(256,activation="relu"))
model.add(Dropout(0.3))
model.add(Dense(128,activation="relu"))
model.add(Dropout(0.3))
model.add(Dense(256,activation="relu"))
model.add(Dense(4,activation="softmax"))

Предобученная Small-YOLO не дала прироста качества (кривая Small-YOLO). 