In [None]:
# This Python 3 environment comes with many helpful analytics libraries installed
# It is defined by the kaggle/python Docker image: https://github.com/kaggle/docker-python
# For example, here's several helpful packages to load

import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

# Input data files are available in the read-only "../input/" directory
# For example, running this (by clicking run or pressing Shift+Enter) will list all files under the input directory

import os
#for dirname, _, filenames in os.walk('/kaggle/input'):
#    for filename in filenames:
#        print(os.path.join(dirname, filename))

# You can write up to 20GB to the current directory (/kaggle/working/) that gets preserved as output when you create a version using "Save & Run All" 
# You can also write temporary files to /kaggle/temp/, but they won't be saved outside of the current session

In [None]:
df = pd.read_csv("../input/cassava-leaf-disease-classification/train.csv")

# Выгрузка модели

In [None]:
!pip install -q efficientnet >> /dev/null

In [None]:
import math, re, os
import random
import tensorflow as tf
import numpy as np
import pandas as pd
from sklearn.model_selection import KFold
import matplotlib.pyplot as plt
from kaggle_datasets import KaggleDatasets
from tensorflow import keras
from functools import partial
from tensorflow.keras import backend as K
from sklearn.model_selection import train_test_split
print("Tensorflow version " + tf.__version__)
import efficientnet.tfkeras as efn
from sklearn.metrics import accuracy_score
from collections import Counter
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Смешанная точность 
это использование в модели во время обучения как 16-битных, так и 32-битных типов с плавающей запятой, чтобы она работала быстрее и использовала меньше памяти

In [None]:
from tensorflow.keras import mixed_precision
policy = mixed_precision.experimental.Policy('mixed_bfloat16')
mixed_precision.experimental.set_policy(policy)

# Подключение к TPU

In [None]:
try:
    tpu = tf.distribute.cluster_resolver.TPUClusterResolver()
    print('Device:', tpu.master())
    tf.config.experimental_connect_to_cluster(tpu)
    tf.tpu.experimental.initialize_tpu_system(tpu)
    strategy = tf.distribute.experimental.TPUStrategy(tpu)
    DEVICE = "TPU"
except:
    DEVICE = "notTPU"
    strategy = tf.distribute.get_strategy()
print('Number of replicas:', strategy.num_replicas_in_sync)

# Параметры

In [None]:

cfg = {"smoothing":0.00, #сглаживание
       "arch_fn":efn, #импортированная модель
      "name": ["EfficientNetB7"],# модель - EfficientNet; B(1-7) виды сеток модели
      "num_class":5, #
       "epochs":50,#кол-во эпох модели
       "kfold":5,#кросс-валидация 
       "seed":42,
       "verbose":2,#тип вывода во время обучения модели(бегущая стрелочка)
      # augmentation
       "resize":512,#изменение размера изображения
       "crop_size":500,#обрезание изображения
       "rotation":180.0,#поворот изображения
       "shear":2.0,#сдвиг 
       "h-zoom":5.0,
       "w-zoom":5.0,
       "h-shift":5.0,#вроде тоже сдвиг
       "w-shift":5.0
      }
AUTOTUNE = tf.data.experimental.AUTOTUNE #для одновременной загрузки изображений автоматическая настройка времени выполнения tf.data
GCS_PATH = KaggleDatasets().get_gcs_path("cassavatfrecords512x512q100")
REPLICAS =  strategy.num_replicas_in_sync #для распределенного обучения
FILENAMES = tf.io.gfile.glob(GCS_PATH + '/ld_train*.tfrec') #для работы с каждым файлом .tfrec
BATCH_SIZE = 32 * strategy.num_replicas_in_sync#отдельно вычисляемая единица
IMAGE_SIZE = [512, 512]#размер изображений
AUGMENT = {}

In [None]:
FILENAMES, len(FILENAMES)

# детерминированные алгоритмы конвуляции

In [None]:
os.environ['TF_CUDNN_DETERMINISTIC'] = '1'
random.seed(cfg["seed"])
np.random.seed(cfg["seed"])
tf.random.set_seed(cfg["seed"])

# Загрузка данных


In [None]:
def read_tfrecord(example, labeled, return_image_name=False):
    tfrecord_format = { #задаем форматы(типы) для значений в .tfrec 
        "image": tf.io.FixedLenFeature([], tf.string),
        "target": tf.io.FixedLenFeature([], tf.int64),
        "image_name": tf.io.FixedLenFeature([], tf.string)
    } if labeled else {
        "image": tf.io.FixedLenFeature([], tf.string),
        "image_name": tf.io.FixedLenFeature([], tf.string)
    }
    example = tf.io.parse_single_example(example, tfrecord_format) #возвращает имена функций отображения словаря в тензор со значениям
    image = decode_image(example['image'])
    if labeled:
        label = tf.cast(example['target'], tf.int32)#перевод из одного типа в другой
        if return_image_name:
            return image, tf.reshape(tf.one_hot([label], depth=cfg["num_class"], axis=-1), [-1]), example["image_name"]
        return image, tf.reshape(tf.one_hot([label], depth=cfg["num_class"], axis=-1), [-1])
    idnum = example['image_name']
    return image, idnum

def decode_image(image):
    image = tf.image.decode_jpeg(image, channels=3)#Декодируйте изображение в формате JPEG на тензор uint8
    image = tf.cast(image, tf.float32) / 255.0 #преобразование из одного типа в другой
    image = tf.reshape(image, [*IMAGE_SIZE, 3])#изменение размера...reshape собсна
    return image

In [None]:
def load_dataset(filenames, labeled=True, ordered=False, return_image_name=False):
    ignore_order = tf.data.Options()#для того чтобы задавать параметры tf.data
    if not ordered:
        ignore_order.experimental_deterministic = False # отключаем порядок, увеличиваем скорость. Пишем, если используем dataset.map или tf.data.Dataset.interleave 
    dataset = tf.data.TFRecordDataset(filenames, num_parallel_reads=AUTOTUNE) # автоматически чередует чтения из нескольких файлов
    dataset = dataset.with_options(ignore_order) # использует данные, как только они поступают, а не в их первоначальном порядке.
    dataset = dataset.map(partial(read_tfrecord, labeled=labeled, return_image_name=return_image_name), num_parallel_calls=AUTOTUNE)
    return dataset

In [None]:
def get_training_dataset(filenames, return_image_name=False):
    dataset = load_dataset(filenames, labeled=True, return_image_name=return_image_name)  
    dataset = dataset.map(data_augment, num_parallel_calls=AUTOTUNE)  
    dataset = dataset.repeat()#должен повторно инициализировать восходящие наборы данных
    dataset = dataset.shuffle(2048)#перетасовываем датасет
    dataset = dataset.batch(BATCH_SIZE)
    dataset = dataset.prefetch(AUTOTUNE)
    return dataset

In [None]:
def get_validation_dataset(filenames, ordered=True, return_image_name=False):
    dataset = load_dataset(filenames, labeled=True, ordered=ordered, return_image_name=return_image_name)
    dataset = dataset.batch(BATCH_SIZE)
    dataset = dataset.cache()
    dataset = dataset.prefetch(AUTOTUNE)
    return dataset

def get_test_dataset(filenames, ordered=True):
    dataset = load_dataset(filenames, labeled=False, ordered=ordered)
    dataset = dataset.batch(BATCH_SIZE)
    dataset = dataset.prefetch(AUTOTUNE)
    return dataset

def count_data_items(filenames):
    n = [int(re.compile(r"-([0-9]*)\.").search(filename).group(1)) for filename in filenames]
    return np.sum(n)

# data aug


In [None]:
# https://www.kaggle.com/cdeotte/triple-stratified-kfold-with-tfrecords

def get_mat(rotation, shear, height_zoom, width_zoom, height_shift, width_shift):
    # возвращает 3х3 трансформационную матрицу, которая преобразует признаки
    
    # Конвертируем градусы в радианы
    rotation = math.pi * rotation / 180.
    shear    = math.pi * shear    / 180.

    def get_3x3_mat(lst):
        return tf.reshape(tf.concat([lst],axis=0), [3,3])
    
    # Крутим-вертим матрицу
    c1   = tf.math.cos(rotation)
    s1   = tf.math.sin(rotation)
    one  = tf.constant([1],dtype='float32')
    zero = tf.constant([0],dtype='float32')
    
    rotation_matrix = get_3x3_mat([c1,   s1,   zero, 
                                   -s1,  c1,   zero, 
                                   zero, zero, one])    
    # Срезаем матрицу
    c2 = tf.math.cos(shear)
    s2 = tf.math.sin(shear)    
    
    shear_matrix = get_3x3_mat([one,  s2,   zero, 
                                zero, c2,   zero, 
                                zero, zero, one])        
    # Зумим матрицу взад-вперед
    zoom_matrix = get_3x3_mat([one/height_zoom, zero,           zero, 
                               zero,            one/width_zoom, zero, 
                               zero,            zero,           one])    
    # Двигаем матрицу
    shift_matrix = get_3x3_mat([one,  zero, height_shift, 
                                zero, one,  width_shift, 
                                zero, zero, one])
    
    return K.dot(K.dot(rotation_matrix, shear_matrix), 
                 K.dot(zoom_matrix,     shift_matrix))


def transform(image, cfg):    
    # входное изображение - это одно изображение размером [dim,dim,3], а не партия [b,dim,dim,3].
    # вывод - изображение произвольно поворачивается, срезается, масштабируется и смещается.
    DIM = cfg["resize"]
    ROT_ = cfg["rotation"]
    SHR_ = cfg["shear"]
    HZOOM_ = cfg["h-zoom"]
    WZOOM_ = cfg["w-zoom"]
    HSHIFT_ = cfg["h-shift"]
    WSHIFT_ = cfg["w-shift"]
    
    
    
    XDIM = DIM%2 #fix for size 331
    
    rot = ROT_ * tf.random.normal([1], dtype='float32')
    shr = SHR_ * tf.random.normal([1], dtype='float32') 
    h_zoom = 1.0 + tf.random.normal([1], dtype='float32') / HZOOM_
    w_zoom = 1.0 + tf.random.normal([1], dtype='float32') / WZOOM_
    h_shift = HSHIFT_ * tf.random.normal([1], dtype='float32') 
    w_shift = WSHIFT_ * tf.random.normal([1], dtype='float32') 

    # получаем извращенную матрицу
    m = get_mat(rot,shr,h_zoom,w_zoom,h_shift,w_shift) 

    # LIST DESTINATION PIXEL INDICES
    x   = tf.repeat(tf.range(DIM//2, -DIM//2,-1), DIM)
    y   = tf.tile(tf.range(-DIM//2, DIM//2), [DIM])
    z   = tf.ones([DIM*DIM], dtype='int32')
    idx = tf.stack( [x,y,z] )
    
    # ROTATE DESTINATION PIXELS ONTO ORIGIN PIXELS
    idx2 = K.dot(m, tf.cast(idx, dtype='float32'))
    idx2 = K.cast(idx2, dtype='int32')
    idx2 = K.clip(idx2, -DIM//2+XDIM+1, DIM//2)
    
    # FIND ORIGIN PIXEL VALUES           
    idx3 = tf.stack([DIM//2-idx2[0,], DIM//2-1+idx2[1,]])
    d    = tf.gather_nd(image, tf.transpose(idx3))
        
    return tf.reshape(d,[DIM, DIM,3])



In [None]:
def data_augment(img, label):
    # Благодаря объявлению dataset.prefetch(AUTO) в следующей функции это 
    # происходит в основном бесплатно на TPU. 
    global cfg

    img = transform(img, cfg)
    img = tf.image.random_crop(img, [cfg['crop_size'], cfg['crop_size'], 3])
    img = tf.image.random_flip_left_right(img)
    img = tf.image.random_hue(img, 0.01)#Регулируем оттенок изображений RGB рандомно
    img = tf.image.random_saturation(img, 0.8, 1.2)#Регулируем насыщенность изображений RGB рандомно
    img = tf.image.random_contrast(img, 0.8, 1.2)#Регулируем контрастность изображения рандомно
    img = tf.image.random_brightness(img, 0.1)#Регулируем яркость изображения
    img = tf.image.resize(img, [cfg["resize"], cfg["resize"]] )
    return img, label

# Model

In [None]:


def get_model(cfg, name):
    model_input = tf.keras.Input(shape=(cfg['resize'], cfg['resize'], 3), name='inputs')
    constructor = getattr(cfg["arch_fn"], name)
    x = constructor(include_top=False, weights="imagenet", 
                        input_shape=(cfg['resize'], cfg['resize'], 3), 
                        pooling=None)(model_input)
    x = tf.keras.layers.GlobalAveragePooling2D(name='avg_pool')(x)
    x = tf.keras.layers.Dropout(0.3)(x)
    outputs = tf.keras.layers.Dense(cfg["num_class"], activation='softmax', name="outputs")(x)
    model = tf.keras.Model(model_input, outputs, name=name+'_{0}'.format(cfg["resize"]))
    for layer in model.layers[:-5]: #переобучаем изначально обученные слои
        layer.trainable = False
    return model

def compile_new_model(cfg, name):    
    with strategy.scope():
        model = get_model(cfg, name)

        losses = tf.keras.losses.CategoricalCrossentropy(label_smoothing = cfg['smoothing'])
        model.compile(
            optimizer = tf.keras.optimizers.Adam(lr=1e-3),
            loss      = losses,
            metrics   = tf.keras.metrics.CategoricalAccuracy()
        )
        
    return model

# TRAINING

In [None]:
oof_val_all = []
oof_target_all = []
for num_model in range(len(cfg["name"])):
    skf = KFold(n_splits=cfg["kfold"],shuffle=True,random_state=cfg["seed"])
    oof_val = []
    oof_target = []
    for fold,(train_idx, val_idx) in enumerate(skf.split(range(len(FILENAMES)))):
        print(f"## FOLD: {fold}")
        if DEVICE=='TPU':
            if tpu: 
                tf.tpu.experimental.initialize_tpu_system(tpu)

        # CREATE TRAIN AND VALIDATION SUBSETS

        filenames_tr = [FILENAMES[i] for i in train_idx]
        filenames_val = [FILENAMES[i] for i in val_idx]
        print(f"Training examples : {count_data_items(filenames_tr)} // Validation examples : {count_data_items(filenames_val)} // {val_idx}")
        ds_train = get_training_dataset(filenames_tr)
        ds_val = get_validation_dataset(filenames_val)


        # BUILD MODEL
        K.clear_session()
        with strategy.scope():
            model = compile_new_model(cfg, cfg['name'][num_model])


            # callbacks
            checkpoint = tf.keras.callbacks.ModelCheckpoint(cfg['name'][num_model]+'-fold-%i.h5'%fold, monitor='val_categorical_accuracy', verbose=2, save_best_only=True,
                save_weights_only=True, mode='max', save_freq='epoch')
            lr_reducer = tf.keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.67, patience=4, verbose=2, mode='auto',min_lr=1e-6)
            callbacks = [checkpoint, lr_reducer]
        # TRAIN
        print('Training...')

            
        history = model.fit(ds_train,epochs= cfg["epochs"], callbacks = callbacks, 
            steps_per_epoch=count_data_items(filenames_tr)/BATCH_SIZE//REPLICAS,
            validation_data=ds_val, verbose=1)
        print('Loading best model...')
        model.load_weights(cfg['name'][num_model]+'-fold-%i.h5'%fold)

        # prediction on val

        preds_val = model.predict(ds_val)
        oof_val.append(preds_val)                 

        oof_target.append( np.array([target.numpy().argmax() for img, target in iter(ds_val.unbatch())]) )

    oof_target = np.concatenate(oof_target)
    oof_val = np.concatenate(oof_val)
    
    oof_val_all.append(oof_val)
    oof_target_all.append(oof_target)

In [None]:
oof_target_all = np.stack(oof_target_all).astype(np.float32)
oof_val_all = np.stack(oof_val_all).astype(np.float32)

In [None]:
oof_target_all.shape, oof_val_all.shape, np.argmax(oof_val_all[num_model], axis=-1).shape

In [None]:
for num_model in range(len(cfg["name"])):
    print(f" {cfg['name'][num_model]} : {accuracy_score(oof_target_all[num_model], np.argmax(oof_val_all[num_model], axis=-1))}")

In [None]:
print(f" Average : {accuracy_score(oof_target_all[0], np.argmax(oof_val_all.mean(0), axis=1))}")

In [None]:
"""

JPEG_PATH = "../input/cassava-leaf-disease-classification/test_images"
def load_image(image_id):
    img = cv2.imread(os.path.join(JPEG_PATH, image_id))/255.0
    img = cv2.resize(img, (cfg["resize"], cfg["resize"])
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    return img
def generator(paths, batch_size=32):
    i=0
    while i < len(paths):
        batch = []
        for cpt in range(batch_size)):
            batch.append(load_image(paths[i+cpt]))
            if i + cpt >= len(paths):
                batch = np.stack(batch)
                i += batch_size
                yield batch
                break
        batch = np.stack(batch)
        i += batch_size
        yield batch
"""        

In [None]:
#submission = pd.read_csv("sample_submission.csv")
#paths = submission.image_id.values

In [None]:

#predict = model.predict_generator(generator(paths))

In [None]:

#submission["label"] = predict
#submission.to_csv("submission.csv", index=False)