In [None]:
import cv2
import numpy as np
import tensorflow as tf
from tensorflow.keras.applications import MobileNetV2

import os
from random import shuffle
from glob import glob

from matplotlib import pyplot as plt

print(tf.__version__)
print(tf.executing_eagerly())

In [None]:
IMG_SIZE = (224, 224)  # размер входного изображения сети

train_files = glob('.data/train_sample/*.jpg')
test_files = glob('.data/test_sample/*.jpg')

In [None]:
from tensorflow.keras.applications.mobilenet_v2 import preprocess_input
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D
from tensorflow.keras.models import Model

def load_image(path):
    img = cv2.imread(path)[..., ::-1]
    img = cv2.resize(img, IMG_SIZE)
    return preprocess_input(img)


In [None]:
# функция-генератор загрузки обучающих данных с диска
def fit_generator(files, batch_size=32):
    if len(files) == 0:
        raise ValueError("Empty file list passed to generator")

    batch_size = min(batch_size, len(files))
    if batch_size == 0:
        raise ValueError("batch_size became zero")

    while True:
        shuffle(files)
        for k in range(len(files) // batch_size):
            i = k * batch_size
            j = i + batch_size
            if j > len(files):
                j = - j % len(files)
            x = np.array([load_image(path) for path in files[i:j]])
            y = np.array([1. if os.path.basename(path).startswith('dog') else 0.
                          for path in files[i:j]])
            yield x, y

In [None]:
def predict_generator(files):
    while True:
        for path in files:
            x = np.array([load_image(path)])
            yield (x,)


##Визуализируем примеры для обучения

In [None]:
%matplotlib inline
from matplotlib import pyplot as plt
fig = plt.figure(figsize=(16, 8))
for i, path in enumerate(train_files[:10], 1):
    subplot = fig.add_subplot(2, 5, i)
    subplot.set_title('%s' % path.split('/')[-1])
    img = cv2.imread(path)[...,::-1]
    img = cv2.resize(img, IMG_SIZE)
    plt.imshow(img)

## Загружаем предобученную модель

In [None]:
base_model = MobileNetV2(
    weights='imagenet',
    include_top=False,
    input_shape=(IMG_SIZE[0], IMG_SIZE[1], 3)
)

In [None]:
base_model.summary()

In [None]:
# фиксируем все веса предобученной сети
for layer in base_model.layers:
    layer.trainable = False

x = base_model.layers[-5].output
x = tf.keras.layers.Flatten()(x)
x = tf.keras.layers.Dense(1,  # один выход (бинарная классификация)
                          activation='sigmoid',  # функция активации  
                          kernel_regularizer=tf.keras.regularizers.l1(1e-4))(x)

model = tf.keras.Model(inputs=base_model.input, outputs=x, name='dogs_vs_cats')

## Выводим архитектуру модели

In [None]:
model.summary()

## Компилируем модель и запускаем обучение

In [None]:
model.compile(
    optimizer='adam',
    loss='binary_crossentropy',
    metrics=['accuracy']
)

In [None]:
val_samples = 50  # число изображений в валидационной выборке

shuffle(train_files)  # перемешиваем обучающую выборку
validation_data = next(fit_generator(train_files[:val_samples], val_samples))
train_data = fit_generator(train_files[val_samples:])  # данные читаем функцией-генератором

# запускаем процесс обучения
model.fit(train_data,
          steps_per_epoch=10,  # число вызовов генератора за эпоху
          epochs=100,  # число эпох обучения
          validation_data=validation_data)

## Предсказания на проверочной выборке

In [None]:
test_pred = model.predict(
    predict_generator(test_files),
    steps=len(test_files)
)


In [None]:
fig = plt.figure(figsize=(12, 6))
for i, (path, score) in enumerate(zip(test_files[:6], test_pred[:6]), 1):
    ax = fig.add_subplot(2, 3, i)
    img = cv2.imread(path)[..., ::-1]
    img = cv2.resize(img, IMG_SIZE)
    ax.imshow(img)
    ax.set_title(f'{score[0]:.2f}')
    ax.axis('off')


## Готовим данные для отправки

In [None]:
import re

with open('submit.txt', 'w') as f:
    f.write('id,label\n')
    for path, score in zip(test_files, test_pred):
        img_id = re.search(r'(\d+)\.jpg$', path).group(1)
        f.write(f'{img_id},{score[0]}\n')
