In [1]:
import os
import shutil
import pandas as pd
import matplotlib as plt

In [2]:
import tensorflow as tf
from tensorflow.keras.preprocessing import image_dataset_from_directory
from tensorflow.keras import layers

## Датасет

Прежде чем разбираться с моделями, нам надо в первую очередь разобраться с тем, как грузить датасет. Давайте напишем класс в торче для этого.

In [3]:
# Объявляем переменные файлов и папки
DIR_TRAIN = "../train/train/"
DIR_TEST = "../test/test/"

PATH_TRAIN = "../train/train.csv"
PATH_TEST = "../test/test.csv"

In [4]:
# Открываем маппинг изображений и классов
train_map = pd.read_csv(PATH_TRAIN)
test_map = pd.read_csv(PATH_TEST)

In [76]:
# Создаем папки для классификации
for label in train_map['class'].value_counts().index:
    os.makedirs(DIR_TRAIN + str(int(label)))

In [77]:
# Создаем папки для классификации
for label in train_map['class'].value_counts().index:
    os.makedirs(DIR_TEST + str(int(label)))

In [71]:
# Перемещаем файлы по папкам классов
def move_file(files_dir, file, category):
    shutil.move(files_dir + file, files_dir + f"{int(category)}/" + file)
    
train_map.apply(lambda x: move_file(DIR_TRAIN, x['ID_img'], x['class']), axis = 1)
test_map.apply(lambda x: move_file(DIR_TEST, x['ID_img'], x['class']), axis = 1)

In [5]:
IMG_SIZE = 256

In [6]:
ds_train = image_dataset_from_directory(
    DIR_TRAIN,
    labels='inferred',
    label_mode='int',
    image_size=[IMG_SIZE, IMG_SIZE],
    batch_size=16,
    interpolation="bilinear",
    shuffle=True,
)

Found 4990 files belonging to 8 classes.


In [7]:
ds_valid = image_dataset_from_directory(
    DIR_TEST,
    labels='inferred',
    label_mode='int',
    image_size=[IMG_SIZE, IMG_SIZE],
    batch_size=16,
    interpolation="bilinear",
    shuffle=True,
)

Found 2138 files belonging to 8 classes.


In [8]:
model = tf.keras.Sequential([
    
#     layers.Rescaling(1./255),
    # Block One
    layers.Conv2D(filters=32, kernel_size=3, activation='relu', padding='same',
                  input_shape=[IMG_SIZE, IMG_SIZE, 3]),
    layers.MaxPool2D(),

    # Block Two
    layers.Conv2D(filters=64, kernel_size=3, activation='relu', padding='same'),
    layers.MaxPool2D(),

    # Block Three
    layers.Conv2D(filters=128, kernel_size=3, activation='relu', padding='same'),
    layers.Conv2D(filters=128, kernel_size=3, activation='relu', padding='same'),
    layers.MaxPool2D(),

    # Head
    layers.Flatten(),
    layers.Dense(6, activation='relu'),
    layers.Dropout(0.2),
    layers.Dense(8, activation='softmax'),
])

In [9]:
model.compile(
    optimizer=tf.keras.optimizers.Adam(epsilon=0.01),
    loss = 'SparseCategoricalCrossentropy',
    metrics = ['SparseCategoricalAccuracy']
)

In [None]:
history = model.fit(
    ds_train,
    validation_data=ds_valid,
    epochs=50,
)

Epoch 1/50
