Команда:
Власенко Наталия
Бурдаев Игорь
Сёмочкин Владимир
Набатов Арсений
Ян Цзяфэн
Датасет представляет из себя набор подводных аннотированных снимков(исходные изображения - dataset/images, аннотации - dataset/masks), всего 1525 изображений и 8 категорий объектов:
Язык программирования - Python
Разрешено использовать любую библиотеку для машинного обучения (PyTorch, TensorFlow, Keras и др.)
Необходимо создать модель для сегментации изображений с определением класса выделенной области
Измерить время работы модели на тестовом датасете и посчитать необходимые метрики
Запрещено использование готовых архитектур "из коробки" одной строчкой. В коде должны быть прописаны слои вашей модели
Метрики оценки качества сегментации:
IoU:
Per-class IoU:
IoU по каждому из 8 классов
Per-pixel accuracy:
Модель Unet, оптимизатор - SGD, lоss - cross_entropy, batch_size = 16, количество эпох - 20
Результаты на валидационной выборке:
Test IoU = 0.60
Test Channel IoU = [0.63, 0.58, 0.65, 0.60, 0.77, 0.57, 0.60, 0.62]
Test Pixel Accuracy = 0.75