homework1_TECHNOPARK #4

vBykoff · 2022-11-02T20:37:22Z

Архитектурные решения:
Проект имеет модульную структуру, основной код находится в папке src.
В папке src/model находятся 2 утилиты командной строки для train и predict:
train_model_pipeline и predict_model_pipeline
Конфигурируются они с помощью hydra, что очень удобно
Соответственно в папке tests тесты для модулей и скрипт для генерации синтетических данных для тестов,
а в data - исходные данные и предсказания

Самооценка:
+0)В описании к пулл реквесту описаны основные "архитектурные" и тактические решения, которые сделаны в вашей работе. В общем, описание того, что именно вы сделали и для чего, чтобы вашим ревьюерам было легче понять ваш код (1 балл)
+1)В пулл-реквесте проведена самооценка, распишите по каждому пункту выполнен ли критерий или нет и на сколько баллов(частично или полностью) (1 балл)
+2)Выполнено EDA, закоммитьте ноутбук в папку с ноутбуками (1 балл)
+3)Написана функция/класс для тренировки модели, вызов оформлен как утилита командной строки, записана в readme инструкцию по запуску (3 балла)
+4)Написана функция/класс predict (вызов оформлен как утилита командной строки), которая примет на вход артефакт/ы от обучения, тестовую выборку (без меток) и запишет предикт по заданному пути, инструкция по вызову записана в readme (3 балла)
+5)Проект имеет модульную структуру (2 балла)
+6)Использованы логгеры (2 балла)
+7)Написаны тесты на отдельные модули и на прогон обучения и predict (3 балла)
+8)Для тестов генерируются синтетические данные, приближенные к реальным (2 балла)
+9)Обучение модели конфигурируется с помощью конфигов в json или yaml, закоммитьте как минимум 2 корректные конфигурации, с помощью которых можно обучить модель (разные модели, стратегии split, preprocessing) (3 балла)
+10)Используются датаклассы для сущностей из конфига, а не голые dict (2 балла)
+11)Напишите кастомный трансформер и протестируйте его (3 балла)
+12)В проекте зафиксированы все зависимости (1 балл)
13)Настроен CI для прогона тестов, линтера на основе github actions (3 балла

Доп
+14)Используйте hydra для конфигурирования (https://hydra.cc/docs/intro/) - 3 балла

bulaevvi

Замечания:
п.3: описанная redme команда не корретная, минус 1 балл
п.4: в readme не записана инструкция по вызову, минус 1 балл

Итого 30 баллов. Делайте merge

vBykoff added 11 commits October 30, 2022 15:46

hw1

807767e

add tests

873f0e1

add tests

edd8188

add ci

1e3b046

Update README.md

3a9d99c

Update README.md

f625d9d

Update CI

7459018

Update CI

a8f35ea

Update CI

9259688

Update CI

fc6d378

Update CI

c7824f0

vBykoff requested a review from Mikhail-M November 2, 2022 20:37

bulaevvi requested review from bulaevvi and removed request for Mikhail-M November 12, 2022 10:18

bulaevvi self-assigned this Nov 12, 2022

bulaevvi approved these changes Nov 12, 2022

View reviewed changes

vBykoff merged commit 77327ce into main Nov 15, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

homework1_TECHNOPARK #4

homework1_TECHNOPARK #4

vBykoff commented Nov 2, 2022

bulaevvi left a comment

homework1_TECHNOPARK #4

homework1_TECHNOPARK #4

Conversation

vBykoff commented Nov 2, 2022

bulaevvi left a comment

Choose a reason for hiding this comment