Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

homework1_TECHNOPARK #4

Merged
merged 11 commits into from
Nov 15, 2022
Merged

homework1_TECHNOPARK #4

merged 11 commits into from
Nov 15, 2022

Conversation

vBykoff
Copy link
Collaborator

@vBykoff vBykoff commented Nov 2, 2022

Архитектурные решения:
Проект имеет модульную структуру, основной код находится в папке src.
В папке src/model находятся 2 утилиты командной строки для train и predict:
train_model_pipeline и predict_model_pipeline
Конфигурируются они с помощью hydra, что очень удобно
Соответственно в папке tests тесты для модулей и скрипт для генерации синтетических данных для тестов,
а в data - исходные данные и предсказания

Самооценка:
+0)В описании к пулл реквесту описаны основные "архитектурные" и тактические решения, которые сделаны в вашей работе. В общем, описание того, что именно вы сделали и для чего, чтобы вашим ревьюерам было легче понять ваш код (1 балл)
+1)В пулл-реквесте проведена самооценка, распишите по каждому пункту выполнен ли критерий или нет и на сколько баллов(частично или полностью) (1 балл)
+2)Выполнено EDA, закоммитьте ноутбук в папку с ноутбуками (1 балл)
+3)Написана функция/класс для тренировки модели, вызов оформлен как утилита командной строки, записана в readme инструкцию по запуску (3 балла)
+4)Написана функция/класс predict (вызов оформлен как утилита командной строки), которая примет на вход артефакт/ы от обучения, тестовую выборку (без меток) и запишет предикт по заданному пути, инструкция по вызову записана в readme (3 балла)
+5)Проект имеет модульную структуру (2 балла)
+6)Использованы логгеры (2 балла)
+7)Написаны тесты на отдельные модули и на прогон обучения и predict (3 балла)
+8)Для тестов генерируются синтетические данные, приближенные к реальным (2 балла)
+9)Обучение модели конфигурируется с помощью конфигов в json или yaml, закоммитьте как минимум 2 корректные конфигурации, с помощью которых можно обучить модель (разные модели, стратегии split, preprocessing) (3 балла)
+10)Используются датаклассы для сущностей из конфига, а не голые dict (2 балла)
+11)Напишите кастомный трансформер и протестируйте его (3 балла)
+12)В проекте зафиксированы все зависимости (1 балл)
13)Настроен CI для прогона тестов, линтера на основе github actions (3 балла

Доп
+14)Используйте hydra для конфигурирования (https://hydra.cc/docs/intro/) - 3 балла

@bulaevvi bulaevvi requested review from bulaevvi and removed request for Mikhail-M November 12, 2022 10:18
@bulaevvi bulaevvi self-assigned this Nov 12, 2022
Copy link

@bulaevvi bulaevvi left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Замечания:
п.3: описанная redme команда не корретная, минус 1 балл
п.4: в readme не записана инструкция по вызову, минус 1 балл

Итого 30 баллов. Делайте merge

@vBykoff vBykoff merged commit 77327ce into main Nov 15, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

None yet

2 participants