Лекции (частично) будут располагаться в папке lections
Примеры работы с модулями, анализа, работы в среде Jupyter Notebook можно найти в папке notebooks:
- jupyter
- numpy
- pandas
- Matplotlib & Seaborn
- Imputation & Transformation
- Pipelines & Column Transformer
Примеры решения задач:
Данные, используемые в анализе - в папке data. Также можно загрузить "игрушечные" датасеты прямо из sklearn: toy-datasets.
Домашние работы индивидуальны. Задание для каждого студента расположено в папке projects
Необходимо, имея обучающую выборку из файла train.csv
, обучить бинарный классификатор и предсказать значения для выборки из файла test.csv
. Метрика качества - accuracy
. Целевые характеристики по метрике описаны в README
. Пример того, как должен выглядеть ответ, можно посмотреть в файле sample_submission.csv
. Ваш ответ в формате csv
необходимо загрузить в ТУИС в соответствующий раздел до 13 января 2020 года.
Удачи!