-
Notifications
You must be signed in to change notification settings - Fork 11
TMO_KURS
Курсовая работа – самостоятельная часть учебной дисциплины «Технологии машинного обучения» – учебная и практическая исследовательская студенческая работа, направленная на решение комплексной задачи машинного обучения. Результатом курсовой работы является отчет, содержащий описания моделей, тексты программ и результаты экспериментов.
Курсовая работа опирается на знания, умения и владения, полученные студентом в рамках лекций и лабораторных работ по дисциплине.
Схема типового исследования, проводимого студентом в рамках курсовой работы, содержит выполнение следующих шагов:
-
Поиск и выбор набора данных для построения моделей машинного обучения. На основе выбранного набора данных студент должен построить модели машинного обучения для решения или задачи классификации, или задачи регрессии.
-
Проведение разведочного анализа данных. Построение графиков, необходимых для понимания структуры данных. Анализ и заполнение пропусков в данных.
-
Выбор признаков, подходящих для построения моделей. Кодирование категориальных признаков Масштабирование данных. Формирование вспомогательных признаков, улучшающих качество моделей.
-
Проведение корреляционного анализа данных. Формирование промежуточных выводов о возможности построения моделей машинного обучения. В зависимости от набора данных, порядок выполнения пунктов 2, 3, 4 может быть изменен.
-
Выбор метрик для последующей оценки качества моделей. Необходимо выбрать не менее трех метрик и обосновать выбор.
-
Выбор наиболее подходящих моделей для решения задачи классификации или регрессии. Необходимо использовать не менее пяти моделей, две из которых должны быть ансамблевыми.
-
Формирование обучающей и тестовой выборок на основе исходного набора данных.
-
Построение базового решения (baseline) для выбранных моделей без подбора гиперпараметров. Производится обучение моделей на основе обучающей выборки и оценка качества моделей на основе тестовой выборки.
-
Подбор гиперпараметров для выбранных моделей. Рекомендуется использовать методы кросс-валидации. В зависимости от используемой библиотеки можно применять функцию GridSearchCV, использовать перебор параметров в цикле, или использовать другие методы.
-
Оценка качества выбранных моделей на основе кросс-валидации. Необходимо использовать не менее трех различных схем кросс-валидации и обосновать их выбор.
-
Оценка качества моделей на основе тестовой выборки.
-
Формирование выводов о качестве построенных моделей. Необходимо сравнить качество моделей на основании выбранных метрик для различных схем кросс-валидации и тестовой выборки. Результаты сравнения качества нужно отобразить в виде графиков и сделать выводы в форме текстового описания.
Приведенная схема исследования является рекомендуемой. Возможно выполнение курсовой работы на нестандартную тему, которая должна быть предварительно согласована с ответственным за прием курсовой работы.
Отчет по курсовой работе – документ, содержащий описание решения комплексной задачи машинного обучения с обоснованием принятых решений.
Обязательными структурными элементами отчета являются:
- Титульный лист установленного образца.
- Задание установленного образца.
- Содержание.
- Введение.
- Основная часть, содержащая описание постановки задачи и последовательности действий студента по решению поставленной задачи.
- Заключение (формулировка выводов по выполненной работе).
- Список использованных источников информации (бумажных и электронных).
Отчет предоставляется студентом в бумажном и электронном виде. Отчет должен быть утвержден и подписан ответственным за прием курсовой работы. Утверждение отчета является допуском к защите курсовой работы.
Защита курсовой работы проводится в форме научно-технического семинара. Студент докладывает результаты проведенных исследований в форме презентации. В качестве презентационных материалов рекомендуется использовать jupyter-ноутбук, содержащий результаты проведенных экспериментов.
На защите курсовой работы присутствуют члены комиссии, сформированной распоряжением заведующего кафедрой для приема курсовых работ, а также все желающие.