В процессе прохождения курса слушатель изучает основные типы задач, решаемых с помощью машинного обучения — в основном речь идёт о классификации, регрессии и кластеризации. Узнает об основных методах машинного обучения и их особенностях, учится оценивать качество моделей — и решать, подходит ли модель для решения конкретной задачи. Наконец, знакомится с современными библиотеками, в которых реализованы обсуждаемые модели и методы оценки их качества.
Слушателю нужно знать об основных понятиях математики: функциях, производных, векторах, матрицах. Для выполнения практических заданий потребуются базовые навыки программирования. Желательно знать Python.
- Предобработка данных в Pandas
- Важность признаков
- Выбор числа соседей
- Выбор метрики
- Нормализация признаков
- Опорные объекты
- Анализ текстов
- Логистическая регрессия
- Метрики качества классификации
- Линейная регрессия: прогноз оклада по описанию вакансии
- Составление фондового индекса
- Размер случайного леса
- Градиентный бустинг над решающими деревьями
- Уменьшение количества цветов изображения
- Проект: предсказания победителя в онлайн-игре