Семинаристы: Талгат Даулбаев (/tdaulbaev@hse.ru/), Надежда Чиркова (/nchirkova@hse.ru/) Ассистенты: Максим Першин (ИАД-2, duminro@gmail.com, telegram), Ксения Вальчук (ИАД-4, ksenia.valchuk@gmail.com, telegram)
Доска объявлений и Telegram-чат После блокировки телеграма писать вопросы можно на почту ассистентам (по заданиям) и семинаристам (по всему остальному).
Адрес курса: hse.minor.dm+2@gmail.com (семинары первой парой) или hse.minor.dm+4@gmail.com (семинары третьей парой)
Домашние задания выдаются на 2 недели (мягкий дедлайн). По истечении дедлайна в течение недели есть возможность досдать задание со штрафными баллами: - 0.5 балла за каждый день просрочки (жесткий дедлайн). После жесткого дедлайна задание не принимается.
- Практическое задание 1. Мягкий дедлайн: 13 февраля, 23:59. Жесткий дедлайн: 21 февраля, 23:59.
Семинар 1. Введение в машинное обучение. Numpy.
- Ноутбук с семинара
- Домашнее задание (без проверки, для тренировки)
- Ноутбук-туториал по numpy (автор: Анастасия Рысьмятова)
- Англоязычный подробный туториал по numpy
Семинар 2. Pandas и Matplotlib.
- Данные о пассажирах «Титаника»
- Ноутбук с семинара
- Лекция на Курсере про pandas - 1
- Лекция на Курсере про pandas - 2
- Подробный ноутбук-туториал про pandas
- Официальная документация pandas - подробнейшие туториалы на английском
Семинар 3. Постановка задачи машинного обучения, библиотека sklearn
Семинар 4. Метод k ближайших соседей, кросс-валидация
- Ноутбук ИАД-2
- Ноутбук ИАД-4
- Ноутбук с полезными функциями из numpy
- Документация sklearn
- Задачи с семинара (кроме №5)
Семинар 5. Градиентный спуск
Семинар 6. Линейная регрессия
Семинар 7. Линейная классификация
Семинар 8. Метрики бинарной классификации
Семинар 9. Семинар про работу с текстами
Семинар 10. Решающие деревья
Консультация перед контрольной работой
Семинар 12. Композиции алгоритмов
Семинар 13. Методы понижения размерности
Семинар 14. Кластеризация
Семинар 15. Визуализация
Семинар 16. Рекомендательные системы
Семинар 17. Методы генерации признаков
- Книга Machine Learning in Python
- Специализация по анализу данных на coursera.org
- James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning
- Видеозаписи курса лекций К. В. Воронцова
- Лекции Andrew Ng на coursera.org: практические задания на языке MATLAB/Octave
- Вводный курс К. В. Воронцова на coursera.org
- https://www.dataquest.io: сайт с интерактивными заданиями по Python для анализа данных
- Pattern Recognition and Machine Learning by C. Bishop
За прохождение курсов на coursera.org не обязательно платить: можно попросить материальную помощь.