Мои решения задач в рамках совместного МФТИ + Yandex курса в рамках специализации Машинное обучение и анализ данных
В машинном обучении встречаются задачи, где нужно изучить структуру данных, найти в них скрытые взаимосвязи и закономерности. Например, нам может понадобиться описать каждого клиента банка с помощью меньшего количества переменных — для этого можно использовать методы понижения размерности, основанные на матричных разложениях. Такие методы пытаются сформировать новые признаки на основе старых, сохранив как можно больше информации в данных. Другим примером может служить задача тематического моделирования, в которой для набора текстов нужно построить модель, объясняющую процесс формирования этих текстов из небольшого количества тем.
Такие задачи назвают обучением без учителя. В отличие от обучения с учителем, в них не предполагают восстановление зависимости между объектами и целевой переменной.
Из этого курса вы узнаете об алгоритмах кластеризации данных, с помощью которых, например, можно искать группы схожих клиентов мобильного оператора. Вы научитесь строить матричные разложения и решать задачу тематического моделирования, понижать размерность данных, искать аномалии и визуализировать многомерные данные.
2. Подробнее о методах кластеризации
3. Понижение размерности и отбор признаков
7. Тематическое моделирование. Часть 1
8. Тематическое моделирование. Часть 2.
- Дзись Андрей - Стажер-исследователь ИППИ РАН - dzisandy
-
Последняя неделя задача на программирование: непонятен вопрос 3 задания, выяснить причину, почему не засчитывает задачу.
-
Доделать дополнительное задание последней недели.