Skip to content

The repository contains materials and useful links for the machine learning course at the MTS.Teta summer school.

Notifications You must be signed in to change notification settings

emeli-dral/teta_ml

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Машинное обучение МТС Тета

Репозиторий содержит материалы и полезные ссылки по курсу машинного обучения в летней школе МТС Тета.

Полезные ссылки:

Slack Channel

МТС Тета Машинное обучение: https://www.teta.mts.ru/machine_learning_program_description

Стажирвка в МТС: https://job.mts.ru/youth

Темы курса:

Блок Basics

Модуль 1

  • Обзор классических алгоритмов обучения с учителем и обучения без учителя
  • Инструменты дата саентиста

Модуль 2

  • Валидация моделей по историческим данным: CV, отложенная выборка, метрики (+ нестандартные), доп. разделы
  • Разбор валидации в python: стандартные и кастомизированные метрики, baseline, стабильность по фолдам, автоматизированные отчеты

Модуль 3

  • Онлайн валидация: пилот, АБ-тестирование, дизайн эксперимента
  • Интервальные оценки метрик качества, применение стат. тестов для оценки результатов онлайн тестирования

Блок Cases

Модуль 4

  • Жизненный цикл проекта по анализу данных, предпроектное исследовнаие
  • Постановка задачи и оценка экономического потенциала на ранней стадии

Модуль 5

  • Запрос на данные, валидация и приемка данных, оценка потенциала датасета для моделирования
  • Инструменты для EDA и визуализации данных: Seaborn, Plotly, Dash

Модуль 6

  • Работа над проектом: воспроизводимые эксперименты, ревью
  • Обзор инструментов для документирования изменений, автоматизации выполнения пайплайнов, менеджмента экспериментов

Блок Services

Модуль 7

  • Data-based cервис: жизненный цикл, разработка и варианты deploy
  • Разработка demo сервиса

Модуль 8

  • Мониторинг ML моделей: input data, drift, performance, fairness etc
  • Интерпретация моделей

Модуль 9

  • Обзор курса и чек-лист дата-саентиста
  • Data Science в МТС: Виктор Кантор про роль DS в большом бизнесе.

Входные требования:

  • General IT background (OS, bash, services, repositories, etc.)
  • Programming Python
  • Python for Data Analysis (Pandas, Numpy, Scipy, Sklearn)
  • The Probability Theory and Mathematical Statistics
  • Time Series Analysis (basics)
  • Understanding of ML basic concepts and problem statements

Рекомендации по подготовке:

Машинное обучение

  1. [просто] Специализация "Машинное обучение и анализ данных" на Coursera: https://www.coursera.org/specializations/machine-learning-data-analysis Специализация на русском языке, преподают в основном практикующие Data Scientist'ы из Яндекс.

Стоит обратить внимание на первые 3 курса:

1.1 Вводный/подготовительный курс: https://www.coursera.org/learn/mathematics-and-python/home/welcome

1.2 Обучение с учителем: https://www.coursera.org/learn/supervised-learning/home/welcome самый интересный курс, в нем рассказываем про алгоритмы классификации и регрессии.

1.3 Обучение без учителя: https://www.coursera.org/learn/unsupervised-learning/home/welcome курс про кластеризацию, уменьшение размерности и визуализацию.

  1. [сложно] Видео-лекции от Факультета Компьютерных Наук ВШЭ по машинному обучению. Вводный технический курс, преподаватель - Евгений Соколов: https://www.youtube.com/watch?v=OBG6EUSRC9g&list=PLEqoHzpnmTfDwuwrFHWVHdr1-qJsfqCUX

  2. [сложно] Открытые видео-лекции ШАД Яндекс по машинному обучению. Классический технический курс, преподаватель - Константин Вячеславович Воронцов: https://www.youtube.com/watch?v=SZkrxWhI5qM&list=PLJOzdkh8T5krxc4HsHbB8g8f0hu7973fK

Статистика

  1. [сложно] Построение выводов по данным, преподаватель - Евгений Рябенко: https://www.coursera.org/learn/stats-for-data-analysis/home/welcome

About

The repository contains materials and useful links for the machine learning course at the MTS.Teta summer school.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published