Skip to content

Latest commit

 

History

History
32 lines (28 loc) · 7.54 KB

File metadata and controls

32 lines (28 loc) · 7.54 KB

Специализация "Машинное обучение и анализ данных"

Данный репозиторий содержит реализаию практических заданий по специализации от Яндекса и МФТИ на Coursera "Машинное обучение и анализ данных".

Специализация состоит из 6 курсов:

  1. Математика и Python для анализа данных
    Первая часть курса о языке программирования Python и работе сбиблиотеками NumPy, SciPy, Matplotlib и Pandas. Вторая часть курса посвящена таким разделам математики как линейная алгебра, математический анализ, методы оптимизации и теория вероятностей. При этом, упор делается на разъяснение математических понятий и их применение на практике, а не на вывод сложных формул и доказательство теорем.
    Практические задания

  2. Обучение на размеченных данных
    Курс рассматриает успешно применяемые на практике алгоритмы классификации и регрессии: линейные модели, нейронные сети, решающие деревья и так далее. Особый акцент на построение композиций, в частности случайные леса и метод градиентного бустинга. Кроме этого: оценивание обобщающей способности алгоритмов, подбор параметров модели, выбор и подсчет метрик качества.
    Практические задания:

  3. Поиск структуры в данных
    Курс об алгоритмах кластеризации данных. Направлен на то, чтобы научить строить матричные разложения и решать задачу тематического моделирования, понижать размерность данных, искать аномалии и визуализировать многомерные данные.
    Практические задания:

  4. Построение выводов по данным

  5. Прикладные задачи анализа данных

  6. Анализ данных: финальный проект