Skip to content

hse-econ-data-science/andan_2023

Repository files navigation

Анализ данных на python (коллекция весна 2023)

Полезные ссылки

Идеология курса

Добро пожаловать на курс по анализу данных. Основная цель этого курса - научить вас работе с данными. Мы научимся анализировать таблицы, строить красивый визуал, проверять гипотезы, симулировать случайные величины, а также посмотрим на базовые концепции машинного обучения.

На семинарах мы будем активно использовать различные понятия из теории вероятностей и математической статистики. Лекции и семинары по ним лучше не прогуливать ;)

Домашние задания и контрольные

Домашки:

Мини-самостоялки:

Большой план маленьких побед

  • sem01 Вспоминаем питон на задачах про симуляции! Говорим про распределения. Вводимся в scipy и matplotlib.
  • sem02 Вводимся в numpy
  • sem03 Вводимся в pandas и визуализацию
  • sem04 Метод моментов, ЦПТ, доверительные интервалы.
  • sem05 Больше EDA и разной визуализации!
  • sem06 Базовое машинное обучение. Вводим основные понятия ML. Говорим про KNN.
  • sem07 Разбираемся с линейной регрессией и как её обучить.
  • sem08 Обсуждаем решуляризацию и подбор гиперпараметров
  • sem09 Что такое классификация и логистическая регрессия?
  • sem10 Метрики классификации. Roc-auc.
  • sem11 АБ-тестирование, гипотезы, критерии.
  • sem12 Больше гипотез и критериев! Непараметрические тесты.
  • sem13 Семинар про бустрап.
  • sem14 Метод максимального правдоподобия.
  • sem15 Резервный семинар на всякий случай.

Самый важный раздел

Вы получаете две оценки. Одну за курс, вторую за независимый экзамен. Оценка за курс ставится по формуле:

Итог = Округление(0.1 * МСР + 0.4 * ДЗ + 0.3 * П + 0.2 * КР)
  • МСР — мини-тесты на парах
  • ДЗ — домашние работы (их будет 4 штуки, по каждой логической части курса)
  • П — свой проект длинной в семестр (расскажем детали позже)
  • КР — контрольная в виде демо-варианта независимого экзамена

Обратите внимание, что отдельная оценка будет ставиться за независимый экзамен. Чтобы его сдать придётся заботать не только питон, но ещё и матстат с тревером.

Лицензия

Весь контент, созданный для этого курса распространяются на правах лицензии MIT License либо на правах лицензии WTFPL на ваш выбор. Материалы публикуются как общественное достояние.

Releases

No releases published

Packages

No packages published