Skip to content

Latest commit

 

History

History
118 lines (64 loc) · 14.5 KB

README.md

File metadata and controls

118 lines (64 loc) · 14.5 KB

R для тервера и матстата

Добро пожаловать на страничку курса "R для теории вероятностей и математической статистики". Чувствуй себя как дома.

Нашёл на этой страничке ошибку? Нашёл какой-то ультраполезный ресурс? Придумал какое-то интересное задание для семинара? Есть конструктивная критика? Не молчи, напиши мне об этом на почту filfonul@gmail.com, в Telegram (@Ppilif) или Vk.

  • Актуальные материалы семинаров лежат в папках ./end_seminars_2021/sem*
  • В каждой папке есть свой небольшойx README с дополнительными материалами
  • Если вы хотите скачать из репозитория конкретную папку, просто вставьте ссылку на неё в сервис для скачки.
  • Если вы хотите скачать всё, жмите зелёную кнопку справа наверху, либо выучите git и просто сделайте clone, а потом при каждом онбновлении делайте pull
  • Видео 2021
  • Cтарая страничка курса, видосы с курса 2020 года

Идеология курса:

Поздравляю! Впервые ты оказался около опасной черты. Твоих математических навыков стало хватать для постижения жизни. Именно этим мы и займёмся. Курс идёт 8 недель. Каждую неделю по две пары. Занятия полупрактические. Смотрим презентации, код, решаем задачи у доски. Цель курса — прокачать интуитивное понимание тервера и матстата, составить картину мира в целом, посмотреть, как они используются на практике. Вспомнить, что вы проходили на лекциях и переосмыслить, а также увидеть что-то новое, на что времени на лекциях не хватило.

Бюрократия

Домашки сдаём командами по три человка. Скорее всего, будет три домашки. Внутри команды вы сами решаете, кто какие задачи решает, потом собираете решения вместе и получаете баллы на команду. Домашние задания сдаются в виде ссылки на colab. По этой ссылке у меня должны быть права на редактирование. Писать решение можно либо на R либо на python. Какой язык вы выбирете - абсолютно неважно.

Ради всего святого, оформляйте домашки по-нормальному:

У каждого, кто записался на курс, уже есть зачёт: 4 балла из 10. Для того, чтобы получить за курс 10, команда должна насобирать 100 баллов. Оценка ставиться на всю команду разом. Первые две команды в рейтинге свожу почилить на крышу Яндекса. Конечно же, если у этих команд больше 100 баллов. (Про Яндекс неточно, в связи с пандемией и ограничениями, но я очень постараюсь).

Домашние задания

Ссылка на колаб дедлайн решение стоимость
Симуляции 10 мая будет 100 баллов
Гипотезы 20 июня будет 100 баллов
Правдоподобие июнь будет 100 баллов
  • Турнирная таблица с баллами команд:

появится тут после сдачи первого дз

Большой план маленьких побед на 2021 год:

Что я хочу: многие вещи из предыдущих итераций курса очень подробно рассказаны в моих онлайн-курсах на coursera, хочется в рамках этого курса не повторяться с тем, что там было и рассказать что-то другое. При этом надо сделать так, чтобы люди понимали о чём идёт речь. Выходит, что какое-то пересечение в темах будет неизбежным :(

  • sem01 Зачем мы учили тервер? Критерий Фишера, знаков и рангов. Говорим про разные распределения. Выводим нормальное распределение из воздуха. Генерируем случайные величины на компьютере.

  • sem02 Говорим про варку случайных величин. Обсуждаем квантильное преобразование. Выводим распределение Пуассона из воздуха. Геометрия случайных величин. Говорим про формализм и сигма-алгебры. Про то, что это простой способ моделировать знания.

  • sem03 Говорим про разные виды сходимости на доске (по вероятности, по распределению, в среднем, почти наверное). Обсуждаем их союзников и зачем они нам сдались. Решаем задачки на сходимости.

  • sem04 Вся статистика через призму средних и ЦПТ. Метод моментов. Мощь средних. Дельта-метод. Доверительные интервалы. Концептуально про гипотезы. Схема матстата. Стабилизация дисперсии. Преобразования выборок. Притащить сюда весы и мешок конфет для эксперимента.

  • sem05 Точные доверительные интервалы и гипотезы для Exp, Bin или U. Решаем задачки на ошибки 1 и 2 рода. Мощность критерия. Какими бывают критерии? Про бутстрап на пальцах.

  • sem06 Метод максимального правдоподобия. Информация Фишера. Доверительные интервалы. Многомерный дельта-метод. Многомерное нормальное распределение.

  • sem07 Энтропия. KL-дивергенция. Информационные критерии. Возможно, про TSNE и UMAP. Возможно, про EM-алгоритм. Как душа ляжет :)

  • sem08 Тут либо про Марковские цепи, либо про Байесовские методы и MCMC.

Чего не хватает: экспоненциальное семейство, достаточные статистики. Распределения максимумов и финансовые рынки. Большая сила o-малых. Задачи на марковские цепи, метод 1 шага и тп для собесов и экзаменов. Куда-нибудь всунуть геометрию случайных величин и тп.

Почиташки и видосы:

Тут лежат всякие глобальные полезные ссылки на разные материалы. Ещё больше ссылок ищите в README к семинарам!

Книги по терверу и матстату:

Книги по R:

Другие крутые источники:

Лицензия и благодарности

Весь контент, созданный для этого курса распространяются на правах лицензии Creative Commons Attribution-Share Alike 4.0. Материалы публикуются как общественное достояние. При наличии технической возможности необходимо также указать активную гиперссылку на страницу курса.

Спасибо за помощь в создании этого курса Демешеву Борису Борисовичу! Его материалы по терверу и запал энтузиазма сделали его возможным. Спасибо за помощь в стенографировании домашек Белякову Юре (формулы). Спасибо огромной своре второкурсников за поиски ошибок и опечаток (Сороковниной Свете, Кидло Ире, Нуртудинову Камилю, Курилкиной Юле и Евстафьеву Серёже и многим-многим другим)