Добро пожаловать на страничку курса "R для теории вероятностей и математической статистики". Чувствуй себя как дома.
Нашёл на этой страничке ошибку? Нашёл какой-то ультраполезный ресурс? Придумал какое-то интересное задание для семинара? Есть конструктивная критика? Не молчи, напиши мне об этом на почту filfonul@gmail.com, в Telegram (@Ppilif) или Vk.
- Актуальные материалы семинаров лежат в папках
./end_seminars_2021/sem*
- В каждой папке есть свой небольшойx README с дополнительными материалами
- Если вы хотите скачать из репозитория конкретную папку, просто вставьте ссылку на неё в сервис для скачки.
- Если вы хотите скачать всё, жмите зелёную кнопку справа наверху, либо выучите git и просто сделайте
clone
, а потом при каждом онбновлении делайтеpull
- Видео 2021
- Cтарая страничка курса, видосы с курса 2020 года
Поздравляю! Впервые ты оказался около опасной черты. Твоих математических навыков стало хватать для постижения жизни. Именно этим мы и займёмся. Курс идёт 8 недель. Каждую неделю по две пары. Занятия полупрактические. Смотрим презентации, код, решаем задачи у доски. Цель курса — прокачать интуитивное понимание тервера и матстата, составить картину мира в целом, посмотреть, как они используются на практике. Вспомнить, что вы проходили на лекциях и переосмыслить, а также увидеть что-то новое, на что времени на лекциях не хватило.
Домашки сдаём командами по три человка. Скорее всего, будет три домашки. Внутри команды вы сами решаете, кто какие задачи решает, потом собираете решения вместе и получаете баллы на команду. Домашние задания сдаются в виде ссылки на colab. По этой ссылке у меня должны быть права на редактирование. Писать решение можно либо на R либо на python. Какой язык вы выбирете - абсолютно неважно.
Ради всего святого, оформляйте домашки по-нормальному:
- Потратьте 10 минут, чтобы разобраться с Markdown
- Ещё 10 минут, чтобы разобраться с колабом
- И ещё 10 минут, чтобы разобраться как вбивать теховские формулы
- И ещё 10 минут почитайте про философию маркдауна и теха
У каждого, кто записался на курс, уже есть зачёт: 4 балла из 10. Для того, чтобы получить за курс 10, команда должна насобирать 100 баллов. Оценка ставиться на всю команду разом. Первые две команды в рейтинге свожу почилить на крышу Яндекса. Конечно же, если у этих команд больше 100 баллов. (Про Яндекс неточно, в связи с пандемией и ограничениями, но я очень постараюсь).
Ссылка на колаб | дедлайн | решение | стоимость |
---|---|---|---|
Симуляции | 10 мая | будет | 100 баллов |
Гипотезы | 20 июня | будет | 100 баллов |
Правдоподобие | июнь | будет | 100 баллов |
- Турнирная таблица с баллами команд:
появится тут после сдачи первого дз
Что я хочу: многие вещи из предыдущих итераций курса очень подробно рассказаны в моих онлайн-курсах на coursera, хочется в рамках этого курса не повторяться с тем, что там было и рассказать что-то другое. При этом надо сделать так, чтобы люди понимали о чём идёт речь. Выходит, что какое-то пересечение в темах будет неизбежным :(
-
sem01 Зачем мы учили тервер? Критерий Фишера, знаков и рангов. Говорим про разные распределения. Выводим нормальное распределение из воздуха. Генерируем случайные величины на компьютере.
-
sem02 Говорим про варку случайных величин. Обсуждаем квантильное преобразование. Выводим распределение Пуассона из воздуха. Геометрия случайных величин. Говорим про формализм и сигма-алгебры. Про то, что это простой способ моделировать знания.
-
sem03 Говорим про разные виды сходимости на доске (по вероятности, по распределению, в среднем, почти наверное). Обсуждаем их союзников и зачем они нам сдались. Решаем задачки на сходимости.
-
sem04 Вся статистика через призму средних и ЦПТ. Метод моментов. Мощь средних. Дельта-метод. Доверительные интервалы. Концептуально про гипотезы. Схема матстата. Стабилизация дисперсии. Преобразования выборок. Притащить сюда весы и мешок конфет для эксперимента.
-
sem05 Точные доверительные интервалы и гипотезы для Exp, Bin или U. Решаем задачки на ошибки 1 и 2 рода. Мощность критерия. Какими бывают критерии? Про бутстрап на пальцах.
-
sem06 Метод максимального правдоподобия. Информация Фишера. Доверительные интервалы. Многомерный дельта-метод. Многомерное нормальное распределение.
-
sem07 Энтропия. KL-дивергенция. Информационные критерии. Возможно, про TSNE и UMAP. Возможно, про EM-алгоритм. Как душа ляжет :)
-
sem08 Тут либо про Марковские цепи, либо про Байесовские методы и MCMC.
Чего не хватает: экспоненциальное семейство, достаточные статистики. Распределения максимумов и финансовые рынки. Большая сила o-малых. Задачи на марковские цепи, метод 1 шага и тп для собесов и экзаменов. Куда-нибудь всунуть геометрию случайных величин и тп.
Тут лежат всякие глобальные полезные ссылки на разные материалы. Ещё больше ссылок ищите в README к семинарам!
- Ещё больше полезных материалов ищи в репозитории к курсеровскому курсу
Книги по терверу и матстату:
- Учебник Черновой по терверу
- Учебник Черновой по матстату
- Книга про парадоксы в теорвере и матстате
- Культурный код. Сборник красивых нетривиальных задач по терверу и матстату. Слабо решить их все?
- Занимательная статистика Лагутина, как и Чёрнова выводит в понимании на более высокий уровень
- Целые 10 глав асимтотического тервера и статистики, очень хороший конспект для продвинутого изучения
- Coock boock по терверу и матстату в 10 страницах
Книги по R:
Другие крутые источники:
- Визуализации по терверу и матстату. Можно посмотреть на условную вероятность и многое другое своими глазами.
- Репозиторий по теории вероятностей от Демешева Б.Б. Рекомендую посмотреть видеозаписи семинаров. Там решается много экстраординарных задач, которые встречаются на собеседованиях.
- Тест по теории вероятностей для школьников из этого репозитория. Слабо ответить на все вопросы верно?
- Набор лекций по рискам от Ильи Езепова. Море теории вероятностей для финансов и не только. Кстати говорая, на Rpubs можно найти много других приятных тетрадок с кодом на R.
Весь контент, созданный для этого курса распространяются на правах лицензии Creative Commons Attribution-Share Alike 4.0. Материалы публикуются как общественное достояние. При наличии технической возможности необходимо также указать активную гиперссылку на страницу курса.
Спасибо за помощь в создании этого курса Демешеву Борису Борисовичу! Его материалы по терверу и запал энтузиазма сделали его возможным. Спасибо за помощь в стенографировании домашек Белякову Юре (формулы). Спасибо огромной своре второкурсников за поиски ошибок и опечаток (Сороковниной Свете, Кидло Ире, Нуртудинову Камилю, Курилкиной Юле и Евстафьеву Серёже и многим-многим другим)