# Теория вероятностей

## Базовые понятия

**Определение:** Конечное вероятностное пространство (finite probability space) - это тройка $\langle\Omega, \rho, P\rangle$, где
1. $\Omega$ - конечное множество элементарных исходов (sample space)
2. $\rho: \Omega \longrightarrow [0, 1]$ - функция вероятности элементарного исхода (probability function), такая что $\sum_{\omega \in \Omega} \rho(\omega) = 1$ (т.е. какое-то элементарный исход точно реализуется)
3. $P: 2^\Omega \longrightarrow [0, 1]$ - вероятностная мера (probability measure), такая что $P(A) = \sum_{\omega \in \Omega} \rho(\omega)$

_Замечание:_ В общем случае $\Omega$ может быть бесконечным множеством. В таком случае $P$ будет являться произвольной мерой на этом множестве. Например $\Omega = \mathbb{R}^2$ (евклидово пространство) с площадью. Строго мы это не вводим, но пользоваться можно. Это еще называют геометрической вероятностью (geometric probability)

**Определение:** Подмножество $A$ множества элементарных исходов $\Omega$ называется событием (event)

**Определение:** Событие называется невозможным (impossible event), если $P(A) = 0$

**Определение:** Событие называется достоверным (sure event), если $P(A) = 1$

**Определение:** События $A$ и $B$ называются несовместными (disjoint events), если $P(A \cap B) = 0$

**Лемма:**
(1) $P(\neg A) = 1 - P(A)$
(2) $P(A \cup B) = P(A) + P(B) - P(A \cap B)$
(3) $P(A_1 \cup ... \cup A_n) = P(A_1) + ... + P(A_n) - P(A_1 \cap A_2) - ... - P(A_{n - 1} \cap A_n) + P(A_1 \cap A_2 \cap A_3) + ...$ формула включений-исключений (inclusion–exclusion principle)
(4) $P(A_1 \cup ... \cup A_n) \le \sum_{i = 1}^{n} A_i$
$\square$
Все факты очевидны из теоретико-множественных соображений, оставлю без доказательства
$\blacksquare$

<br /><br />

### Примеры

**Игральный кубик:**
$\Omega = \{\omega_1, \omega_2, \omega_3, \omega_4, \omega_5, \omega_6\}$ - пространство бросаний шестигранного кубика. Очевидно, что для всех $i$ и $j$ $ \rho(\omega_i) = \rho(\omega_j) = \frac{1}{6}$

**Геометрическая вероятность:**
Коля и Вася договорились о встрече в промежуток с 9:00 до 10:00. Оба приходят в случайный момент в ремени из этого промежутка и ждут в течение 15 минут. Т.н. вероятность встречи.
<br />
<img src="../static/IMG_C984BA21888F-1.jpeg" width="600">
<br />

$A$ - событие встречи
$P(A) = 1 - \frac{3}{4}^2 = \frac{7}{16}$

**Задача о беспорядках**

100 студентов сидели на своих местах в 100-местной аудитории. Их попросили пересесть случайным образом. Требуется найти вероятность того, что все студенты сели не на свои места.

$A$ - событие «все ученики сидят не на своем месте»

$P(A) = 1 - P(\neg A) = 1 - \frac{#(A_1 \cup ... \cup A_{70})}{70!} = $

По формуле включений-исключений:
$ = 1 - \frac{\binom{70}{1}69! - \binom{70}{2}68! + ... - \binom{70}{70}1!}{70!} = 1 - \frac{1}{1!} + \frac{1}{2!} - \frac{1}{3!} + ... - \frac{1}{70!} \simeq e^{-1}$

**Определение:** Условная вероятность (conditional probability) - вероятность наступления события $A$ при наступившем событии $B$. Вычисляется по формуле $P(A | B) = \frac{P(A \cap B)}{P(B)}$

**Определение:** События $A$ и $B$ называются независимыми (independent), если $P(A \cap B) = P(A) \cdot P(B)$ или, что эквивалентно $P(A | B) = P(A)$

Пусть $\Alpha = \left\{ A_1, A_2, ..., A_n \right\}$ - множество событий, тогда
**Определение:** Оно называется попарно независимым (pairwise independent), если $\forall i, j < n$ $A_i$ и $A_j$ - независимы
**Определение:** Оно называется независимым в совокупности (mutually independent), если $\forall I \subset \{1, ..., n\}$ $P\bigg(\bigcap_{i \in I} A_i\bigg) = \prod_{i \in I} P(A_i)$

### Примеры

**Игральный кубик**

Продемонстрируем разницу между попарной независимостью и независимостью в совокупности.
Рассмотрим вероятностное пространство бросания двух кубиков.
Выберем такие события:
1. На первом кубике выпало четное число
2. На втором кубике выпало четное число
3. Сумма чисел на двух кубиках четна

Эти события являются попарно независимыми, но не в совокупности. Действительно, (1) и (2) независимы по определению, (1) и (3) независимы, так как четность суммы зависит и от события (2), то же самое можно сказать и про пару (2) и (3), т.о. они и правда попарно независимы. Однако же очевидно, что они не могут быть независимыми в совокупности, ведь четность суммы однозначно определяется через четность слагаемых.

**Разноцветный тетраэдр**
Другой пример - Тетраэдр, с одной красной, одной зеленой, одной синей и одной красно-зелено-синей полосатой гранью.
$R$ - событие «на стороне есть красный цвет»
$G$ - событие «на стороне есть зеленый цвет»
$B$ - событие «на стороне есть синий цвет»

Очевидно, что:
$P(R) = P(G) = P(B) = \frac{1}{2}$

Попарная независимость наблюдается:
$P(R \cap G) = P(R \cap B) = P(G \cap B) = \frac{1}{4} = \frac{1}{2} \cdot \frac{1}{2}$

Однако независимости в совокупности нет:
$P(R \cap G \cap B) = \frac{1}{4} \neq \frac{1}{8}$

**Раскраски**
Пусть есть множество $A = \{1, 2, 3, 4, 5, 6\}$ и два цвета. Очевидно, всего есть $2^6 раскрасок$.

$A_{ij}$ - $i$ и $j$ раскрашены в один цвет

$P(A_{ij}) = \frac{1}{2}$
$P(A_{ij} \cap A_{kl}) = $

$P(A_{ijk}) = $

Случайная раскраска в два цвета (интересный случай)

**Теорема Байеса (Bayes):**
$P(A | B) = \frac{P(B | A) \cdot P(A)}{P(B)}$
$\square$
По определению условной вероятности:
$P(A | B) = \frac{P(A \cap B)}{P(B)}$, т.о.
(1) $P(A \cap B) = \frac{P(A | B)}{P(B)}$

По определению условной вероятности:
$P(B | A) = \frac{P(A \cap B)}{P(A)}$, т.о.
(2) $P(A \cap B) = \frac{P(B | A)}{P(A)}$

Приравняв получим (1) и (2):
$P(A | B) = \frac{P(B | A) \cdot P(A)}{P(B)}$
$\blacksquare$

### Примеры


**Определение:** Множество событий $\left\{ A_1, A_2, ..., A_n \right\}$ образует полную группу (collectively exhaustive events) в вероятностном пространстве $\Omega$, если:
 1. $\forall A_i, A_j$ $P(A_i \cap A_j) = 0$, т.е. все события несовместимы
 2.  $\sum_{i}{P(A_i)} = 1$, при этом они покрывают все вероятностное пространство $\Omega$

### Примеры:
<br/>
<img src="../static/IMG_09F686348EDB-1.jpeg" width="400"/>
<br/>

Таким образом вероятность события $B$ в этом пространстве $\Omega$ можно выразить через элементы полной группы как:
$P(B) = \sum_{i}{P(B | A_i) \cdot P(A_i)}$

<br/>
<img src="../static/IMG_252744EDB449-1.jpeg" width="400"/>
<br/>

_Замечание:_ Это чем-то напоминает факторизацию в алгебре

+ С теоремой байеса
**Пример:** Урновая схема

## Схема испытаний Бернулли (Биномиальная схема)

**Определение:** Испытание Бернулли - случайный опыт, который может закончиться одним из двух элементарных событий - успех ($1$) либо неудача ($0$). Вероятность успеха обозначается $p \in [0, 1]$, соответственно вероятность неудачи $q = 1 - p$.

**Определение** Схема испытаний Бернулли - это последовательность из $n$ испытаний бернулли

Свойства схемы испытаний Бернулли:
1. Вероятностное пространство $\Omega = \{0, 1\}^n$
2. $#\Omega = 2^n$
3. $P(\omega) = p^k \cdot q^{n - k}$, где $k$ - кол-во успехов
4. Если событие A - произошло k успехов, то $P(A) = \binom{n}{k} \cdot p^k \cdot q^{n - k}$

## Примеры:
Случайное блуждание на прямой

Случайный граф

Теорема Эрдёша

**Определение:** Мультиномиальная схема -

## Примеры:
Теорема эрдеша-радо

## Полиномиальная схема

**Определение:** Полиномиальное испытание - случайный опыт, который может закончиться одним из $m$ элементарных исходов - $\omega_1, ..., \omega_m$.

**Определение** Полиномиальная схема - это последовательность из $n$ полиномиальных испытаний

Свойства схемы Полиномиальной схемы:
1. Вероятностное пространство - $\Omega = \{\omega_1, ..., \omega_m\}^n$
2. $#\Omega = m^n$
3. $P(\omega) = \rho(\omega_1)^{\alpha_1} \cdot ...$
4. $P(A) = \binom{n}{k_1, ..., k_m} \cdot P(\omega)$

Теорема Ван-дер-ваардена

## Случайные величины

**Определение:** Случайная величина (random variable) - это произвольная функция $\xi: \Omega \longrightarrow \mathbb{R}$

**Определение:** Распределение случайной величины $\xi$ - это функция $F: \mathbb{R} \longrightarrow [0, 1]$, т.ч.
$F(x) = P(\xi = x)$

Совместное распределение

**Определение:** (!!!!!!) Случайные величины $\xi$ и $\psi$ называются независимыми, если $\forall x, y \in \mathbb{R} \mbox{ } (x \neq y)$ $A = P(\xi = x)$ и $B = P(\psi = y)$ - $A$ и $B$ независимы

_Замечание:_ По аналогии, можно ввести понятие попарных независимых и независимых в совокупности случайных величин

**Пример:**
Предположим мы играем в игру с монеткой с такими правилами:
1. Если выпал орел, мы теряем 100 рублей
2. Если выпала решка, мы получаем 100 рублей

Тогда интуитивно можно ввести случайную величину $\xi$ таким образом:
\begin{align}
$\xi =$
\begin{cases}
-100, & \mbox{ } \omega \mbox{ - орел} \\
100, & \mbox{ } \omega \mbox{ - решка}
\end{cases}
\end{align}

**Определение:** Математическое ожидание (expected value) случайной величины - взвешенное среднее ее значений, т.е. $E\xi = \sum_{\omega \in \Omega}{\xi(\omega) \cdot P(\omega)}$

**Замечание:** То же самое можно записать грубо говоря «по Лебегу» $E\xi = \sum_{y \in cod(\xi)}{y \cdot P(\omega : \xi(\omega) = y)}$

**Пример:**
Посчитаем матожидание случайной величины из предыдущего примера с игрой с монеткой:
$E\xi = -100 \cdot \frac{1}{2} + 100 \cdot \frac{1}{2} = 0$

+ простейшие св-ва

**Теорема о линейности математического ожидания**
$E(\alpha\xi + \beta\psi) = \alpha \cdot E\xi + \beta \cdot E\psi$
$\square$ $E(\alpha\xi + \beta\psi) = \sum_{\omega \in \Omega}{\bigg(\alpha\xi(\omega) + \beta\psi(\omega)\bigg)} = E(\alpha\xi) + E(\beta\psi) = \alpha \cdot E\xi + \beta \cdot E\psi$ $\blacksquare$

+ перенести сюда теорему о незав матожидании


**Определение:** Индикаторная случайная величина (indicator random value) - это функция вида
\begin{align}
$I_A(\omega) =$
\begin{cases}
1, & \mbox{ } \omega \in A \\
0, & \mbox{ } \omega \notin A
\end{cases}
\end{align}

**Задача о назначениях:**

Пусть есть множество $A$ работников, множество $T$ работ и функция стоимости $C : A \times T \longrightarrow  \mathbb{R}$. Обычно функция стоимости задается в виде матрицы $C$
Необходимо найти биекцию $f : A \longrightarrow T$, такую что сумма $\sum_{a \in A} C(a, f(a))$ минимальна.

В общем случае эта задача решается венгерским алгоритмом, но в обучающих целях рассмотрим, что будет, если мы попытаемся в качестве ответа брать случайную функцию $f$. Посчитаем математическое ожидание:

$E\xi = E\bigg(\sum_{i = 1}^{n}\sum_{j = 1}^{n} I_{c_{ij}} \cdot c_{ij}\bigg) = \sum_{i = 1}^{n}\sum_{j = 1}^{n} c_{ij} \cdot E(I_{c_{ij}}) = \frac{\sum_{i = 1}^{n}\sum_{j = 1}^{n} c_{ij}}{n}$

**Задача максимального разреза:**

Пусть у нас есть граф $G$.
Необходимо найти максимальный разрез этого графа, т.е. такое подмножество вершин, что у максимального количества ребер одна вершина лежит в этом подмножестве, а вторая нет. Например:
<br/>
<img src="../static/IMG_F4D34D90BF7D-1.jpeg" width="1000">

Для этой задачи неизвестен полиномиальный алгоритм решения, поэтому давайте попробуем посчитать матожидание случайного равновероятного выбора вершин в подмножество. Т. е. мы будем проходиться по всем вершинам графа и с вероятностью $\frac{1}{2}$ брать их в разрез.

Введем индикаторную случайную величину:
\begin{align}
$I_c = I_{uv} = $
\begin{cases}
1, & \mbox{ } u \in A, v \in \overline{A} \\
1, & \mbox{ } u \in \overline{A}, v \in A \\
0, & \mbox{ } u \in A, v \in A \\
0, & \mbox{ } u \in \overline{A}, v \in \overline{A} \\
\end{cases}
\end{align}

Тогда:
$E\bigg(\sum I_c\bigg) = \sum E(I_c) = \sum P(A_{uv}) = \frac{\epsilon(G)}{2}$

**Наибольшая возрастающая подпоследовательность:**

Пусть у нас есть массив $A$.
Необходимо найти наибольший возрастающий подмассив в $A$.

Эта задача решается методом динамического программирования, однако в учебных целях давайте попробуем решить ее жадным алгоритмом и посчитать математическое ожидания длины получающейся на выходе подпоследовательности.

Введем индикаторную случайную величину:

\begin{align}
$I_{A_i} =$
\begin{cases} 1, & \mbox{ } \forall j < i \mbox{ } A_j < A_i \\
0
\end{cases}
\end{align}

Тогда:
$E\bigg(\sum I_{A_i}\bigg) = \sum E(I_{A_i}) = \sum P(A_i) = \sum \frac{1}{i} = \ln(n) + \gamma + \epsilon_n$, где $\epsilon \rightarrow 0$

**Теорема о математическом ожидании независимых величин**
$E(\xi \cdot \psi) = E\xi \cdot E\psi$, если $\xi$ и $\psi$ - независимые случайные величины
$\square$
$E(\xi \cdot \psi) = \sum_{z \in cod(\xi \cdot \psi)} z \cdot P(\xi \cdot \psi = z) = \sum_{x \in cod(\xi)} \sum_{y \in cod(\psi)} xy \cdot P(\xi = x \cap \psi = y) = \sum_{y \in cod(\psi)} xy \cdot P(\xi = x) \cdot P(\psi = y) = E\xi \cdot E\psi$
$\blacksquare$

## Дисперсия

**Определение:** Дисперсия случайной величины $\xi$ - это $D\xi = E(\xi - E\xi)^2$
_Замечание:_ Это второй момент случайной величины. Первый - это $E(|\xi - E\xi|)$, n-тый соответственно $E(|\xi - E\xi|^n)$

+ элементарные св-ва

**Определение:** Средне квадратичное отклонение случайно величины $\xi$ - это $\sigma = \sqrt{D\xi}$

**Теорема:** $D\xi = E\xi^2 - (E\xi)^2$
$\square$
$D\xi = \sum_{\omega \in \Omega} p(\omega) \cdot (\xi(\omega) - E\xi) = E\xi^2 - 2(E\xi)^2 + (E\xi)^2 = E\xi^2 - (E\xi)^2$
$\blacksquare$

**Теорема:** $D(c\xi) = c^2 \cdot D\xi$
$\square$
$D(c\xi) = E(c^2 \cdot \xi^2) - (E(c\xi)^2) = c^2 \cdot (E\xi^2 - (E\xi)^2) = c^2 \cdot D\xi$
$\blacksquare$

**Теорема:** $D(\xi + \psi) = D\xi + D\psi$, если $\xi$ и $\psi$ - это независимые случайные величины
$\square$
$D(\xi + \psi) = E(\xi + \psi - E(\xi + \psi)) = E(\xi^2 + 2\xi\psi + \psi^2) - (E\xi + E\psi)^2 = E\xi^2 + 2 \cdot E\xi \cdot E\psi + E\psi^2 - (E\xi)^2 - (E\psi)^2 = D\xi + D\psi$
$\blacksquare$



+ неравенства + чернова

+ введение в монте-карло

+ предельные теоремы

## Ковариация

## Генерация случайных чисел

**Определение:** Случайное число - реализация случайной величины

**Определение:** Псевдослучайное число – число, полученное детерминированным алгоритмом, используемое в качестве случайного числа

**Определение:** Истинно случайное число – случайное число, полученное на основе некоторого физического явления

**Определение:** Генератор случайных бит -

**Идея:** Генератор псевдослучайных чисел - алгоритм, порождающий последовательность почти независимых чисел, подчиняющихся заданному распределению (обычно дискретному равномерному)

[Больше инфы](https://www.sgu.ru/sites/default/files/textdocsfiles/2018/07/09/slepovichev_i.i._generatory_psevdosluchaynyh_chisel_2017.pdf?ysclid=ldyv77tf5r858198351)

## Другое

+ разные распределения
+ цпт
+ стохастическая теорема