# Теория вероятностей

## Базовые понятия

**Определение:** Конечное вероятностное пространство (finite probability space) - это тройка $\langle\Omega, \rho, P\rangle$, где
1. $\Omega$ - конечное множество элементарных исходов (sample space)
2. $\rho: \Omega \longrightarrow [0, 1]$ - функция вероятности элементарного исхода (probability function), такая что $\sum_{\omega \in \Omega} \rho(\omega) = 1$
3. $P: 2^\Omega \longrightarrow [0, 1]$ - вероятностная мера (probability measure), такая что $P(A) = \sum_{\omega \in \Omega} \rho(\omega)$

_Замечание:_ В общем случае $\Omega$ может быть бесконечным множеством. В таком случае $P$ будет являться произвольной мерой на этом множестве. Например $\Omega = \mathbb{R}^2$ с мерой Лебега (т. е. c площадью). Строго мы это не вводим, но пользоваться можно. Это еще называют геометрической вероятностью


**Определение:** Событие называется невозможным (impossible event), если $P(A) = 0$
**Определение:** Событие называется достоверным (sure event), если $P(A) = 1$

**Определение:** Условная вероятность (conditional probability) - вероятность наступления события $A$ при наступившем событии $B$. Вычисляется по формуле $P(A | B) = \frac{P(A \cap B)}{P(B)}$

**Определение:** События $A$ и $B$ называются независимыми (independent), если $P(A \cap B) = P(A) \cdot P(B)$ или, что эквивалентно $P(A | B) = P(A)$

Пусть $\left\{ A_1, A_2, ..., A_n \right\}$ - мн-во событий, тогда
**Определение:** Оно называется попарно независимым, если $\forall i, j < n$ $A_i$ и $A_j$ - независимы
**Определение:** Оно называется независимым в совокупности, если они все одновременно независимы

**Пример:**
Продемонстрируем разницу между попарной независимостью и независимостью в совокупности.
Пусть $\Omega$ - бросание двух кубиков
Выберем такие события:
1. На первом кубике выпало четное число
2. На втором кубике выпало четное число
3. Сумма чисел на двух кубиках четна

Это события являются попарно независимыми, но не в совокупности.

**Определение:** Множество событий $\left\{ A_1, A_2, ..., A_n \right\}$ образует полную группу в вероятностном пространстве $\Omega$, если:
 1. $\forall A_i, A_j$ $P(A_i \cap A_j) = 0$, т.е. все события несовместимы
 2.  $\sum_{i}{P(A_i)} = 1$, при этом они покрывают все вероятностное пространство $\Omega$

**Пример:**
<br/>
<img src="../static/IMG_09F686348EDB-1.jpeg" width="400"/>
<br/>

Таким образом вероятность события $B$ в этом пространстве $\Omega$ можно выразить через элементы полной группы как:
$P(B) = \sum_{i}{P(B | A_i) \cdot P(A_i)}$

<br/>
<img src="../static/IMG_252744EDB449-1.jpeg" width="400"/>
<br/>

_Замечание:_ Это чем-то напоминает факторизацию в алгебре

## Случайные величины

**Определение:** Случайная величина - это произвольная функция $\xi: \Omega \longrightarrow \mathbb{R}$

**Определение:** Случайные величины $\xi$ и $\psi$ называются независимыми, если $\forall x, y \in \mathbb{R} (x \neq y)$ $A = P(\xi = x)$ и $B = P(\psi = y)$ - $A$ и $B$ независимы

_Замечание:_ По аналогии, можно ввести понятие попарных независимых и независимых в совокупности случайных величин

**Пример:**
Предположим мы играем в игру с монеткой с такими правилами:
1. Если выпал орел, мы теряем 100 рублей
2. Если выпала решка, мы получаем 100 рублей

Тогда интуитивно можно ввести случайную величину $\xi$ таким образом:
\begin{align}
$\xi =$ \begin{cases} -100, & \mbox{ } \omega \mbox{ - орел}\\ 100, & \mbox{ } \omega \mbox{ - решка} \end{cases}
\end{align}

**Определение:** Математическое ожидание случайной величины - взвешенное среднее ее значений, т.е. $E\xi = \sum_{\omega \in \Omega}{\xi(\omega) \cdot P(\omega)}$

**Замечание:** То же самое можно записать грубо говоря «по Лебегу» $E\xi = \sum_{y \in cod(\xi)}{y \cdot P(\omega : \xi(\omega) = y)}$

**Пример:**
Посчитаем матожидание случайно величины из предыдущего примера с игрой с монеткой:
$E\xi = -100 \cdot \frac{1}{2} + 100 \cdot \frac{1}{2} = 0$

**Теорема о линейности математического ожидания**
$E(\alpha\xi + \beta\psi) = \alpha \cdot E\xi + \beta \cdot E\psi$
$\square$ $E(\alpha\xi + \beta\psi) = \sum_{\omega \in \Omega}{\bigg(\alpha\xi(\omega) + \beta\psi(\omega)\bigg)} = E(\alpha\xi) + E(\beta\psi) = \alpha \cdot E\xi + \beta \cdot E\psi$ $\blacksquare$


**Определение:** Индикаторная случайная величина - это функция вида
\begin{align}
$I_A(\omega) =$
\begin{cases}
1, & \mbox{ } \omega \in A \\
0, & \mbox{ } \omega \notin A
\end{cases}
\end{align}

**Примеры:**

Задача о назначениях:
Пусть у нас есть множество $A$ работников, множество $T$ работ и функция стоимости $C : A \times T \longrightarrow  \mathbb{R}$. Обычно функция стоимости задается в виде матрицы $C = c_{ij}$
Необходимо найти биекцию $f : A \longrightarrow T$, такую что сумма $\sum_{a \in A} C(a, f(a))$ минимальна.

В общем случае эта задача решается венгерским алгоритмом, но в обучающих целях рассмотрим, что будет, если мы попытаемся в качестве ответа брать случайную функцию $f$. Посчитаем математическое ожидание:

$E\xi = E\bigg(\sum_{i = 1}^{n}\sum_{j = 1}^{n} I_{c_{ij}} \cdot c_{ij}\bigg) = \sum_{i = 1}^{n}\sum_{j = 1}^{n} c_{ij} \cdot E(I_{c_{ij}}) = \frac{\sum_{i = 1}^{n}\sum_{j = 1}^{n} c_{ij}}{n}$

Задача максимального разреза:
Пусть у нас есть граф $G$.
Необходимо найти максимальный разрез этого графа, т.е. такое подмножество вершин, что у максимального количества ребер одна вершина лежит в этом подмножестве, а вторая нет. Например:
<br/>
<img src="../static/IMG_F4D34D90BF7D-1.jpeg" width="1000">

Для этой задачи неизвестен полиномиальный алгоритм решения, поэтому давайте попробуем посчитать матожидание случайного равновероятного выбора вершин в подмножество. Т. е. мы будем проходиться по всем вершинам графа и с вероятностью $\frac{1}{2}$ брать их в разрез.

Введем индикаторную случайную величину:
\begin{align}
$I_c = I_{uv} = $
\begin{cases}
1, & \mbox{ } u \in A, v \in \overline{A} \\
1, & \mbox{ } u \in \overline{A}, v \in A \\
0, & \mbox{ } u \in A, v \in A \\
0, & \mbox{ } u \in \overline{A}, v \in \overline{A} \\
\end{cases}
\end{align}

Тогда:
$E\bigg(\sum I_c\bigg) = \sum E(I_c) = \sum P(A_uv) = \frac{\epsilon(G)}{2}$

Наибольшая возрастающая подпоследовательность:
Пусть у нас есть массив $A$.
Необходимо найти наибольший возрастающий подмассив в $A$.

Эта задача решается методом динамического программирования, однако в учебных целях давайте попробуем решить ее жадным алгоритмом и посчитать математическое ожидания длины получающейся на выходе подпоследовательности.

Введем индикаторную случайную величину:

\begin{align}
$I_{A_i} =$
\begin{cases} 1, & \mbox{ } \forall j < i \mbox{ } A_j < A_i \\
0
\end{cases}
\end{align}

Тогда:
$E\bigg(\sum I_{A_i}\bigg) = \sum E(I_{A_i}) = \sum P(A_i) = \sum \frac{1}{i} = \ln(n) + \gamma + \epsilon_n$, где $\epsilon \rightarrow 0$


**Теорема**
$E(\xi \cdot \psi) = E\xi \cdot E\psi$, если $\xi$ и $\psi$ - независимые случайные величины
$\square$
$E(\xi \cdot \psi) = \sum_{z \in cod(\xi \cdot \psi)} z \cdot P(\xi \cdot \psi = z) = \sum_{x \in cod(\xi)} \sum_{y \in cod(\psi)} xy \cdot P(\xi = x \cap \psi = y) = \sum_{y \in cod(\psi)} xy \cdot P(\xi = x) \cdot P(\psi = y) = E\xi \cdot E\psi$
$\blacksquare$

## Дисперсия

**Определение:** Дисперсия случайной величины $\xi$ - это $D\xi = E(\xi - E\xi)^2$
_Замечание:_ Это второй момент случайной величины. Первый - это $E(|\xi - E\xi|)$, n-тый соответственно $E(|\xi - E\xi|^n)$

**Определение:** Средне квадратичное отклонение случайно величины \xi $\sigma = \sqrt{D\xi}$