# <font color = Crimson size = 6> <b>Случайные величины</b> </font>

<u>**Случайной**</u> называют **величину**, которая в результате испытания примет одно и только одно числовое значение, зависящее от случайных факторов и заранее непредсказуемое.

**Виды случайных величин:**
1) <u>**Дискретная**</u> (прерывная) случайная величина – принимает отдельно взятые, изолированные значения. Количество этих значений конечно либо бесконечно, но счётно. \
2) <u>**Непрерывная**</u> случайная величина – принимает все числовые значения из некоторого конечного или бесконечного промежутка.

In [2]:
import numpy as np

import scipy.stats as stats

import matplotlib.pyplot as plt

___
## <font color = DarkGreen size = 5> <b>Дискретная случайная величина</b> </font>
___
### <font color = MediumBlue size = 4> <b>Закон распределения дискретной случайной величины</b> </font>
– это соответствие между возможными значениями этой величины и их вероятностями.

Т.к. случайная величина $X$ обязательно примет одно из значений $x_1, x_2, \ldots, x_n$, то соответствующие события образуют полную группу и сумма вероятностей их наступления равна единице: \
$\displaystyle \sum_{i=1}^{n}{p_i} = 1$
<br><br>

<table border="1" bordercolor="grey" align="left" width="400">
    <tr>
        <td rowspan = 2>$X$</td>
        <td>$x_1$</td>
        <td>$x_2$</td>
        <td>$\ldots$</td>
        <td>$x_n$</td>
    </tr>
    <tr>
        <td>$p_1$</td>
        <td>$p_2$</td>
        <td>$\ldots$</td>
        <td>$p_n$</td>
    </tr>
</table>


___
### <font color = MediumBlue size = 4> <b>Математическое ожидание дискретной случайной величины</b> </font>
– это среднеожидаемое значение при многократном повторении испытаний.

$\displaystyle M(X)  = \sum_{i=1}^{n}{x_ip_i}$

**Свойства математического ожидания**:
1) Математическое ожидание постоянной величины равно самой постоянной: $M(C) = C$ \
2) Постоянный множитель можно выносить за знак математического ожидания: $M(CX) = CM(X)$ \
3) Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий: $M(XY) = M(X) \cdot M(Y)$ \
4) Математическое ожидание суммы двух случайных величин равно сумме математических ожиданий слагаемых: $M(X+Y) = M(X)+M(Y)$

#### <font color = SteelBlue size = 3> <b>Математическое ожидание числа появлений события в независимых испытаниях</b> </font>

Математическое ожидание $M(X)$ числа появлений события $A$ в $n$ независимых испытаниях равно произведению числа испытаний на вероятность появления события в каждом испытании: \
$\displaystyle M(X)  = np$


___
### <font color = MediumBlue size = 4> <b>Дисперсия дискретной случайной величины</b> </font>
Для того чтобы оценить, как рассеяны возможные значения случайной величины вокруг ее математического ожидания, пользуются, в частности, числовой характеристикой, которую называют <u>**дисперсией**</u>.

<u>**Отклонением**</u> называют разность между случайной величиной и ее математическим ожиданиям: $X-M(X)$ \
**Математическое ожидание отклонения равно нулю: $M[X-M(X)] = 0$**

<u>**Дисперсией дискретной случайной величины**</u> называют математическое ожидание квадрата отклонения случайной величины от ее математического ожидания: \
$\displaystyle D(X) = M[X-M(X)]^2 = \sum_{i=1}^{n}{(x_i-M(X))^2p_i}$

Дисперсия равна разности между математическим ожиданием квадрата случайной величины $X$ и квадратом ее математического ожидания: \
$\displaystyle D(X) = M(X^2)-[M(X)]^2$

**Свойства дисперсии**:
1) Дисперсия постоянной величины $C$ равна нулю: $D(C)=0$

2) Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат: $D(CX) = C^2D(X)$

3) Дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин: $D(X+Y) = D(X) + D(Y)$

* Дисперсия суммы нескольких взаимно независимых случайных величин равна сумме дисперсий этих величин: $D(X+Y+Z)=D(X)+D(Y)+D(Z)$
    
* Дисперсия суммы постоянной величины и случайной равна дисперсии случайной величины: $D(C+X)=D(X)$
    
4) Дисперсия разности двух независимых случайных величин равна сумме их дисперсий: $D(X-Y) = D(X) + D(Y)$

#### <font color = SteelBlue size = 3> <b>Дисперсия числа появлений события в независимых испытаниях</b> </font>

Дисперсия числа появлений события $A$ в $n$ независимых испытаниях, в каждом из которых вероятность $p$ появления события постоянна, равна произведению числа испытаний на вероятности появления и непоявления события в одном испытании: \
$D(X) = npq$<br>

___
### <font color = MediumBlue size = 4> <b>Среднее квадратическое отклонение</b> </font>

Средним квадратическим отклонением случайной величины $X$ называют квадратный корень из дисперсии: \
$\sigma = \sqrt{D(X)}$<br>

>В тех случаях, когда желательно, чтобы оценка рассеяния имела размерность случайной величины, вычисляют среднее квадратическое отклонение, а не дисперсию.

Среднее квадратическое отклонение суммы конечного числа взаимно независимых случайных величин равно квадратному корню из суммы квадратов средних квадратических отклонений этих величин: \
$\displaystyle \sigma(X_1+X_2+\ldots+X_n) = \sqrt{\sum_{i=1}^{n}{D(X_i)}} = \sqrt{\sum_{i=1}^{n}{\sigma^2(X_i)}}$


___
### <font color = MediumBlue size = 4> <b>Одинаково рапределенные взаимно независимые случайные величины</b> </font>

Рассмотрим $n$ взаимно независимых случайных величин $X_1, X_2, \ldots, X_n$,  которые имеют одинаковые распределения, а следовательно, и одинаковые характеристики (математическое ожидание, дисперсию и др.).\
Обозначим среднее арифметическое рассматриваемых случайных величин через $\bar{X}$:
$\displaystyle \bar{X} = \frac{X_1+X_2+\ldots+X_n}{n}$

1) Математическое ожидание среднего арифметического одинаково распределенных взаимно независимых случайных величин равно математическому ожиданию $a$ каждой из величин: $M(\bar{X})=a$

2) Дисперсия среднего арифметического $n$ одинаково распределенных взаимно независимых случайных величин в $n$ раз меньше дисперсии $D$ каждой из величин: $\displaystyle D(\bar{X})=\frac{D}{n}$

3) Среднее квадратическое отклонение среднего арифметического $n$ одинаково распределенных взаимно независимых случайных величин в $\sqrt{n}$ раз меньше среднего квадратического отклонения $\sigma$ каждой из величин: $\displaystyle \sigma(\bar{X}) = \frac{\sigma}{\sqrt{n}}$

**Среднее арифметическое достаточно большого числа взаимно независимых случайных величин имеет значительно меньшее рассеяние, чем каждая отдельная величина.**

___
### <font color = MediumBlue size = 4> <b>Начальные и центральные теоретические моменты</b> </font>

<u>**Начальным моментом порядка $k$**</u> случайной величины $X$ называют математическое ожидание величины $X$: \
$\nu_k = M(X^k)$
<br>

$\nu_1 = M(X) \\
\nu_2 = M(X^2) \\
D(X) = \nu_2-\nu_1^2$
<br><br>

<u>**Центральным моментом порядка $k$**</u> случайной величины $X$ называют математическое ожидание величины $(X-M(X))^k$:
$\mu_k = M[(X-M(X))^k]$
<br>

$\mu_1 = M[(X-M(X))] = 0 \\
\mu_2 = M[(X-M(X))^2] = D(X) \\
\mu_2 = \nu_2-\nu_1^2$


___
### <font color = MediumBlue size = 4> <b>Многоугольник и функция распределения дискретной случайной величины</b> </font>

<u>**Многоугольником</u> распределения вероятностей** дискретной случйаной величины называют ломаную, звенья которой соединяют соседние точки $(x_i;p_i)$.

Функция распределения случайной величины: \
$F(X)=P(X<x)$, где \
$P(X<x)$ – вероятность того, что случайная величина  примет значение, меньше, чем переменная $x \in \mathbb R$.

**Свойтсва функции распределения**:
1) Значения функции распределения принадлежат отрезку $[0,1]$: $0 \leq F(x) \leq 1$

2) $F(x)$ – неубывающая функция: $F(x_2) \geq F(x_1)$, если $x_2 > x_1$

___
## <font color = DarkGreen size = 5> <b>Распределения дискретной случайной величины</b> </font>
___
### <font color = MediumBlue size = 4> <b>Биномиальное распределение вероятностей</b> </font>

Пусть проводится $n$ **независимых испытаний**, в каждом из которых случайное событие $A$ может появиться с вероятностью $p$. Тогда случайная величина $X$ – число появлений события $A$ в данной серии испытаний, имеет биномиальное распределение.

Понятно, что эта случайная величина может принять одно из следующих значений: $x_0=0, x_1=1, x_2=2, \ldots, x_n=n$.

Соответствующие вероятности определяются формулой Бернулли: \
$\displaystyle p_i = P_n^{x_i} = C_n^{x_i}p^{x_i}q^{n-x_i}$, где \
$n$ – количество независимых испытаний \
$p$ – вероятность появления события $A$ в каждом испытании \
$q=1-p$ – вероятность **не**появления события $A$ в каждом испытании \
$x_i=\{0,1,2,\ldots,n\}$ – сколько раз может появиться событие $A$ в данной серии испытаний


<table border="1" bordercolor="grey" width="700">
    <tr>
        <td rowspan = 2>$X$</td>
        <td>$x_i$</td>
        <td>$0$</td>
        <td>$1$</td>
        <td>$2$</td>
        <td>$\ldots$</td>
        <td>$n-1$</td>
        <td>$n$</td>
    </tr>
    <tr>
        <td>$p_i$</td>
        <td>$C_n^{0}p^{0}q^{n}$</td>
        <td>$C_n^{1}p^{1}q^{n-1}$</td>
        <td>$C_n^{2}p^{2}q^{n-2}$</td>
        <td>$\ldots$</td>
        <td>$C_n^{n-1}p^{n-1}q^{1}$</td>
        <td>$C_n^{n}p^{n}q^{0}$</td>
    </tr>
</table>
<br>

Вероятности $p_i$ представляют собой **члены бинома Ньютона**. По формуле бинома:
$C_n^{0}p^{0}q^{n} + C_n^{1}p^{1}q^{n-1} + C_n^{2}p^{2}q^{n-2} + \ldots + C_n^{n-1}p^{n-1}q^{1} + C_n^{n}p^{n}q^{0} = (q+p)^n = 1^n = 1$


___
### <font color = MediumBlue size = 4> <b>Распределение и формула Пуассона</b> </font>

Пусть производится $n$ независимых испытаний, в каждом из которых вероятность появления события равна $p$.
Если количество испытаний $n$ достаточно велико, а вероятность $p$ появления события $A$ в отдельно взятом испытании весьма мала ($<0.1$), то вероятность того, что в данной серии испытаний событие $A$ появится ровно $m$ раз, можно приближенно вычислить по формуле Пуассона: \
$\displaystyle P_m\approx \frac{λ^m}{m!}\cdot e^{-λ}$, где $λ = np$ - среднее количество наступления события за определенную единицу измерений.

>В теории установлено, что **математическое ожидание** пуассоновской случайной величины равно $M(X)=\lambda$ и **дисперсия** – тому же самому значению $D(X)=\lambda$.

___
### <font color = MediumBlue size = 4> <b>Геометрическое распределение вероятностей</b> </font>

Пусть проводится серия испытаний, в каждом из которых случайное событие $A$ может появиться с вероятностью $p$, причём, испытания заканчиваются при первом же появлении данного события. Тогда случайная величина $X$, характеризующая количество совершённых попыток, имеет геометрическое распределение.

Дискретная случайная величина, которая  принимает бесконечное и счётное количество значений. В общем виде её закон распределения записывается следующим образом: $P(X=n)=q^{n-1}p$

<table border="1" bordercolor="grey" width="500">
    <tr>
        <td rowspan = 2>$X$</td>
        <td>$x_i$</td>
        <td>$1$</td>
        <td>$2$</td>
        <td>$3$</td>
        <td>$\ldots$</td>
        <td>$n$</td>
        <td>$\ldots$</td>
    </tr>
    <tr>
        <td>$x_i$</td>
        <td>$q^0p$</td>
        <td>$q^1p$</td>
        <td>$q^2p$</td>
        <td>$\ldots$</td>
        <td>$q^{n-1}p$</td>
        <td>$\ldots$</td>
    </tr>
</table>

Вероятности $p_i$ представляют собой **бесконечно убывающую геометрическую прогрессию** с первым членом $p$ и основанием $q$. \
Как известно, сумма такой прогрессии равна: $\displaystyle p+qp+q^2p+q^3p+\ldots=\frac{p}{1-q}=\frac{p}{p}=1$

___
### <font color = MediumBlue size = 4> <b>Гипергеометрическое распределение вероятностей</b> </font>

Пусть в совокупности из $N$ объектов содержатся $M$ бъектов, обладающие некоторым признаком ($M<N$). Из этой совокупности случайным образом и без возвращения извлекается $n$ объектов. Тогда случайная величина $X$ – количество $m$ «особых» объектов в выборке – распределена по гипергеометрическому закону.

Искомая вероятность равна отношению числа исходов, благоприятствующих событию $X=m$, к числу всех элементарных исходов: \
$\displaystyle P(X=m) = \frac{C_M^m C_{N-M}^{n-m}}{C_N^n}$