## Работа с распределениями в SciPy

В SciPy — это очень мощная библиотека для работы с распределениями. Тут реализовано почти все, что может понадобиться: генерация случайных величин, функции плотности/распрелеления/квантилей, вычисление численных характеристик случайных величин.  

In [None]:
import numpy as np
from scipy import stats 
import matplotlib.pyplot as plt

В SciPy реализованы объекты для большого количества распределений. Вот некоторые из них: 

<table class="shadedrows">
<tr>
<th><strong>Распределение</strong></th>
<th><strong>Название в SciPy</strong></th>
<th><strong>Параметры</strong></th>
</tr>
<tr>
<td>Биномиальное</td>
<td><code>binom</code></td>
<td><code>size</code>, <code>prob</code></td>
</tr>
<tr>
<td>Пуассона</td>
<td><code>poisson</code></td>
<td><code>lambda</code></td>
</tr>
<tr>
<td>Равномерное</td>
<td><code>uniform</code></td>
<td></td>
</tr>
<tr>
<td>Экспоненциальное</td>
<td><code>expon</code></td>
<td></td>
</tr>
<tr>
<td>Нормальное</td>
<td><code>norm</code></td>
<td></td>
</tr>
<tr>
<td>Коши</td>
<td><code>cauchy</code></td>
<td></td>
</tr>
<tr>
<td>Хи-квадрат</td>
<td><code>chi2</code></td>
<td><code>df</code></td>
</tr>
<tr>
<td>Стьюдента</td>
<td><code>t</code></td>
<td><code>df</code></td>
</tr>
</table>

В данной таблице указаны не все параметры, а обязательные для заполнения. Значения неуказанных параметров установлены по умолчанию (но их тоже можно менять). Другие распределения можно найти тут: https://docs.scipy.org/doc/scipy/reference/stats.html

In [None]:
# Пример использования
dist1 = stats.norm() # стандартное нормальное распределение N(0,1)
dist2 = stats.norm(0,2) # нормальное распределение N(0,2^2)
dist3 = stats.uniform() # равномерное распределение на [0,1]
dist4 = stats.uniform(2,3) # равномерное распределение на [2,5] (!)

После того, как Вы определите объект для некоторого распределения, Вы сможете использовать следующие методы (некоторые из них применимы только к непрерывным распределениям):
    
<table style="text-align:left;">
<tr>
<th><strong>Метод</strong></th>
<th><strong>Значение</strong></th>
</tr>
<tr>
<td><code>rvs</code></td>
<td>генерация случайных чисел</td>
</tr>
<tr>
<td><code>pdf</code></td>
<td>плотность распределения</td>
</tr>
<tr>
<td><code>cdf</code></td>
<td>функция распределения</td>
</tr>
<tr>
<td><code>ppf</code></td>
<td>фукция для квантилей (обратная функция к функции распределения)</td>
</tr>
<tr>
<td><code>moment</code></td>
<td>моменты (нецентральные)</td>
</tr>    
<tr>
<td><code>stats</code></td>
<td>характеристики распределения: среднее, дисперсия, коэффициенты асимметрии и эксцесса </td>
</tr>
<tr>
<td><code>expect</code></td>
<td>математическое ожидание произвольной функции</td>
</tr>   
<tr>
<td><code>mean</code></td>
<td>математическое ожидание</td>
</tr>    
<tr>
<td><code>var</code></td>
<td>дисперсия</td>
</tr>    
</table>

Подробнее, опять же, тут: https://docs.scipy.org/doc/scipy/reference/stats.html

In [None]:
# геренация случайных чисел из dist2
dist2.rvs(size=[10,2], random_state=2)

In [None]:
# вычисление функции плотности dist2 в точке u=1
dist2.pdf(1)

In [None]:
# вычисление функции распределения dist1 в точке u=1
dist2.cdf(1)

In [None]:
# нарисуем функцию плотности и распределения dist2 от -7 до 7
fig, (ax1, ax2) = plt.subplots(ncols=2,figsize=(16,4)) 

x = np.linspace(-7,7,100)

y = dist2.pdf(x)
ax1.plot(x,y)

y = dist2.cdf(x)
ax2.plot(x,y)

plt.show()

In [None]:
# функция квантилей 
x = dist2.ppf(1-0.05/2)
dist2.cdf(x)

In [None]:
# вычисление момента порядка 2 для dist1
dist2.moment(4)

In [None]:
# вычисление среднего, дисперсии, коэффициентов асимметрии и эксцесса для dist2 
# коэффициент эксцесса центрируется на 3 (!)
dist2.stats(moments='mvsk')

In [None]:
# вычисление математического ожидания g(X), для g(u) = u^2 и X из dist1
dist2.expect(lambda x: np.sin(x)**2)

In [None]:
# вычисление математического ожидания
dist2.mean()

In [None]:
# вычисление дисперсиии
dist2.var()