# Вероятностные распределения : пакет Distributions.

Пакет Distributions предоставляет базовый функционал для дискретных и абсолютно непрерывных вероятностных распределений и связанных с ними функций, таких как:
1. Функции распределения $F_{\xi}(x) = \mathbb{P}[\xi \le x]$ и дополнение к функции распределения $1 - F_{\xi}(x)$.
2. Плотности функции распределения $f_{\xi}(x)$ (для абсолютно непрерывных) и распределение вероятностей дискретной случайной величины $\mathbb{P}(\xi = x_k)$.
3. Моменты случайных величин (мат. ожидание, дисперсия, коэффициент асимметрии, коэффициент эксцесса); энтропия вероятностного распределения.
Для использования пакета для начала его надо установить:
```julia
using Pkg
Pkg.add("Distributions")
```

In [1]:
using Distributions

Задать распределение можно с помощью команды:
```julia
d = Distributions.<DistributionName>(parameters)
```
либо без отсылки к пакету Distributions (имена всех распределений импортируются):
```julia
d = <DistributionName>(parameters)
```
Некоторые полезные распределения:

## Абсолютно непрерывные распределения:

### Нормальное распределение
```julia
d = Normal()
d = Normal(mean)
d = Normal(mean, sigma)
```
Первая команда создает нормальное распределение со средним 0 и дисперсией 1 (стандартное нормальное распределение $N(0, 1)$). Вторая команда создает нормальное распределение со средним $mean$ и дисперсией 1: $N(mean, 1)$. Третья команда создает нормальное распределение со средним $mean$ и дисперсией $sigma^2$: $N(mean, sigma)$.

### Экспоненциальное распределение
Плотность распределения:
$$ f(x\,|\,\theta) = \frac{1}{\theta} e^{-\frac{x}{\theta}}, \, x > 0$$
```julia
d = Exponential()
d = Exponential(theta)
```
Первая команда создает экспоненциальное распределение с параметром $theta = 1.0$. 

### Равномерное распределение
```julia
d = Uniform()
d = Uniform(a, b)
```
Равномерное распределение на отрезке $[a, b]$. По умолчанию (первая строка) параметры $a = 0, b = 1$.

### Бета-распределение
Плотность распределения:
$$ f(x\, |\, a, b) = \frac{1}{B(\alpha, \beta)} x^{\alpha - 1} (1-x)^{\beta - 1} , x \in [0, 1]$$
```julia
Beta()        # equivalent to Beta(1, 1)
Beta(a)       # equivalent to Beta(a, a)
Beta(a, b)    # Beta distribution with shape parameters a and b
```
Первая команда создает распределение Beta(1, 1), вторая - распределение Beta(a, a).

### Хи-квадрат
Плотность распределения:
$$ f(x \, | \, k) = \frac{1}{2^{k/2}} \frac{1}{\Gamma(k/2)} x^{\frac{k}{2} - 1} e^{-\frac{x}{2}}$$
```julia
d = Chisq(k)
```
Распределение $\chi^2$ с $k$ степенями свободы.

Разумеется, это не все доступные абсолютно непрерывные распределения. С полным списком поддерживаемых распределений можно ознакомиться на странице пакета Distributions.

## Дискретные распределения

### Распределение Бернулли
```julia
Bernoulli()
Bernoulli(p)
```
По умолчанию параметр $p = 0.5$.

### Распределение Пуассона
```julia
Poisson()
Poisson(lambda)
```
По умолчанию параметр $lambda = 1.$

### Геометрическое распределение
Количество неудач до первого успеха.
$$\mathbb{P}(X = k) = p (1 - p)^{k}, k = 0, 1, 2, \ldots$$
```julia
Geometric()
Geometric(p)
```
По умолчанию параметр $p = 0.5$.

### Дискретное равномерное распределение
$$ \mathbb{P}(X = k) = \frac{1}{b - a + 1}, k = a, a+1, \ldots b$$
```julia
DiscreteUniform(a, b)
```
Внимание: $a, b$ должны быть целыми либо допускать преобразование в целое без ошибки InexactError.

### Произвольное дискретное конечное распределение
$$\mathbb{P}(X = k) = p[k], k = 1, 2, \ldots M, \sum_{k=1}^M p[k] = 1$$
```julia
Categorical(p)
```
$p$ - вектор вероятностей.

Опять же, список дискретных распределений неполный. Полный список поддерживаемых распределений можно получить, используя команду ?Distributions в REPL (либо зайдя на сайт пакета).
```
  Arcsine, Bernoulli, Beta, BetaBinomial, BetaPrime, Binomial, Biweight,
  Categorical, Cauchy, Chi, Chisq, Cosine, DiagNormal, DiagNormalCanon,
  Dirichlet, DiscreteUniform, DoubleExponential, EdgeworthMean,
  EdgeworthSum, EdgeworthZ, EmpiricalUnivariateDistribution, Erlang,
  Epanechnikov, Exponential, FDist, FisherNoncentralHypergeometric,
  Frechet, FullNormal, FullNormalCanon, Gamma, GeneralizedPareto,
  GeneralizedExtremeValue, Geometric, Gumbel, Hypergeometric,
  InverseWishart, InverseGamma, InverseGaussian, IsoNormal,
  IsoNormalCanon, Kolmogorov, KSDist, KSOneSided, Laplace, Levy,
  Logistic, LogNormal, MixtureModel, Multinomial, MultivariateNormal,
  MvLogNormal, MvNormal, MvNormalCanon, MvNormalKnownCov, MvTDist,
  NegativeBinomial, NoncentralBeta, NoncentralChisq, NoncentralF,
  NoncentralHypergeometric, NoncentralT, Normal, NormalCanon,
  NormalInverseGaussian, Pareto, Poisson, PoissonBinomial,
  QQPair, Rayleigh, Skellam, SymTriangularDist, TDist, TriangularDist,
  Triweight, Truncated, TruncatedNormal, Uniform, UnivariateGMM,
  VonMises, VonMisesFisher, WalleniusNoncentralHypergeometric, Weibull,
  Wishart, ZeroMeanIsoNormal, ZeroMeanIsoNormalCanon,
  ZeroMeanDiagNormal, ZeroMeanDiagNormalCanon, ZeroMeanFullNormal,
  ZeroMeanFullNormalCanon
```

## Полезные функции

### Функция распределения, выборка, квантиль
```julia
cdf(d, x)
```
Вычислить функцию распределения d в точке x

```julia
pdf(d, x)
```
Вычислить плотность распределения d в точке х.

```julia
rand(d, n)
```
Получить выборку размера n из распределения d.

```julia
rand!(d, x)
```
Заполнить массив x элементами, выбранными случайно из распределения d. Память не аллокируется. Часто перед использованием необходимо дополнительно использовать модуль Random (using Random).

```julia
quantile(d, alpha)
```
Квантиль распределения d уровня alpha (решение уравнения $F_{\xi}(x) = \alpha$)

```julia
quantile(d, [alphas])
```
Массив квантилей распределения d соответствующих уровней. К примеру, код
```julia
quantile(Normal(), [0.5, 0.95])
```
выдаст массив из двух элементов (медиана, 95%-ная квантиль) для стандартного нормального распределения.

### Характеристики распределения: центральные меры тенденции, характеристическая функция, производящая функция
```julia
mean(d)       # математическое ожидание, среднее значение
var(d)        # дисперсия
std(d)        # стандартное отклонение
median(d)     # медиана
mode(d)       # мода (первая)
modes(d)      # все моды распределения
skewness(d)   # коэффициент асимметрии
kurtosis(d)   # коэффициент эксцесса
entropy(d)    # энтропия распределения
cf(d, t)      # значение характеристической функции в точке t
mgf(d, t)     # производящая функция моментов в точке t
```

### "Подгонка" распределения.
```julia
fit(D, x)
```
По данным наблюдениям $x$ (массив наблюдений) julia подбирает параметры распределения D (чаще всего - по методу максимального правдоподобия, однако it depends - бывают и другие методы). Важно, что D - это тип (type) распределения, а не само распределение. Пример использования:

In [3]:
d = Normal()
x = rand(d, 1000)
fit(Normal, x)

Normal{Float64}(μ=-0.023289228339368737, σ=1.0086248775651658)

Мы видим, что значения получились близкие к "настоящим" (0, 1). Функция fit работает не для всех распределений; иногда она может быть заменена на функцию fit_mle, которая подбирает коэффициенты по методу максимального правдоподобия:
```julia
fit_mle(D, x)
```

## Задачи на "подумать":
1. Утверждается, что если у нас есть две случайные величины X, Y, равномерно распределенные на интервале (0, 1], то мы можем получить нормально распределенную случайную величину следующим образом
$$Z = \cos{2\pi X}\sqrt{-2\ln{Y}}$$
Проверить эмпирически данное утверждение. Проверить с помощью статистических критериев (Андерсон-Дарлинг, Колмогоров-Смирнов,...).

2. Утверждается, что сумма независимых Пуассоновских случайных величин вновь подчиняется распределению Пуассона. Проверить эмпирически.

3. Изучить взаимосвязь между мерами центральной тенденции и производящей функцией моментов. 