# Лабораторная работа №2

In [1]:
import numpy as np
from scipy import stats
from math import sqrt

## Постановка задачи
Для 5 распределений:
* Нормальное распределение $N(x,0,1)$;
* Распределение Коши $C(x,0,1)$;
* Распределение Лапласа $L(x,0,\frac{1}{\sqrt{2}})$;
* Распределение Пуассона $P(k,10)$;
* Равномерное распределение $U(x,-\sqrt{3},\sqrt{3})$

Сгенерировать выборки размером 10, 100 и 1000 элементов. Для каждой выборки вычислить следующие статистические характеристики положения данных: $\overline{x},med(x),z_R,z_Q,z_{tr}$. Повторить такие вычисления 1000 раз для каждой выборки и найти среднее характеристик положения и их квадратов:
$$E(z)=\overline{z}$$
Вычислить оценку дисперсии по формуле:
$$D(z)=\overline{z^2}-\overline{z}^2$$
Представить полученные данные в виде таблиц.

## Теория


## Реализация

In [2]:
# Normal distribution
normal_distribution = {
    'distrib' : np.random.standard_normal,
    'pdf' : stats.norm.pdf,
    'title' : "Нормальное распределение $N(x,0,1)$",
    'name' : "Normal distribution",
}

# Cauchy distribution
cauchy_distribution = {
    'distrib' : np.random.standard_cauchy,
    'pdf' : stats.cauchy.pdf,
    'title' : "Распределение Коши $C(x,0,1)$",
    'name' : "Cauchy distribution",
}

# Laplace distribution
laplace_param = [0, 1 / sqrt(2)] # mu, lambda
laplace_distribution = {
    'distrib' : lambda n: np.random.laplace(laplace_param[0], laplace_param[1], n),
    'pdf' : lambda x: stats.laplace.pdf(x, laplace_param[0], laplace_param[1]),
    'title' : "Распределение Лапласа $L(x,0,1 / \sqrt{2})$",
    'name' : "Laplace distribution",
}

# Poisson distribution
poisson_param = 10 # mu
poisson_distribution = {
    'distrib' : lambda n: np.random.poisson(poisson_param, n),
    'pdf' : lambda x: (np.power(x, poisson_param) / np.math.factorial(poisson_param)) * np.exp(-x),
    'title' : "Распределение Пуассона $P(k,10)$",
    'name' : "Poisson distribution",
}

# Uniform distribution
segment = [-sqrt(3), sqrt(3)]
uniform_distribution = {
    'distrib' : lambda n: np.random.uniform(segment[0], segment[1], n),
    'pdf' : lambda x: stats.uniform.pdf(x, segment[0], segment[1] - segment[0]),
    'title' : "Равномерное распределение $U(x,-\sqrt{3},\sqrt{3})$",
    'name' : "Uniform distribution",
}

In [3]:
def HalfAmountQuartiles(x):
    np = len(x) // 4
    if len(x) % 4 > 0:
        np += 1
    np -= 1
    z_Q = x[np]
    
    np = (len(x) * 3) // 4
    if (len(x) * 3) % 4 > 0:
        np += 1
    np -= 1
    z_Q += x[np]
    return z_Q / 2

def E(z):
    return np.mean(z)

def D(z):
    return np.var(z)

def InitDict():
    z = {
            "mean" : [],
            "median" : [],
            "z_R" : [],
            "z_Q" : [],
            "z_tr" : [],
    }
    return z

def ResearchDistibution(distribution, n, iter_num):
    np.random.seed(42)
    rounded = 4
    res = {
        "E" : InitDict(),
        "D" : InitDict(),
    }
    for i in range(len(n)):
        z = InitDict()
        for _ in range(iter_num):
            x = distribution['distrib'](n[i])
            x.sort()
            z["mean"].append(np.mean(x))
            z["median"].append(np.median(x))
            z["z_R"].append((min(x) + max(x)) / 2)
            z["z_Q"].append(HalfAmountQuartiles(x))
            z["z_tr"].append(stats.trim_mean(x, 0.25))
        for key in z.keys():
            res["E"][key].append(round(E(z[key]), rounded))
            res["D"][key].append(round(D(z[key]), rounded))
    return res

In [4]:
distributions = [normal_distribution,
                 cauchy_distribution,
                 laplace_distribution,
                 poisson_distribution,
                 uniform_distribution]

In [12]:
n = [10, 100, 1000]
iter_num = 1000

for distrib in distributions:
    res = ResearchDistibution(distrib, n, iter_num)
    print(distrib['name'])
    #print("E\n", res["E"])
    #print("D\n", res["D"])
    for key in res['E'].keys():
        print(key + ":")
        string = (res["E"][key][0], res["D"][key][0],
                  res["E"][key][1], res["D"][key][1],
                  res["E"][key][2] ,res["D"][key][2])
        print("$%.4f$ & $%.4f$ & $%.4f$ & $%.4f$ & $%.4f$ & $%.4f$\\\\" %string)

Normal distribution
mean:
$-0.0021$ & $0.0985$ & $0.0023$ & $0.0107$ & $-0.0017$ & $0.0010$\\
median:
$-0.0090$ & $0.1337$ & $0.0035$ & $0.0149$ & $-0.0010$ & $0.0016$\\
z_R:
$-0.0017$ & $0.1847$ & $0.0010$ & $0.0928$ & $-0.0056$ & $0.0630$\\
z_Q:
$-0.0015$ & $0.1177$ & $-0.0133$ & $0.0132$ & $-0.0039$ & $0.0012$\\
z_tr:
$-0.0033$ & $0.1113$ & $0.0020$ & $0.0123$ & $-0.0017$ & $0.0012$\\
Cauchy distribution
mean:
$2.8525$ & $8261.4971$ & $-0.2714$ & $282.5623$ & $-0.6571$ & $1680.6291$\\
median:
$-0.0043$ & $0.3821$ & $-0.0046$ & $0.0260$ & $-0.0015$ & $0.0024$\\
z_R:
$14.1643$ & $206062.7067$ & $-10.5066$ & $693686.7652$ & $-358.4519$ & $417271337.3135$\\
z_Q:
$0.0312$ & $1.2177$ & $-0.0336$ & $0.0493$ & $-0.0029$ & $0.0049$\\
z_tr:
$0.0049$ & $0.5952$ & $-0.0038$ & $0.0261$ & $-0.0013$ & $0.0026$\\
Laplace distribution
mean:
$-0.0197$ & $0.0897$ & $-0.0015$ & $0.0099$ & $0.0017$ & $0.0010$\\
median:
$-0.0158$ & $0.0648$ & $0.0025$ & $0.0058$ & $0.0003$ & $0.0005$\\
z_R:
$-0.0338$ & $