# Характеристики положения и рассеяния

Необходимо сгенерировать выборки размером 10, 100, 1000 элементов. Для каждой выборки вычислить следующие статистические характеристики:

1. выборочное среднее
2. выборочная медиана
3. полусумма экстремальных выборочных элементов
4. полусумма квартилей
5. усечённое среднее

Повторить такие вычисления 1000 раз для каждой выборки и найти среднее характеристик положения их квадратов. Вычислить оценку дисперсии. Представить полученные данные в виде таблиц.

In [27]:
from scipy.stats import norminvgauss, laplace, poisson, cauchy, uniform
import numpy as np
import math as m

In [28]:
sizes = [10, 100, 1000]
NORMAL, CAUCHY, LAPLACE, POISSON, UNIFORM = "NormalNumber", "CauchyNumber", "LaplaceNumber", "PoissonNumber", "UniformNumber"
NUMBER_OF_REPETITIONS = 1000

Функция вычисления выборочного среднего

In [29]:
def mean(selection):
    return np.mean(selection)

Функция вычисления выборочной медианы

In [30]:
def med(selection):
    return np.median(selection)

Функция вычисления полусуммы экстремальных выборочных элементов

In [31]:
def z_R(selection, size):
    z_R = (selection[0] + selection[size - 1]) / 2
    return z_R

Функция вычисления выборочной квартили порядка р

In [32]:
def z_p(selection, np):
    if np.is_integer():
        return selection[int(np)]
    else:
        return selection[int(np) + 1]

In [33]:
def z_Q(selection, size):
    z_1 = z_p(selection, size / 4)
    z_2 = z_p(selection, 3 * size / 4)
    return (z_1 + z_2) / 2

Функция вычисления усечённого среднего

In [34]:
def z_tr(selection, size):
    r = int(size / 4)
    sum = 0
    for i in range(r + 1, size - r + 1):
        sum += selection[i]
    return (1 / (size - 2 * r)) * sum 

Функция вычисления дисперсии

In [35]:
def dispersion(selection):
    return np.std(selection) ** 2 

Функция построения таблицы для нормального распределения

In [45]:
def NormalNumbers():
    mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
    all_list = [mean_list, med_list, z_R_list, z_tr_list]
    for size in sizes:
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = norminvgauss.rvs(1, 0, size=size)
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        print(E)
        print(D)
    return
NormalNumbers()

[-0.017083, -0.010017, 0.005245, -0.01171]
[0.103828, 0.094729, 0.494152, 0.176591]
[-0.010634, -0.008364, 0.007187, -0.006499]
[0.05704, 0.05219, 0.497589, 0.098281]
[-0.006939, -0.005421, 0.012277, -0.004517]
[0.038373, 0.035116, 0.480981, 0.066168]


Функция построения таблицы для распределения Коши

In [47]:
def CauchyNumbers():
    mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
    all_list = [mean_list, med_list, z_R_list, z_tr_list]
    for size in sizes:
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = cauchy.rvs(size=size)
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        print(E)
        print(D)
    return
CauchyNumbers()

[2.385181, -0.013023, 7.472869, 1.636121]
[2925.751934, 0.278021, 52825.869252, 2255.92386]
[5.940857, -0.006036, 5.271, 10.369904]
[48085.994652, 0.151948, 32466.34009, 187485.152435]
[6.538808, -0.00384, 3.424497, 7.146975]
[50341.089823, 0.102123, 21826.008261, 125153.02119]


Функция построения таблицы для распределения Лапласа

In [48]:
def LaplaceNumbers():
    mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
    all_list = [mean_list, med_list, z_R_list, z_tr_list]
    for size in sizes:
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = laplace.rvs(size=size, scale=1 / m.sqrt(2), loc=0)
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        print(E)
        print(D)
    return
LaplaceNumbers()

[-0.005003, -0.004907, 0.001735, -0.002231]
[0.099281, 0.074265, 0.52748, 0.171046]
[-0.003208, -0.001888, -0.00332, -0.001526]
[0.054849, 0.040017, 0.499454, 0.095556]
[-0.002384, -0.001383, -0.013836, -0.001191]
[0.036902, 0.026847, 0.480692, 0.064361]


Функция построения таблицы распределения Пуассона

In [49]:
def PoissonNumbers():
    mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
    all_list = [mean_list, med_list, z_R_list, z_tr_list]
    for size in sizes:
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = poisson.rvs(10, size=size)
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        print(E)
        print(D)
    return
PoissonNumbers()

[10.0051, 9.903, 10.0045, 9.972667]
[1.066504, 1.545091, 5.08473, 1.71942]
[10.00068, 9.86925, 9.9905, 9.994703]
[0.582337, 0.882779, 5.27741, 0.961191]
[9.998883, 9.910667, 9.982833, 9.992858]
[0.391604, 0.593853, 5.187455, 0.647827]


Функция построения таблицы равномерного распределения

In [50]:
def UniformNumbers():
    mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
    all_list = [mean_list, med_list, z_R_list, z_tr_list]
    for size in sizes:
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = uniform.rvs(size=size, loc=-m.sqrt(3), scale=2 * m.sqrt(3))
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        print(E)
        print(D)
    return
UniformNumbers()

[0.003575, 0.004968, 0.022722, 0.011497]
[0.094385, 0.231843, 0.517434, 0.163409]
[0.000577, 0.002148, 0.013476, 0.006383]
[0.051759, 0.130048, 0.50773, 0.090981]
[0.000154, 0.001459, 0.000521, 0.003517]
[0.034832, 0.087645, 0.509554, 0.061383]
