# Характеристики положения и рассеяния

Необходимо сгенерировать выборки размером 10, 100, 1000 элементов. Для каждой выборки вычислить следующие статистические характеристики:

1. выборочное среднее
2. выборочная медиана
3. полусумма экстремальных выборочных элементов
4. полусумма квартилей
5. усечённое среднее

Повторить такие вычисления 1000 раз для каждой выборки и найти среднее характеристик положения их квадратов. Вычислить оценку дисперсии. Представить полученные данные в виде таблиц.

In [93]:
from scipy.stats import norm, laplace, poisson, cauchy, uniform
import numpy as np
import math as m

In [94]:
sizes = [10, 100, 1000]
NORMAL, CAUCHY, LAPLACE, POISSON, UNIFORM = "NormalNumber", "CauchyNumber", "LaplaceNumber", "PoissonNumber", "UniformNumber"
NUMBER_OF_REPETITIONS = 1000

Функция вычисления выборочного среднего

In [95]:
def mean(selection):
    return np.mean(selection)

Функция вычисления выборочной медианы

In [96]:
def med(selection):
    return np.median(selection)

Функция вычисления полусуммы экстремальных выборочных элементов

In [97]:
def z_R(selection, size):
    z_R = (selection[0] + selection[size - 1]) / 2
    return z_R

Функция вычисления выборочной квартили порядка р

In [98]:
def z_p(selection, np):
    if np.is_integer():
        return selection[int(np)]
    else:
        return selection[int(np) + 1]

Функция вычисления полусуммы квартилей

In [99]:
def z_Q(selection, size):
    z_1 = z_p(selection, size / 4)
    z_2 = z_p(selection, 3 * size / 4)
    return (z_1 + z_2) / 2

Функция вычисления усечённого среднего

In [100]:
def z_tr(selection, size):
    r = int(size / 4)
    sum = 0
    for i in range(r + 1, size - r + 1):
        sum += selection[i]
    return (1 / (size - 2 * r)) * sum 

Функция вычисления дисперсии

In [101]:
def dispersion(selection):
    return np.std(selection) ** 2 

Функция построения таблицы для нормального распределения

In [102]:
def NormalNumbers():
    for size in sizes:
        mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
        all_list = [mean_list, med_list, z_R_list, z_Q_list, z_tr_list]
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = norm.rvs(size=size)
            distribution.sort()
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        print(E)
        print(D)
    return
NormalNumbers()

[-0.003187, -0.000115, -0.0247, 0.308567, 0.277825]
[0.102966, 0.140946, 0.191103, 0.129026, 0.120587]
[0.003066, 0.000346, 0.023303, 0.019601, 0.027897]
[0.009639, 0.015394, 0.092588, 0.011958, 0.011553]
[0.000514, 0.000249, 0.006689, 0.003727, 0.003675]
[0.001052, 0.001765, 0.064693, 0.001353, 0.001355]


Функция построения таблицы для распределения Коши

In [103]:
def CauchyNumbers():
    for size in sizes:
        mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
        all_list = [mean_list, med_list, z_R_list, z_Q_list, z_tr_list]
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = cauchy.rvs(size=size)
            distribution.sort()
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        print(E)
        print(D)
    return
CauchyNumbers()

[0.979135, -0.01825, 5.022521, 1.276069, 0.745008]
[1550.202178, 0.335254, 38434.691641, 20.479952, 3.435703]
[0.621373, -0.004278, 32.95601, 0.027616, 0.033263]
[274.894228, 0.026903, 664969.781226, 0.054183, 0.028593]
[0.092996, -0.001509, 43.414922, 0.001244, 0.001925]
[513.764924, 0.002347, 126177909.448292, 0.00476, 0.002434]


Функция построения таблицы для распределения Лапласа

In [104]:
def LaplaceNumbers():
    for size in sizes:
        mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
        all_list = [mean_list, med_list, z_R_list, z_Q_list, z_tr_list]
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = laplace.rvs(size=size, scale=1 / m.sqrt(2), loc=0)
            distribution.sort()
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        print(E)
        print(D)
    return
LaplaceNumbers()

[-0.009252, -0.006867, -0.019241, 0.288286, 0.221315]
[0.097523, 0.068894, 0.422688, 0.118323, 0.080333]
[-0.003976, -0.004124, 0.012266, 0.009485, 0.015338]
[0.010566, 0.005703, 0.391439, 0.010209, 0.006423]
[0.000446, 0.001196, -0.024662, 0.002258, 0.003135]
[0.000988, 0.00054, 0.402958, 0.001012, 0.000655]


Функция построения таблицы распределения Пуассона

In [105]:
def PoissonNumbers(): 
    for size in sizes:
        mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
        all_list = [mean_list, med_list, z_R_list, z_Q_list, z_tr_list] 
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = poisson.rvs(10, size=size)
            distribution.sort()
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        print(E)
        print(D)
    return
PoissonNumbers()

[9.9729, 9.875, 10.2715, 10.877, 10.743]
[1.087016, 1.510375, 1.960038, 1.576371, 1.339784]
[10.00065, 9.8565, 10.909, 9.952, 9.94592]
[0.099615, 0.206658, 1.012219, 0.164196, 0.118534]
[10.002411, 9.9945, 11.621, 9.998, 9.868756]
[0.009712, 0.00522, 0.627859, 0.001496, 0.011182]


Функция построения таблицы равномерного распределения

In [106]:
def UniformNumbers():
    for size in sizes:
        mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
        all_list = [mean_list, med_list, z_R_list, z_Q_list, z_tr_list]
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = uniform.rvs(size=size, loc=-m.sqrt(3), scale=2 * m.sqrt(3))
            distribution.sort()
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        print(E)
        print(D)
    return
UniformNumbers()

[0.010389, 0.01709, 0.001281, 0.3258, 0.33084]
[0.102599, 0.231137, 0.048097, 0.13775, 0.156502]
[0.003832, 0.005935, 0.00136, 0.019801, 0.039607]
[0.009591, 0.027275, 0.000528, 0.014836, 0.018672]
[-0.001505, -0.002896, -9.4e-05, -0.000167, 0.001204]
[0.000856, 0.002646, 6e-06, 0.001312, 0.00174]
