# Характеристики положения и рассеяния

Необходимо сгенерировать выборки размером 10, 100, 1000 элементов. Для каждой выборки вычислить следующие статистические характеристики:

1. выборочное среднее
2. выборочная медиана
3. полусумма экстремальных выборочных элементов
4. полусумма квартилей
5. усечённое среднее

Повторить такие вычисления 1000 раз для каждой выборки и найти среднее характеристик положения их квадратов. Вычислить оценку дисперсии. Представить полученные данные в виде таблиц.

In [17]:
import math

from scipy.stats import norm, laplace, poisson, cauchy, uniform
import numpy as np
import math as m

In [18]:
sizes = [10, 100, 1000]
NORMAL, CAUCHY, LAPLACE, POISSON, UNIFORM = "NormalNumber", "CauchyNumber", "LaplaceNumber", "PoissonNumber", "UniformNumber"
NUMBER_OF_REPETITIONS = 1000

Функция вычисления выборочного среднего

In [19]:
def mean(selection):
    return np.mean(selection)

Функция вычисления выборочной медианы

In [20]:
def med(selection):
    return np.median(selection)

Функция вычисления полусуммы экстремальных выборочных элементов

In [21]:
def z_R(selection, size):
    z_R = (selection[0] + selection[size - 1]) / 2
    return z_R

Функция вычисления выборочной квартили порядка р

In [22]:
def z_p(selection, np):
    if np.is_integer():
        return selection[int(np)]
    else:
        return selection[int(np) + 1]

Функция вычисления полусуммы квартилей

In [23]:
def z_Q(selection, size):
    z_1 = z_p(selection, size / 4)
    z_2 = z_p(selection, 3 * size / 4)
    return (z_1 + z_2) / 2

Функция вычисления усечённого среднего

In [24]:
def z_tr(selection, size):
    r = int(size / 4)
    sum = 0
    for i in range(r + 1, size - r + 1):
        sum += selection[i]
    return (1 / (size - 2 * r)) * sum 

Функция вычисления дисперсии

In [25]:
def dispersion(selection):
    return np.std(selection) ** 2

In [26]:
def E_sqrtD(E, D):
    result = []
    for e, g in zip(E,D):
        result.append([round(e - math.sqrt(g), 6), round(e + math.sqrt(g), 6)])
    return  result

In [27]:

def my_print(V):
    message = ''
    for v in V:
        message += '& ' + str(v)
    return print(message)

Функция построения таблицы для нормального распределения

In [28]:
def NormalNumbers():
    for size in sizes:
        mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
        all_list = [mean_list, med_list, z_R_list, z_Q_list, z_tr_list]
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = norm.rvs(size=size)
            distribution.sort()
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        my_print(E)
        my_print(D)
        my_print(E_sqrtD(E, D))
        print('Вывод для size -' + str(size) + '\n')
NormalNumbers()

& -0.017468& -0.019852& -0.025488& 0.300647& 0.260236
& 0.099305& 0.145161& 0.182558& 0.119238& 0.11468
& [-0.332595, 0.297659]& [-0.400852, 0.361148]& [-0.452756, 0.40178]& [-0.044662, 0.645956]& [-0.078408, 0.59888]
Вывод для size -10

& -0.000866& 0.002153& -0.004746& 0.013516& 0.027086
& 0.010386& 0.01633& 0.085266& 0.012678& 0.012396
& [-0.102778, 0.101046]& [-0.125636, 0.129942]& [-0.296749, 0.287257]& [-0.099081, 0.126113]& [-0.084251, 0.138423]
Вывод для size -100

& 0.000153& 8.9e-05& 0.007519& 0.001509& 0.002836
& 0.000981& 0.001642& 0.059635& 0.001228& 0.001195
& [-0.031168, 0.031474]& [-0.040433, 0.040611]& [-0.236684, 0.251722]& [-0.033534, 0.036552]& [-0.031733, 0.037405]
Вывод для size -1000



Функция построения таблицы для распределения Коши

In [29]:
def CauchyNumbers():
    for size in sizes:
        mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
        all_list = [mean_list, med_list, z_R_list, z_Q_list, z_tr_list]
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = cauchy.rvs(size=size)
            distribution.sort()
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        my_print(E)
        my_print(D)
        my_print(E_sqrtD(E, D))

        print('Вывод для size -' + str(size) + '\n')

CauchyNumbers()

& 0.562654& -0.006675& 2.898445& 1.104381& 0.671502
& 523.363485& 0.295683& 12824.001857& 4.591925& 1.076515
& [-22.314485, 23.439793]& [-0.550442, 0.537092]& [-110.344665, 116.141555]& [-1.038497, 3.247259]& [-0.36605, 1.709054]
Вывод для size -10

& -0.7079& -0.001573& -34.396555& 0.03319& 0.038699
& 398.608006& 0.027015& 945555.067& 0.057985& 0.027952
& [-20.67307, 19.25727]& [-0.165935, 0.162789]& [-1006.793114, 938.000004]& [-0.207611, 0.273991]& [-0.12849, 0.205888]
Вывод для size -100

& -0.510318& 0.000322& -260.66918& 0.004265& 0.003941
& 290.388668& 0.002172& 69909833.801229& 0.00484& 0.002387
& [-17.551112, 16.530476]& [-0.046283, 0.046927]& [-8621.879248, 8100.540888]& [-0.065305, 0.073835]& [-0.044916, 0.052798]
Вывод для size -1000



Функция построения таблицы для распределения Лапласа

In [30]:
def LaplaceNumbers():
    for size in sizes:
        mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
        all_list = [mean_list, med_list, z_R_list, z_Q_list, z_tr_list]
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = laplace.rvs(size=size, scale=1 / m.sqrt(2), loc=0)
            distribution.sort()
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        my_print(E)
        my_print(D)
        my_print(E_sqrtD(E, D))
        print('Вывод для size -' + str(size) + '\n')

LaplaceNumbers()

& -0.006405& -0.006188& -0.005512& 0.293618& 0.229066
& 0.095724& 0.066942& 0.431033& 0.117278& 0.079644
& [-0.315798, 0.302988]& [-0.26492, 0.252544]& [-0.662043, 0.651019]& [-0.048841, 0.636077]& [-0.053147, 0.511279]
Вывод для size -10

& 0.002803& 0.001905& 0.023725& 0.017159& 0.021071
& 0.010247& 0.006208& 0.425481& 0.010082& 0.006497
& [-0.098424, 0.10403]& [-0.076886, 0.080696]& [-0.628564, 0.676014]& [-0.08325, 0.117568]& [-0.059533, 0.101675]
Вывод для size -100

& -0.000576& -0.000407& -0.012718& 0.001384& 0.001477
& 0.000935& 0.000498& 0.407977& 0.000978& 0.000579
& [-0.031154, 0.030002]& [-0.022723, 0.021909]& [-0.651449, 0.626013]& [-0.029889, 0.032657]& [-0.022585, 0.025539]
Вывод для size -1000



Функция построения таблицы распределения Пуассона

In [31]:
def PoissonNumbers(): 
    for size in sizes:
        mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
        all_list = [mean_list, med_list, z_R_list, z_Q_list, z_tr_list] 
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = poisson.rvs(10, size=size)
            distribution.sort()
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        my_print(E)
        my_print(D)
        my_print(E_sqrtD(E, D))
        print('Вывод для size -' + str(size) + '\n')

PoissonNumbers()

& 10.0015& 9.87& 10.265& 10.9455& 10.786167
& 1.101808& 1.5811& 1.936775& 1.46278& 1.362525
& [8.95183, 11.05117]& [8.612582, 11.127418]& [8.873319, 11.656681]& [9.736046, 12.154954]& [9.618895, 11.953439]
Вывод для size -10

& 9.9932& 9.844& 10.9475& 9.959& 9.93526
& 0.10332& 0.204664& 0.997494& 0.159819& 0.122566
& [9.671766, 10.314634]& [9.391602, 10.296398]& [9.948754, 11.946246]& [9.559226, 10.358774]& [9.585166, 10.285354]
Вывод для size -100

& 10.000822& 9.997& 11.671& 9.9955& 9.86806
& 0.00993& 0.002991& 0.746759& 0.00223& 0.01131
& [9.901173, 10.100471]& [9.94231, 10.05169]& [10.806848, 12.535152]& [9.948277, 10.042723]& [9.761712, 9.974408]
Вывод для size -1000



Функция построения таблицы равномерного распределения

In [32]:
def UniformNumbers():
    for size in sizes:
        mean_list, med_list, z_R_list, z_Q_list, z_tr_list = [], [], [], [], []
        all_list = [mean_list, med_list, z_R_list, z_Q_list, z_tr_list]
        E, D = [], []    
        for i in range(NUMBER_OF_REPETITIONS):
            distribution = uniform.rvs(size=size, loc=-m.sqrt(3), scale=2 * m.sqrt(3))
            distribution.sort()
            mean_list.append(mean(distribution))
            med_list.append(med(distribution))
            z_R_list.append(z_R(distribution, size))
            z_Q_list.append(z_Q(distribution, size))
            z_tr_list.append(z_tr(distribution, size))
        for lis in all_list:
            E.append(round(mean(lis), 6))
            D.append(round(dispersion(lis), 6))
        my_print(E)
        my_print(D)
        my_print(E_sqrtD(E, D))
        print('Вывод для size -' + str(size)+ '\n' )

UniformNumbers()

& -0.007779& -0.011541& -0.00537& 0.316201& 0.304339
& 0.104723& 0.233967& 0.047982& 0.130148& 0.159694
& [-0.331388, 0.31583]& [-0.495242, 0.47216]& [-0.224418, 0.213678]& [-0.044559, 0.676961]& [-0.095278, 0.703956]
Вывод для size -10

& -0.003973& -0.004643& 0.001269& 0.012524& 0.02923
& 0.009763& 0.029286& 0.000551& 0.014414& 0.019828
& [-0.102781, 0.094835]& [-0.175775, 0.166489]& [-0.022204, 0.024742]& [-0.107534, 0.132582]& [-0.111582, 0.170042]
Вывод для size -100

& -0.001949& -0.002912& -9.6e-05& -0.000109& 0.000962
& 0.001006& 0.00297& 6e-06& 0.001499& 0.001982
& [-0.033667, 0.029769]& [-0.05741, 0.051586]& [-0.002545, 0.002353]& [-0.038826, 0.038608]& [-0.043558, 0.045482]
Вывод для size -1000



In [60]:
import re

def table_print(string='& [9.90543, 10.102884]& [9.924466, 10.065534]& [10.851231, 12.507769]& [9.934255, 10.051745]& [9.769529, 9.972527]'):
    first = []
    second = []
    cells = string.split('&')
    for cell in cells[1:]:
        fst, sec =  cell.split(',')
        first.append(re.findall("\d+\.\d+", fst.strip())[0])
        second.append(re.findall("\d+\.\d+", sec.strip())[0])
    message = ''
    for el in first:
        message += '&' + '[' + str(el) + ';'
    message += '\\\\'

    for el in second:
        message += '&' + str(el) + ']'
    return message





print(table_print())

&[9.90543;&[9.924466;&[10.851231;&[9.934255;&[9.769529;\\&10.102884]&10.065534]&12.507769]&10.051745]&9.972527]
