### О сравнении качества оценок.

Для трех распределений  $X$ ~ $\displaystyle N(a, \sigma)$, $X$ ~ $\displaystyle U(a - \frac{\delta}{2}, a + \frac{\delta}{2})$ и распределения Лапласа или двойного показательного – $\displaystyle L(a, u)= a + Exp_\lambda - Exp_\lambda, \lambda = \frac{1}{u}$  (суммируемые показательные распределения независимы).

Сравнить следующие оценки параметра $a$ – математического ожидания и медианы всех распределений,  $\displaystyle \bar{X_n}$- выборочного среднего, $med_n$ - выборочной медианы и $\displaystyle \frac{x_1 + x_n}{2}$ - полусуммы минимума и максимума вариационного ряда.

Все оценки не смещены. Сравнивать оценки нужно с точки зрения квадратичного риска (т. е. для несмещенных оценок одномерного параметра – дисперсии оценки). 

При $n = 100$  – объем выборки, $m = 100$ – количество выборок, построить 100 оценок каждого вида и сравнить их выборочные среднеквадратичные отклонения, повторить при $n = 10000$, $m = 100$. 
Сравнить с теоретическими среднеквадратичными отклонениями.

Результат – 6 таблиц и вывод о том какая из оценок с точки зрения квадратичного риска является наилучшей.

In [1]:
clear
clc
pkg load statistics
pkg load econometrics

In [2]:
function result = normal_distribution(sigma, n)
    result = [
        (sigma ^ 2) / n,
        (pi * sigma ^ 2) / (2 * n),
        (0.4 * sigma ^ 2) / log(n)
    ];
end

In [3]:
function result = uniform_distribution(delta, n)
    result = [
        (delta ^ 2) / (12 * n),
        (delta ^ 2) / (4 * n),
        (delta ^ 2) / (2 * n ^ 2)
    ];
end

In [4]:
function result =  laplace_distribution(u, n)
    result = [
        (2 * u ^ 2) / n,
        (u ^ 2) / n,
        (0.9 * u ^ 2)
    ];
end

In [5]:
function result = estimators(X)
    result = [
        std(mean(X)),
        std(median(X)),
        std((min(X) + max(X)) * .5)
    ];
end

In [6]:
function make_table(table_name, l, r, theory, experiment, n, m)
    printf('\n%s(%d, %d), n = %d, m = %d \n\n',
            table_name, l, r, n, m);

    theory = sqrt(theory);    
    prettyprint([theory, experiment, abs(theory - experiment)].',
                ['sigma_th'; 'sigma_pr'; 'diff'],
                ['mean'; 'median'; 'halfsum']);
    printf('\n\n');
end

In [7]:
function all_distributions(a1, sigma, a2, delta, a3, u, n, m)
    X_norm = normrnd(a1, sigma, n, m);
    make_table('normal', a1, sigma,
                normal_distribution(sigma, n), estimators(X_norm),
                n, m);
                
    X_unif = unifrnd(a2 - delta / 2, a2 + delta / 2, n, m);
    make_table('uniform', a2 - delta / 2, a2 + delta / 2,
                uniform_distribution(delta, n), estimators(X_unif),
                n, m);
    
    X_lapl = a3 + exprnd(u, n, m) - exprnd(u, n, m);
    make_table('laplace', a3, u,
                laplace_distribution(u, n), estimators(X_lapl),
                n, m);
end

In [8]:
all_distributions(1, 2, 3, 4, 5, 6, 100, 100)


normal(1, 2), n = 100, m = 100 

                mean      median     halfsum  
sigma_th       0.200       0.251       0.589
sigma_pr       0.193       0.258       0.594
diff           0.007       0.007       0.004



uniform(1, 5), n = 100, m = 100 

                mean      median     halfsum  
sigma_th       0.115       0.200       0.028
sigma_pr       0.120       0.214       0.028
diff           0.005       0.014       0.000



laplace(5, 6), n = 100, m = 100 

                mean      median     halfsum  
sigma_th       0.849       0.600       5.692
sigma_pr       0.683       0.503       5.438
diff           0.166       0.097       0.255




In [10]:
all_distributions(1, 2, 3, 4, 5, 6, 10000, 100)


normal(1, 2), n = 10000, m = 100 

                mean      median     halfsum  
sigma_th       0.020       0.025       0.417
sigma_pr       0.020       0.025       0.439
diff           0.000       0.000       0.022



uniform(1, 5), n = 10000, m = 100 

                mean      median     halfsum  
sigma_th       0.012       0.020       0.000
sigma_pr       0.011       0.021       0.000
diff           0.000       0.001       0.000



laplace(5, 6), n = 10000, m = 100 

                mean      median     halfsum  
sigma_th       0.085       0.060       5.692
sigma_pr       0.082       0.064       5.238
diff           0.003       0.004       0.454


