### problem 2.2

Оценим параметр $\mu$ с параметром масштабирования $\lambda = 1$ по выборке из распределение Лапласса.
По предельной теореме об асимптотическом поведении среднего члена вариационного ряда,
среднее значение выборки хорошо описывается нормальным распределением $\textbf{N}\left(\mu, \frac{\sigma}{\sqrt{n}}\right)$,
где $\sigma$ - среднее стандартное отклонение распределения, в нашем случае $\sigma = \frac{\sqrt{2}}{\lambda} = \sqrt{2}$.

имеем $\sqrt{n}\frac{\overline{X} - \mu}{\sigma} \rightarrow N\left(\mu, \sqrt{\frac{2}{n}}\right) \Rightarrow
P\left(q_{1-\frac{\alpha}{2}} \le \sqrt{n}\frac{\overline{X} - \mu}{\sigma} \le -q_{1-\frac{\alpha}{2}}\right \approx 1 - \alpha \Rightarrow P\left(-\frac{\sigma q_{1-\frac{\alpha}{2}}}{\sqrt{n}} + \overline{X} \le \mu \le \frac{\sigma q_{1-\frac{\alpha}{2}}}{\sqrt{n}} + \overline{X}\right) \approx 1 - \alpha
$

In [13]:
"""imports"""
import numpy as np
from scipy.stats import norm as nr, laplace as lp
from itertools import repeat

"""consts"""
time = 1000
alpha = 0.05
mu = 2
firstExpr = 25
secondExpr = 10000
distribution = lp(loc = mu)

In [14]:
def get(n, Time, dist):
    getPopulations = lambda size, times: (x.rvs(size) for x in repeat(dist, times))
    return getPopulations(n, Time)


def expr(n, dist):
    sig = np.sqrt(2)
    count = 0
    for X in get(n, time, dist):
        val = -sig * nr.ppf(1 - alpha / 2) / np.sqrt(n) <= mu - X.mean() <= sig * nr.ppf(1 - alpha / 2) / np.sqrt(n)
        count += int(val)
    return n, count


def printResult(n, count):
    print("Размер выборки n =", n, ". При этом доверительный интервал был покрыт в", count, "случаях, а это", count / 10, "% всех случаев")

In [15]:
def run():
    resultN, resultCount = expr(firstExpr, distribution)
    printResult(resultN, resultCount)
    resultN, resultCount = expr(secondExpr, distribution)
    printResult(resultN, resultCount)


run()

Размер выборки n = 25 . При этом доверительный интервал был покрыт в 953 случаях, а это 95.3 % всех случаев
Размер выборки n = 10000 . При этом доверительный интервал был покрыт в 952 случаях, а это 95.2 % всех случаев


Результаты эксперимента подтверждают найденный доверительный интервал. Вероятность того, что реальное значение находится в этом интервале, близка к $1 - \alpha$.

### Problem 1.2

Так как выборки являются нормальными, то выборочные средние $\overline{X}$ и $\overline{Y}$ также распределены нормально. Кроме того, выборки независимы, поэтому разность $\overline{X} - \overline{Y}$ также имеет нормальное распределение. Это возможно благодаря тому, что выборочные средние являются линейными комбинациями независимых нормальных величин (выборки i.i.d.), которые в свою очередь являются функциями от реализаций независимых выборок.

Кроме того, математическое ожидание разности выборочных средних равно разности математических ожиданий исходных выборок, то есть $E(\overline{X}) - E(\overline{Y}) = E(X) - E(Y) = \mu_1 - \mu_2 = \tau$. А дисперсия разности выборочных средних равна сумме дисперсий выборочных средних, то есть $Var(\overline{X} - \overline{Y}) = \sigma^2 = Var(\overline{X}) + Var\left(\overline{Y}\right) = \frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}$.

В итоге, распределение $Z = \overline{X} - \overline{Y} \sim N(\tau, \sigma^2)$.

Центрируя и нормируя получаем стандартное нормальное распределение:
$$
\frac{\overline{X} - \overline{Y} - \tau}{\sigma} \sim N(0, 1)
$$
Из-за симметрии имеем:
$$
P\left(-z_{1-\frac{\alpha}{2}} \le \frac{\overline{X} - \overline{Y} - \tau}{\sigma} \le z_{1-\frac{\alpha}{2}}\right) = 1 - \alpha
$$
где $z_{\alpha}$ - $\alpha$-квантиль стандартного нормального распределения.

Выражаем $\tau$ в неравенстве и получаем доверительный интервал:
$$P\left(\overline{X} - \overline{Y} - \sigma q_{1-\frac{\alpha}{2}} \le \tau \le \overline{X} - \overline{Y} + \sigma q_{1-\frac{\alpha}{2}}\right) = 1 - \alpha$$

In [23]:
"""consts"""
firstEx = 2
secondEx = 1
firstSd = 1
secondSd = np.sqrt(0.5)

XDistribution = nr(loc = firstEx, scale = firstSd)
YDistribution = nr(loc = secondEx, scale = secondSd)

In [24]:
genPopulations = lambda size, times: ((x.rvs(size), y.rvs(size)) for x, y in repeat((XDistribution, YDistribution), times))
sigma = lambda n: np.sqrt(1.5 / n)

def expr(n):
    count = 0
    for X, Y in genPopulations(n, time):
        val = X.mean() - Y.mean() - sigma(n) * nr.ppf(1 - alpha / 2) <= firstEx - secondEx <= X.mean() - Y.mean() + sigma(n) * nr.ppf(1 - alpha / 2)
        count += int(val)
    return n, count


def run():
    resultN, resultCount = expr(firstExpr)
    printResult(resultN, resultCount)
    resultN, resultCount = expr(secondExpr)
    printResult(resultN, resultCount)


run()

Размер выборки n = 25 . При этом доверительный интервал был покрыт в 959 случаях, а это 95.9 % всех случаев
Размер выборки n = 10000 . При этом доверительный интервал был покрыт в 949 случаях, а это 94.9 % всех случаев


Из проведенного эксперимента можно сделать вывод, что вероятность покрытия интервала достаточно близка к заданному уровню доверия $1-\alpha$. Кроме того, стоит отметить, что эта вероятность не зависит от размера выборки, что является важным свойством для статистических выводов.