<a href="https://colab.research.google.com/github/andrey-gl/study2020/blob/master/%D0%97%D0%B0%D0%BD%D1%8F%D1%82%D0%B8%D0%B5_5.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Точечное оценивание

Пусть $\mathbf{X} = (X_1, . . . , X_n)$ - выборка объёма $n$ из распределения $\mathcal{F}_\theta$, которая известным образом зависит от некоторого параметра $\theta \in \Theta$.

**Определение.** Статистикой называется произвольная борелевская функция $\theta^* = \theta^*(X_1, . . . , X_n)$ от элементов выборки.

Статистика может быть:
1. Состоятельной, если для любого $\theta \in \Theta$: $\theta^* \stackrel{{\sf P}}{\longrightarrow} \theta$ при $n\rightarrow \infty$.
2. Несмещенной, если $E\theta^* = \theta$;
3. Асимптотически несмещенными, если $E\theta^* \stackrel{{\sf P}}{\longrightarrow} \theta$ при $n\rightarrow \infty$;
4. Асимптотически нормальной с коэффициентом $\sigma ^ 2(\theta)$, если для любого $\theta \in \Theta$ при $n \rightarrow \infty$ $\sqrt{n}(\theta^*-\theta) \Rightarrow N_{0, \sigma ^ 2(\theta)}$.

**Определение. Метод моментов.** Выберем некоторую функцию $g(y): \mathbb R \rightarrow \mathbb R$ такую, чтобы существовал момент $E(g(X_1)) = h(\theta)$ и функция $h$ была обратима в области $\Theta$. Тогда статистика
$$\theta^* = h^{-1}(\overline{g(X)}) = h^{-1}(\sum_{i = 1}^ng(X_i))$$
называется оценкой метода моментов.

**Теорема.** Пусть $\theta^* = h^{-1}(\overline{g(X)})$ - оценка по методу моментов и функция $h^{-1}$ - непрерына. Тогда оценка $\theta^*$ - состоятельна.

# Построение доверительных интервалов

Пусть $\mathbf{X} = (X_1, . . . , X_n)$ - выборка объёма $n$ из распределения $\mathcal{F}_\theta$ с параметром $\theta \in \Theta$.

**Определение.** Пусть $0 < ε < 1$. Интервал со случайными концами $(\theta−, \theta+) = (\theta^−(\mathbf{X}, ε), \theta^+(\mathbf{X}, ε))$ называется доверительным интервалом для параметра $\theta$ уровня доверия $1−ε$, если для любого $\theta \in \Theta$:
$$P(\theta^− < \theta < \theta^+) ⩾ 1 − ε.$$

**Определение.** Пусть $0 < ε < 1$. Последовательность интервалов со случайными концами $(\theta−, \theta+) = (\theta_n^−(\mathbf{X}, ε), \theta_n^+(\mathbf{X}, ε))$ называется асимптотическим доверительным интервалом для параметра $\theta$ уровня доверия $1−ε$, если для любого $\theta \in \Theta$:
$$lim_{n\rightarrow\infty}inf P(\theta^− < \theta < \theta^+) ⩾ 1 − ε.$$

In [None]:
# Построение точных доверительных интервалов с иллюстрацией точности попадания оцениваемого параметра в доверительный интервал
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
import math

N = 100 # размер выборки
M = 1000
xs = 0.2
mu = 2
sigma = 10

k = 0

for _ in range(M):
    x = np.random.normal(mu, sigma, N)
    mu1 = np.mean(x)-(sigma*norm.ppf(1-0.025))/(N**0.5)
    mu2 = np.mean(x)+(sigma*norm.ppf(1-0.025))/(N**0.5)
    if ((mu < mu2) and (mu > mu1)): k = k+1

k / M

0.939

**Принцип потроения доверительных интервалов.** Пусть случайная величина $G(\mathbf X, \theta)$ такова, что ее распределение известно и не зависит от $\theta$. И пусть $G(\mathbf X, \theta)$ строго монотонна (как правило, возрастает) и непрерывна по $\theta$. Пусть также $g-$ и $g+$ – квантили распределения $G$ такие, что 
$$1-\epsilon = P(g- < G(\mathbf X, \theta) < g+)$$
Разрешив неравенство, получим точный доверительный интервал для $\theta$.

**Принцип построения асимптотических доверительных интервалов.** Пусть $\theta^*(\mathbf X)$ – асимптотически нормальная оценка $\theta$ с параметром дисперсии $\sigma ^ 2(\theta)$. Пусть также $u_{\epsilon / 2}$ и $u_{1-\epsilon / 2}$ - квантили распределения $N(0,1)$. Тогда:

$$\lim_{n \to \infty}P(u_{\epsilon / 2} < \sqrt{n} \frac{\theta^*-\theta}{\sigma(\theta)} < u_{1-\epsilon / 2}) = 1-\epsilon$$

Если есть возможность разрешить данное неравенство, мы получим точный асимптотический доверительный интервал. Если нет, но функция $\sigma(\theta)$ – непрерывна, то:

$$\sqrt{n} \frac{\theta^*-\theta}{\sigma(\theta^*)} \Rightarrow N(0,1)$$

и тогда без проблем получаем асимптотически точный доверительный интервал.

#Доверительные интервалы для параметров нормального распределения

**Определение.** Распределение $Г(1/2, n/2)$ называется распределением хи-квадрат и обозначается $\chi_n^2$.

Распределение $\chi_n^2$ – распределение суммы квадратов независимых стандартных нормальных случайных величин (легко проверить). 

**Определение.** Пусть $\xi \sim \chi_m^2, \mu \sim \chi_k^2$. Тогда случайная величина $\frac{\xi / m}{\mu / k}$ имеет распределение Фишера с $m, k$ степенями свободы $F_{m,k}$.

**Определение.** Пусть $\xi \sim N(0,1), \mu \sim \chi_n^2$. Тогда случайная величина $\frac{\xi}{\sqrt{\mu / n}}$ имеет распределение Стьюдента с $n$ степенями свободы и обозначается $T_n$.

**Теорема.** Пусть $\mathbf{X} = (X_1, . . . , X_n)$ - выборка объёма $n$ из распределения $N(\mu, \sigma^2)$. Тогда:
1. $\sqrt{n} \frac{\overline{X}-\mu}{\sigma} \sim N(0,1)$ – для $\mu$ при известном $\sigma$;
2. $\frac{\sum_{i=1}^n(X_i-a)^2}{\sigma^2} \sim \chi^2_n$ – для $\sigma$ при известном $\mu$;
3. $\sqrt n \frac{\overline{X} - \mu}{\sqrt{S_0^2}} \sim T_{n-1}$ – для $\mu$ при неизвестном $\sigma$;
4. $\frac{(n-1)S_0^2}{\sigma^2} \sim \chi^2_{n-1}$ – для $\sigma$ при неизвестном $\mu$.

И на основаниии данных статистик мы можем строить точные доверительные интервалы для параметров нормального распределения для соответствующих случаев.