In [None]:
import numpy as np
import random
import scipy.stats as sps
import pandas as pd

import matplotlib.pyplot as plt
import seaborn as sns
sns.set(font_scale=1.8)

In [None]:
# зафиксируем сид для воспроизводимости генерации
SEED = 42
np.random.seed(SEED)
random.seed(SEED)

## Критерий Вальда

Вы провели эксперимент и получили данные из экспоненциального распределения. 

In [None]:
sample = [0.11731702, 0.75253036, 0.32918642, 0.22823564, 0.04240622,
        0.04239907, 0.01495969, 0.50280772, 0.22977054, 0.30781252,
        0.00519983, 0.87588937, 0.44660739, 0.05967191, 0.05016975,
        0.05065286, 0.09068843, 0.18598196, 0.14138427, 0.08605575,
        0.23659272, 0.03755863, 0.08637888, 0.1140693 , 0.15223367,
        0.384484  , 0.05568397, 0.18050729, 0.22437618, 0.01189096]

Вы хотите проверить, является ли это распределение с параметром $\lambda=2$. Используя Критерий Вальда, сделайте вывод по данному предположению.

### Двусторонняя альтернатива
$X_1, ... X_n$ - выборка из распределения $Exp(\theta)$.  
Проверьте гипотезу $\mathsf{H}_0\colon \theta = 2$ vs. $\mathsf{H}_1\colon \theta \neq 2$

Из лекции вы узнали про критерий Вальда.
Для случая двусторонней альтернативы $\mathsf{H}_1\colon \theta \neq \theta_0$ критерий имел следующий вид:
$$\large{S = \left\{ \left|\sqrt{n} \frac{\hat{\theta} - \theta_0}{\hat{\sigma}} \right| > z_{1 - \frac{\alpha}{2}} \right\}}$$

где $\hat{\theta}$ &mdash; асимптотически нормальная оценка $\theta$ с асимптотической дисперсией $\sigma^2(\theta)$, 
$\hat{\sigma}$ &mdash; состоятельная оценка $\sigma(\theta)$.  

Эквивалентный асимптотичсекий доверительный интервал для параметра $\theta$ уровня доверия $1-\alpha$
$$C = \left( \hat{\theta} - \frac{z_{1-\alpha/2} \hat{\sigma}}{\sqrt{n}}, \hat{\theta} + \frac{z_{1-\alpha/2} \hat{\sigma}}{\sqrt{n}}\right)$$

На первой лекции вы получали, что $\frac{1}{\overline{X}}$ &mdash; АНО для параметра $\theta$ c асимптотической дисперсией $\theta^2$

**Выпишите состоятельную оценку дисперсии и статистику критерия Вальда**


**Ответ:**  из предыдущих занятий $\hat{\sigma}^2=\frac{1}{\overline{X}^2}$ и статистика $\sqrt{n}\frac{\hat{\theta}-\theta_0}{\hat{\sigma}}$  

Первым шагом необходимо выставить уровень значимости, поставим $\alpha = 0.05$

In [None]:
alpha = 0.05
theta = 2 # тета из основной гипотезы
n = len(sample)

Посчитаем квантиль (критическое значение)

In [None]:
z = sps.norm.ppf(1-alpha/2)

Посчитайте статистику, которую будете сравнивать с критическим значением. Выведите значение полученной статистики.

In [None]:
statistic = np.abs(np.sqrt(n)*(1/np.mean(sample)-theta)/(1/np.mean(sample)))
statistic

3.2704505437191247

Сравним модуль статистики с критическим значением

In [None]:
np.absolute(statistic) > z

True

**Какой вывод можно сделать?**

**Вывод:** из этого следует, что мы можем отвергнуть нулевую гипотезу с уровнем доверия 0.95.

Посчитайте доверительный интервал

(3.187693843343649, 6.740324187101983)

**Какой вывод можно сделать?**

**Вывод:** данный доверительный интервал, показывает, что параметр лежит в данном интревале с вероятностью 95%. Т.е. параметр равен 2 с вероятностью не более чем 5%.

На лекции вы узнали про p-value &mdash; это вероятность получить при справедливости $H_0$ такое значение статистики $t = T(x)$ или еще более экстремальное, то есть в случае двустороннего критерия
$$p(x) = \mathsf{P}_0(T(X) \geq|t|) + \mathsf{P}_0(T(X) \leq -|t|)$$
Посчитайте p-value. Для этого можно использовать функции из библиотеки `scipy.stats`.

In [None]:
p_value = 2 * sps.norm.sf(np.abs(1/np.mean(sample)))
p_value

6.905273592967502e-07

Оформите подсчет статистики и  p-value в виде одной функции.

In [None]:
def wald_test_two_sided(sample, theta, estimation_theta, estimation_sigma):
    """
    param sample: реализация выборки
    param theta: истинное значение параметра
    param estimation_theta: оценка параметра
    param estimation_sigma: оценка асимптотической дисперсии оценки estimation_sigma

    return statistic
    return p_value
    return conf_int - доверительный интервал
    """
    alpha = 0.05
    n = len(sample)
    z = sps.norm.ppf(1-alpha/2)
    statistic = np.abs(np.sqrt(n)*(estimation_theta-theta)/(estimation_sigma))
    p_value = 2 * sps.norm.sf(np.abs(estimation_theta))
    c_left = estimation_theta - z*estimation_sigma/np.sqrt(n)
    c_right = estimation_theta + z*estimation_sigma/np.sqrt(n)
    return statistic, p_value, (c_left, c_right)

### Правосторонняя и левосторонняя альтернативы

In [None]:
def wald_test(sample, theta, estimation_theta, estimation_sigma, alternative='two_sided'):
    """
    param sample: реализация выборки
    param theta: истинное значение параметра
    param estimation_theta: оценка параметра
    param estimation_sigma: оценка асимптотической дисперсии оценки estimation_sigma
    param alternative: вид альтернативной гипотезы, может принимать одно из значений 'two_sided', 'less', 'greater'

    return statistic
    return p_value
    return conf_int - доверительный интервал
    """

    <...>

Проверьте гипотезы с провосторонней и левосторонней альтернативой

In [None]:
<...>

**Какие выводы вы можете сделать?**

**Вывод:** <...>

Теперь посмотрим на выборку меньших размеров

In [None]:
sample_cut = [0.11731702, 0.75253036, 0.32918642, 0.22823564, 0.04240622,
        0.04239907, 0.01495969, 0.50280772, 0.22977054, 0.30781252]

Выведите статистику, p-value и доверительный интервал. Какой вывод можно сделать из полученных значений?

In [None]:
<...>

**Вывод:** <...>

---
# Реальный уровень значимости

Напомним, что реальным уровнем значимости критерия $\mathsf{H}_0 \colon \theta = \theta_0$ vs. $\mathsf{H}_1 \colon \theta \neq \theta_0$ называется $\mathsf{P}_{\theta_0}(X \in S)$. Поскольку критерий Вальда асимптотический, при фиксированных $n$ он может отличаться от $\alpha$. В таком случае бывает полезно экспериментально определить реальный уровень значимости с помощью метода Монте-Карло.

С помощью статистических методов можно проверить человека на наличие экстрасенсорных способностей: предложим ему угадать последовательность, состоящую из двух цветов, длины 100. 

Сформулируем задачу на статистическом языке: 

$X_1...X_{100}$ &mdash; выборка из распределения $Bern(p)$

$p=0.5$ отвечает случайному угадыванию.

Cгенерируйте эту выборку.

In [None]:
sample_size = 100
sample = <...>

Проверьте гипотезу: $\mathsf{H}_0 \colon p=0.5$ vs $\mathsf{H}_1 \colon p \neq 0.5$. Используйте критерий Вальда.

В качестве асимптотически нормальной оценки можно использовать $\widehat{p} = \overline{X}$ с асимптотической дисперсией $\sigma^2(p) = p (1 - p)$.

**Выпишите состоятельную оценку дисперсии и статистику критерия Вальда**


**Ответ:** <...>

Примените критерий, используйте реализованную вами функцию.

In [None]:
alpha = 0.05
theta = 0.5
estimation_theta = <...>
estimation_sigma = <...>

wald_test(sample, theta, estimation_theta, estimation_sigma)

**Какой вывод вы можете сделать?**

**Ответ:** <...>

Проведи подобный эксперимент 1000 раз и посчитайте долю случаев отвержения гипотезы для определения реального уровня значимости критерия. 

*Замечание:* поскольку погрешность определения реального уровня значимости оценивается как $\frac{1}{\sqrt{k}}$, где $k$ - количество экспериментов, при 1000 повторений точность определения значения составляет $\approx 0.03$ и не является высокой. Такое значение выбрано для скорости подсчета на семинаре, но в реальных экспериментах его стоит брать намного больше.

In [None]:
samples_count = 1000
sample = <...>

In [None]:
estimation_theta = <...>
estimation_sigma = <...>

counter = 0
for i in range(samples_count):
    _, p_value, conf_int = wald_test(sample[i], theta, estimation_theta[i], estimation_sigma[i])
    is_rejected = <...>
    if is_rejected:
        counter += 1

counter/samples_count

**Вывод:** <...>