# `Практикум по программированию на языке Python`

## `Реферат: проверка статистических гипотез в Python`

### `Третьяков Андрей Андреевич, МАИ, М80-110М-20`
#### `Москва, 2021`

## Основные определения

* _Однородная выборка (выборка)_ -- набор $Z_n$ независимых одинаково распределенных случайных величин $X_i \sim F(x): Z_n = \{X_1\dots X_n\}$


* _Реализация выборки_ $Z_n$ -- неслучайный набор $z_n$ из полученных значений $x_i$ СВ  в ходе численного эксперимента: $z_n = \{x_1\dots x_n\}$ 


* СВ $Z=\varphi(Z_n)$, где $\varphi(z_n)$ -- функция, определенная на мн-ве всех реализаций $z_n$ и независимая от $F(x)$, называется _статистикой_ 


* _Статистическая гипотеза $H$_ -- любое предположение о законе распределения и других свойствах одной или нескольких случайных величин, которое проверяется по выборке $Z_n$, формирующейся из _наблюдаемой_ СВ $X$


* Проверяемая гипотеза помечается основной (нулевой) $H_0$, а конкурирующая по смыслу гипотеза - альтернативной $H_A$


* _Статистический критерий проверки $H_0$_ -- некое правило, в соответствии с которым статистика $T= \varphi(Z_n)$ имеет определенный з-н распределения если $H_0$ верна


* _Критической областью_ статистического критерия называется мн-во реализаций $\bar T = \varphi(z_n)$ статистики критерия $T$, при которых гипотеза $H_0$ _отвергается в пользу $H_A$_. Оставшееся мн-во реализаций называется _доверительной областью_: в ней $H_0$ _не отвергается_


* _Ошибка 1-го рода_ -- случайное событие, при котором $H_0$ отвергается, когда она на самом деле верна (не верить в правду). Вероятность ошибки 1-го рода $\alpha$ называется _уровнем значимости_ (величина $1 - \alpha$ -- _уровнем доверия_)


* _Ошибка 2-го рода_ -- случайное событие, при котором $H_0$ _не отвергается_, когда она на самом деле верна $H_A$(верить в неправду). Вероятность ошибки 2-го рода обозначают $\beta$ 


  С уменьшением $\alpha$ возрастает $\beta$, поэтому необходим оптимальный выбор уровня значимости

## Общий алгоритм проверки гипотез
0. Определить $H_0$ и $H_A$, выбрать $\alpha$
1. Применение статистического критерия, который утверждает, что если $H_0$ верна, то статистика критерия $T$ имеет конкретный з-н распределения. Посчитать реализацию $\bar T$ по имеющимся в задаче наблюдениям
2. Построить критическую область в зависимости от формулировки $H_A$:
  * для формулировки типа $<, >$ односторонние области $\{z < z_\alpha \}$ или $\{z > z_{1 - \alpha} \}$
  * для формулировки типа $\not=$ двухстороннюю область $\{z < z_{\alpha /2}\} \cup \{z > z_{1 - \alpha /2}\}$

  где $z_\phi$ -- квантиль уровня $\phi$
3. Если реализация $\bar T$ попала в критическую область, то $H_0$ _отвергается в пользу_ $H_A$. Иначе $H_0$ _не отвергается_

## P-value

Пусть для наблюдений задачи найдена $\bar T = \varphi(x_1\dots x_n):$ 

$p_{value}$ -- вероятность получить более экстремальную реализацию статистики критерия в решаемой задаче при верной $H_0$:
* для формулировки $H_A$ типа $<, >$:

  $p = P_{H_0}\{T(X_1\dots X_n)\le \bar T\} = p_{value}$

  $p'= P_{H_0}\{T(X_1\dots X_n)> \bar T\} = 1 - p_{value}$

* для формулировки $H_A$ типа $\not=$:

  $p_{value} = min\{p, p'\}$

Другими словами $p_{value}$ показывает насколько вероятно получить реализацию статистики критерия $T$, более не подходящую под гипотезу $H_0$, чем $\bar T$; 

$p_{value} < \alpha$ означает чрезмерную неестественную уверенность в выполнении $H_0$ по ходу решения задачи (вера в чрезмерную малость шанса ошибки первого рода), что может трактоваться как сигнал отвергнуть $H_0$ в пользу $H_A$

Преимуществом данного подхода является то, что явно видно при каком уровне значимости нулевая гипотеза будет отвергнута 

Недостатком $p_{value}$ является отсутствие учета специфики эксперимента и возможности неправильно выбранного критерия для проверки гипотезы

Вычисление $p_{value}$ можно выполнять (4)-м шагом в общем алгоритме проверки гипотез




  












# Примеры задач

## 1. Задача о сдвиге. Критерий Вилкоксона (ранговый)

### Задача
$X_1\dots X_m \sim F(t)$

$Y_1\dots Y_n \sim F(t + \theta)$

$\theta$ определяет разницу между элементами выборок в среднем

### Критерий
0. $H_0: \theta=0$
  
  $H_A: \theta > 0$ или $\theta < 0$ или $\theta \not= 0$

1. Элементы объединенной выборки (X, Y) ранжируются, но $R_i$ -- ранг $Y_i$

  Статистика: $w = \sum_{i=1}^{n}{R_i}; m_w = 0.5(m + n + 1); d_w = \frac{mn(m + n + 1)}{12}$

  $T = \frac{w - m_w}{\sqrt{d_w}}|_{H_0}\sim_{m, n \to \infty}N(0, 1)$

### Пример

_Дано:_
Изучается влияние кобальта в рационе кроликов на прирост массы тела. Опыт проводился на двух группах, второй группе добавляли в еду хлористый кобальт. Прирост веса в граммах:

1-я: 560, 580, 600, 420, 530, 490, 580, 740

2-я: 692, 700, 621, 640, 561, 680, 630

Можно ли на уровне доверия 0.95 считать, что кобальт способствует приросту веса?

_Решение:_ В данной задаче $\theta$ показывает насколько в среднем кроли на кобальте тяжелее

0. $H_0: \theta=0$
1. $H_A: \theta \not= 0$

In [1]:
import numpy as np
from scipy import stats

In [2]:
x = np.array([560, 580, 600, 420, 530, 490, 580, 740])
y = np.array([692, 700, 621, 640, 561, 680, 630])

alpha = 0.05
p_val_wilcox = stats.ranksums(x, y)[1] # Wilcoxon signed-rank test
print(p_val_wilcox)

0.037242544595979345


$p_{value} < \alpha \Rightarrow H_0$ -- отвергается на заданном в условии уровне доверия в пользу альтернативы

Ответ: нельзя 

## 2. Задача однофакторного дисперсионного анализа. Критерий Краскера-Уолисса

### Задача
Есть некий числовой показатель - отклик. Есть фактор (вообще говоря не числовой), который может влиять на значение отклика. Конкретные реализации фактора задаются уровнями. Имея выборки для каждого из уровней фактора необходимо понять, влияет ли фактор на отклик или нет


| уровень фактора               | 1          | 2          | k          |
|-------------------------------|:----------:|:----------:|:----------:|
| $X_{ij}$ --  значения отклика | $X_{11}$   | $X_{12}$   | $X_{1k}$   |
|                               | ...        |  ...       | ...        |
|                               | $X_{n_11}$ | $X_{n_22}$ | $X_{n_kk}$ |


$X_{ij} = \mu + \tau_j+\epsilon_{ij}$

$\mu$ -- неизвестное среднее значение отклика

$\tau_j$ -- влияние фактора

$\epsilon_{ij}$ -- возможное побочное случайное влияние

### Критерий
Вообще критерий Краскера-Уолисса проверяет медианы нескольких выборок на равенство - в данной задаче он тоже применим, т.к. разница в медианах по уровням фактора выдаст его влияние

0. $H_0:\tau_1=\dots =\tau_k = 0$ -- фактор не влияет; 

  $H_А: \exists \tau_j \not = 0$ -- фактор влияет

1. Элементы объединенной выборки ранжируются; $N = \sum_{i=1}^{k}{n_i}$ -- кол-во всех наблюдений

$r_{ij}$ - ранг $X_{ij}$; $\bar r_j = \frac{\sum_{i=1}^{n_j}{r_{ij}}}{n_j}$ -- средний ранг j-го уровня фактора

Статистика: $H = \frac{12}{N+1}\sum_{j=1}^k{n_j(\bar r_j - \frac{N+1}{2})^2}|_{H_0} \sim \chi^2(k-1)$

### Пример

30 человек разбили на 6 групп по 5 и каждому предложили решить набор из 30 задач; группы отличались вознаграждением за задачу: от минимального в 1-й до максимального в 6-й. Количество решенных задач:

| 1  | 2  | 3  | 4  | 5  | 6  |
|----|----|----|----|----|----|
| 10 | 8  | 12 | 12 | 24 | 19 |
| 11 | 10 | 17 | 15 | 16 | 18 |
| 9  | 16 | 14 | 16 | 22 | 27 |
| 13 | 13 | 9  | 16 | 18 | 25 |
| 7  | 12 | 16 | 19 | 20 | 24 |

Можно ли с $\alpha=0.03$ утверждать, что величина вознаграждения влияет на результат?

In [3]:
imp = np.array([
          [10, 11, 9, 13, 7],
          [8, 10, 16, 13, 12],
          [12, 17, 14, 9, 16],
          [12, 15, 16, 16, 19],
          [24, 16, 22, 18, 20], 
          [19, 18, 27, 25, 24]
])

res_pval = stats.kruskal(*imp)[1]
res_pval

0.0007363868820730067

$p_{value} < \alpha \Rightarrow H_0$ -- отвергается на заданном в условии уровне доверия в пользу альтернативы

Ответ: можно