# <a href="https://mipt-stats.gitlab.io/courses/ad_mipt.html">Phystech@DataScience</a>
## Задание 5

**Правила:**

* Выполненную работу нужно отправить телеграм-боту `@miptstats_pds_bot`.
* Дедлайн **10 апреля в 23:00**. После дедлайна работы не принимаются кроме случаев наличия уважительной причины.
* Прислать нужно ноутбук в формате `ipynb` и все фотографии, если пишете теоретическую часть от руки.
* Решения, размещенные на каких-либо интернет-ресурсах, не принимаются. Публикация решения может быть приравнена к предоставлении возможности списать.
* Для выполнения задания используйте этот ноутбук в качестве основы, ничего не удаляя из него.

-----

*Замечания.* Теоретические решения можно оформить
* в $\LaTeX$-формате в ноутбуке;
* написать от руки и прикрепить к ноутбуку;
* написать от руки и выслать боту.  

Во втором случае также **важно** "вшить" фото в ноутбук. Сделать это можно с помощью Edit -> Insert Image в Jupyter или с помощью кнопки "Вставить изображение" в Colab. Следите за размером итогового файла.

Фотографии принимаются только в хорошем качестве, **следите за освещением и почерком**. На фотографиях также указывайте номера задач.

-----

In [2]:
import numpy as np
import pandas as pd
import scipy.stats as sps

import matplotlib.pyplot as plt
import seaborn as sns

red = '#FF3300'
blue = '#0099CC'
green = '#00CC66'

from statsmodels.sandbox.stats.multicomp import multipletests
from tqdm.notebook import tqdm

%matplotlib inline


#Теоретическая часть

## p-value (основной поток)

### Задача 1. 
 Для всех пунктов задач 3 и 4 прошлого домашнего задания выпишите формулу для p-value  $p(t) = <...>$  в виде кода на `scipy`, где $t$ - реализация статистики вашего критерия, т.е. $t = T(x), x$ &mdash; реализация выборки, $T(X)$ &mdash; статистика. 

Для задачи 4 также посчитайте численные значения для обоих случаев p-value для данного в задаче существа. Какие гипотезы отклоняются? 

Вычисления можно выполнить в Питоне по приведенным вами формулам. 

## Множественная проверка гипотез (основной поток)


### Задача 2.
 Пусть $X_1, ...,  X_n$ --- выборка из неизвестного распределения $\mathsf{P}$. Для проверки гипотезы $\mathsf{H}_0\ vs.\ \mathsf{H}_1$ было решено использовать три различных критерия. Соответствующие p-value равны 0.00001, 0.7361, 0.0482. Какое должно быть принято решение об отвержении гипотезы $\mathsf{H}_0$ на уровне значимости 0.05? *Подсказка: используйте любой подходящий метод МПГ, далее делайте вывод об отвержении/не отвержении, поясните свой вывод.*




### Задача 1

#### Задача 3 пункт а

$p (t) = P_{H_0} (\sum\limits_{i=1}^n) \leq t) = P (\sum\limits_{i=1}^n) \leq t \: | \: \theta \geq \theta_0)$

`p_val = sps.norm(loc=n*theta_0, scale=n).cdf(t)`

#### Задача 3 пункт б

$p (t) = P_{H_0} (\sum\limits_{i=1}^n) \geq t) = P (\sum\limits_{i=1}^n) \geq t \: | \: \theta \leq \theta_0)$

`p_val = sps.norm(loc=n*theta_0, scale=n).sf(t)`

#### Задача 4 пункт а

Гипотеза: $H_0: p_1 = \Gamma(\frac67, 2)$ vs альтернатива: $H_1: p_2 = \Gamma(\frac{5}{44}, 3)$

$p (t) = P_{H_0} (x \geq t)$

`p_val = sps.gamma(a=2, scale=7/6).sf(t)`

#### Задача 4 пункт б

Гипотеза: $H_0: p_2 = \Gamma(\frac{5}{44}, 3) $ vs альтернатива: $H_1: p_1 = \Gamma(\frac67, 2)$

$p (t) = P_{H_0} (x \leq t)$

`p_val = sps.gamma(a=3, scale=44/5).cdf(t)`



In [8]:
# к задаче 1 к пунктам 4а и 4б
t=6.66

p_val_4a = sps.gamma(a=2, scale=7/6).sf(t)
p_val_4b = sps.gamma(a=3, scale=44/5).cdf(t)


print(round(p_val_4a, 3), ' < 0.05, значит гипотеза о том, что существо - пес, отвергается при уровне значимости a = 0.05')
print(round(p_val_4b, 3), ' < 0.05, значит гипотеза о том, что существо - единорог, отвергается при уровне значимости a = 0.05')

0.022  < 0.05, значит гипотеза о том, что существо - пес, отвергается при уровне значимости a = 0.05
0.041  < 0.05, значит гипотеза о том, что существо - единорог, отвергается при уровне значимости a = 0.05


### Задача 2

Метод Бонферрони:

`p_value = [0.00001, 0.7361, 0.0482]`

`alpha = 0.05`

`alpha_cor = alpha/(len(p_value))`

`rejected = [bool(p <= alpha_cor) for p in p_value]`

`print(rejected)`



In [13]:
p_value = [0.00001, 0.7361, 0.0482]
alpha = 0.05
alpha_cor = alpha/(len(p_value))
rejected = [bool(p <= alpha_cor) for p in p_value]
print(rejected)

[True, False, False]


По методу Бонферрони только для одного критерия из трех мы отвергаем гипотезу на уровне значимости 0.05. 

# Практическая часть

## Множественная проверка гипотез


###Задача 3 (все потоки).
Проведены эксперименты для оценки эффективности нескольких препаратов для снижения послеоперационной тошноты. Результаты экспериментов приведены в таблице ниже. При проведении эксперимента пациенты делились на группы случайным образом.

    
                            Количество пациентов  Количество случаев возникновения тошноты

		Плацебо                80                    45 

		Хлорпромазин           75                    26 
    
		Дименгидринат          85                    52 
    
		Пентобарбитал (100 мг) 67                    35 
    
		Пентобарбитал (150 мг) 85                    37 
    

 Проведите сравнение каждого препарата по эффективности по отношению к плацебо c использованием критерия Вальда (см. лекцию 5 и последующие). Какие методы МПГ, контролирующие FWER и FDR, можно использовать в данной задаче? Какие ответы можно получить для этих методов? В каждом случае приведите значения статистики критерия Вальда, p-value и скорректированные p-value. Поясните смысл p-value и множественной проверки гипотез в данной задаче. Оформите решение структурированно. 

Эффективность я понимаю как отсутствие рвоты.

Рвота либо есть, либо нет, значит все распределения - распределения Бернулли с некоторым параметром p. Оценка параметра - $\hat{p} = \overline{X}$ - доля случаев без рвоты.



Пусть $X \sim Bern(p_1)$ - дали лекарство; $Y \sim Bern(p_2)$ - плацебо

$H_0$ - лекарство такое же эффективное, как плацебо ($p_1 = p_2$)

$H_1$ - лекарство более эффективное, чем плацебо ($p_2 > p_1$)

Критерий Вальда: 

$W = \frac{\hat{p_1} - \hat{p_2}}{\hat{\sigma}}$

$\hat{\sigma} = \sqrt{\frac{\hat{p_1} (1 - \hat{p_1})}{n} + \frac{\hat{p_2} (1 - \hat{p_2})}{m}}$

$W (X, Y) \sim \mathcal{N} (0, 1)$

$S = \{  W (X, Y) > z_{1-\alpha} \}$

In [118]:
alpha = 0.05

data = pd.DataFrame([["Плацебо", 80, 45],
    ["Хлорпромазин", 75, 26],
    ["Дименгидринат", 85, 52],
    ["Пентобарбитал (100 мг)", 67, 35],
    ["Пентобарбитал (150 мг)", 85, 37]])

data.columns = ["Название", "Количество пациентов", "Количество случаев возникновения тошноты"]
data["estimation"] = 1-data["Количество случаев возникновения тошноты"]/data["Количество пациентов"] #доля случаев без рвоты
data["sigma_sq"] = data["estimation"]*(1 - data["estimation"])/data["Количество пациентов"] 

data["W"] = [(data["estimation"][i] - data["estimation"][0])/ \
     (data["sigma_sq"][0] + data["sigma_sq"][i])**0.5 for i in range(len(data["estimation"]))] # критерий Вальда
Wald_result = data["W"] > sps.norm.ppf(1-alpha)

data["Отвергаем ли мы гипотезу на осн. кр. Вальда"] = Wald_result

In [110]:
data

Unnamed: 0,Название,Количество пациентов,Количество случаев возникновения тошноты,estimation,sigma_sq,W,Отвергаем ли мы гипотезу на осн. кр. Вальда
0,Плацебо,80,45,0.4375,0.003076,0.0,False
1,Хлорпромазин,75,26,0.653333,0.00302,2.764364,True
2,Дименгидринат,85,52,0.388235,0.002794,-0.642987,False
3,Пентобарбитал (100 мг),67,35,0.477612,0.003724,0.486428,False
4,Пентобарбитал (150 мг),85,37,0.564706,0.002892,1.646605,True


Видно, что по критерию Вальда мы отвергли гипотезу для Хлорпромазина и Пентобарбитала (150 мг). Это значит, что они более эффективны, чем плацебо. Теперь посмотрим на p-value = $P_0 (W > w)$

In [119]:
p_val = sps.norm.sf(data["W"])
data["p_val"] = p_val
p_val_result = data["p_val"] <= alpha
data["Отвергаем ли мы гипотезу на осн. p-value"] = p_val_result
data

Unnamed: 0,Название,Количество пациентов,Количество случаев возникновения тошноты,estimation,sigma_sq,W,Отвергаем ли мы гипотезу на осн. кр. Вальда,p_val,Отвергаем ли мы гипотезу на осн. p-value
0,Плацебо,80,45,0.4375,0.003076,0.0,False,0.5,False
1,Хлорпромазин,75,26,0.653333,0.00302,2.764364,True,0.002852,True
2,Дименгидринат,85,52,0.388235,0.002794,-0.642987,False,0.739884,False
3,Пентобарбитал (100 мг),67,35,0.477612,0.003724,0.486428,False,0.313332,False
4,Пентобарбитал (150 мг),85,37,0.564706,0.002892,1.646605,True,0.04982,True


По результатм видно, что мы отвергли гипотезу только для Хлорпромазина. Это значит, что Хлорпромазин эффективнее плацебо, а Пентобарбитал (150 мг) уже нет (а критерий Вальда "сказал", что Пентобарбитал (150 мг) эффективнее плацебо).

Так как статистики независимы, можно использовать методы: Бонферрони (FWER), Холма (FWER), Шидака (FWER), Шидака-Холма (FWER), Бенджамини-Иекутиели (FDR), Бенджамини-Хохберга (FDR)

In [120]:
methods = ["bonferroni", "sidak", "holm-sidak", "holm", "fdr_bh", "fdr_by"]
methods_rus = ["Бонферрони", "Шидака", "Холма-Шидака", "Холма", "Бенджамини-Хохберга", "Бенджамини-Иекутиели"]

for method, method_rus in zip(methods, methods_rus):
    reject, pvals_corrected = multipletests(data["p_val"], method=method, alpha=alpha)[:2]
    data[f"Исправленные p-values для метода {method_rus}"] = pvals_corrected
    data[f"Отвергаем ли гипотезу для метода {method_rus}"] = reject

In [116]:
data

Unnamed: 0,Название,Количество пациентов,Количество случаев возникновения тошноты,estimation,sigma_sq,W,Отвергаем ли мы гипотезу на осн. кр. Вальда,p_val,Отвергаем ли мы гипотезу на осн. p-value,Исправленные p-values для метода Бонферрони,...,Исправленные p-values для метода Шидака,Отвергаем ли гипотезу для метода Шидака,Исправленные p-values для метода Холма-Шидака,Отвергаем ли гипотезу для метода Холма-Шидака,Исправленные p-values для метода Холма,Отвергаем ли гипотезу для метода Холма,Исправленные p-values для метода Бенджамини-Хохберга,Отвергаем ли гипотезу для метода Бенджамини-Хохберга,Исправленные p-values для метода Бенджамини-Иекутиели,Отвергаем ли гипотезу для метода Бенджамини-Иекутиели
0,Плацебо,80,45,0.4375,0.003076,0.0,False,0.5,False,1.0,...,0.96875,False,0.75,False,1.0,False,0.625,False,1.0,False
1,Хлорпромазин,75,26,0.653333,0.00302,2.764364,True,0.002852,True,0.014258,...,0.014177,True,0.014177,True,0.014258,True,0.014258,True,0.032557,True
2,Дименгидринат,85,52,0.388235,0.002794,-0.642987,False,0.739884,False,1.0,...,0.998809,False,0.75,False,1.0,False,0.739884,False,1.0,False
3,Пентобарбитал (100 мг),67,35,0.477612,0.003724,0.486428,False,0.313332,False,1.0,...,0.847337,False,0.676227,False,0.939996,False,0.52222,False,1.0,False
4,Пентобарбитал (150 мг),85,37,0.564706,0.002892,1.646605,True,0.04982,True,0.249098,...,0.225484,False,0.184875,False,0.199278,False,0.124549,False,0.284387,False


In [121]:
inc_columns = ["Название", "Отвергаем ли мы гипотезу на осн. кр. Вальда", "Отвергаем ли мы гипотезу на осн. p-value",
               "Отвергаем ли гипотезу для метода Бонферрони", "Отвергаем ли гипотезу для метода Холма-Шидака",
               "Отвергаем ли гипотезу для метода Холма", "Отвергаем ли гипотезу для метода Бенджамини-Хохберга",
               "Отвергаем ли гипотезу для метода Бенджамини-Иекутиели"]
data[inc_columns]

Unnamed: 0,Название,Отвергаем ли мы гипотезу на осн. кр. Вальда,Отвергаем ли мы гипотезу на осн. p-value,Отвергаем ли гипотезу для метода Бонферрони,Отвергаем ли гипотезу для метода Холма-Шидака,Отвергаем ли гипотезу для метода Холма,Отвергаем ли гипотезу для метода Бенджамини-Хохберга,Отвергаем ли гипотезу для метода Бенджамини-Иекутиели
0,Плацебо,False,False,False,False,False,False,False
1,Хлорпромазин,True,True,True,True,True,True,True
2,Дименгидринат,False,False,False,False,False,False,False
3,Пентобарбитал (100 мг),False,False,False,False,False,False,False
4,Пентобарбитал (150 мг),True,True,False,False,False,False,False


Сравнение плацебо с плацебо смысла не несет, поэтому первая строка таблицы бессмысленна

**Вывод:**

По таблице видно, что по критерию Вальда мы отвергаем Гипотезу о том, что препарат такой же эффективеный, как плацебо для Хлорпромазина и Пентобарбитала (150 мг). Это значит, что эти препараты более эффективны плацебо. p-value тоже отвергает гипотезу для Хлорпромазина и Пентобарбитала (150 мг). А вот скорректированные p-value для всех 6 методов отвергают гипотезу только для Хлорпромазина. 

p-value в данном случае это степень уверенности в том, что препарат эффективнее плацебо (чем меньше, тем увереннее). 


Если мы будем проверять гипотезу по отдельности для каждого препарата, то вероятность получить ошибку для каждого препарата будет неизменна $\alpha$, но для всего списка она будет больше чем $\alpha$. Смысл МПГ в данной задаче - уменьшить вероятность допущения ошибки в отвержении гипотезы для всего набора препаратов в целом.

