### Предсказания птиц

Имеем распределение дождливых дней по Бернулли с параметром $p = \frac{70}{365}$. Считаем, что 70 обозначет именно количество дождливых дней в году в среднем.

Так как вероятность успешного предсказания одинакова, и наблюдения за птицами независимы, то можно провести один биномиальный тест, просуммировав соответствующие данные:

In [22]:
from scipy import stats

def test_result(test, significance_level=0.05):
    if test.pvalue <= significance_level:
        print("H0 is rejected")
    else:
        print("H0 is not rejected")

n = 24+37+29+33+28+36+32
k = 15+16+13+21+18+20+21

test_result(stats.binomtest(k, n, 70/365))

H0 is rejected


Отвергли гипотезу, что вероятность дождя не меняется.

### Лаборант

Есть модель неизвестного распределения. Нужно очистить данные (убрать 8% экстремальных значений выборок) и провести проверку следующей гипотезы:

$$H_0: \mathbb{E}{X}_1 = \mathbb{E}{X}_2$$

Если лаборант тоже тщательно помыл пробирки, как и мы, то среднее значение аммиака не должно отличаться в выборках.

Для проверки данной гипотезы превосходно подходит двухвыборочный $t$-критерий Стьюдента для независимых выборок.

In [10]:
import pandas as pd

lab1_sample = pd.read_csv('IB_statistics_data_lab1.txt', sep=' ')
lab2_sample = pd.read_csv('IB_statistics_data_lab1.txt', sep=' ')
n1 = len(lab1_sample)
n2 = len(lab2_sample)

lab1 = lab1_sample.sort_values("Ammonia")[int(n1*0.08):int(n1*0.92)]
lab2 = lab2_sample.sort_values("Ammonia")[int(n2*0.08):int(n2*0.92)]

test_result(stats.ttest_ind(lab1, lab2))

H0 is not rejected


### Поросята

В данном случае проверяем гипотезу:

$$H_0: \lambda \le 3.14$$

Для этого воспользуемся РНМ критерием. Так как распределение Пуассона относится к семейству экспоненциальных:

$$\varphi(x) = \begin{cases}1, x > C \\ \gamma, x = C \\ 0, x > C\end{cases}$$

$C$ и $\gamma$ выбираем так, что $\mathbb{E}\varphi(x) = 0.01$ при $\lambda = 3.14$.