# Урок 5. Тестирование гипотез

In [1]:
import numpy as np
import scipy.stats as stats

***
## Задание 1.

### Ниже приведены диаметры коронарных артерий после приема нифедипина и плацебо. Позволяют ли приводимые ниже данные утверждать, что нифедипин влияет на диаметр коронарных артерий?

$H_0: \bar{X} = \bar{Y}$

$H_1: \bar{X} \not= \bar{Y}$ – двусторонняя критическая область

$\displaystyle T = \frac{\bar{x}-\bar{y}}{\displaystyle \sqrt{\frac{\sigma_x^2}{n}+\frac{\sigma_y^2}{m}}}$

Двусторонняя критическая область. Если $|t_н| < t_к$, то гипотеза $H_0$ принимается, в противном случае – отвергается.

In [2]:
X = np.array([2.5, 2.2, 2.6, 2.0, 2.1, 1.8, 2.4, 2.3, 2.7, 2.7, 1.9])
Y = np.array([2.5, 1.7, 1.5, 2.5, 1.4, 1.9, 2.3, 2.0, 2.6, 2.3, 2.2])

In [3]:
alpha = 0.05
n, m = X.shape[0], Y.shape[0]
k = n + m - 2

x, y = round(np.mean(X),2), round(np.mean(Y),2)
#print(x, y)
d_x, d_y = np.var(X, ddof=1), np.var(Y, ddof=1)
#print(d_x, d_y)
Tn = round((x - y)/np.sqrt(d_x/n + d_y/m),2)
print(f'{Tn = }')

# Two-Tailed Test
Tk = round(stats.t.ppf(1 - alpha/2, k),3)
print(f'{Tk = }')

print(['H1: X <> Y','H0: M(X) = M(Y)'][int(abs(Tn)<Tk)])

Tn = 1.33
Tk = 2.086
H0: M(X) = M(Y)


In [7]:
stats.ttest_ind(X,Y)

Ttest_indResult(statistic=1.3283484757831463, pvalue=0.19902265798859647)

***
## Задание 2.

### Возьмем данные для группы людей, которые работали в накуренном помещении и для людей, выкуривающих небольшое число сигарет в день. Объемы выборок одинаковые - по 200 человек. Для людей, работающих в накуренном помещении средняя скорость средины выдоха составляет 2.72, std = 0.71, а выкуривающих небольшое число сигарет 2.63, std=0.73. Можно ли считать одинаковой максимальную объемную скорость середины выдоха в обеих группах?

$H_0: \bar{X} = \bar{Y}$

$H_1: \bar{X} \not= \bar{Y}$ – двусторонняя критическая область

$\displaystyle T = \frac{\bar{x}-\bar{y}}{\displaystyle \sqrt{\frac{\sigma_x^2}{n}+\frac{\sigma_y^2}{m}}}$

$\displaystyle \Phi(t_к) = \frac{1-\alpha}{2}$ – для двусторонней области \
$\alpha$ – выбранный уровень значимости \
$\Phi(t)$ – функция Лапласа

Двусторонняя критическая область. Если $|t_н| < t_к$, то гипотеза $H_0$ принимается, в противном случае – отвергается.

In [9]:
n = 200
x, s_x, y, s_y = 2.72, 0.71, 2.63, 0.73
alpha = 0.05

phi = (1-alpha)/2
print(f'Phi(Tk) = {phi}')
Tk = round(stats.norm.ppf(phi+0.5),3)
print(f'{Tk = }')

Tn = round((x - y)/np.sqrt((s_x**2 + s_y**2)/n),2)
print(f'{Tn = }')

print(['H1: X <> Y','H0: M(X) = M(Y)'][int(abs(Tn)<Tk)])

Phi(Tk) = 0.475
Tk = 1.96
Tn = 1.25
H0: M(X) = M(Y)


***
## Задание 3.

### Утверждается, что средний рост мужчины национальности X 179.5 см. Была взята выборка из 100 человек, по которой получилось среднее арифметическое 178.5 см. Проверить это утверждение с помощью одностороннего теста, если известно, что стандартное отклонение генеральной совокупности 3 см. А уровень статистической значимости принят за 1%.

$H_0: a = a_0$ \
$H_1: a < a_0$ - левосторонняя критическая область

$\displaystyle Z = \frac{(\bar{x}-a_0)\sqrt{n}}{\sigma}$

$\displaystyle \Phi(z_к) = \frac{1-2\alpha}{2}$ – для односторонней области

Для левосторонней критической области. Если $z_н > -z_к$, то гипотеза $H_0$ на уровне значимости $\alpha$ принимается. Если $z_н < -z_к$, то отвергается.

In [10]:
a0, n, a1, s, alpha = 179.5, 100, 178.5, 3, 0.01

phi = (1-2*alpha)/2
print(f'Phi(Zk) = {phi}')
Zk = round(stats.norm.ppf(phi+0.5),3)
print(f'{Zk = }')

Zn = round(((a1-a0)*np.sqrt(n))/s,3)
print(f'{Zn = }')

print(['H1: a < a0','H0: a = a0'][int(Zn>-Zk)])

Phi(Zk) = 0.49
Zk = 2.326
Zn = -3.333
H1: a < a0
