## Проверка гипотез. Распределение Стьюдента (Т-распределение)  
Если число наблюдений в выборке невелико и $\sigma$ (стандартное отклонение генеральной совокупности) неизвестно (почти всегда),  
используется распределение Стьюдента (T-distribution), чтобы описать, как будут себя вести все выборочные средние.  
  
В дальнейшем стоит использовать t - распределение для проверки гипотез, если нам неизвестно стандартное отклонение в генеральной совокупности,  
необходимое для расчета стандартной ошибки, даже если объем выборки больше 30.  
  
Число степеней свободы (df) – количество элементов, которые могут варьироваться при расчете некоторого статистического показателя.  
Например, если у нас есть 10 наблюдений и мы знаем среднее значение по этим 10 наблюдениям, то нам достаточно знать среднее и только 9 из них,  
чтобы узнать, чему равен 10 оставшийся элемент. Т.е. у него нет никакой возможности варьировать свои значения.

In [5]:
import scipy.stats as st

def p_value_calc(t, n, area='bt'):
    df = n - 1
    return {
        'bt': 2 * (1 - st.t.cdf(abs(t), df)), # both tales
        'lt': st.t.cdf(t, df), # lower tail
        'ut': 1 - st.t.cdf(t, df) # upper tail
           }[area]

In [6]:
M = 10

mean = 10.8
sd = 2
n = 25

# H0: M = 10
# H1: M != 10
alpha = 0.05

t = (mean - M) / (sd / (n ** 0.5))
print('t:', t)

p_value = p_value_calc(t, n)
print('p_value:', p_value)

if p_value > alpha:
    print(f'p_value(X < {t:.2f} or X > {t:.2f}) > alpha. Do not reject H0')
else:
    print(f'p_value(X < {t:.2f} or X > {t:.2f}) < alpha. Reject H0')

t: 2.0000000000000018
p_value: 0.0569398499365914
p_value(X < 2.00 or X > 2.00) > alpha. Do not reject H0


### Задача  
Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр d = 10 мм.  
Используя односторонний критерий с α = 0,05, проверить эту гипотезу, если в выборке из n = 16 шариков средний диаметр  
оказался равным 10,3 мм, а дисперсия известна и равна = 1.

In [7]:
M = 10

mean = 10.3
sd = D = 1
n = 16

# H0: M = 10
# H1: M! = 10
alpha = 0.05

t = (mean - M) / (sd / n ** 0.5)
print('t: ', t)

p_value = p_value_calc(t, n, area='ut')
print('p_value: ', p_value)

if p_value > alpha:
    print(f'p_value(X > {t:.2f}) > alpha. Do not reject H0')
else:
    print(f'p_value(X > {t:.2f}) < alpha. Reject H0')

t:  1.2000000000000028
p_value:  0.12437489369401078
p_value(X > 1.20) > alpha. Do not reject H0


### Задача  
Продавец утверждает, что средний вес пачки чая составляет 100 г. Из партии извлечена выборка и взвешена.  
Вес каждой пачки - см. таблицу. Не противоречит ли это утверждению продавца?  
Доверительная вероятность 99%. Вес пачек чая распределен нормально.



In [8]:
import numpy as np

M = 100

sample = np.array([98, 104, 97, 97, 101, 100, 99, 101, 99, 98])
n = len(sample)

# H0: M = 100
# H1: M != 100
alpha = 0.01

mean = np.mean(sample)
sd = np.std(sample, ddof=1)

t = (mean - M) / (sd / n ** 0.5)
print('t:', t)

p_value = p_value_calc(t, n, area='bt')
print('p_value:', p_value)

if p_value > alpha:
    print(f'p_value(X < {t:.2f} or X > {t:.2f}) > alpha. Do not reject H0')
else:
    print(f'p_value(X < {t:.2f} or X > {t:.2f}) < alpha. Reject H0')

t: -0.8741572761215297
p_value: 0.40475467173969104
p_value(X < -0.87 or X > -0.87) > alpha. Do not reject H0
