In [9]:
import numpy as np
from scipy import stats

### Задача 1

$ X_1, … , X_n\ –\ наблюдения $

$ Предполагается, что\ E[X_0] = µ $

$ µ = µ_0 $

Формулировка гипотез:

$ H_0: µ = µ_0 $

$ H_A: µ \neq  µ_0 $


In [10]:
sample = np.array([12.9, 11.6, 13.5, 13.9, 12.1, 11.9, 13.0])
mu0 = 12

In [11]:
t_statistic, p_value = stats.ttest_1samp(sample, mu0)
stats.ttest_1samp(sample, mu0)

TtestResult(statistic=2.1578017974978794, pvalue=0.07430190210562303, df=6)

In [12]:
alpha = 0.05
if p_value < alpha:
    print("Отвергаем нулевую гипотезу: нельзя считать, что среднее напряжение равно 12 В.")
else:
    print("Не отвергаем нулевую гипотезу: можно считать, что среднее напряжение равно 12 В.")

Не отвергаем нулевую гипотезу: можно считать, что среднее напряжение равно 12 В.


### Задача 2

$ X_1, ... , X_n;\ Y_1, ... , Y_n \ – \ парные \ наблюдения $

$E[X_i] = µ_x,\ E[Y_i] = µ_y $

µ = µ₀

Формулировка гипотез:

$H_0: µ_x = µ_y $  

$H_A: µ_x \neq µ_y $

In [13]:
method1 = np.array([23.1, 23.2, 26.5, 26.6, 27.1, 48.3, 40.5, 25.0, 38.4, 23.5])
method2 = np.array([22.7, 23.6, 27.1, 27.4, 27.4, 46.8, 40.4, 24.9, 38.1, 23.8])

In [14]:
mu0 = 0
diff = method2-method1
diff

array([-0.4,  0.4,  0.6,  0.8,  0.3, -1.5, -0.1, -0.1, -0.3,  0.3])

In [15]:
t_statistic, p_value = stats.ttest_1samp(diff, mu0)
stats.ttest_1samp(diff, mu0)

TtestResult(statistic=-1.7154884978678027e-15, pvalue=0.9999999999999987, df=9)

In [16]:
alpha = 0.05
if p_value < alpha:
    print("Отвергаем нулевую гипотезу: один метод даёт в среднем более высокие показания, чем другой")
else:
    print("Не отвергаем нулевую гипотезу: методы дают в среднем одинаковые показания")

Не отвергаем нулевую гипотезу: методы дают в среднем одинаковые показания


### Задача 3

$ C_1, ... , C_n;\ V_1, ... , V_m \ – \ независимые \ наблюдения $

$E[C_i] = µ_c,\ E[V_i] = µ_v $

µ = µ₀

Формулировка гипотез:

$H_0: µ_c = µ_v $  

$H_A: µ_c > µ_v $

In [17]:
cityzens = np.array([132, 111, 119, 138, 200, 131, 138, 170, 159, 140])
villagers = np.array([115, 190, 127, 155, 148, 121, 116, 121, 197])

In [18]:
t_statistic, p_value = stats.ttest_ind(cityzens, villagers, alternative='greater')
stats.ttest_ind(cityzens, villagers, alternative='greater')


TtestResult(statistic=0.035165199049777565, pvalue=0.486178812200461, df=17.0)

In [19]:
alpha = 0.05
if p_value < alpha:
    print("Отвергаем нулевую гипотезу: среднее систолическое артериальное давление у горожан выше, чем у селян.")
else:
    print("Не отвергаем нулевую гипотезу: среднее систолическое артериальное давление у горожан и у селян одинаково.")

Не отвергаем нулевую гипотезу: среднее систолическое артериальное давление у горожан и у селян одинаково.


### Задача 4

n - размер выборки

m - количество мужчин в выборке

p - ожидаемая доля мужчин

Формулировка гипотез:

$H_0: p = p_0 $  

$H_A: p \neq p_0 $

In [20]:
n = 5000
men = 2500
p0 = 0.52

In [21]:
p_value = stats.binomtest(men, n, p0).pvalue
print(f"p-значение: {p_value}")

p-значение: 0.004849502159545284


In [22]:
alpha = 0.05
if p_value < alpha:
    print("Отвергаем нулевую гипотезу: смертность мужчин и женщин не одинакова.")
else:
    print("Не отвергаем нулевую гипотезу: смертность мужчин и женщин одинакова.")

Отвергаем нулевую гипотезу: смертность мужчин и женщин не одинакова.


### Задача 5

Одна из возможных причин таких результатов может быть в размере выборок.
Если размер выборки в первом эксперименте был достаточно большим, то даже небольшая разница между средними могла быть статистически значимой.
Соответственно, если размер выборки во втором эксперименте был мал, то даже значительная разница могла не быть статистически значимой.

Еще возможная причина - разные дисперсии.
Если в первом эксперименте дисперсия была маленькой, то есть данные в выборках были сконцентрированы вокруг своих средних значений, то это могло повлиять на то, что небольшая разница между средними оказалась статистически значимой.
Во втором же эксперименте при большой дисперсии данные в выборках могли быть сильно разбросаны, что сделало большую разницу между средними незначимой.