In [None]:
!pip install numpy scipy statsmodels



## 1. One-Sample t-Test

Компания утверждает, что среднее время доставки равно 30 минут.
Проверим это утверждение с помощью одновыборочного t-теста.

Гипотезы:
H₀: μ = 30  
H₁: μ ≠ 30  
Уровень значимости α = 0.05


In [10]:
delivery_times = np.array([32, 28, 30, 29, 31, 35, 33, 27, 29, 28,
                           30, 34, 31, 29, 30])

t_stat, p_value = stats.ttest_1samp(delivery_times, 30)
t_stat, p_value
print(f"t-statistic = {t_stat:.3f}")
print(f"p-value = {p_value:.3f}")


t-statistic = 0.676
p-value = 0.510


Если p-value > 0.05, мы не отвергаем нулевую гипотезу.
В данном случае среднее время доставки не отличается от 30 минут.


## 2. Two-Sample Independent t-Test

Сравнение результатов тестов двух независимых групп студентов:
традиционный метод обучения и новый метод.

Гипотезы:
H₀: μ₁ = μ₂  
H₁: μ₁ ≠ μ₂


In [11]:
traditional_scores = np.array([78, 85, 88, 92, 76, 80, 84, 75, 83, 89])
new_method_scores = np.array([90, 88, 85, 93, 95, 87, 84, 91, 92, 90])

t_stat, p_value = stats.ttest_ind(traditional_scores, new_method_scores)
t_stat, p_value
print(f"t-statistic = {t_stat:.3f}")    
print(f"p-value = {p_value:.3f}")

t-statistic = -3.066
p-value = 0.007


Если p-value < 0.05, существует статистически значимая разница
между методами обучения.


## 3. Paired t-Test

Измерения веса одних и тех же людей до и после диеты.

Гипотезы:
H₀: средняя разница равна 0  
H₁: средняя разница не равна 0


In [12]:
weights_before = np.array([70,82,85,90,88,76,95,78,84,72,80,86])
weights_after = np.array([68,80,83,85,86,74,90,76,82,70,78,85])

t_stat, p_value = stats.ttest_rel(weights_before, weights_after)
t_stat, p_value
print(f"t-statistic = {t_stat:.3f}")    
print(f"p-value = {p_value:.3f}")

t-statistic = 6.751
p-value = 0.000


Парный t-тест показывает, оказывает ли диета значимое влияние на вес.


## 4. One-Sample t-Test с нормально распределёнными данными

Сгенерируем 30 значений из нормального распределения
и проверим, отличается ли среднее от 500.


In [22]:
np.random.seed(42)
scores = np.random.normal(loc=500, scale=50, size=30)

t_resault = stats.ttest_1samp(scores, 500)
print("Результаты одновыборочного t-теста:")
print(f"  t-статистика: {t_resault.statistic:.2f}")
print(f"  p-value: {t_resault.pvalue:.3f}")
print(f"  Число степеней свободы: {len(scores)-1}")




Результаты одновыборочного t-теста:
  t-статистика: -1.15
  p-value: 0.262
  Число степеней свободы: 29


Если p-value > 0.05, среднее значение статистически не отличается от 500.


## 5. One-Sample z-Test для среднего значения

Известно стандартное отклонение и большая выборка (n = 50),
поэтому используется z-тест.


In [24]:
z = (9.5 - 10) / (1.2 / np.sqrt(50))
p_value = 2 * (1 - stats.norm.cdf(abs(z)))

print(f"p-value = {p_value:.3f}")


p-value = 0.003


In [None]:
Если p-value < 0.05, реальное среднее время работы батареи
отличается от заявленного.


## 6. Two-Sample z-Test для средних значений


In [25]:
z = (75 - 78) / np.sqrt((10**2 / 80) + (8**2 / 100))
p_value = 2 * (1 - stats.norm.cdf(abs(z)))

z, p_value
print(f"z = {z:.3f}")

z = -2.182


Тест определяет, есть ли значимая разница между средними баллами двух школ.


## 7. One-Sample z-Test для доли


In [27]:
p_hat = 290 / 500
z = (p_hat - 0.6) / np.sqrt((0.6 * 0.4) / 500)
p_value = 2 * (1 - stats.norm.cdf(abs(z)))

z, p_value
print(f"z = {z:.3f}")
print(f"p-value = {p_value:.3f}")

z = -0.913
p-value = 0.361


Если p-value > 0.05, доля людей, предпочитающих онлайн-шопинг,
не отличается от заявленных 60%.


## 8. Two-Sample z-Test для долей


In [28]:
p1, p2 = 250 / 1000, 320 / 1200
p_pool = (250 + 320) / (1000 + 1200)

z = (p1 - p2) / np.sqrt(p_pool * (1 - p_pool) * (1/1000 + 1/1200))
p_value = 2 * (1 - stats.norm.cdf(abs(z)))

z, p_value
print(f"z = {z:.3f}")
print(f"p-value = {p_value:.3f}")

z = -0.888
p-value = 0.374


Результат показывает, различается ли использование общественного транспорта
между двумя городами.


In [None]:
## 9. ANOVA Test


In [29]:
only_breast = np.array([794.1,716.9,993,724.7,760.9,908.2,659.3,690.8,768.7,
                         717.3,630.7,729.5,714.1,810.3,583.5,679.9,865.1])

only_formula = np.array([898.8,881.2,940.2,966.2,957.5,1061.7,1046.2,980.4,895.6,
                          919.7,1074.1,952.5,796.3,859.6,871.1,1047.5,919.1,1160.5,996.9])

both = np.array([976.4,656.4,861.2,706.8,718.5,717.1,759.8,894.6,867.6,805.6,
                 765.4,800.3,789.9,875.3,740,799.4,790.3,795.2,823.6,818.7,
                 926.8,791.7,948.3])

f_stat, p_value = stats.f_oneway(only_breast, only_formula, both)
f_stat, p_value
print(f"F-statistic = {f_stat:.3f}")
print(f"p-value = {p_value:.3f}")

F-statistic = 26.701
p-value = 0.000


Если p-value < 0.05, существует статистически значимая разница
между средним набором веса у трёх групп.
