Критерий Стьюдента (t-критерий) и Z-критерий (Z-тест) - это статистические методы, используемые для тестирования гипотез о средних значениях двух выборок или о среднем значении одной выборки.

**Критерий Стьюдента (t-критерий)**:
- Используется, когда известно среднее квадратичное отклонение генеральной совокупности (или выборки малого размера) или когда генеральная совокупность имеет нормальное распределение.
- Обычно используется для проверки статистических гипотез о различиях между средними значениями двух независимых выборок или между средними значениями одной выборки и известным значением.

**Z-критерий (Z-тест)**:
- Используется, когда известно стандартное отклонение генеральной совокупности и/или размер выборки большой (обычно n≥30) или когда генеральная совокупность имеет нормальное распределение.
- Применяется для проверки гипотез о различиях между средними значениями двух независимых выборок или между средними значениями одной выборки и известным значением.
----------------------------------------------------------------
Таким образом, основное различие между критерием Стьюдента и Z-критерием заключается в том, что критерий Стьюдента используется при малых выборках и/или когда неизвестно стандартное отклонение генеральной совокупности, тогда как Z-критерий используется при больших выборках и/или когда известно стандартное отклонение генеральной совокупности.

Проведите тест гипотезы. Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм. Используя односторонний критерий с α=0,05, проверить эту гипотезу, если в выборке из n=100 шариков средний диаметр оказался равным 17.5 мм, а дисперсия известна и равна 4 кв. мм.

In [1]:
import math
from scipy.stats import norm

In [2]:
# Заданные параметры
mu = 17  # среднее значение генеральной совокупности (заявленное значение)
x_bar = 17.5  # среднее значение выборки
sigma = math.sqrt(4)  # стандартное отклонение генеральной совокупности
n = 100  # размер выборки
alpha = 0.05  # уровень значимости

# Рассчет Z-статистики
Z = (x_bar - mu) / (sigma / math.sqrt(n))

# Рассчитаем критическое значение Z для одностороннего теста
Z_critical = norm.ppf(1 - alpha)

# Вывод рассчитанной Z-статистики и критического значения Z
print("Z-статистика:", Z)
print("Критическое значение Z:", Z_critical)

# Принятие статистического решения
if Z > Z_critical:
    print("Отвергаем нулевую гипотезу.")
else:
    print("Не отвергаем нулевую гипотезу.")

Z-статистика: 2.5
Критическое значение Z: 1.6448536269514722
Отвергаем нулевую гипотезу.


Проведите тест гипотезы. Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет: 202, 203, 199, 197, 195, 201, 200, 204, 194, 190. Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что доверительная вероятность равна 99%? (Провести двусторонний тест.)

In [4]:
from scipy.stats import t
import numpy as np

In [5]:
# Заданные параметры
mu = 200  # среднее значение генеральной совокупности (заявленное значение)
sample = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])  # выборка из весов пачек
n = len(sample)  # размер выборки
alpha = 0.01  # уровень значимости (доверительная вероятность)

# Рассчитываем среднее значение и стандартное отклонение выборки
x_bar = np.mean(sample)
s = np.std(sample, ddof=1)  # исправленное стандартное отклонение

# Рассчитываем t-статистику
t_statistic = (x_bar - mu) / (s / np.sqrt(n))

# Находим критические значения t
t_critical = t.ppf(1 - alpha/2, df=n-1)  # двусторонний тест

# Выводим результаты
print("t-статистика:", t_statistic)
print("Критические значения t:", -t_critical, t_critical)

# Принятие статистического решения
if t_statistic < -t_critical or t_statistic > t_critical:
    print("Отвергаем нулевую гипотезу.")
else:
    print("Не отвергаем нулевую гипотезу.")

t-статистика: -1.0651074037450896
Критические значения t: -3.2498355440153697 3.2498355440153697
Не отвергаем нулевую гипотезу.


Есть ли статистически значимые различия в росте дочерей? Рост матерей 172, 177, 158, 170, 178,175, 164, 160, 169, 165 Рост взрослых дочерей: 173, 175, 162, 174, 175, 168, 155, 170, 160

In [6]:
from scipy.stats import ttest_ind

In [7]:
def t_test_mothers_daughters(mothers_heights, daughters_heights, alpha=0.05):
    # Проведение t-теста
    t_statistic, p_value = ttest_ind(mothers_heights, daughters_heights)
    
    # Вывод результатов
    print("Результаты t-теста:")
    print("t-статистика:", t_statistic)
    print("p-значение:", p_value)
    
    # Принятие статистического решения
    if p_value < alpha:
        print("Есть статистически значимые различия в росте дочерей.")
    else:
        print("Нет статистически значимых различий в росте дочерей.")

# Заданные данные
mothers_heights = [172, 177, 158, 170, 178, 175, 164, 160, 169, 165]
daughters_heights = [173, 175, 162, 174, 175, 168, 155, 170, 160]

# Вызов функции для проведения теста
t_test_mothers_daughters(mothers_heights, daughters_heights)

Результаты t-теста:
t-статистика: 0.24400587215969016
p-значение: 0.8101467126543231
Нет статистически значимых различий в росте дочерей.
