Задача 1. Даны две независимые выборки. Не соблюдается условие нормальности
- x1 380,420, 290
- y1 140,360,200,900

Сделайте вывод по результатам, полученным с помощью функции, имеются ли статистические различия между группами?

Решение

Так как имеются две независимые выборки и не соблюдается условие нормальности, 
то используем непарамертический тест Манна Уитни

In [2]:
import scipy.stats as stats
import numpy as np

In [3]:
x_1 = np.array([380,420, 290])
y_1 = np.array([140,360,200,900])
α = 0.05

In [4]:
stats.mannwhitneyu(x_1, y_1)

MannwhitneyuResult(statistic=8.0, pvalue=0.6285714285714286)

Вывод: значение pvalue>α => нулевая гипотеза принимается, что означает 
статистические различия между группами отсутствуют

Задача 2. Исследовалось влияние препарата на уровень давления пациентов. Сначала
измерялось давление до приема препарата, потом через 10 минут и через 30 минут. Есть
ли статистически значимые различия между измерениями давления? В выборках не соблюдается условие нормальности.
- 1е измерение до приема препарата: 150, 160, 165, 145, 155
- 2е измерение через 10 минут: 140, 155, 150, 130, 135
- 3е измерение через 30 минут: 130, 130, 120, 130, 125

Решение

Так как имеются три зависимые выборки и не соблюдается условие нормальности, то используем 
непарамертический тест Фридмана

In [5]:
x1 = np.array([150, 160, 165, 145, 155])
y1 = np.array([140, 155, 150, 130, 135])
z1 = np.array([130, 130, 120, 130, 125])
α = 0.05

In [8]:
stats.friedmanchisquare(x1, y1, z1)

FriedmanchisquareResult(statistic=9.578947368421062, pvalue=0.00831683351100441)

Вывод: значение pvalue<α => нулевая гипотеза отвергается, что означает 
статистические различия между измерениями давления имеют место быть

Задача 3. Сравните 1 и 2 е измерения, предполагая, что 3го измерения через 30 минут не было. Есть
ли статистически значимые различия между измерениями давления?

Решение

Так как имеются две зависимые выборки и не соблюдается условие нормальности, 
то используем непарамертический тест Уилкоксона

In [13]:
x_first = np.array([50, 160, 165, 145, 155])
x_second = np.array([140, 155, 150, 130, 135])
α = 0.05

In [14]:
stats.wilcoxon(x_first, x_second)

WilcoxonResult(statistic=5.0, pvalue=0.625)

Вывод: значение pvalue>α => нулевая гипотеза принимается, что означает статистические различия между 
измерениями давления отсутствуют

Задача 4. Даны 3 группы учеников плавания. Не соблюдается условие нормальности.
В 1 группе время на дистанцию 50 м составляют:
- 56, 60, 62, 55, 71, 67, 59, 58, 64, 67
- Вторая группа : 57, 58, 69, 48, 72, 70, 68, 71, 50, 53
- Третья группа: 57, 67, 49, 48, 47, 55, 66, 51, 54

Есть ли статистически значимые различия между группами?

Решение

Так как имеются три независимые выборки и не соблюдается условие нормальности, то 
используем непарамертический тест Крускала-Уоллиса

In [15]:
gr_1 = np.array([56, 60, 62, 55, 71, 67, 59, 58, 64, 67])
gr_2 = np.array([57, 58, 69, 48, 72, 70, 68, 71, 50, 53])
gr_3 = np.array([57, 67, 49, 48, 47, 55, 66, 51, 54])
α = 0.05

In [16]:
stats.kruskal(gr_1, gr_2, gr_3)

KruskalResult(statistic=5.465564058257224, pvalue=0.0650380998590494)

Вывод: значение pvalue>α => нулевая гипотеза принимается, что означает статистические 
различия между группами отсутствуют

Задача 5. Заявляется, что партия изготавливается со средним арифметическим 2,5 см. Проверить
данную гипотезу, если известно, что размеры изделий подчинены нормальному закону
распределения. Объем выборки 10, уровень статистической значимости 5%
2.51, 2.35, 2.74, 2.56, 2.40, 2.36, 2.65, 2.7, 2.67, 2.34

Решение

In [19]:
x = np.array([2.51, 2.35, 2.74, 2.56, 2.40, 2.36, 2.65, 2.7, 2.67, 2.34])
α = 0.05
n = 10
x_mean = 2.5

Так как среднее квадратичное отклонение генеральной совокупности неизвестно, то 
используем критерий Стьюдента

In [27]:
x_std = np.std(x, ddof=1)
t_cr = stats.t.ppf(α/2, df=n-1)
L = x_mean - t_cr*x_std/n**0.5#нижняя граница интервала
U = x_mean + t_cr*x_std/n**0.5#верхняя граница интервала
print(f'Доверительный интервал - ({U}, {L}]')
print(t_cr)

Доверительный интервал - (2.3875071095954667, 2.6124928904045333]
-2.262157162740992


Вывод: Так как среднее арифметическое 2,5 входит в доверительный интервaл, то гипотеза о том, что 
партия изготавливается со средним арифметическим 2,5 см не отклоняется