In [20]:
### Сравнение двух дисперсий нормальных генеральных совокупностей  ###

import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt

from statsmodels.distributions.empirical_distribution import ECDF
from scipy.stats import norm
from scipy.stats import f

loc1, scale1, size1 = 10, 2, 100
norm_sample1 = norm.rvs(loc=loc1, scale=scale1, size=size1)

loc2, scale2, size2 = 15, 4, 150
norm_sample2 = norm.rvs(loc=loc2, scale=scale2, size=size2)

norm_var1 = np.var(norm_sample1, ddof=1)
norm_var2 = np.var(norm_sample2, ddof=1)


# Расчёт наблюдаемой F-статистики
F_statistic_norm = norm_var2 / norm_var1

# Степени свободы
k1 = size2 - 1 
k2 = size1 - 1

# Расчёт p-значения для F-теста
# По 2 правилу
#p_value_norm = 1 - f.cdf(F_statistic_norm, k1, k2)

# Вывод результатов
print("F-статистика:", F_statistic_norm)
print("F-критическое:", 1.3) # Примерное значение из таблицы "Критические точки распределения F Фишера-Снедекора"
#print("P-значение:", p_value_norm)
print("Выборочная дисперсия выборки 1:", norm_var1)
print("Выборочная дисперсия выборки 2:", norm_var2) ## Отвергаем

F-статистика: 3.0660027392925246
F-критическое: 1.3
P-значение: 4.757613525363524e-09
Выборочная дисперсия выборки 1: 4.585362183355331
Выборочная дисперсия выборки 2: 14.058733014815797


In [15]:
### Сравнение двух средних генеральных совокупностей, дисперсии которых известны (большие выборки) ###

import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt


from statsmodels.distributions.empirical_distribution import ECDF
from scipy.stats import f

from scipy.stats import norm, zscore

# Генерируем 2 выборки и находим их мат. ожидание

mu1, sigma1, n1 = 50, 5, 100
sample1 = norm.rvs(loc=mu1, scale=sigma1, size=n1)

mu2, sigma2, n2 = 53, 6, 150
sample2 = norm.rvs(loc=mu2, scale=sigma2, size=n2)

mean1 = np.mean(sample1)
mean2 = np.mean(sample2)

# Вычисляем наблюдаемое значение критерия z набл
z_statistic = (mean1 - mean2) / np.sqrt(sigma1 ** 2 / n1 + sigma2 ** 2 / n2)

rule1_z = 1.96 # крит
rule2_z = 1.65 # крит

print("Среднее 1 выборки:", mean1)
print("Среднее 2 выборки:", mean2)
print("Z-набл: ", z_statistic)
print("Z-кр, правило 1: ", rule1_z)
print("Z-кр, правило 2: ", rule2_z)

# Отвергаем 0 гипотезу тк по модулю |z набл| больше

Среднее 1 выборки: 49.87531925471574
Среднее 2 выборки: 52.407756821205176
Z-набл:  -3.6177679521277644
Z-кр, правило 1:  1.96
Z-кр, правило 2:  1.65


In [19]:
### Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам различного объема. Критерий Бартлетта ##

import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt


from statsmodels.distributions.empirical_distribution import ECDF
from scipy.stats import f

from scipy.stats import norm, zscore, bartlett

# Заданные параметры
means = [10, 20, 30, 40, 50]  # разные средние значения для каждой выборки
sigma = 5  # одинаковое стандартное отклонение
sizes = [50, 60, 70, 80, 90]  # объемы выборок

# Генерация пяти выборок

samples = []
for i in range(0, 5):
    samples.append(norm.rvs(loc=means[i], scale=sigma, size=sizes[i]))

vars = []
for sample in samples:
    vars.append(np.var(sample))

print(vars)

'''
Применение критерия Бартлетта для проверки равенства дисперсий между выборками.
Функция bartlett(*samples) принимает несколько выборок как аргументы, 
представленные в виде *samples, и возвращает значение статистики 
Бартлетта и соответствующее p-значение.
'''


# Применение критерия Бартлетта для проверки равенства дисперсий
bartlett_stat, p_value = bartlett(*samples)

#l - число выборок
chi_crit = 9.5

print(bartlett_stat, ' ', p_value)

# bartlett_stat < chi_crit => дисп примерно равны


'''
Значение статистики Бартлетта: около 3.43.
Это число показывает меру различий между дисперсиями выборок. Чем больше это значение, тем больше различия между дисперсиями.


Значение p-значения: около 0.49.
Это вероятность получить такие же или более экстремальные результаты,
если нулевая гипотеза (о равенстве дисперсий) верна. В данном случае,
так как p-значение больше уровня значимости 0.05, нет оснований отклонять
нулевую гипотезу, и мы можем сказать, что дисперсии между группами
статистически не различаются.
'''

[20.402953995692346, 16.42551172169158, 23.685350144702376, 22.222378776119655, 25.34302863935714]
3.434365689269816   0.4879281000541241
