# Нормальное распределение

In [5]:
import numpy as np
import scipy.stats as stats

# Данные
intervals = np.array([(0, 3), (3, 6), (6, 9), (9, 12), (12, 15), (15, 18), (18, 21), (21, 24)])
observed_frequencies = np.array([3, 17, 20, 22, 13, 12, 10, 3])  # n_i
N = sum(observed_frequencies)  # Общее количество наблюдений

# Параметры нормального распределения
mu = 5.58  # Среднее
sigma = 4.92  # Стандартное отклонение

# Расчет теоретических частот
theoretical_frequencies = []

for lower, upper in intervals:
    # Вычисляем z-значения
    z_lower = (lower - mu) / sigma
    z_upper = (upper - mu) / sigma
    
    # Находим вероятности
    p_lower = stats.norm.cdf(z_lower)
    p_upper = stats.norm.cdf(z_upper)
    
    # Вычисляем вероятность попадания в интервал
    probability = p_upper - p_lower
    
    # Рассчитываем теоретическую частоту
    theoretical_frequency = probability * N
    theoretical_frequencies.append(theoretical_frequency)

# Преобразуем в массив numpy
theoretical_frequencies = np.array(theoretical_frequencies)

# Выводим теоретические частоты
print("Теоретические частоты (n_i теор):", theoretical_frequencies)

# Расчет статистики χ²
chi_squared_statistic = np.sum((observed_frequencies - theoretical_frequencies) ** 2 / theoretical_frequencies)

# Выводим результат
print("Статистика χ²:", chi_squared_statistic)

# Степени свободы
degrees_of_freedom = len(intervals) - 1  # k - 1
print("Степени свободы:", degrees_of_freedom)

# Критическое значение для уровня значимости 0.05
alpha = 0.05
critical_value = stats.chi2.ppf(1 - alpha, degrees_of_freedom)
print("Критическое значение χ²:", critical_value)

# Проверка гипотезы
if chi_squared_statistic > critical_value:
    print("Отвергаем альтернативную гипотезу о нормальном распределении.")
else:
    print("Нет оснований отвергать альтернативную гипотезу о нормальном распределении.")


Теоретические частоты (n_i теор): [17.16369866 23.40111602 22.24958298 14.75222511  6.81975999  2.19746291
  0.49331851  0.07711824]
Статистика χ²: 360.53871154028343
Степени свободы: 7
Критическое значение χ²: 14.067140449340169
Отвергаем альтернативную гипотезу о нормальном распределении.


In [4]:
sigma

0.7584418656710384

# Гамма распределение

In [6]:
import numpy as np
import scipy.stats as stats

# Данные
intervals = np.array([(0, 3), (3, 6), (6, 9), (9, 12), (12, 15), (15, 18), (18, 21), (21, 24)])
observed_frequencies = np.array([3, 17, 20, 22, 13, 12, 10, 3])  # n_i
N = sum(observed_frequencies)  # Общее количество наблюдений

# Параметры гамма-распределения (параметры могут быть подобраны в зависимости от данных)
mu = 5.58  # Среднее
sigma = 4.92  # Стандартное отклонение
alpha = (mu ** 2) / (sigma ** 2)
beta = sigma ** 2 / mu

# Расчет теоретических частот
theoretical_frequencies = []

for lower, upper in intervals:
    # Вычисляем теоретическую частоту для гамма-распределения
    p_lower = stats.gamma.cdf(lower, alpha, scale=beta)
    p_upper = stats.gamma.cdf(upper, alpha, scale=beta)
    
    # Рассчитываем вероятность попадания в интервал
    probability = p_upper - p_lower
    
    # Рассчитываем теоретическую частоту
    theoretical_frequency = probability * N
    theoretical_frequencies.append(theoretical_frequency)

# Преобразуем в массив numpy
theoretical_frequencies = np.array(theoretical_frequencies)

# Выводим теоретические частоты
print("Теоретические частоты (n_i теор):", theoretical_frequencies)

# Расчет статистики χ²
chi_squared_statistic = np.sum((observed_frequencies - theoretical_frequencies) ** 2 / theoretical_frequencies)

# Выводим результат
print("Статистика χ²:", chi_squared_statistic)

# Степени свободы
degrees_of_freedom = len(intervals) - 1  # k - 1
print("Степени свободы:", degrees_of_freedom)

# Критическое значение для уровня значимости 0.05
alpha = 0.05
critical_value = stats.chi2.ppf(1 - alpha, degrees_of_freedom)
print("Критическое значение χ²:", critical_value)

# Проверка гипотезы
if chi_squared_statistic > critical_value:
    print("Отвергаем альтернативную гипотезу о гамма-распределении.")
else:
    print("Нет оснований отвергать альтернативную гипотезу о гамма-распределении.")


Теоретические частоты (n_i теор): [37.1055596  27.65989685 16.14797925  8.92776907  4.81095242  2.55384665
  1.3423419   0.70062648]
Статистика χ²: 167.77966204515178
Степени свободы: 7
Критическое значение χ²: 14.067140449340169
Отвергаем альтернативную гипотезу о гамма-распределении.


# равномерный 

In [7]:
import numpy as np
import scipy.stats as stats

# Данные
observed_frequencies = np.array([3, 17, 20, 22, 13, 12, 10, 3])  # n_i
N = sum(observed_frequencies)  # Общее количество наблюдений
k = len(observed_frequencies)  # Количество интервалов

# Шаг 1: Определение теоретических частот для равномерного распределения
expected_frequency = N / k
theoretical_frequencies = np.full(k, expected_frequency)

# Шаг 2: Расчет статистики χ²
chi_squared_statistic = np.sum((observed_frequencies - theoretical_frequencies) ** 2 / theoretical_frequencies)

# Выводим результат
print("Теоретические частоты (n_i теор):", theoretical_frequencies)
print("Статистика χ²:", chi_squared_statistic)

# Степени свободы
degrees_of_freedom = k - 1  # k - 1
print("Степени свободы:", degrees_of_freedom)

# Критическое значение для уровня значимости 0.05
alpha = 0.05
critical_value = stats.chi2.ppf(1 - alpha, degrees_of_freedom)
print("Критическое значение χ²:", critical_value)

# Проверка гипотезы
if chi_squared_statistic > critical_value:
    print("Отвергаем гипотезу о равномерном распределении.")
else:
    print("Нет оснований отвергать гипотезу о равномерном распределении.")


Теоретические частоты (n_i теор): [12.5 12.5 12.5 12.5 12.5 12.5 12.5 12.5]
Статистика χ²: 28.32
Степени свободы: 7
Критическое значение χ²: 14.067140449340169
Отвергаем гипотезу о равномерном распределении.


# Отчаяние

In [8]:
import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt

# Данные по частотам и интервалам
n_i = np.array([3, 17, 20, 22, 13, 12, 10, 3])  # Частоты
intervals = np.array([0, 3, 6, 9, 12, 15, 18, 21, 24])  # Границы интервалов

# Вычисляем середины интервалов
midpoints = (intervals[:-1] + intervals[1:]) / 2

# Расширяем данные в соответствии с частотами (повторяем значения середины интервалов)
data = np.repeat(midpoints, n_i)

# Список распределений, которые будем проверять
distributions = ['norm', 'expon', 'gamma', 'uniform', 'lognorm', 'beta']

# Словарь для хранения результатов
results = {}

# Подгонка каждого распределения к данным
for distribution in distributions:
    dist = getattr(stats, distribution)
    params = dist.fit(data)  # Подгонка распределения
    
    # Рассчитаем критерий Колмогорова-Смирнова
    D, p_value = stats.kstest(data, distribution, args=params)
    
    # Сохраним результат
    results[distribution] = {'D': D, 'p_value': p_value, 'params': params}

# Отсортируем результаты по p-value
sorted_results = sorted(results.items(), key=lambda x: x[1]['p_value'], reverse=True)

# Выведем результаты
print("Распределения отсортированы по p-value:")
for dist_name, result in sorted_results:
    print(f"{dist_name}: D={result['D']:.4f}, p-value={result['p_value']:.4f}, params={result['params']}")
    
# Выберем распределение с наибольшим p-value
best_dist_name, best_result = sorted_results[0]
print(f"\nНаилучшее распределение: {best_dist_name} с p-value={best_result['p_value']:.4f}")


Распределения отсортированы по p-value:
gamma: D=0.1160, p-value=0.1254, params=(6.804562235145746, -3.1948823475347545, 2.0831435380305647)
lognorm: D=0.1234, p-value=0.0871, params=(0.23176251650856308, -12.015626518723428, 22.391235638825908)
beta: D=0.1343, p-value=0.0491, params=(1.4656681480928986, 1.8744029568143268, 1.1739256113956462, 22.47784493786207)
norm: D=0.1561, p-value=0.0135, params=(10.98, 5.294298820429387)
uniform: D=0.1914, p-value=0.0011, params=(1.5, 21.0)
expon: D=0.2690, p-value=0.0000, params=(1.5, 9.48)

Наилучшее распределение: gamma с p-value=0.1254
