<a href="https://colab.research.google.com/github/AndriiVasylenkoML/statistical-research-methods/blob/main/estimation_data_distribution_law_parameters.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [4]:
from scipy.stats import chi2_contingency, norm, expon, weibull_min
import numpy as np


In [5]:
# Дані вибірки
x = np.array([2.6, 2.5, 0.8, 2.8, 2.4, 2.1, 2.3, 3.4, 1.7, 1.7, 2.2, 1.3, 3.4, 2.3, 1.6, 1.4])

# 1. Групування даних: Створюємо інтервали (класи)
num_bins = 5  # обираємо кількість інтервалів
frequencies, bin_edges = np.histogram(x, bins=num_bins)

# Середини інтервалів для підрахунку теоретичних частот
bin_centers = (bin_edges[:-1] + bin_edges[1:]) / 2



In [6]:
# 2. Оцінка параметрів для можливих розподілів

# Нормальний розподіл
mean_x = np.mean(x)
std_x = np.std(x, ddof=1)
theoretical_norm = norm.cdf(bin_edges, loc=mean_x, scale=std_x)
theoretical_freq_norm = np.diff(theoretical_norm) * len(x)

# Експоненційний розподіл
lambda_exp = 1 / mean_x  # оцінка параметра для експоненційного розподілу
theoretical_exp = expon.cdf(bin_edges, scale=1/lambda_exp)
theoretical_freq_exp = np.diff(theoretical_exp) * len(x)

# Вейбулів розподіл (з наближеним параметром k, знайденим раніше)
weibull_k = 10.8  # використовую раніше знайдене наближене значення
weibull_lambda = mean_x  # масштабний параметр оцінений як середнє
theoretical_weibull = weibull_min.cdf(bin_edges, c=weibull_k, scale=weibull_lambda)
theoretical_freq_weibull = np.diff(theoretical_weibull) * len(x)



[![image.png](https://i.postimg.cc/ry7fZDyX/image.png)](https://postimg.cc/3WCjdJDn)

де 𝑂𝑖 — спостережувана частота, 𝐸𝑖 — очікувана частота.

In [15]:
# 3. Обчислення критерію хі-квадрат для кожного з розподілів
chi2_norm, p_norm = chi2_contingency([frequencies, theoretical_freq_norm])[:2]
chi2_exp, p_exp = chi2_contingency([frequencies, theoretical_freq_exp])[:2]
chi2_weibull, p_weibull = chi2_contingency([frequencies, theoretical_freq_weibull])[:2]

print(f"""
1. Частоти (фактичні) для кожного інтервалу:
Теоретичні частоти для можливих розподілів: {frequencies}
\n2. Теоретичні частоти для можливих розподілів:
Нормальний розподіл: {theoretical_freq_norm}
Експоненційний розподіл: {theoretical_freq_exp}
Вейбулів розподіл: {theoretical_freq_weibull}
\n3. Результати критерію хі-квадрат:
Нормальний розподіл: 𝜒2 = {chi2_norm}, 𝑝-value = {p_norm}
Експоненційний розподіл: 𝜒2 = {chi2_exp}, 𝑝-value = {p_exp}
Вейбулів розподіл: 𝜒2 = {chi2_weibull}, 𝑝-value = {p_weibull}
""")



1. Частоти (фактичні) для кожного інтервалу: 
Теоретичні частоти для можливих розподілів: [2 4 4 4 2] 

2. Теоретичні частоти для можливих розподілів:
Нормальний розподіл: [1.4893814  3.31842832 4.49215533 3.69592004 1.84773205]
Експоненційний розподіл: [2.36580778 1.85885387 1.46053189 1.1475638  0.90165965]
Вейбулів розподіл: [7.93104009e-02 2.56049617e+00 1.22311629e+01 1.12867277e+00
 2.05294981e-09]

3. Результати критерію хі-квадрат:
Нормальний розподіл: 𝜒2 = 0.14160385249024782, 𝑝-value = 0.9976087688604927
Експоненційний розподіл: 𝜒2 = 1.2654833565905952, 𝑝-value = 0.8672039744279754
Вейбулів розподіл: 𝜒2 = 9.871755175484504, 𝑝-value = 0.042644255472142914

