In [71]:
import matplotlib.pyplot as plt
import numpy as np
from scipy.stats import expon, chi2

In [74]:
entries_num = 10000
lambda_vals = [0.1, 0.5, 1, 1.5, 2]
bins_num = 50
alpha = 0.01

In [97]:
def get_chi_squared_stat(observed_data, expected_frequencies):
    observed_frequencies = np.histogram(observed_data, bins=bins_num, density=True)[0]
    # x_theor = np.linspace(0, x_max, 50)
    # expected_frequencies = expon.pdf(x_theor, scale=1/lam)
    chi_squared_stat = np.sum((observed_frequencies - expected_frequencies) ** 2 / expected_frequencies)
    critical_val = chi2.ppf(1-alpha, bins_num-1)
    return chi_squared_stat, critical_val

Експоненційний розподіл

In [63]:
def get_random_exp_nums(lam):
    rand_nums = np.random.rand(entries_num)
    return (-1 / lam) * np.log(rand_nums)

In [94]:
def get_x_theor(x_max, lam):
    x_theor_range = np.linspace(0, x_max, 50)
    theor_pdf = np.e ** (-lam * x_theor_range) * lam
    return x_theor_range, theor_pdf

In [None]:
for lam in lambda_vals:
    x = get_random_exp_nums(lam)
    plt.hist(x, bins=bins_num, density=True, label="Згенеровані дані")

    x_max = np.max(x)
    x_theor_range, theor_pdf = get_x_theor(x_max, lam)
    plt.plot(x_theor_range, theor_pdf, "r-", label="Теоретичний PDF")

    mean = np.mean(x)
    variance = np.var(x)

    chi_squared_stat, critical_val = get_chi_squared_stat(x, theor_pdf)

    print(f"Середнє = {mean}")
    print(f"Дисперсія = {variance}")
    print(f"Статистика Х^2: {chi_squared_stat}")
    print(f"Критичне значення Х^2: {critical_val}")

    if critical_val < chi_squared_stat:
        print(f"Відхиляємо нульову гіпотезу")
    else:
        print(f"Не відхиляємо нульову гіпотезу")

    plt.legend()
    plt.title(f"λ = {lam}")
    plt.xlabel("Значення")
    plt.ylabel("Частота")
    plt.show()

Нормальний розподіл

In [79]:
from scipy.stats import norm

In [90]:
a_vals = [-1, 0, 1]
sigma_vals = [0.5, 1, 4]

In [88]:
def mu():
    return np.sum(np.random.rand(12)) - 6

In [None]:
for a in a_vals:
    for sigma in sigma_vals:
        x = sigma * np.array([mu() for _ in range(entries_num)]) + a
        plt.hist(x, bins=bins_num, density=True, label=f"Згенеровані дані")

        mean = np.mean(x)
        variance = np.var(x)

        x_range = np.linspace(min(x), max(x), 50)
        theor_pdf = norm.pdf(x_range, loc=mean, scale=np.sqrt(variance))
        plt.plot(x_range, theor_pdf, 'r-', label="Теоретичний PDF")

        chi_squared_stat, critical_val = get_chi_squared_stat(x, theor_pdf)

        print(f"Середнє = {mean}")
        print(f"Дисперсія = {variance}")
        print(f"Статистика Х^2: {chi_squared_stat}")
        print(f"Критичне значення Х^2: {critical_val}")

        if critical_val < chi_squared_stat:
            print(f"Відхиляємо нульову гіпотезу")
        else:
            print(f"Не відхиляємо нульову гіпотезу")

        plt.title(f"sigma = {sigma}, a = {a}")
        plt.legend()
        plt.show()

        

Рівномірний розподіл

In [None]:
a = [-1, 0, 1]
c = []