**Імпорт бібліотек**

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import scipy.stats as sp

**Рівень значущості для статистичних критеріїв**

In [2]:
ALPHA = 0.05

**Перевірка нормальності розподілу за критерієм Пірсона** 

*Розраховує теоретичні ймовірності, порівнює їх із емпіричними частотами та обчислює χ2*

*Повертає таблиці і результат перевірки гіпотези*

In [3]:
def normality_check_pearson(data):
    borders = data["borders"]
    frequencies = data["frequencies"]
    dist_len = sum(frequencies)
    mean = calc_mean(data)
    std_dev = calc_std_dev(data)
    prob_table = []
    chi2_table = []
    total_theor_prob = 0
    total_chi2 = 0

    for idx in range(len(frequencies)):
        left = float("-inf") if idx == 0 else borders[idx]
        right = float("inf") if idx == len(frequencies) - 1 else borders[idx + 1]

        z_l = (left - mean) / std_dev
        z_r = (right - mean) / std_dev
        phi_l = laplace(z_l)
        phi_r = laplace(z_r)
        prob = phi_r - phi_l
        prob_table.append([left, right, z_l, z_r, phi_l, phi_r, prob])
        total_theor_prob += prob

    prob_table.append(["", "", "", "", "", "", total_theor_prob])

    for idx, freq in enumerate(frequencies):
        theor_freq = dist_len * prob_table[idx][6]
        diff = freq - theor_freq
        chi2_contrib = (diff ** 2) / theor_freq
        total_chi2 += chi2_contrib

        chi2_table.append([freq, theor_freq, diff, diff ** 2, chi2_contrib])

    chi2_table.append([dist_len, "", "", "", total_chi2])
    crit = chi2_crit(ALPHA, len(frequencies) - 1 - 2)

    return {
    "prob_table": prob_table,
    "chi2_table": chi2_table,
    "chi2_emp": total_chi2,
    "chi2_crit": crit,
    "is_normal": total_chi2 < crit
    }

**Перевірка нормальності розподілу за критерієм Колмогорова**

*Розраховує емпіричну та теоретичну функції розподілу, порівнює їх відхилення*

*Повертає таблицю і значення λ, D та критичні значення*

In [4]:
def normality_check_kolmogorov(data):
    borders = data["borders"]
    freqs = data["frequencies"]
    total = sum(freqs)
    mean = calc_mean(data)
    std = calc_std_dev(data)

    extended = {
        "borders": [float("-inf")] + borders + [float("inf")],
        "frequencies": [0] + freqs + [0]
    }

    borders = extended["borders"]
    freqs = extended["frequencies"]
    count_table = []
    accum_freq = 0
    max_diff = 0

    for i in range(1, len(freqs) - 1):
        accum_freq += freqs[i] / total
        z = (borders[i + 1] - mean) / std
        theor = sp.norm.cdf(z)
        diff = abs(theor - accum_freq)
        max_diff = max(max_diff, diff)

        count_table.append([
            borders[i], borders[i + 1], freqs[i], accum_freq,
            z, theor, diff
        ])

    lam_emp = max_diff * (total ** 0.5)
    return {
    "kolm_table": count_table,
    "max_diff": max_diff,
    "lambda_emp": lam_emp,
    "lambda_crit": lambda_crit(ALPHA),
    "kolmog_crit": kolmogorov_crit(ALPHA, total),
    "beta_crit": prob_from_lambda(lam_emp)
    }