Спостерігається вибірка $\bar{X}=\left(X_1, \ldots, X_n\right)$, де $\left\{X_i\right\}$ - незалежні однаково
розподілені випадкові величини, які мають показниковий розподіл з параметром $\lambda$,
тобто 
$$
F(u ; \lambda)=\mathbf{P}\left\{X_i<u\right\}=1-\exp \{-\lambda u\}, u \geq 0
$$.
Якщо $\left\{\omega_i\right\}$ - незалежні рівномірно розподілені на відрізку $[0,1]$ в.в., то
$$
X_i=F^{-1}\left(1-\omega_i ; \lambda\right)=-\frac{1}{\lambda} \ln \omega_i .
$$
Створюємо функцію для генерації вибірки для $n=1000, n=10000$ та $n=100000$.

In [None]:
import numpy as np

def sample_exponential_sequence(n, lam):
    omega = np.random.uniform(size=n)
    x = -1 / lam * np.log(1 - omega)
    return x

## Завдання 1
За допомогою критерія Колмогорова перевірити гіпотези:
- $H_0: X_i \sim F(u ; 1)$, коли насправді $X_i \sim F(u ; 1)$;
- $H_0: X_i \sim F(u ; 1)$, коли насправді $X_i \sim F(u ; 1.3)$.

Рівень знначущості $\gamma = 0.05$

1. Знаходимо z_\gamma, таку що K(z_\gamma) = 1 - \gamma
2. Рахуємо статистику $D_n(\overline{X})$
2. Перевіряємо нерівність $\sqrt{n}D_n(\overline{X}) \leq z_\gamma$

In [None]:
from scipy.stats import kstest
from scipy.stats import expon
from scipy.special import kolmogorov
from scipy.special import kolmogi

def exponential_test(data, lam, gamma):
    n = len(data)
    # 1.
    critical_value = kolmogi(gamma)
    
    # 2.
    ks_statistic, p_value = kstest(data, lambda x: expon.cdf(x, scale=1/lam))
    
    # 3.
    if np.sqrt(n) * ks_statistic <= critical_value:
        return True, p_value
    else:
        return False, p_value

x = sample_exponential_sequence(1000, 1)
res, p_value = exponential_test(x, 1, 0.05)
print(f"""
Для n={1000}, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1)
Результат: {res}
p-value: {p_value}

""")

x = sample_exponential_sequence(10000, 1)
res, p_value = exponential_test(x, 1, 0.05)
print(f"""
Для n={10000}, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1)
Результат: {res}
p-value: {p_value}

""")

x = sample_exponential_sequence(100000, 1)
res, p_value = exponential_test(x, 1, 0.05)
print(f"""
Для n={100000}, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1)
Результат: {res}
p-value: {p_value}

""")

x = sample_exponential_sequence(1000, 1.3)
res, p_value = exponential_test(x, 1, 0.05)
print(f"""
Для n={10000}, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1.3)
Результат: {res}
p-value: {p_value}

""")

x = sample_exponential_sequence(10000, 1.3)
res, p_value = exponential_test(x, 1, 0.05)
print(f"""
Для n={10000}, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1.3)
Результат: {res}
p-value: {p_value}

""")

x = sample_exponential_sequence(100000, 1.3)
res, p_value = exponential_test(x, 1, 0.05)
print(f"""
Для n={10000}, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1.3)
Результат: {res}
p-value: {p_value}

""")


Для n=1000, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1)
Результат: True
p-value: 0.3189086160135479



Для n=10000, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1)
Результат: True
p-value: 0.31350627400131426



Для n=100000, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1)
Результат: True
p-value: 0.6181772733660007



Для n=10000, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1.3)
Результат: False
p-value: 5.403642754710831e-07



Для n=10000, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1.3)
Результат: False
p-value: 3.33732277168134e-101



Для n=10000, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1.3)
Результат: False
p-value: 0.0




## Завдання 2: 
За допомогою критерія $\chi^2$ перевірити гіпотези:
- $H_0: X_i \sim F(u ; 1)$, коли насправді $X_i \sim F(u ; 1)$;
- $H_0: X_i \sim F(u ; 1)$, коли насправді $X_i \sim F(u ; 1.3)$.

Рівень знначущості $\gamma = 0.05$


In [None]:
import numpy as np
from scipy.stats import chi2, expon


print(np.array([1, 2, 3, 4, 5]) < 3)


def generate_intervals(r, distr):
  intervals = [(0, distr.ppf(1/r))]
  for i in range(0, r-1):
    intervals.append((distr.ppf((i+1)/r) - distr.ppf(i/r), distr.ppf((i+2)/r) - distr.ppf((i+1)/r)))
  return intervals



def calculate_freqs(data, intervals):
  freqs = []
  for u0, u1 in intervals:
    freqs.append(np.sum(np.int32((data < u1).all() and (data > u0).all())))
  return np.array(freqs)  


print(generate_intervals(3, expon))

def chi_square_test(data, lam, gamma):
    # Step 1: Calculate the critical value
    r = int(30 * len(data) / 10000)
    chi2_critical = chi2.ppf(1 - gamma, r)
    
    # Step 2: Calculate the expected probabilities and frequencies
    intervals = generate_intervals(r, expon)
    expected_freqs = np.array(map(lambda u1,u0: expon.cdf(u1, scale=1/lam) - expon.cdf(u0, scale=1/lam), intervals))
    observed_freqs = calculate_freqs(data, intervals)

    # expected_probs = [expon.cdf(expon.ppf((k+1) * 1/r, scale=1/lam) - expon.ppf(k * 1/r, scale=1/lam)) for k in range(0, r)]
    #for point in divide_points:

    # expected_probs = expon.cdf(areas, scale=1/lam)
    print(expected_freqs)
    print(observed_freqs)

    # expected_freqs, _ = np.histogram(expected_probs, bins=r)
    # observed_freqs, _ = np.histogram(data, bins=r)
    
    # Step 3: Calculate the chi-square test statistic
    delta_n = np.sum((observed_freqs - expected_freqs) ** 2 / expected_freqs)
    
    # Step 4: Compare the test statistic with the critical value
    if delta_n < chi2_critical:
        return True
    else:
        return False

x = sample_exponential_sequence(1000, 1)
res = chi_square_test(x, 1, 0.05)
print(f"""
Для n={1000}, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1)
Результат: {res}

""")

# x = sample_exponential_sequence(10000, 1)
# res = chi_square_test(x, 1, 0.05)
# print(f"""
# Для n={10000}, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1)
# Результат: {res}

# """)

# x = sample_exponential_sequence(100000, 1)
# res = chi_square_test(x, 1, 0.05)
# print(f"""
# Для n={100000}, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1)
# Результат: {res}

# """)

# x = sample_exponential_sequence(1000, 1.3)
# res = chi_square_test(x, 1, 0.05)
# print(f"""
# Для n={10000}, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1.3)
# Результат: {res}

# """)

# x = sample_exponential_sequence(10000, 1.3)
# res = chi_square_test(x, 1, 0.05)
# print(f"""
# Для n={10000}, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1.3)
# Результат: {res}

# """)

# x = sample_exponential_sequence(100000, 1.3)
# res = chi_square_test(x, 1, 0.05)
# print(f"""
# Для n={10000}, гіпотеза X ~ F(u, 1), коли насправді X ~ F(u, 1.3)
# Результат: {res}

# """)

[ True  True False False False]
[(0, 0.4054651081081643), (0.4054651081081643, 0.6931471805599453), (0.6931471805599453, inf)]
<map object at 0x7fdc8a5ad8e0>
[0 0 0]


TypeError: ignored