# Завдання 1

Нехай спостерігається вибірка $X = (X_1,\dots,X_n)$, де $X_i \sim N(0,1)$

Побудувати довірчий інтервал для:

a) математичного сподівання $a$ у припущенні, що спостерігаються в.в. $\{X_i\}$ , які мають нормальний розподіл, але дисперсія $\sigma^2$ невідома;

b) математичного сподівання $a$ у припущенні, що спостерігаються в.в. $\{X_i\}$,розподіл яких невідомий.

c) дисперсії $\sigma^2$ у припущенні, що спостерігаються в.в. $\{X_i\}$ , які мають нормальний розподіл.

In [1]:
import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt

## a) Побудувати довірчий інтервал для математичного сподівання $a$ у припущенні, що спостерігаються в.в. $\{X_i\}$ , які мають нормальний розподіл, але дисперсія $\sigma^2$ невідома.

Довірчий інтервал для математичного сподівання $a$ має вигляд:
$$
\bar{X}\pm t_{\frac{1+\gamma}{2}; n-1}\cdot \frac{S}{\sqrt n}
$$
де

$\bar{X}  =\frac{1}{n}\sum_{i=1}^n X_i$ – вибіркове середнє

$S^2  = \frac{1}{n-1}\sum_{i=1}^n X_i^2$ – вибіркова дисперсія (незміщена)

$t_{\frac{1+\gamma}{2}; n-1}$ – критичне значення розподілу Стьюдента з $n−1$ ступенями свободи, яке відповідає квантилю $\frac{1+\gamma}{2}$

In [2]:
def conf_int_a(n: int, gamma: float = 0.99) -> tuple[float, float]:
    """
    Обчислення довірчого інтервалу математичного сподівання 
    при нормальному розподілі з невідомою дисперсією.

    Параметри:
    - n: int - Розмір вибірки
    - gamma: float - Рівень довіри 

    Повертає:
    - tuple[float, float] - Нижня та верхня межі довірчого інтервалу
    """

    # Генеруємо вибірку зі стандартного нормального розподілу
    sample: np.ndarray = np.random.randn(n)
    
    mean: float = np.mean(sample)  # Вибіркове середнє
    std_dev: float = np.std(sample, ddof=1)  # Незміщене стандартне відхилення

    # Обчислюємо критичне значення t-розподілу
    t_critical: float = stats.t.ppf((1+gamma)/2, n-1)
    margin_of_error: float = t_critical * (std_dev / np.sqrt(n))

    # Визначаємо межі довірчого інтервалу
    lower_bound: float = mean - margin_of_error
    upper_bound: float = mean + margin_of_error

    return lower_bound, upper_bound


# Масив розмірів вибірок
n_values: list[int] = [100, 10000, 1000000]

# Обчислення та вивід довірчих інтервалів для кожного розміру вибірки
print("Довірчі інтервали для нормального розподілу з невідомою дисперсією:")
for n in n_values:    
    lower_bound, upper_bound = conf_int_a(n)
    print(f"n = {n}: \nІнтервал: [{lower_bound:.4f}, {upper_bound:.4f}]")
    print(f"Ширина інтервалу: {upper_bound - lower_bound:.4f}\n")

Довірчі інтервали для нормального розподілу з невідомою дисперсією:
n = 100: 
Інтервал: [-0.1261, 0.4197]
Ширина інтервалу: 0.5457

n = 10000: 
Інтервал: [-0.0213, 0.0297]
Ширина інтервалу: 0.0511

n = 1000000: 
Інтервал: [-0.0024, 0.0027]
Ширина інтервалу: 0.0052



## b) Побудувати довірчий інтервал для математичного сподівання $a$ у припущенні, що спостерігаються в.в. $\{X_i\}$,розподіл яких невідомий.

Асимптотичний $\gamma$-довірчий інтервал для $a$:
$$
\bar{X} \pm z_{\frac{1+\gamma}{2}}\frac{S}{\sqrt{n}}
$$
де

$\bar{X}  =\frac{1}{n}\sum_{i=1}^n X_i$ – вибіркове середнє

$S^2  = \frac{1}{n-1}\sum_{i=1}^n X_i^2$ – вибіркова дисперсія (незміщена)

$z_{\frac{1+\gamma}{2}}$ – критичне значення стандартного нормального розподілу, яке відповідає квантилю $\frac{1+\gamma}{2}$

In [3]:
def conf_int_unknown_dist(n: int, gamma: float = 0.99) -> tuple[float, float]:
    """
    Обчислення довірчого інтервалу математичного сподівання 
    при невідомому розподілі за допомогою центральної граничної теореми.

    Параметри:
    - n: int - Розмір вибірки
    - gamma: float - Рівень довіри

    Повертає:
    - tuple[float, float] - Нижня та верхня межі довірчого інтервалу
    """
    # Генеруємо вибірку
    sample: np.ndarray = np.random.randn(n)
    mean: float = np.mean(sample)  # Вибіркове середнє
    std_dev: float = np.std(sample, ddof=1)  # Незміщене стандартне відхилення
    
    # Обчислюємо критичне значення нормального розподілу
    z_critical: float = stats.norm.ppf((1+gamma)/2)
    margin_of_error: float = z_critical * (std_dev / np.sqrt(n))
    
    # Визначаємо межі довірчого інтервалу
    lower_bound: float = mean - margin_of_error
    upper_bound: float = mean + margin_of_error
    
    return lower_bound, upper_bound


print("Довірчі інтервали для невідомого розподілу:")
for n in n_values:    
    lower_bound, upper_bound = conf_int_unknown_dist(n)
    print(f"n = {n}: \nІнтервал: [{lower_bound:.4f}, {upper_bound:.4f}]")
    print(f"Ширина інтервалу: {upper_bound - lower_bound:.4f}\n")

Довірчі інтервали для невідомого розподілу:
n = 100: 
Інтервал: [-0.1758, 0.3176]
Ширина інтервалу: 0.4934

n = 10000: 
Інтервал: [-0.0186, 0.0328]
Ширина інтервалу: 0.0514

n = 1000000: 
Інтервал: [-0.0024, 0.0027]
Ширина інтервалу: 0.0052



## c) Побудувати довірчий інтервал для дисперсії $\sigma^2$ у припущенні, що спостерігаються в.в. $\{X_i\}$ , які мають нормальний розподіл.

$\gamma$-довірчий інтервал для дисперсії $\sigma^2$ нормальної моделі:

$$
\left(\frac{(n-1)S^2}{\chi^2_{\frac{1+\gamma}{2};n-1}},\frac{(n-1)S^2}{\chi^2_{\frac{1-\gamma}{2};n-1}}\right)
$$
де

$S^2  = \frac{1}{n-1}\sum_{i=1}^n X_i^2$ – вибіркова дисперсія (незміщена)

$\chi^2_{\frac{1-\gamma}{2};n-1}$ – квантиль рівня $\frac{1-\gamma}{2}$ розподілу $\chi^2$ з $n-1$ ступенями свободи

$\chi^2_{\frac{1+\gamma}{2};n-1}$ – квантиль рівня $\frac{1+\gamma}{2}$ розподілу $\chi^2$ з $n-1$ ступенями свободи

In [4]:
def conf_int_c(n: int, gamma: float = 0.99) -> tuple[float, float]:
    """
    Обчислення довірчого інтервалу дисперсії 
    при нормальному розподілі за допомогою хи-квадрат розподілу.

    Параметри:
    - n: int - Розмір вибірки
    - gamma: float - Рівень довіри (за замовчуванням 0.99)

    Повертає:
    - tuple[float, float] - Нижня та верхня межі довірчого інтервалу
    """
    # Генеруємо вибірку зі стандартного нормального розподілу
    sample: np.ndarray = np.random.randn(n)
    var_dev: float = np.var(sample, ddof=1)  # Незміщена вибіркова дисперсія 
    
    # Обчислюємо критичні значення хі-квадрат розподілу
    chi_critical_lower: float = stats.chi2.ppf((1-gamma)/2, n-1)
    chi_critical_upper: float = stats.chi2.ppf((1+gamma)/2, n-1)
    
    # Визначаємо межі довірчого інтервалу для дисперсії
    lower_bound: float = (n * var_dev) / chi_critical_upper
    upper_bound: float = (n * var_dev) / chi_critical_lower
    
    return lower_bound, upper_bound

# Обчислення та вивід довірчих інтервалів для кожного розміру вибірки
print("Довірчі інтервали для дисперсії при нормальному розподілі:")
for n in n_values:    
    lower_bound, upper_bound = conf_int_c(n)
    print(f"n = {n}: \nІнтервал: [{lower_bound:.4f}, {upper_bound:.4f}]")
    print(f"Ширина інтервалу: {upper_bound - lower_bound:.4f}\n")

Довірчі інтервали для дисперсії при нормальному розподілі:
n = 100: 
Інтервал: [0.7391, 1.5446]
Ширина інтервалу: 0.8055

n = 10000: 
Інтервал: [0.9821, 1.0563]
Ширина інтервалу: 0.0742

n = 1000000: 
Інтервал: [0.9954, 1.0026]
Ширина інтервалу: 0.0073

