## Задание 1
Даны две выборки  $X_1∼N(μ_1,σ_1^2),  X_2∼N(μ_2,σ_2^2) $ объемов $n_1, n_2$ соответственно, со следующими параметрами  $μ_1=0, μ_2=0, σ_1^2=2, σ_2^2=1$. Оцениваемая функция:  $τ=σ_1^2 / σ_2^2 ;  μ_1,μ_2$  известны.

$𝑋_{i,1}, … ,𝑋_{i,n_i}$ независимые нормальные случайные величины, значит случайная величина $Y_i=\sum _{j=1}^{n_i}\left({\frac {X_{i, j}-\mu _i}{\sigma _i}}\right)^{2}$ имеет распределение $\chi ^{2}(n_i)$

### Распределение Фишера
Пусть $Y_{1},Y_{2}$ — две независимые случайные величины, имеющие распределение хи-квадрат: $Y_{i}\sim \chi ^{2}(d_{i})$. Тогда распределение случайной величины
$F={\frac {Y_{1}/d_{1}}{Y_{2}/d_{2}}}$ называется распределением Фишера со степенями свободы $d_{1}, d_{2}$. $F\sim \mathrm {F} (d_{1},d_{2})$

Подставим $Y_1, Y_2$ в распределение Фишера:
$$\frac{Y_1 / n_1}{Y_2 / n_2} = \frac{n_2 \sum_{i=1}^{n_1} (X_{1,i} - \mu _1)^2}{n_1 \sum_{i=1}^{n_2} (X_{2,i} - \mu _2)^2} \cdot \frac{1}{\tau} \sim \mathrm {F} (n_{1},n_{2})$$

### Доверительный интервал  
$$P(Z_{α/2}(n_1, n_2) ≤ \frac{Y_1 / n_1}{Y_2 / n_2} = \frac{n_2 \sum_{i=1}^{n_1} (X_{1,i} - \mu _1)^2}{n_1 \sum_{i=1}^{n_2} (X_{2,i} - \mu _2)^2} \cdot \frac{1}{\tau} ≤Z_{1−α/2}(n_1, n_2))≥1−α $$

Так как $Z_{α/2}(n_1, n_2) = \frac{1}{Z_{1 - \alpha /2}(n_2, n_1)}$, получаем:

$$τ ∈ \left[Z_{α/2} (n_2, n_1) \frac{n_1 \sum_{i=1}^{n_2}{(X_{2,i} - \mu_2)^2}}{n_2 \sum_{i=1}^{n_1}{(X_{1,i} - \mu_1)^2}};  Z_{1 - α/2}(n_2, n_1) \frac{n_1 \sum_{i=1}^{n_2}{(X_{2,i} - \mu_2)^2}}{n_2 \sum_{i=1}^{n_1}{(X_{1,i} - \mu_1)^2}}\right]$$




In [None]:
import numpy as np
import scipy as sc

def func(n):
    cnt = 0
    m1 = 0
    m2 = 0
    d1 = 2
    d2 = 1
    alpha = 0.05
    z1 = sc.stats.f.ppf(alpha / 2, n, n)
    z2 = sc.stats.f.ppf(1 - alpha / 2, n, n)
    tao = d1 / d2


    for i in range(1000):
        sample_1 = np.random.normal(m1, np.sqrt(d1), n)
        sample_2 = np.random.normal(m2, np.sqrt(d2), n)
        statistic = (n * np.sum((sample_1 - m1) ** 2)) / (n * np.sum((sample_2 - m2) ** 2))
        lower_bound = statistic / z2
        upper_bound = statistic / z1
        if lower_bound < tao < upper_bound:
            cnt += 1

    print(f"Для выборки размера {n} количество параметров внутри интервала: {cnt}")
    print(f"Вероятность попадания: {cnt / 10}%")

func(25)
func(10000)

Для выборки размера 25 количество параметров внутри интервала: 948
Вероятность попадания: 94.8%
Для выборки размера 10000 количество параметров внутри интервала: 952
Вероятность попадания: 95.2%


## Задание 2
Построить асимптотический доверительный интервал уровня $1 - \alpha$ для параметра $p$ распределения $Geom(p)$, $p=0.7$

ЦПТ:
$$\sqrt{n}\frac{\overline{X_n} - \mu}{\sigma} \sim N(0, 1)$$
$$\mu = \frac{1}{p}$$

Заменим дисперсию на выборочную

Получаем:
$$\sqrt{n}\frac{\overline{X_n} - \frac{1}{p}}{S} \sim N(0, 1)$$


###Доверительный интервал
$$P\left(-Z_{α/2}(n) ≤ \sqrt{n}\frac{\overline{X_n} - \frac{1}{p}}{S} ≤Z_{α/2}(n)\right)≥1−α $$

$$p \in \left[ \frac{1}{\overline{X} + Z_{α/2}\frac{S}{\sqrt{n}}}, \frac{1}{\overline{X} - Z_{α/2}\frac{S}{\sqrt{n}}} \right]$$



In [None]:
import numpy as np
import scipy as sc

def func(n):
    cnt = 0
    p = 0.7
    alpha = 0.05
    z = sc.stats.norm.ppf(1 - alpha / 2)


    for i in range(1000):
        sample = np.random.geometric(p, size=n)
        lower_bound = 1 / (np.mean(sample) + z * np.sqrt(np.var(sample) / n))
        upper_bound = 1 / (np.mean(sample) - z * np.sqrt(np.var(sample) / n))
        # upper_bound = 1 / (np.mean(sample) - z * np.sqrt(n - 1 * np.var(sample)) / n)
        if lower_bound < p < upper_bound:
            cnt += 1

    print(f"Для выборки размера {n} количество параметров внутри интервала: {cnt}")
    print(f"Вероятность попадания: {cnt / 10}%")

func(25)
func(10000)

Для выборки размера 25 количество параметров внутри интервала: 892
Вероятность попадания: 89.2%
Для выборки размера 10000 количество параметров внутри интервала: 956
Вероятность попадания: 95.6%
