## Задание 1(3)

По условию $X = (X_1, ..., X_n) \sim N(\mu_1, \sigma_1^2)$, $Y = (Y_1, ..., Y_m) \sim N(\mu_2, \sigma_2^2)$

По теореме Фишера для выборки из нормального распределения:
$$\frac{n \cdot S_*^2}{\sigma^2} \sim \chi^2_{n-1} \text{ ,}$$
где $n$ - размер выборки, $S_*^2$ - смещенная выборочная дисперсия

Тогда
$$\frac{m(n-1)}{n(m-1)} \cdot \frac{S_{*Y}^2}{S_{*X}^2} \cdot \frac{\sigma_1^2}{\sigma_2^2} 
\sim \frac{\chi^2_{m-1} / (m-1)}{\chi^2_{n-1} / (n-1)} = F(m-1, n-1) \text{ ,}$$
где $F$ - распределение Фишера

Построим доверительный интервал уровня $1- \alpha$:
$$q_{\frac{\alpha}{2}} \leq 
\cdot \frac{m(n-1)}{n(m-1)} \cdot \frac{S_{*Y}^2}{S_{*X}^2} \cdot \frac{\sigma_1^2}{\sigma_2^2}
\leq q_{1 - \frac{\alpha}{2}}$$ 

$$q_{\frac{\alpha}{2}} \cdot \frac{n(m-1)}{m(n-1)} \cdot \frac{S_{*X}^2}{S_{*Y}^2} \leq 
\frac{\sigma_1^2}{\sigma_2^2}
\leq q_{1 - \frac{\alpha}{2}} \cdot \frac{n(m-1)}{m(n-1)} \cdot \frac{S_{*X}^2}{S_{*Y}^2} \text{ ,}$$
 
где $q_{\frac{\alpha}{2}}$, $q_{1 - \frac{\alpha}{2}}$ - квантили распределения $F(m-1, n-1)$

### Эксперимент

In [253]:
import numpy as np
from scipy import stats

mu1 = mu2 = 0
var1 = 2
var2 = 1
alpha = 0.05
t = var1 / var2

In [254]:
def test(n, m, test_count = 1000):
    left_q = stats.f.ppf(alpha / 2, m - 1, n - 1)
    right_q = stats.f.ppf(1 - alpha / 2, m - 1, n - 1)
    hit_count = 0
    for i in range(test_count):
        x = stats.norm.rvs(mu1, np.sqrt(var1), n)
        y = stats.norm.rvs(mu2, np.sqrt(var2), m)
        x_var = np.var(x)
        y_var = np.var(y)
        coef = n * (m - 1) * x_var / (m * (n - 1) * y_var)
        if left_q * coef < t < right_q * coef:
            hit_count += 1
    return hit_count

In [255]:
print("Количество попаданий в интервал:")
print("\tпри n = m = 5: ", test(5, 5))
print("\tпри n = m = 25: ", test(25, 25))
print("\tпри n = m = 10000: ", test(10000, 10000))

Количество попаданий в интервал:
	при n = m = 5:  946
	при n = m = 25:  952
	при n = m = 10000:  951


Можно заметить, что количество попаданий не зависит от размеров выборок и приблизительно равно 950, поскольку рассматриваем доверительный 95% интервал и ширина доверительного интервала зависит от размеров выборок (больше выборка $\implies$ меньше интервал, но больше точность статистики, а значит количество попаданий не меняется)