In [28]:
import scipy.stats as stats
import math

$X \sim N(\mu_1, \sigma_1)$
$Y \sim N(\mu_2, \sigma_2)$

$\tau = \mu_1 - \mu_2$

Хотим доверительный интервал уровня $1 - \alpha$ для $\tau$, при условии что известны $\sigma_1, \sigma_2$

Воспользуемся ЦПТ
$$\overline{X} - \mu_1 \sim N(0, \frac{\sigma_1^2}{n})$$

$$\overline{Y} - \mu_w \sim N(0, \frac{\sigma_2^2}{m})$$

Вычтем

$$\overline{X} - \overline{Y} - \tau \sim N(0, \frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m})$$

$$\frac{\overline{X} - \overline{Y} - \tau}{\sigma} \sim N(0, 1)$$

$\sigma^2 = \frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}$

Тогда возьмём квантили нормального распределения $\pm q_{1-\frac{\alpha}{2}}$

$$P(-q_{1-\frac{\alpha}{2}} \le \frac{\overline{X} - \overline{Y} - \tau}{\sigma} \le q_{1-\frac{\alpha}{2}}) = 1-\alpha$$

$$P(\overline{X} - \overline{Y} - \sigma q_{1-\frac{\alpha}{2}} \le \tau \le \overline{X} - \overline{Y} + \sigma q_{1-\frac{\alpha}{2}}) = 1 - \alpha$$

Значит мы нашли доверительный интервал



In [29]:
N = 25
M = 25
mu1 = 2.0
mu2 = 1.0
# sigmas are in squares
sigma1 = 1.0
sigma2 = 0.5

sigma = math.sqrt(sigma1 / N + sigma2 /M)
tau = mu1 - mu2
alpha = 0.05
q_r = stats.norm.ppf(1-alpha/2)
rndX = stats.norm(mu1, sigma1)
rndY = stats.norm(mu2, sigma2)

In [30]:
def gen_sample(size, rnd):
    return [rnd.rvs() for _ in range(size)]

In [31]:
def mean(xs):
    return sum(xs) / len(xs)

def calc_interval(xs, ys):
    c = mean(xs) - mean(ys)
    left = c - q_r * sigma
    right = c + q_r * sigma
    return left, right

In [32]:
def check_interval(amount):
    res = 0
    for _ in range(amount):
        l, r = calc_interval(gen_sample(N, rndX), gen_sample(M, rndY))
        if l <= tau <= r:
            res += 1
    print(f"{res}/{amount} \t\t {res/amount * 100:.2f}%")


In [33]:
check_interval(1000)

959/1000 		 95.90%


In [34]:
check_interval(10000)

9676/10000 		 96.76%
