In [1]:
import numpy as np
from scipy.stats import norm

# Заданные параметры
mu1 = 2
mu2 = 1
sigma1 = np.sqrt(1)
sigma2 = np.sqrt(0.5)
tau_true = mu1 - mu2
alpha = 0.05

n = 25
m = 25
num_samples = 1000


# Функция для генерации выборок
def generate_samples():
    X = norm.rvs(mu1, sigma1, n)
    Y = norm.rvs(mu2, sigma2, m)
    return X, Y


# Функция для вычисления статистики F
def compute_F(X, Y):
    return (np.mean(X) - np.mean(Y) - tau_true) / np.sqrt(sigma1**2 / len(X) + sigma2**2 / len(Y))

Для нахождения доверительного интервала найдём квантиль порядка $\alpha$ и посчитаем границы доверительного интервала по формуле
$$(\bar{X} - \bar{Y} - q_{1 - \frac{\alpha}{2}}\sigma ; \bar{X} - \bar{Y} - q_{\frac{\alpha}{2}}\sigma)$$
Поскольку нормальное распределение симметрично относительно $\mu$, возьмём $q_{1 - \frac{\alpha}{2}} = -q_{\frac{\alpha}{2}}$

In [2]:
# Функция для вычисления доверительного интервала
def compute_CI(X, Y):
    q_alpha = norm.ppf(1 - alpha / 2)

    # Воспользуемся симметрией распределения и получим, что
    CI = (np.mean(X) - np.mean(Y) - q_alpha * np.sqrt(sigma1**2/n + sigma2**2/m),
          np.mean(X) - np.mean(Y) + q_alpha * np.sqrt(sigma1**2/n + sigma2**2/m))
    return CI


# Генерация выборок и расчет доверительных интервалов
results_25 = np.zeros((num_samples, 2))
for i in range(num_samples):
    X, Y = generate_samples()
    results_25[i] = compute_CI(X, Y)

n = 10000
m = 10000
results_10000 = np.zeros((num_samples, 2))
for i in range(num_samples):
    X, Y = generate_samples()
    results_10000[i] = compute_CI(X, Y)

# Проверка покрытия истинного значения параметра
coverage_25 = np.mean((results_25[:, 0] <= tau_true) & (results_25[:, 1] >= tau_true))

print(f"Доверительный интервал уровня {1 - alpha} для n=m=25: ({results_25[:, 0].mean():.3f}, {results_25[:, 1].mean():.3f})")
print(f"Покрытие истинного значения параметра для n=m=25: {coverage_25:.3f}")

coverage_10000 = np.mean((results_10000[:, 0] <= tau_true) & (results_10000[:, 1] >= tau_true))

print(f"Доверительный интервал уровня {1 - alpha} для n=m=10000: ({results_10000[:, 0].mean():.3f}, {results_10000[:, 1].mean():.3f})")
print(f"Покрытие истинного значения параметра для n=m=10000: {coverage_10000:.3f}")

Доверительный интервал уровня 0.95 для n=m=25: (0.529, 1.489)
Покрытие истинного значения параметра для n=m=25: 0.948
Доверительный интервал уровня 0.95 для n=m=10000: (0.976, 1.024)
Покрытие истинного значения параметра для n=m=10000: 0.947


In [3]:
from scipy.stats import laplace

# Исходные данные
mu = 2
alpha = 0.05
n = 25
count = 1000

def generate_sample():
    return laplace.rvs(loc=mu, scale=1, size=n)


def compute_CI(sample):
    q_alpha = norm.ppf(1 - alpha/2)

    CI = (np.mean(sample) - q_alpha * np.sqrt(np.var(sample)/n),
          np.mean(sample) + q_alpha * np.sqrt(np.var(sample)/n))
    return CI


# Генерация выборок и расчет доверительных интервалов
results_25 = np.zeros((count, 2))
for i in range(count):
    sample = generate_sample()
    results_25[i] = compute_CI(sample)


n = 10000
results_10000 = np.zeros((count, 2))
for i in range(count):
    sample = generate_sample()
    results_10000[i] = compute_CI(sample)

# Проверка покрытия истинного значения параметра
coverage_25 = np.mean((results_25[:, 0] <= mu) & (results_25[:, 1] >= mu))

print(f"Доверительный интервал уровня {1 - alpha} для n=25: ({results_25[:, 0].mean():.3f}, {results_25[:, 1].mean():.3f})")
print(f"Покрытие истинного значения параметра для n=25: {coverage_25:.3f}")

coverage_10000 = np.mean((results_10000[:, 0] <= mu) & (results_10000[:, 1] >= mu   ))

print(f"Доверительный интервал уровня {1 - alpha} для n=10000: ({results_10000[:, 0].mean():.3f}, {results_10000[:, 1].mean():.3f})")
print(f"Покрытие истинного значения параметра для n=10000: {coverage_10000:.3f}")

Доверительный интервал уровня 0.95 для n=25: (1.466, 2.546)
Покрытие истинного значения параметра для n=25: 0.934
Доверительный интервал уровня 0.95 для n=10000: (1.971, 2.027)
Покрытие истинного значения параметра для n=10000: 0.943
