Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением, равным 16.
Найти доверительный интервал для оценки математического ожидания a с надежностью 0.95, если выборочная средняя M = 80, а объем выборки n = 256.

Доверительный интервал может быть вычислен с помощью формулы:

M ± t*(s / sqrt(n))

где t - квантиль стьдента с уровнем доверия 0.95, s - среднее квадратическое отклонение генеральной совокупности (16), а sqrt(n) - корень из объема выборки (256).

t может быть вычислен с помощью таблицы квантилей стьдента или функции scipy.stats.t.ppf(). Например:

from scipy.stats import t

t_critical = t.ppf(0.95, 255)

Доверительный интервал будет:

(80 - t_critical * (16 / sqrt(256)), 80 + t_critical * (16 / sqrt(256)))

In [1]:
import numpy as np
from scipy import stats

M = 80
sigma = 16
n = 256
alpha = 0.05

conf_interval = stats.norm.interval(alpha=1-alpha, loc=M, scale=sigma/np.sqrt(n))
print(f"Доверительный интервал: [{conf_interval[0]:.2f}, {conf_interval[1]:.2f}]")


Доверительный интервал: [78.04, 81.96]


В результате 10 независимых измерений некоторой величины X, выполненных с одинаковой точностью, получены опытные данные:
6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1

Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины X при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95.

In [2]:
import numpy as np
from scipy import stats

data = np.array([6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1])
mean = np.mean(data)
std = np.std(data, ddof=1)
n = len(data)
alpha = 0.05

interval = stats.norm.interval(alpha=1-alpha, loc=mean, scale=std/np.sqrt(n))

print(f'Доверительный интервал с доверительной вероятностью 0.95: ({interval[0]:.4f}, {interval[1]:.4f})')


Доверительный интервал с доверительной вероятностью 0.95: (6.3106, 6.8694)


Рост дочерей 175, 167, 154, 174, 178, 148, 160, 167, 169, 170

Рост матерей  178, 165, 165, 173, 168, 155, 160, 164, 178, 175

Используя эти данные построить 95% доверительный интервал для разности среднего роста родителей и детей.

In [4]:
import numpy as np
import scipy.stats as st

daughters_height = np.array([175, 167, 154, 174, 178, 148, 160, 167, 169, 170])
mothers_height = np.array([178, 165, 165, 173, 168, 155, 160, 164, 178, 175])

diff_mean = mothers_height.mean() - daughters_height.mean()
diff_std = np.sqrt((mothers_height.var() + daughters_height.var()) / 2)

t_critical = st.t.ppf(0.975, df=len(mothers_height) - 1)

margin_of_error = t_critical * diff_std / np.sqrt(len(mothers_height))

confidence_interval = (diff_mean - margin_of_error, diff_mean + margin_of_error)

print("95% доверительный интервал для разности среднего роста родителей и детей:", confidence_interval)


95% доверительный интервал для разности среднего роста родителей и детей: (-4.0000684389561805, 7.800068438956192)
