# Урок 6. Сравнение долей. Построение доверительного интервала

## 1. Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением, равным 16. Найти доверительный интервал для оценки математического ожидания a с надежностью 0.95, если выборочная средняя M = 80, а объем выборки n = 256.

Для нахождения доверительного интервала для математического ожидания $ a $ с надежностью 0.95, когда известно стандартное отклонение генеральной совокупности ($ \sigma $), выборочная средняя ($ M $) и объем выборки ($ n $), мы можем использовать формулу доверительного интервала для нормально распределенной совокупности:

$$
M \pm z \frac{\sigma}{\sqrt{n}}
$$

где $ z $ - значение z-оценки, соответствующее желаемому уровню доверия. Для уровня доверия 0.95, $ z $ обычно равно 1.96.

Подставим данные значения в формулу:

- $\sigma = 16 $
- $ M = 80 $
- $ n = 256 $
- $ z = 1.96 $

$$
Доверительный\ интервал = 80 \pm 1.96 \frac{16}{\sqrt{256}}
$$

Рассчитаем доверительный интервал:

$$
Доверительный\ интервал = 80 \pm 1.96 \frac{16}{16}
$$

$$
Доверительный\ интервал = 80 \pm 1.96
$$

Таким образом, доверительный интервал составляет:

$$
[80 - 1.96, 80 + 1.96] = [78.04, 81.96]
$$

**Доверительный интервал** для оценки математического ожидания $ a $ с надежностью 0.95 равен **[78.04, 81.96]**.

In [1]:
import numpy as np

# Заданные значения
sigma = 16  # Стандартное отклонение генеральной совокупности
M = 80      # Выборочная средняя
n = 256     # Объем выборки
z = 1.96    # Z-значение для уровня доверия 0.95

# Расчет доверительного интервала
margin_of_error = z * (sigma / np.sqrt(n))
confidence_interval = (M - margin_of_error, M + margin_of_error)

print(f"Доверительный интервал: {confidence_interval}")

Доверительный интервал: (78.04, 81.96)


## 2. В результате 10 независимых измерений некоторой величины X, выполненных с одинаковой точностью, получены опытные данные: 6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1 Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины X при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95.

In [6]:
pip install scipy

Collecting scipyNote: you may need to restart the kernel to use updated packages.

  Downloading scipy-1.14.0-cp312-cp312-win_amd64.whl.metadata (60 kB)
     ---------------------------------------- 0.0/60.8 kB ? eta -:--:--
     ------------ ------------------------- 20.5/60.8 kB 330.3 kB/s eta 0:00:01
     ------------------- ------------------ 30.7/60.8 kB 330.3 kB/s eta 0:00:01
     -------------------------------------- 60.8/60.8 kB 463.5 kB/s eta 0:00:00
Downloading scipy-1.14.0-cp312-cp312-win_amd64.whl (44.5 MB)
   ---------------------------------------- 0.0/44.5 MB ? eta -:--:--
   ---------------------------------------- 0.0/44.5 MB 1.9 MB/s eta 0:00:24
   ---------------------------------------- 0.1/44.5 MB 975.2 kB/s eta 0:00:46
   ---------------------------------------- 0.2/44.5 MB 1.1 MB/s eta 0:00:39
   ---------------------------------------- 0.2/44.5 MB 1.0 MB/s eta 0:00:43
   ---------------------------------------- 0.3/44.5 MB 1.3 MB/s eta 0:00:35
   --------------


[notice] A new release of pip is available: 24.0 -> 24.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


Для оценки истинного значения величины $ X $ с помощью доверительного интервала, мы сначала рассчитаем выборочное среднее ($ \bar{X} $) и стандартное отклонение ($ s $) на основе предоставленных данных. Затем используем t-распределение Стьюдента, так как размер выборки меньше 30.

 Для данных измерений величины $ X $:

Данные: $ X = [6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1] $

Рассчитаем выборочное среднее ($ \bar{X} $) и стандартное отклонение ($ s $):

In [7]:
import numpy as np
from scipy.stats import t

# Данные измерений
X = np.array([6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1])

# Выборочное среднее
X_mean = np.mean(X)

# Несмещенное стандартное отклонение
X_std = np.std(X, ddof=1)

# Объем выборки
n = len(X)

# Критическое значение t для 95% доверительного интервала
t_critical = t.ppf(0.975, df=n-1)

# Расчет доверительного интервала
margin_of_error = t_critical * (X_std / np.sqrt(n))
confidence_interval_X = (X_mean - margin_of_error, X_mean + margin_of_error)

print(f"Доверительный интервал для величины X: {confidence_interval_X}")


Доверительный интервал для величины X: (6.267515851399589, 6.912484148600412)


## 3.Рост дочерей 175, 167, 154, 174, 178, 148, 160, 167, 169, 170 Рост матерей  178, 165, 165, 173, 168, 155, 160, 164, 178, 175 Используя эти данные построить 95% доверительный интервал для разности среднего роста родителей и детей.

Для разности среднего роста дочерей и матерей:

Данные роста дочерей: $ D = [175, 167, 154, 174, 178, 148, 160, 167, 169, 170] $

Данные роста матерей: $ M = [178, 165, 165, 173, 168, 155, 160, 164, 178, 175] $

Рассчитаем выборочные средние ($ \bar{D} $ и $ \bar{M} $), стандартные отклонения ($ s_D $ и $ s_M $), и затем доверительный интервал для разности средних:

In [8]:
# Данные роста дочерей и матерей
D = np.array([175, 167, 154, 174, 178, 148, 160, 167, 169, 170])
M = np.array([178, 165, 165, 173, 168, 155, 160, 164, 178, 175])

# Выборочные средние
D_mean = np.mean(D)
M_mean = np.mean(M)

# Несмещенные стандартные отклонения
D_std = np.std(D, ddof=1)
M_std = np.std(M, ddof=1)

# Разность средних
mean_difference = D_mean - M_mean

# Стандартная ошибка разности средних
SE_difference = np.sqrt((D_std**2)/len(D) + (M_std**2)/len(M))

# Критическое значение t для 95% доверительного интервала
t_critical = t.ppf(0.975, df=min(len(D), len(M))-1)

# Расчет доверительного интервала для разности средних
margin_of_error_diff = t_critical * SE_difference
confidence_interval_diff = (mean_difference - margin_of_error_diff, mean_difference + margin_of_error_diff)

print(f"95% доверительный интервал для разности среднего роста: {confidence_interval_diff}")


95% доверительный интервал для разности среднего роста: (-10.69530273471117, 6.895302734711159)
