# Теория вероятностей и математическая статистика
## Урок 6. Сравнение долей. Построение доверительного интервала

In [1]:
import numpy as np
import scipy.stats as stats

**Задача 1**  
Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением, равным 16.
Найти доверительный интервал для оценки математического ожидания a с надежностью 0.95, если выборочная средняя M = 80, а объем выборки n = 256.

![image.png](attachment:image.png)

In [2]:
x = 80
z = 1.96
σ = 16
n = 256

# Нижняя граница интервала
L_1 = x - z * σ / np.sqrt(n)
print(f'Нижняя граница интервала = {L_1}')

# Верхняя граница интервала
U_1 = x + z * σ / np.sqrt(n)
print(f'Верхняя граница интервала = {U_1}')

Нижняя граница интервала = 78.04
Верхняя граница интервала = 81.96


--------------------------

**Ответ:**  
*Нижняя граница интервала* = 78.04  
*Верхняя граница интервала* = 81.96

--------------------------

**Задача 2**  
В результате 10 независимых измерений некоторой величины X, выполненных с одинаковой точностью, получены опытные данные:  
6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1  
Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины X при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95.

![image.png](attachment:image.png)

In [3]:
data = np.array([6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1])

In [4]:
# Среднее арифметическое 
avg = np.mean(data)

# Несмещенная дисперсия
D = np.var(data, ddof=1)

# Критерий Стьюдента
t_2 = stats.t.ppf(0.975, (len(data)-1))

In [5]:
# Нижняя граница интервала
L_2 = avg - t_2 * np.sqrt(D/len(data))
print(f'Нижняя граница интервала = {round(L_2, 2)}')

# Верхняя граница интервала
U_2 = avg + t_2 * np.sqrt(D/len(data))
print(f'Верхняя граница интервала = {round(U_2, 2)}')

Нижняя граница интервала = 6.27
Верхняя граница интервала = 6.91


------------------

**Ответ:**  
*Нижняя граница интервала* = 6.27  
*Верхняя граница интервала* = 6.91

---------------------------

**Задача 3**  
Рост дочерей 175, 167, 154, 174, 178, 148, 160, 167, 169, 170  
Рост матерей 178, 165, 165, 173, 168, 155, 160, 164, 178, 175  
Используя эти данные построить 95% доверительный интервал для разности среднего роста родителей и детей.

![image.png](attachment:image.png)

In [6]:
daughters = np.array([175, 167, 154, 174, 178, 148, 160, 167, 169, 170])
mothers = np.array([178, 165, 165, 173, 168, 155, 160, 164, 178, 175])

In [7]:
# Среднее арифметическое
avg_d = np.mean(daughters)
avg_m = np.mean(mothers)

# РАЗНОСТЬ СРЕДНИХ
delta = avg_m - avg_d

# Несмещенная дисперсия
D_d = np.var(daughters, ddof=1)
D_m = np.var(mothers, ddof=1)

# ОБЪЕДИНЕННАЯ ОЦЕНКА ДИСПЕРСИИ
D = (D_d + D_m) / 2

# СТАНДАРТНАЯ ОШИБКА РАЗНОСТИ СРЕДНЕГО
SE = np.sqrt(D/len(daughters) + D/len(mothers))

# КРИТЕРИЙ СТЬЮДЕНТА
t_3 = stats.t.ppf(0.975, (2*(len(daughters)-1)))

In [8]:
# Нижняя граница интервала
L_3 = delta - t_3 * SE
print(f'Нижняя граница интервала = {round(L_3, 2)}')

# Верхняя граница интервала
U_3 = delta + t_3 * SE
print(f'Верхняя граница интервала = {round(U_3, 2)}')

Нижняя граница интервала = -6.27
Верхняя граница интервала = 10.07


-----------------

**Ответ:**  
*Нижняя граница интервала* = -6.27  
*Верхняя граница интервала* = 10.07

-------------------------------