In [5]:
from scipy.stats import norm
from scipy.stats import t

Была опрошена случайная выборка из 36 жителей региона об их затратах на продукты питания за последний месяц. 
Выборочное среднее оказалось равным 16 100 рублей.
Допустим, откуда-то известно, что истинное стандартное отклонение расходов равно 12 000 рублей.
Нам нужно построить доверительный интервал для истинных средних расходов жителя данного региона на продукты питания в месяц. 
Интервал должен определять истинное значение с надежностью в 95 %.

In [2]:
n = 36 # размер выборки
x_mean = 16100 # выборочное среднее
sigma = 12000 # истинное стандартное отклонение
gamma = 0.95 # уровень надёжности
alpha = 1 - gamma # уровень значимости

In [3]:
z_crit = -norm.ppf(alpha/2) # z критическое
eps = z_crit * sigma/(n ** 0.5) #погрешность
lower_bound = x_mean - eps # левая (нижняя) граница
upper_bound = x_mean + eps # правая (верхняя) граница
confidence_interval = (round(lower_bound), round(upper_bound)) # создаём кортеж из округлённых границ интервала
print('Доверительный интервал: {}'.format(confidence_interval)) # выводим результат

Доверительный интервал: (12180, 20020)


Аккумуляторный завод производит батарейки, срок службы которых имеет истинное стандартное отклонение в 2.4 месяца. 
Средний срок службы батареек в случайной выборке из 64 штук составил 12.35 месяца. 
Необходимо построить 90 %-ный доверительный интервал для истинного среднего срока службы производимой батарейки.

In [4]:
n = 64 # размер выборки
x_mean = 12.35 # выборочное среднее
sigma = 2.4 # истинное стандартное отклонение
gamma = 0.90 # уровень надёжности
alpha = 1 - gamma # уровень значимости

In [8]:
z_crit = -norm.ppf(alpha/2) # z критическое
eps = z_crit.round(2) * sigma/(n ** 0.5) #погрешность
lower_bound = x_mean - eps # левая (нижняя) граница
upper_bound = x_mean + eps # правая (верхняя) граница
confidence_interval = (round(lower_bound, 2), round(upper_bound, 2)) # создаём кортеж из округлённых границ интервала
print('Доверительный интервал: {}'.format(confidence_interval)) # выводим результат

Доверительный интервал: (11.86, 12.84)


Управляющий супермаркета хочет оценить, сколько денег покупатели тратят за один поход в супермаркет в среднем. 
На основании ранее собранных данных известно, что расходы одного покупателя распределены приблизительно нормально. 
Управляющий взял случайную выборку из 15 покупателей и выяснил, что их средние расходы равны 2 000 рублей, 
а выборочное стандартное отклонение равно 400 рублей.

In [10]:
n = 15 # размер выборки
k = n - 1 # число степеней свободы
x_mean = 2000 # выборочное среднее
x_std = 400 # выборочное стандартное отклонение
gamma = 0.95 # уровень надёжности
alpha = 1 - gamma # уровень значимости

In [11]:
t_crit = -t.ppf(alpha/2, k) # t-критическое
eps = t_crit * x_std/(n ** 0.5) # погрешность
lower_bound = x_mean - eps # левая (нижняя) граница
upper_bound = x_mean + eps # правая (верхняя) граница
confidence_interval = (round(lower_bound), round(upper_bound)) # создаём кортеж из округлённых границ интервала
print('Доверительный интервал: {}'.format(confidence_interval)) # выводим результат

Доверительный интервал: (1778, 2222)


Чиновника интересует сумма подоходного налога, выплачиваемого домохозяйствами за год. 
На случайной выборке из 25 домохозяйств был посчитан средний размер выплаченного налога, и он составил $ 3 540. 
Также известно выборочное отклонение величины подоходного налога, равное $ 1 150.

In [12]:
n = 25 # размер выборки
k = n - 1 # число степеней свободы
x_mean = 3540 # выборочное среднее
x_std = 1150 # выборочное стандартное отклонение
gamma = 0.90 # уровень надёжности
alpha = 1 - gamma # уровень значимости

In [13]:
t_crit = -t.ppf(alpha/2, k) # t-критическое
eps = t_crit * x_std/(n ** 0.5) # погрешность
lower_bound = x_mean - eps # левая (нижняя) граница
upper_bound = x_mean + eps # правая (верхняя) граница
confidence_interval = (round(lower_bound), round(upper_bound)) # создаём кортеж из округлённых границ интервала
print('Доверительный интервал: {}'.format(confidence_interval)) # выводим результат

Доверительный интервал: (3146, 3934)


Чтобы оценить удовлетворённость клиентов сети отелей, менеджер взял случайную выборку из 189 комментариев, 
оставленных посетителями на онлайн-платформе по бронированию, и провёл анализ их содержания. 
Выяснилось, что 132 комментария были положительными, остальные — негативными.

In [7]:
n = 189 # размер выборки
x_p = 132/189 # выборочная пропорция
gamma = 0.90

In [2]:
x_p

0.698

In [8]:
alpha = 1 - gamma # уровень значимости
alpha = 1 - gamma # уровень значимости
z_crit = -norm.ppf(alpha/2) # z критическое
eps = z_crit * (x_p * (1 - x_p) / n) ** 0.5 #погрешность
lower_bound = x_p - eps # левая (нижняя) граница
upper_bound = x_p + eps # правая (верхняя) граница
print('Доверительный интервал:', round(lower_bound * 100, 2), round(upper_bound * 100, 2)) # выводим результат

Доверительный интервал: 64.35 75.33


Проводится A/B-тестирование вариантов отображения страницы корзины на сайте интернет-магазина.
Есть два варианта отображения страницы: с товарными рекомендациями «Хиты продаж» и персональными, 
подобранными под интерес конкретно этого пользователя. 
Метрикой является конверсия действия «добавить в корзину товар из рекомендаций». Были собраны следующие данные:

Группа A (Персональные скидки)
Число добавленных в корзину товаров 45
Размер выборки 1000

Группа B (Хиты продаж)
Число добавленных в корзину товаров 50
Размер выборки 1000

In [18]:
# размеры выборок групп А и B
n = 1000
# выборочная пропорция групп A и B
xp_a = 45/1000
xp_b = 50/1000
# выборочная разница конверсий групп B и A
diff = 50/1000 - 45/1000
gamma = 0.95

In [19]:
alpha = 1 - gamma # уровень значимости
z_crit = -norm.ppf(alpha/2) # z критическое
eps = z_crit * (xp_a * (1 - xp_a)/n + xp_b * (1 - xp_b)/n) ** 0.5 # погрешность
lower_bound = diff - eps # левая (нижняя) граница
upper_bound = diff + eps # правая (верхняя) граница
print('Доверительный интервал:', round(lower_bound * 100, 2), round(upper_bound * 100, 2)) # выводим результат

Доверительный интервал: -1.36 2.36
