# Тести для малих вибірок та пропорцій



**Завдання 1**. E-commerce компанія після редизайну сайту підозрює, що **середній час до покупки (time-to-purchase)** користувачів **збільшився**.
Історично середній час від першого заходу на сайт до покупки становив $\mu_0 = 123.7$ хвилин.

Команда аналітиків випадково обрала дані **7 покупців після редизайну**:
`128, 135, 121, 142, 126, 151, 123`

З допомогою наявних даних зʼясуйте, чи збільшився середній час покупки після редизайну.

Для цього виконайте наступні 6 кроків. Правильне виконання кожного з кроків оцінюється в 1 бал.

1. Запишіть нульову та альтернативну гіпотези і визначте тип тесту.
2. Обчисліть вибіркові статистики: $\bar x$, $s$, $n$.
3. Оберіть тип тесту та виконайте його (знайдіть критичне значення тесту, статистику тесту та р-значення) будь-яким пасуючим способом, щоб перевірити гіпотезу на рівні значущості $\alpha = 0.10$.
4. Прийміть рішення, чи відхиляєте ви гіпотезу $H_0$ використовуючи p-value.
5. Напишіть висновок: чи справді редизайн сайту подовжив час до покупки?
6. Чи зміниться ваше рішення при зміні рівня значущості на $\alpha = 0.05$.


In [None]:
# -----1-----
H₀: μ = 123.7 (середній час від заходу до покупки залишився таким же)
H₁: μ > 123.7 (середній час від заходу до покупки збільшився)
Тип тесту: правосторонній (one-tailed)

In [1]:
import numpy as np
from scipy import stats

av_time = np.array([128, 135, 121, 142, 126, 151, 123])
mu0 = 123.7   # середній час до покупки
alpha = 0.10

In [2]:
# -----2-----
# обчислення вибіркових статистик

x_bar = np.mean(av_time)
s = np.std(av_time, ddof=1)   # стандартне відхилення з n-1
n = len(av_time)

In [5]:
# -----3-----
# scipy тест
res = stats.ttest_1samp(av_time, popmean=mu0, alternative="greater")
t_crit = stats.t.ppf(1-alpha, res.df)
print(f" t = {res.statistic:.3f}, p-value = {res.pvalue:.5f}, t_cr = {t_crit:.3f}")

 t = 2.069, p-value = 0.04202, t_cr = 1.440


In [8]:
# -----4-----
# висновок на основі р-значення

if res.pvalue < alpha:
    print(f"Відхиляємо H0: середній час до покупки більше 123.7 на рівні значущості {alpha}")
else:
    print("Не відхиляємо H0: доказів недостатньо")

Відхиляємо H0: середній час до покупки більше 123.7 на рівні значущості 0.1


In [None]:
Чи справді редизайн сайту подовжив час до покупки?
Так, на основі отриманих результатів можна зробити висновок, що редизайн сайту справді подовжив час до покупки.

In [9]:
# -----6-----
# перевірка гіпотез при рівні значущості 0.05

a=0.05 
if res.pvalue < a:
    print(f"Відхиляємо H0: середній час до покупки більше 123.7 на рівні значущості {a}")
else:
    print("Не відхиляємо H0: доказів недостатньо")

Відхиляємо H0: середній час до покупки більше 123.7 на рівні значущості 0.05


In [None]:
При зміні рівня значущості на 0.05 рішення відхилити Н0 не змінюється.

**Завдання 2.**

До спеціальної рекламної кампанії **23%** дорослих упізнавали логотип компанії. Після завершення кампанії відділ маркетингу провів опитування: з **1200** випадково відібраних дорослих **311** упізнали логотип.

Перевірте на рівні значущості **3%** ($\alpha=0.03$), чи дають ці дані достатні підстави стверджувати, що **тепер більше ніж 23%** дорослих упізнають логотип компанії. Для розвʼязку використовуйте бібліотеку `statsmodels`.

Зробіть висновок, чи зросла впізнаваність логотипу.

Додатково, обчисліть довірчий інтревал на заданому рівні значущості і проінтерпретуйте текстом - як він додатково пояснює прийняте нами рішення?

In [11]:
import statsmodels.api as sm
from statsmodels.stats.proportion import proportions_ztest, proportion_confint

count = 311   # кількість "успіхів"
sample_s = 1200   # обсяг вибірки
p0 = 0.23      # гіпотетична пропорція (H0)

# z-тест для пропорції
stat, pval = proportions_ztest(count, sample_s, p0, alternative='larger')
confint = proportion_confint(count, sample_s, alpha=0.03, method='normal')

print("🔹 Тест для однієї пропорції")
print(f"Z-статистика = {stat:.3f}")
print(f"p-value = {pval:.4f}")
print(f"97% довірчий інтервал: {confint}")

🔹 Тест для однієї пропорції
Z-статистика = 2.306
p-value = 0.0106
97% довірчий інтервал: (0.23171700302179205, 0.28661633031154127)


In [None]:
Односторонній тест

H0:p=0.23 
H1:p>0.
Оскільки  p-value=0.0106<0.03 , відхиляємо  H0 . 👉 Є статистично значущі докази, що частка тих, 
хто впізнає логотип компанії зросла.

97% довірчий інтервал (0.2317, 0.2866)

Це означає, що з імовірністю 97% справжня частка лежить у межах від 23.17% до 28.66%, що дійсно 
більше за 23%, тобто є підстави відхилити Н0.