Аветісова Карина
# Тести для малих вибірок та пропорцій



**Завдання 1**. E-commerce компанія після редизайну сайту підозрює, що **середній час до покупки (time-to-purchase)** користувачів **збільшився**.
Історично середній час від першого заходу на сайт до покупки становив $\mu_0 = 123.7$ хвилин.

Команда аналітиків випадково обрала дані **7 покупців після редизайну**:
`128, 135, 121, 142, 126, 151, 123`

З допомогою наявних даних зʼясуйте, чи збільшився середній час покупки після редизайну.

Для цього виконайте наступні 6 кроків. Правильне виконання кожного з кроків оцінюється в 1 бал.

1. Запишіть нульову та альтернативну гіпотези і визначте тип тесту.
2. Обчисліть вибіркові статистики: $\bar x$, $s$, $n$.
3. Оберіть тип тесту та виконайте його (знайдіть критичне значення тесту, статистику тесту та р-значення) будь-яким пасуючим способом, щоб перевірити гіпотезу на рівні значущості $\alpha = 0.10$.
4. Прийміть рішення, чи відхиляєте ви гіпотезу $H_0$ використовуючи p-value.
5. Напишіть висновок: чи справді редизайн сайту подовжив час до покупки?
6. Чи зміниться ваше рішення при зміні рівня значущості на $\alpha = 0.05$.


In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats

In [5]:
data = np.array([128, 135, 121, 142, 126, 151, 123])
mu0 = 123.7 
alpha = 0.10

x_bar = np.mean(data)
s = np.std(data, ddof=1)
n = len(data)

SE = s / np.sqrt(n)
t_stat = (x_bar - mu0) / SE

p_value = 1 - stats.t.cdf(t_stat, df=n-1)

df = n - 1
t_crit = stats.t.ppf(1 - alpha, df=n-1)

print(f"Вибіркове середнє: {x_bar:.2f}")
print(f"Вибіркове стандартне відхилення: {s:.2f}")
print(f"t-статистика: {t_stat:.3f}")
print(f"Критичне значення (df={df}): {t_crit:.3f}")
print(f"p-value: {p_value:.4f}")

if p_value < alpha:
    print("Відхиляємо H0: середній час покупки справді зріс після редизайну.")
else:
    print("Немає підстав відхиляти H0: доказів зростання часу недостатньо.")

Вибіркове середнє: 132.29
Вибіркове стандартне відхилення: 10.98
t-статистика: 2.069
Критичне значення (df=6): 1.440
p-value: 0.0420
Відхиляємо H0: середній час покупки справді зріс після редизайну.


**Завдання 2.**

До спеціальної рекламної кампанії **23%** дорослих упізнавали логотип компанії. Після завершення кампанії відділ маркетингу провів опитування: з **1200** випадково відібраних дорослих **311** упізнали логотип.

Перевірте на рівні значущості **3%** ($\alpha=0.03$), чи дають ці дані достатні підстави стверджувати, що **тепер більше ніж 23%** дорослих упізнають логотип компанії. Для розвʼязку використовуйте бібліотеку `statsmodels`.

Зробіть висновок, чи зросла впізнаваність логотипу.

Додатково, обчисліть довірчий інтревал на заданому рівні значущості і проінтерпретуйте текстом - як він додатково пояснює прийняте нами рішення?

In [9]:
import statsmodels.api as sm

p0 = 0.23
n = 1200
x = 311
alpha = 0.03

phat = x / n

z_stat, p_value = sm.stats.proportions_ztest(count=x, nobs=n, value=p0, alternative='larger')

confint_low, confint_high = sm.stats.proportion_confint(count=x, nobs=n, alpha=alpha, method='normal')

print(f"Вибіркова пропорція: {phat:.4f}")
print(f"Z-статистика: {z_stat:.3f}")
print(f"p-value: {p_value:.4f}")
print(f"{int((1-alpha)*100)}% довірчий інтервал: [{confint_low:.4f}, {confint_high:.4f}]")

if p_value < alpha:
    print("Відхиляємо H0: впізнаваність логотипу зросла після кампанії.")
else:
    print("Немає підстав відхиляти H0: доказів зростання впізнаваності недостатньо.")

Вибіркова пропорція: 0.2592
Z-статистика: 2.306
p-value: 0.0106
97% довірчий інтервал: [0.2317, 0.2866]
Відхиляємо H0: впізнаваність логотипу зросла після кампанії.
