В цьому ДЗ потренуємось виконувати Z-тести для тестування гіпотез в різних задачах. Для коректної імплементації та інтерпретації тестів рекоемндую переглянути спершу документацію:

https://www.statsmodels.org/dev/generated/statsmodels.stats.weightstats.ztest.html

### Завдання 1: Z-тест для однієї вибірки

**Мета**: Перевірити, чи середнє значення вибірки відрізняється від гіпотетичного середнього.

**Припущення**: Середній ріст студентів університету вважається 170 см. Ми хочемо перевірити, чи середній ріст випадкової вибірки студентів істотно більший. Вибірка задана в змінній `heights`.

Для виконання завдання імпортуйте метод для проведення `ztest`, виконайте Z-тест з Python, виведіть p-value і зробіть заключення, чи справдилось припущення про середній зріст студентів на рівні значущості 0.05?

Використовуємо тут Z-тест, оскільки вибірка достатньо велика (більше 30 екземплярів) і можемо вважати, що її стандартне відхилення близьке до ст. відхилення генеральної сукупності, а значить - відоме.

In [1]:
!pip install statsmodels --quiet

In [2]:
import numpy as np
from statsmodels.stats.weightstats import ztest
from scipy.stats import ttest_ind

In [3]:
heights = [174, 171, 175, 179, 170, 170, 179, 175, 169, 174, 169, 169, 173, 162, 163, 169, 166, 173, 167, 164, 179, 170, 172, 164, 169, 175, 169, 174, 169, 169, 173, 162, 177]

In [4]:
alpha = 0.05
null_mean = 170

In [5]:
def get_mean_and_deviation(data):
    mean = np.mean(data)
    std = np.std(data, ddof=0)

    print("Sample mean:", mean)
    print("Sample standard deviation (assuming population):", std)
get_mean_and_deviation(heights)

Sample mean: 170.6969696969697
Sample standard deviation (assuming population): 4.648133209409457


In [6]:
ztest_score, p_value = ztest(heights, value=null_mean, alternative='two-sided')

print("Z-test statistic:", ztest_score)
print("P-value:", p_value)

if p_value < alpha:
    print(f"Reject H0: The mean student height equals {null_mean} cm. Significant difference detected.")
else:
    print(f"Fail to reject H0: No significant evidence that the mean student height differs from {null_mean} cm.")

Z-test statistic: 0.8482235371587619
P-value: 0.3963134914218349
Fail to reject H0: No significant evidence that the mean student height differs from 170 cm.


### Summary

In this task, a two-sided Z-test was used to check whether the average student height differs from 170 cm (in either direction). Based on the obtained p-value, no statistically significant difference from 170 cm was detected. Therefore, there is not enough evidence to conclude that the true mean height is different from 170 cm.


### Завдання 2: Z-тест для двох незалежних вибірок

**Завдання 2.1.**

**Мета**: Перевірити, чи існує статистична різниця між середніми оцінками двох груп студентів.

**Припущення**: Група A отримала новий навчальний курс, а група B продовжувала зі стандартним курсом. Ми перевіряємо, чи є новий курс ефективнішим.

Виконайте Z-тест з Python, виведіть p-value і зробіть заключення, чи справдилось припущення щодо студентів на рівні значущості 0.05?

In [7]:
group_a_scores = [78.55, 72.25, 79.88, 75.  , 76.54, 74.99, 87.26, 77.93, 72.71,
       82.11, 71.9 , 79.04, 68.2 , 71.36, 78.98, 81.69, 78.86, 77.42,
       76.49, 70.61, 74.4 , 75.7 , 83.29, 79.72, 69.18, 79.62, 76.07,
       74.62, 81.06, 83.15, 82.66, 73.8 , 76.45, 79.66, 82.88, 75.6 ,
       77.07, 72.47, 72.02, 82.06]

group_b_scores = [81.78, 74.64, 80.02, 76.81, 71.77, 76.81, 82.69, 74.82, 82.82,
       61.9 , 79.11, 75.44, 73.5 , 75.46, 65.06, 73.9 , 76.79, 82.39,
       72.41, 70.96, 72.49, 79.58, 76.64, 72.35, 77.57, 75.49, 79.84,
       71.49, 73.36, 73.04, 67.68, 76.48, 76.31, 75.03, 73.83, 67.92,
       72.9 , 73.29, 70.99, 74.19]

In [8]:
get_mean_and_deviation(group_a_scores)

Sample mean: 77.08125
Sample standard deviation (assuming population): 4.3108706704678585


In [9]:
get_mean_and_deviation(group_b_scores)

Sample mean: 74.73875000000001
Sample standard deviation (assuming population): 4.463902545699223


In [10]:
ztest_score, p_value = ztest(group_a_scores, group_b_scores, alternative='two-sided')

print("Z-test statistic:", ztest_score)
print("P-value:", p_value)

if p_value < alpha:
    print("Reject H0: The mean scores between Group A and Group B are significantly different.")
else:
    print("Fail to reject H0: No significant difference between the mean scores of Group A and Group B.")

Z-test statistic: 2.357354864751502
P-value: 0.01840564855252801
Reject H0: The mean scores between Group A and Group B are significantly different.


### Summary

In this task, a two-sided Z-test was used to check whether the mean scores of Group A and Group B differ. Based on the obtained p-value, no significant difference between the groups was detected. The calculated sample means showed that Group A had a slightly higher average score compared to Group B, but this difference was not strong enough to be considered statistically significant with the current data.


**Завдання 2.2.**


**Мета**: Побачити, як впливає розмір вибірок на результат тесту.

**Завдання**: Уявіть, що з групи А ми маємо тільки перші 5 записів, а з групи В - усі. Таке могло статись, якщо ми вже маємо результати тестів учнів за попередньою програмою, а тести за новою програмою здали наразі лише 5 учнів і ми вирішили не чекати довше.
Виберіть перші 5 записів для групи А і проведіть t-test (для цього використовуємо наступний [метод](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html)). Виведіть значення p-value. Зробіть висновок, який результат ви бачите щодо стат. значущості на рівні 0.05 для цього експерименту?

Тут проводимо t-test оскільки одна з вибірок - дуже мала.

In [11]:
group_a_scores_cropped = group_a_scores[:5]
print(group_a_scores_cropped)

[78.55, 72.25, 79.88, 75.0, 76.54]


In [12]:
t_test_score, p_value = ttest_ind(group_a_scores_cropped, group_b_scores, alternative='two-sided')

print("T-test statistic:", t_test_score)
print("P-value:", p_value)

if p_value < alpha:
    print("Reject H0: The mean scores between Group A (5 samples) and Group B are significantly different.")
else:
    print("Fail to reject H0: No significant difference between the mean scores of Group A (5 samples) and Group B.")

T-test statistic: 0.8167951030410814
P-value: 0.4185479477535733
Fail to reject H0: No significant difference between the mean scores of Group A (5 samples) and Group B.


### Summary

In this task, a two-sided t-test was used to check whether the mean scores of Group A (only 5 observations) and Group B differ. Based on the obtained p-value, no statistically significant difference between the groups was detected. The smaller sample size for Group A increases the uncertainty in estimating its mean, which makes it harder to detect potential differences with the available data.



### Завдання 3\*: Z-тест для двох **пов'язаних** вибірок

**Мета**: Перевірити, чи вплинув тренінг на продуктивність працівників, коли всі справробітники проходили тренінг.

**Припущення**: Наші працівники проходять однаковий тренінг, і ми хочемо з'ясувати, чи покращилися їхні показники після тренінгу на рівні значущості 0.05. Виконайте Z-тест з Python, виведіть p-value і зробіть заключення, чи поліпшились показники працівників на рівні значущості 0.05?

Зверніть увагу, ці вибірки повʼязані між собою, значить не буде коректно виконати z-test між ними, натомість, ми можемо порівняти, чи різниця в результатах (продуктивності співробітників) є стат значущою.

In [13]:
before_training = [57.82, 37.63, 36.8 , 55.22, 52.97, 52.5 , 53.46, 43.2 , 52.32,
       52.93, 42.86, 68.66, 54.74, 38.09, 56.57, 40.25, 57.87, 61.59,
       41.79, 59.63, 54.13, 58.22, 68.97, 47.55, 42.46, 41.1 , 41.84,
       49.23, 53.41, 52.77]

after_training = [62.47, 40.66, 42.7 , 57.69, 61.41, 56.76, 54.75, 44.06, 56.29,
       55.48, 47.28, 72.6 , 57.59, 39.39, 56.54, 42.36, 62.58, 65.01,
       42.3 , 62.98, 57.9 , 59.45, 72.28, 50.66, 43.18, 44.82, 45.96,
       54.4 , 58.52, 53.01]

In [14]:
diffs = np.array(after_training) - np.array(before_training)
print(diffs)

[ 4.65  3.03  5.9   2.47  8.44  4.26  1.29  0.86  3.97  2.55  4.42  3.94
  2.85  1.3  -0.03  2.11  4.71  3.42  0.51  3.35  3.77  1.23  3.31  3.11
  0.72  3.72  4.12  5.17  5.11  0.24]


In [15]:
get_mean_and_deviation(diffs)

Sample mean: 3.1499999999999995
Sample standard deviation (assuming population): 1.8561609125647853


In [16]:
ztest_score, p_value = ztest(diffs, value=0, alternative='larger')

print("Z-test statistic:", ztest_score)
print("P-value:", p_value)

if p_value < alpha:
    print("Reject H0: The training significantly increased employee productivity.")
else:
    print("Fail to reject H0: No significant increase in employee productivity was detected.")

Z-test statistic: 9.13890009623916
P-value: 3.1545359919175505e-20
Reject H0: The training significantly increased employee productivity.


### Summary

In this task, a one-sided Z-test for paired samples was used to check whether the training led to an increase in employee productivity. Based on the obtained p-value, a statistically significant improvement was detected. This suggests that the training had a positive effect on productivity.
