## Z-тест и стандартизация

Z-тест — это статистический тест, который используется для определения того, различаются ли средние значения двух выборок настолько существенно, чтобы это можно было считать статистически значимым. Z-тест обычно применяется, когда имеются следующие условия:

- Известны средние значения и стандартное отклонение генеральной совокупности.
- Размер выборки велик (как правило, больше 30), что позволяет использовать центральную предельную теорему для предположения о нормальном распределении средних выборочных значений.
- Данные в выборке должны быть независимыми друг от друга.

Чтобы считать z-статистику нам нужно сначала
1. Узнать что такое стандартизация
2. Узнать что такое уровень значимости


### Стандартизация

<div style="border:2px solid black; padding:10px;">
  <p> Стандартное нормальное распределение — частный случай нормального распределения, когда μ = 0, σ = 1.</p>
</div> 

Мы можем перевести наши значения в Z-пространство

$$
Z = \frac{X - \mu}{\sigma}.
$$


Z-тест приводит к z-статистике, которая представляет собой меру того, на сколько стандартных отклонений выборочное среднее отклоняется от среднего генеральной совокупности. Полученное значение z-статистики затем сравнивается с критическими значениями стандартного нормального распределения (z-распределения) для определения p-значения, которое показывает вероятность получить наблюдаемый или более экстремальный результат, если нулевая гипотеза верна.

Правило для стандартного нормального распределения: 95% наиболее вероятных значений будут располагаться в интервале от −1.96 до 1.96. Это означает, что только  5% всех возможных значений лежат за пределами этого интервала. 

Таким образом, сценарий х Z-теста такой:

1. Сформулировать $H_0$ и $H_1$.
2. Выбрать $\alpha$, найти соответствующие критические значения.
3. Вычислить выборочное среднее.
4. Вычислить z-статистику.
5. Сравнить z-статистику с критическими значениями.
6. Принять решение:
   - Если z-статистика выходит за пределы критических значений, отклонить нулевую гипотезу.
   - Если z-статистика не выходит за пределы критических значений, принимаем решение, что отклонить нулевую гипотезу нельзя.


Напишем функцию для рассчете z статистики:

In [1]:
# загрузка библиотек
import math

In [2]:
def z_count(x, m, s, n):
    se = s/math.sqrt(n)
    z = (x - m)/se
    decision = "Не отвергаем нулевую гипотезу" if ((-1.96) <z < 1.96) else "Отвергаем нулевую гипотезу"
    return z, decision

**Задача для пример работы функции:**  

Посчитали количество пятен на 100 жирафах. Среднее по выборке поучилось 258 а стандартное отклонение 50. Мы предполагаем, что среднее количество пятен на жирафах равно 250.

In [3]:
x = 258
m = 250
n = 100
s = 50

In [4]:
z_count(x, m, s, n)

(1.6, 'Не отвергаем нулевую гипотезу')

<p style="text-indent: 40px;"> Значение 1.6 лежит в интервале от -1.96 до 1.96, поэтому можно сказать, что оно недостаточно экстремальное. В таком случае у нас нет оснований усомниться в нашей нулевой гипотезе. А значит, у нас нет оснований считать, что среднее количество отличается от 250. Нулевая гипотеза верна.

<p style="text-indent: 40px;">Если бы получилось число z - статистики меньше -1.96 или больше 1.96, то это основание отвергнуть нулевую гипотезу.

**Задача**:  Есть предположения о средней массе разных существ и расчёты необходимых показателей. Выясните, есть ли основания отвергать гипотезу о средней массе животного. х = 129 (среднее по выборке), μ = 125 (среднему значению генеральной совокупности), σ = 120 (стандартное отклонение в генеральной совокупности), n=400 (размер выборки).

In [5]:
x = 129
m = 125
n = 400
s = 120 

In [6]:
z_count(x, m, s, n)

(0.6666666666666666, 'Не отвергаем нулевую гипотезу')

 z в интервале между критическими значениями −1.96<0.67<1.96, Оснований отвергнуть нулевую гипотезу нет.

### Обратная стандартизация

Если можно взять любую величину и перевести в z - пространство, значит можно сделать и обратный процесс

$$
\bar{x} = \mu + z \cdot SE.
$$


Теперь мы можем выбрать критические значения для z-статистики, например, уже известные нам −1.96 и 1.96, подставить их и найти границы для среднего значения по выборке. 

Найти значения левой и правой границы можно по формуле:

<p style="text-indent: 40px;"> Левая граница: $\mu − 1.96⋅SE$
    
<p style="text-indent: 40px;"> Правая граница: $\mu + 1.96⋅SE$

Пример обратной стандартизации

In [7]:
mean = 70  # Среднее значение исходной шкалы
std_dev = 10  # Стандартное отклонение исходной шкалы

# Стандартизированная оценка, которую нужно преобразовать
z_score = 1.5  # Пример стандартизированной оценки

# Обратная стандартизация
original_score = z_score * std_dev + mean

print(f"Исходная оценка: {original_score}")

Исходная оценка: 85.0


### Уровень значимости

<p style="text-indent: 40px;"> Уровень значимости α — это вероятность совершения <strong> ошибки первого рода </strong> , то есть отклонить нулевую гипотезу, когда она верна. 
Ложно-положительный результат. Пример: Тест полоска ошибочно обнаруживает загрязнение в чистой воде

<p style="text-indent: 40px;"> Если уровень значимости равен 0.05, это означает, что мы готовы принять риск ошибочного отклонения верной нулевой гипотезы в 
5% случаев.

**Ошибка второго рода**, β — это ситуация, когда исследователь не отвергает нулевую гипотезу, хотя на самом деле верна альтернативная. Ложно-отрицательный. Не обнаруживает загрязнение в реально загрязнённой воде

Мощность статистического теста, 
1−β — это вероятность правильно отклонить нулевую гипотезу, когда она действительно неверна.(Это вероятность обнаружить загрязнение, когда оно действительно есть.)

<div style="border:2px solid black; padding:10px;">
  <p> p-value — это вероятность того, насколько вероятно обнаружить текущие или более экстремальные значения статистики, если нулевая гипотеза верна.</p>
</div>


Таким образом, сценарий х Z-теста такой:

1. Сформулировать $H_0$ и $H_1$.
2. Выбрать $\alpha$, найти соответствующие критические значения.
3. Вычислить выборочное среднее.
4. Вычислить z-статистику.
5. Вычислить p-value;
6. Принять решение:сравниваем p-value с уровнем значимости:
 - Если p-value меньше уровня значимости, отклоняем нулевую гипотезу.
 - Если p-value больше уровня значимости, то оснований отклонять нулевую гипотезу нет.


Напишем функцию для проведения z - теста

In [8]:
import math
from scipy.stats import norm

In [9]:
def calculate_z_statistic_and_decision(sample_mean, std_dev, n, population_mean, alpha=0.05):
    """
    Расчет Z-статистики и принятие решения об отвержении нулевой гипотезы.

    :param sample_mean: Среднее значение выборки
    :param std_dev: Стандартное отклонение выборки
    :param n: Размер выборки
    :param population_mean: Предполагаемое среднее значение генеральной совокупности
    :param alpha: Уровень значимости
    :return: Значение Z-статистики и решение об отвержении нулевой гипотезы
    """
    z = (sample_mean - population_mean) / (std_dev / math.sqrt(n))
    p_value = 2 * norm.cdf(-abs(z))

    decision = "Отвергаем нулевую гипотезу" if p_value < alpha else "Не отвергаем нулевую гипотезу"
    return z, decision, p_value 

Пример использования функции

**Задача** 

Ваша компания заинтересована в изучении средней зарплаты специалистов в IT-секторе. По результатам предыдущих исследований вы предполагаете, что средняя зарплата IT-специалиста составляет 67 тыс. долларов в год. Однако, на основе последних данных, полученных из выборки в 64 наблюдения, было рассчитано, что средняя зарплата составляет 77 тыс. долларов в год при стандартном отклонении 24 тыс. долларов. Вам необходимо проверить, значимо ли отличается средняя зарплата IT-специалистов от предполагаемой средней зарплаты на рынке.

Сформулируем нулевую и альтернативную гипотезы для проверки:

- Нулевая гипотеза ($H_0$): Средняя зарплата IT-специалистов равна предполагаемому значению на рынке, то есть $H_0: \mu = 67$.
- Альтернативная гипотеза ($H_1$): Средняя зарплата IT-специалистов не равна предполагаемому значению на рынке, то есть $H_1: \mu \neq 67$.


In [10]:

sample_mean = 77     # среднее значение выборки
std_dev = 24         # стандартное отклонение выборки σ
n = 64              # размер выборки
population_mean = 67 # гипотетическое среднее значение генеральной совокупности μ

z_statistic, decision, p_value = calculate_z_statistic_and_decision(sample_mean, std_dev, n, population_mean)
print(f"Z-статистика: {z_statistic}, Решение: {decision}, p-value {p_value}")


Z-статистика: 3.3333333333333335, Решение: Отвергаем нулевую гипотезу, p-value 0.0008581206663936744


P-value меньше установленного уровня значимости в 0.05, что позволяет нам отвергнуть нулевую гипотезу. В контексте вашей задачи это означает, что есть достаточные статистические доказательства для утверждения о том, что средняя зарплата IT-специалистов на самом деле отличается от предполагаемой средней зарплаты в 67 тыс. долларов.

## Отличия в большую и меньшую сторону от среднего

**Задача:**

Компания производит светящиеся шарики для пинг-понга и утверждает, что в среднем их шарики светятся 24 часа. Вы подозреваете, что на самом деле шарики светятся **меньше** утверждаемого времени. Чтобы проверить это утверждение, вы проводите тест и измеряете продолжительность свечения у случайной выборки из 50 шариков. Среднее время свечения в вашей выборке составило 23.5 часов при стандартном отклонении в генеральной совокупности 2 часа. Используя уровень значимости 0.05, проверьте гипотезу о том, что шарики светятся в среднем 24 часа.

В контексте нашей задачи гипотезы формулируются следующим образом:

- **Нулевая гипотеза** ($H_0$): Среднее время свечения шариков равно утверждаемому производителем значению.
$$H_0: \mu = 24$$
где $\mu$ — среднее время свечения шариков в генеральной совокупности.

- **Альтернативная гипотеза** ($H_1$): Среднее время свечения шариков меньше, чем утверждаемое производителем значение.
$$H_1: \mu < 24$$

Это предполагает, что мы проверяем, достаточно ли у нас доказательств для отклонения нулевой гипотезы в пользу альтернативной, указывающей на то, что среднее время свечения шариков статистически значимо меньше заявленных 24 часов.


In [11]:
sample_mean = 23.5     
std_dev = 2         
n = 50              
population_mean = 24

In [12]:
# Расчет z-статистики
z = (sample_mean - population_mean) / (std_dev / (n ** 0.5))

# Расчет p-значения
p_value = norm.cdf(z)

print(f"Z-статистика: {z}")
print(f"P-значение: {p_value}")

Z-статистика: -1.7677669529663689
P-значение: 0.03854993587177085


Так как p-значение (0.0771) больше, чем уровень значимости (0.05). На основании полученных данных, мы не можем отвергнуть нулевую гипотезу о том, что среднее время свечения шариков для пинг-понга составляет 24 часа. Статистически значимых доказательств того, что шарики светятся меньше утверждаемого времени, не найдено.

🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿🗿