# Загрузка библиотек

In [63]:
import math
from scipy.stats import ttest_ind
import numpy as np
from matplotlib import pyplot as plt
from scipy.stats import t
from scipy import stats

# T критерий для проверки коррелированности двух выборок 

In [64]:
import numpy as np
from scipy import stats

def T_krit(x, y):
    """
    Функция для проверки значимости коэффициента корреляции.

    Аргументы:
    x, y -- входные массивы данных

    Возвращает:
    Вывод результатов проверки значимости коэффициента корреляции.
    """
    rho = np.corrcoef(x, y)[0, 1]  # Вычисляем коэффициент корреляции
    alpha = 0.05  # Уровень значимости
    t_stat = rho * np.sqrt((len(x) - 2) / (1 - rho**2))  # Вычисляем значение t-статистики
    t_crit = stats.t.ppf(1 - alpha / 2, len(x) - 2)  # Вычисляем критическое значение t-статистики

    print("=" * 50)
    print("Проверка значимости коэффициента корреляции")
    print("=" * 50)
    print(f"Значение статистики t: {t_stat:.4f}")
    print(f"Критическое значение t: ±{t_crit:.4f}")
    print("-" * 50)

    # Проверка уровня значимости
    if -t_crit < t_stat < t_crit:
        print("Принимаем нулевую гипотезу")
    else:
        print("Отвергаем нулевую гипотезу")
    print("=" * 50)



In [65]:
n = 1000
sample = np.random.normal(3, math.sqrt(5), n)
x, y = sample[:500], sample[500:]

In [66]:
print("Выборка из N(3,5), разделенная пополам:")
print()
T_krit(x, y)

Выборка из N(3,5), разделенная пополам:

Проверка значимости коэффициента корреляции
Значение статистики t: -1.7310
Критическое значение t: ±1.9647
--------------------------------------------------
Принимаем нулевую гипотезу


In [67]:
x= np.random.normal(3, math.sqrt(5), n)
epsilon=np.random.normal(0, 1, n)
y=5*x-7+0.3*epsilon

In [68]:
print('Выборка y=5x-7+0.3e' )
print()
T_krit(x,y)

Выборка y=5x-7+0.3e

Проверка значимости коэффициента корреляции
Значение статистики t: 1160.8650
Критическое значение t: ±1.9623
--------------------------------------------------
Отвергаем нулевую гипотезу


# T критерий для проверки двух средних

In [69]:
def T_krit_mean(x, y):
    """
    Функция для проверки значимости разницы средних двух выборок.

    Аргументы:
    x, y -- входные массивы данных

    Возвращает:
    Вывод результатов проверки значимости разницы средних.
    """
    n = len(x)  # Предполагаем, что длины выборок равны
    mean1 = np.mean(x)  # Вычисляем среднее первой выборки
    mean2 = np.mean(y)  # Вычисляем среднее второй выборки
    std1 = np.std(x)  # Вычисляем стандартное отклонение первой выборки
    std2 = np.std(y)  # Вычисляем стандартное отклонение второй выборки
    alpha = 0.05  # Уровень значимости
    S = np.sqrt(((n - 1) * std1 ** 2 + (n - 1) * std2 ** 2) / (2 * n - 2))  # Вычисляем объединенное стандартное отклонение

    # Вычисление статистики t и p-value
    t_stat = (mean1 - mean2) / (S * np.sqrt((1 / n) + (1 / n)))
    df = 2 * n - 2  # Число степеней свободы
    t_crit = stats.t.ppf(1 - alpha / 2, df)  # Вычисляем критическое значение t-статистики

    print("=" * 50)
    print("Проверка значимости разницы средних двух выборок")
    print("=" * 50)
    print(f"Значение статистики t: {t_stat:.4f}")
    print(f"Критическое значение t: ±{t_crit:.4f}")
    print("-" * 50)

    # Проверка уровня значимости
    if -t_crit < t_stat < t_crit:
        print("Принимаем нулевую гипотезу")
    else:
        print("Отвергаем нулевую гипотезу")
    print("=" * 50)

In [70]:
n=1000
x= np.random.normal(3, math.sqrt(5), n)
y= np.random.normal(2, math.sqrt(6), n)
x1,x2=x[:500], x[500:]

In [73]:
print('Выборка разделенная пополам:')
print()
T_krit_mean(x1,x2)

Выборка разделенная пополам:

Проверка значимости разницы средних двух выборок
Значение статистики t: -0.5909
Критическое значение t: ±1.9623
--------------------------------------------------
Принимаем нулевую гипотезу


In [74]:
print('Две разные выборки:')
print()
T_krit_mean(x,y)

Две разные выборки:

Проверка значимости разницы средних двух выборок
Значение статистики t: 9.2292
Критическое значение t: ±1.9612
--------------------------------------------------
Отвергаем нулевую гипотезу


# Проверка двух средних для Z=x-y

In [75]:
def diff(z):
    """
    Функция для проверки значимости среднего значения выборки.

    Аргументы:
    z -- входной массив данных

    Возвращает:
    Вывод результатов проверки значимости среднего значения.
    """
    mean_z = np.mean(z)  # Вычисляем среднее значение выборки
    std_z = np.std(z, ddof=1)  # Вычисляем стандартное отклонение выборки (с поправкой на смещение)
    alpha = 0.05  # Уровень значимости

    # Вычисление статистики t и p-value
    t_stat = mean_z / (std_z / np.sqrt(len(z)))
    df = len(z) - 1  # Число степеней свободы
    t_crit = stats.t.ppf(1 - alpha / 2, df)  # Вычисляем критическое значение t-статистики

    print("=" * 50)
    print("Проверка значимости среднего значения выборки")
    print("=" * 50)
    print(f"Значение статистики t: {t_stat:.4f}")
    print(f"Критическое значение t: ±{t_crit:.4f}")
    print("-" * 50)

    # Проверка уровня значимости
    if -t_crit < t_stat < t_crit:
        print("Принимаем нулевую гипотезу")
    else:
        print("Отвергаем нулевую гипотезу")
    print("=" * 50)

In [76]:
n=100
x= np.random.normal(3, math.sqrt(5), n)
y= 5*x
z=x-y

In [77]:
print('z=x-5x')
print()
diff(z)

z=x-5x

Проверка значимости среднего значения выборки
Значение статистики t: -10.5863
Критическое значение t: ±1.9842
--------------------------------------------------
Отвергаем нулевую гипотезу


In [78]:
x= np.random.normal(3, math.sqrt(5), n)
epsilon=np.random.normal(0, 1, n)
y=5*x+0.4+0.3*epsilon

In [79]:
print('z=x-5x+0.4+0.3e')
print()
diff(x-y)

z=x-5x+0.4+0.3e

Проверка значимости среднего значения выборки
Значение статистики t: -13.3464
Критическое значение t: ±1.9842
--------------------------------------------------
Отвергаем нулевую гипотезу


# Критерий Фишера для сравнении дисперсий


In [45]:
def Fisher(x, y):
    """
    Функция для проверки равенства дисперсий двух выборок с помощью F-теста.

    Аргументы:
    x, y -- входные массивы данных

    Возвращает:
    Вывод результатов проверки равенства дисперсий.
    """
    alpha = 0.05  # Уровень значимости
    std1 = np.std(x)  # Вычисляем стандартное отклонение первой выборки
    std2 = np.std(y)  # Вычисляем стандартное отклонение второй выборки
    f = (std1 ** 2) / (std2 ** 2)  # Вычисляем значение F-статистики
    F_l = stats.f.ppf(alpha / 2, len(x) - 1, len(y) - 1)  # Вычисляем левое критическое значение F-статистики
    F_r = stats.f.ppf(1 - alpha / 2, len(x) - 1, len(y) - 1)  # Вычисляем правое критическое значение F-статистики

    print("=" * 50)
    print("Проверка равенства дисперсий двух выборок (F-тест)")
    print("=" * 50)
    print(f"Значение статистики F: {f:.4f}")
    print(f"Критические значения F: {F_l:.4f}, {F_r:.4f}")
    print("-" * 50)

    # Проверка уровня значимости
    if F_l < f < F_r:
        print("Принимаем нулевую гипотезу")
    else:
        print("Отвергаем нулевую гипотезу")
    print("=" * 50)

In [46]:
n=1000
x= np.random.normal(3, math.sqrt(5), n)
y= np.random.normal(2, math.sqrt(6), n)

In [47]:
x1,x2=x[:500], x[500:]
print('Выборка разделенная пополам')
print()
Fisher(x1,x2)

Выборка разделенная пополам

Проверка равенства дисперсий двух выборок (F-тест)
Значение статистики F: 0.9986
Критические значения F: 0.8389, 1.1921
--------------------------------------------------
Принимаем нулевую гипотезу


In [48]:
print('Две разные выборки')
print()
Fisher(x,y)

Две разные выборки

Проверка равенства дисперсий двух выборок (F-тест)
Значение статистики F: 0.8477
Критические значения F: 0.8833, 1.1321
--------------------------------------------------
Отвергаем нулевую гипотезу


# Критерий значимости разницы биномиальных распределений

In [41]:
def binom(x, y, n):
    """
    Функция для проверки значимости разницы долей двух выборок.

    Аргументы:
    x -- количество успехов в первой выборке
    y -- количество успехов во второй выборке
    n -- общее число наблюдений в каждой выборке

    Возвращает:
    Вывод результатов проверки значимости разницы долей.
    """
    l = x  # Количество успехов в первой выборке
    n1 = n  # Общее число наблюдений в первой выборке
    m = y  # Количество успехов во второй выборке
    n2 = n  # Общее число наблюдений во второй выборке
    alpha = 0.05  # Уровень значимости
    p = (l + m) / (n1 + n2)  # Оценка общей доли успехов
    Z = (l / n1 - m / n2 - 1 / (2 * (n1 + n2))) / (np.sqrt(p * (1 - p) * (1 / n1 + 1 / n2)))  # Вычисление Z-статистики

    print("=" * 50)
    print("Проверка значимости разницы долей двух выборок")
    print("=" * 50)
    print(f"Значение статистики Z: {Z:.4f}")
    z_crit = stats.norm.ppf(1 - alpha / 2)  # Вычисление критического значения Z-статистики
    print(f"Критическое значение Z: ±{z_crit:.4f}")
    print("-" * 50)

    # Проверка уровня значимости
    if -z_crit < Z < z_crit:
        print("Принимаем нулевую гипотезу")
    else:
        print("Отвергаем нулевую гипотезу")
    print("=" * 50)

In [57]:
n=1000
x= np.random.binomial(n,0.3)
y= np.random.binomial(n,0.4)
x1= np.random.binomial( n,0.3)

In [58]:
print('Две разные выборки:')
print()
binom(x,y,n)

Две разные выборки:

Проверка значимости разницы долей двух выборок
Значение статистики Z: -5.0367
Критическое значение Z: ±1.9600
--------------------------------------------------
Отвергаем нулевую гипотезу


In [61]:
print('Выборка разделенная пополам:')
print()
binom(x,x1,n)

Выборка разделенная пополам:

Проверка значимости разницы долей двух выборок
Значение статистики Z: 0.5233
Критическое значение Z: ±1.9600
--------------------------------------------------
Принимаем нулевую гипотезу


# Критерий значимости разницы средних двух выборок с распределением Пуассона

In [49]:
def puasson(x, y, n):
    """
    Функция для проверки значимости разницы средних двух выборок с распределением Пуассона.

    Аргументы:
    x -- первая выборка с распределением Пуассона
    y -- вторая выборка с распределением Пуассона
    n -- размер каждой выборки

    Возвращает:
    Вывод результатов проверки значимости разницы средних.
    """
    alpha = 0.05  # Уровень значимости
    Z = (np.mean(x) - np.mean(y)) / np.sqrt(np.mean(x) / n + np.mean(y) / n)  # Вычисление Z-статистики

    print("=" * 50)
    print("Проверка значимости разницы средних двух выборок с распределением Пуассона")
    print("=" * 50)
    print(f"Значение статистики Z: {Z:.4f}")
    z_crit = stats.norm.ppf(1 - alpha / 2)  # Вычисление критического значения Z-статистики
    print(f"Критическое значение Z: ±{z_crit:.4f}")
    print("-" * 50)

    # Проверка уровня значимости
    if -z_crit < Z < z_crit:
        print("Принимаем нулевую гипотезу")
    else:
        print("Отвергаем нулевую гипотезу")
    print("=" * 50)

In [50]:
n=1000
x= np.random.poisson(3,n)
y= np.random.poisson(4,n)
x1= np.random.poisson(3,n)

In [54]:
print('Две разные выборки:')
print()
puasson(x,y,n)

Две разные выборки

Проверка значимости разницы средних двух выборок с распределением Пуассона
Значение статистики Z: -11.3426
Критическое значение Z: ±1.9600
--------------------------------------------------
Отвергаем нулевую гипотезу


In [55]:
print('Выборка разделенная пополам:')
print()
puasson(x,x1,n)

Выборка разделенная пополам

Проверка значимости разницы средних двух выборок с распределением Пуассона
Значение статистики Z: -0.9997
Критическое значение Z: ±1.9600
--------------------------------------------------
Принимаем нулевую гипотезу
