#  Импорт необходимых библиотек

In [2]:
import numpy as np
import scipy.stats as stats
import scipy.special as special

# Определение вспомогательных функций

In [3]:
def w(x, y):
    """
    Вычисление статистику критерия знаков.
    """
    d = {"+": 0, "-": 0}
    n = len(x)
    for i in range(n):
        if x[i] < y[i]:
            d["+"] += 1
        else:
            d["-"] += 1
    return min(d["+"], d["-"])

def t20(w, n):
    """
    Вычисление двустороннего p-значения для статистики критерия знаков для малых выборок (n=20).
    """
    s = 0
    for i in range(w + 1):
        s += special.comb(n, i, exact=True)
    return s / pow(2, n)

def t1000(w, n):
    """
    Вычисление стандартизированной тестовой статистики для больших выборок (n=1000).
    """
    return (w - n / 2) / np.sqrt(n / 4)

def cor(x):
    """
    Вычисление коэффициента корреляции с поправкой.
    """
    s = 0
    n = len(x)
    summ = sum(x)
    for i in range(n - 1):
        s += x[i] * x[i + 1]
    r = (n * s - summ ** 2 + n * x[0] * x[n - 1]) / (n * sum(x ** 2) - summ ** 2)
    m = -1 / (n - 1)
    d = n * (n - 3) / (n + 1) / (n - 1) ** 2
    return (r - m) / np.sqrt(d)

def h(x):
    """
    Вычисление тестовую статистику для проверки равенства дисперсий в круговых данных.
    """
    n = len(x)
    med = np.median(x)
    s = 0
    for i in range(n):
        s += i * (x[i] - med) ** 2
    H = s / (n - 1) / sum((x - med) ** 2)
    m = 1 / 2
    d = (n + 1) / 6 / (n - 1) / (n + 2)
    return (H - m) / np.sqrt(d)

# Инициализация параметров

In [4]:
n = 1000
alpha = 0.05
N01 = stats.norm.ppf(1 - alpha / 2)

# Выполнение статистических тестов

### Тест 1: Сравнение двух нормальных распределений

Генерируем 2 выборки: первую из N(3,5); вторую из N(3,6).

Первый тест выполняется для малой выборки (n=20).
Второй тест выполняется для большой выборки (n=1000).

In [5]:
x11 = np.random.normal(3, np.sqrt(5), n)
y11 = np.random.normal(3, np.sqrt(6), n)

print("="*70)
print("Тест 1: Сравнение двух нормальных распределений".center(70))
print("="*70)

# Малая выборка
ans1 = t20(w(x11[:20], y11[:20]), 20)
print("-"*70)
print(f"Малая выборка (n=20), H0: x - y = 0, N(3,5), N(3,6)")
print("-"*70)
print(f"p-значение: {ans1:.4f}")
print(f"Доверительный интервал: ({alpha/2:.4f}, {1 - alpha/2:.4f})")
print(f"Отвергаем H0: {alpha / 2 < ans1 < 1 - alpha / 2}")

# Большая выборка
ans2 = t1000(w(x11, y11), n)
print("-"*70)
print(f"Большая выборка (n = 1000), H0: x - y = 0, N(3,5), N(3,6)")
print("-"*70)
print(f"Стандартизированная тестовая статистика: {ans2:.4f}")
print(f"Доверительный интервал: (-{N01:.4f}, {N01:.4f})")
print(f"Отвергаем H0: {-N01 < ans2 < N01}")

           Тест 1: Сравнение двух нормальных распределений            
----------------------------------------------------------------------
Малая выборка (n=20), H0: x - y = 0, N(3,5), N(3,6)
----------------------------------------------------------------------
p-значение: 0.2517
Доверительный интервал: (0.0250, 0.9750)
Отвергаем H0: True
----------------------------------------------------------------------
Большая выборка (n = 1000), H0: x - y = 0, N(3,5), N(3,6)
----------------------------------------------------------------------
Стандартизированная тестовая статистика: -1.5179
Доверительный интервал: (-1.9600, 1.9600)
Отвергаем H0: True


### Тест 2: Сравнение сдвинутых нормальных распределений

Генерируем 2 выборки: первую из N(3, 5); вторую из N(3.5, 6).

Первый тест выполняется для малой выборки (n=20).
Второй тест выполняется для большой выборки (n=1000).

In [10]:
x12 = x11
y12 = np.random.normal(3.5, np.sqrt(6), n)

print("="*70)
print("Тест 2: Сравнение сдвинутых нормальных распределений".center(70))
print("="*70)

# Малая выборка
ans1 = t20(w(x12[:20], y12[:20]), 20)
print("-"*70)
print(f"Малая выборка (n = 20), H0: x - y = 0, N(3,5), N(3.5,6)")
print("-"*70)
print(f"p-значение: {ans1:.4f}")
print(f"Доверительный интервал: ({alpha/2:.4f}, {1 - alpha/2:.4f})")
print(f"Отвергаем H0: {alpha / 2 < ans1 < 1 - alpha / 2}")

# Большая выборка
ans2 = t1000(w(x12, y12), n)
print("-"*70)
print(f"Большая выборка (n = 1000), H0: x - y = 0, N(3,5), N(3.5,6)")
print("-"*70)
print(f"Стандартизированная тестовая статистика: {ans2:.4f}")
print(f"Доверительный интервал: (-{N01:.4f}, {N01:.4f})")
print(f"Отвергаем H0: {-N01 < ans2 < N01}")

         Тест 2: Сравнение сдвинутых нормальных распределений         
----------------------------------------------------------------------
Малая выборка (n = 20), H0: x - y = 0, N(3,5), N(3.5,6)
----------------------------------------------------------------------
p-значение: 0.5881
Доверительный интервал: (0.0250, 0.9750)
Отвергаем H0: True
----------------------------------------------------------------------
Большая выборка (n = 1000), H0: x - y = 0, N(3,5), N(3.5,6)
----------------------------------------------------------------------
Стандартизированная тестовая статистика: -3.8580
Доверительный интервал: (-1.9600, 1.9600)
Отвергаем H0: False


### Тест 3: Проверка на автокорреляцию в нормальном распределении

Генерируем 1 выборку из N(3,5).

Делаем проверку на автокорреляцию

In [9]:
x21 = x11

print("="*70)
print("Тест 3: Проверка на автокорреляцию на нормальном распределении".center(70))
print("="*70)

ans = cor(x21)
print("-"*70)
print("H0: cor = 0, N(3,5)")
print("-"*70)
print(f"Тестовая статистика: {ans:.4f}")
print(f"Доверительный интервал: (-{N01:.4f}, {N01:.4f})")
print(f"Отвергаем H0: {-N01 < ans < N01}")

    Тест 3: Проверка на автокорреляцию на нормальном распределении    
----------------------------------------------------------------------
H0: cor = 0, N(3,5)
----------------------------------------------------------------------
Тестовая статистика: 0.9177
Доверительный интервал: (-1.9600, 1.9600)
Отвергаем H0: True


### Тест 4: Проверка на автокорреляцию в построенной последовательности

Cтроим последовательность такую, что x_i = x_(i-1) + 2*x_(i-2). То есть строим выборку с искуственно созданной автокорреляцией

In [52]:
y21 = []
y21.append(x21[0] - 2 * x21[len(x21) - 1])
for i in range(1, len(x21)):
    y21.append(x21[i] + 2 * x21[i - 1])
y21 = np.array(y21)

print("="*70)
print("Тест 4: Проверка на автокорреляцию в построенной последовательности".center(70))
print("="*70)

ans = cor(y21)
print("-"*70)
print("H0: cor = 0, y построено по x")
print("-"*70)
print(f"Тестовая статистика: {ans:.4f}")
print(f"Доверительный интервал: (-{N01:.4f}, {N01:.4f})")
print(f"Отвергаем H0: {-N01 < ans < N01}")

 Тест 4: Проверка на автокорреляцию в построенной последовательности  
----------------------------------------------------------------------
H0: cor = 0, y построено по x
----------------------------------------------------------------------
Тестовая статистика: 12.5475
Доверительный интервал: (-1.9600, 1.9600)
Отвергаем H0: False


### Тест 5: Проверка на равенство дисперсий в нормальном распределении

Генерируем 1 выборку из N(3,5).

In [54]:
x31 = x11

print("="*70)
print("Тест 5: Проверка на равенство дисперсий в нормальном распределении".center(70))
print("="*70)

ans = h(x31)
print("-"*70)
print("H0: D(xj) равны, N(3,5)")
print("-"*70)
print(f"Тестовая статистика: {ans:.4f}")
print(f"Доверительный интервал: (-{N01:.4f}, {N01:.4f})")
print(f"Отвергаем H0: {-N01 < ans < N01}")

  Тест 5: Проверка на равенство дисперсий в нормальном распределении  
----------------------------------------------------------------------
H0: D(xj) равны, N(3,5)
----------------------------------------------------------------------
Тестовая статистика: 0.9993
Доверительный интервал: (-1.9600, 1.9600)
Отвергаем H0: True


### Тест 6: Проверка на равенство дисперсий в смешанном распределении

Генерируем 1 выборку с помощью смешения выборок из N(3, 5) и N(3, 6).


In [55]:
y31 = np.concatenate([x11[:500], y11[:500]])

print("="*70)
print("Тест 6: Проверка на равенство дисперсий в смешанном распределении".center(70))
print("="*70)

ans = h(y31)
print("-"*70)
print("H0: D(xj) равны, построено из N(3,5) и N(3,6)")
print("-"*70)
print(f"Тестовая статистика: {ans:.4f}")
print(f"Доверительный интервал: (-{N01:.4f}, {N01:.4f})")
print(f"Отвергаем H0: {-N01 < ans < N01}")

  Тест 6: Проверка на равенство дисперсий в смешанном распределении   
----------------------------------------------------------------------
H0: D(xj) равны, построено из N(3,5) и N(3,6)
----------------------------------------------------------------------
Тестовая статистика: 2.3248
Доверительный интервал: (-1.9600, 1.9600)
Отвергаем H0: False
