In [1]:
import numpy as np
import pandas as pd
import scipy.stats as sps
from scipy.stats import norm, expon
from scipy.stats import ttest_ind, mannwhitneyu

import pandas as pd
import plotly.graph_objs as go

Реализовать t-критерий Стьюдента для 2 независимых выборок при условии неизвестной дисперсии. Необходимо считать значение статистики и p_value для разных видов гипотез (двусторонняя, односторонние), а также результат (отвергается нулевая гипотеза или нет). Сравнить результаты с реализацией в scipy.stats.ttest_ind. 

In [2]:
def calculate_t_test(sample1, sample2, alternative='two-sided'):
    # Вычисление средних значений выборок
    mean1 = np.mean(sample1)
    mean2 = np.mean(sample2)

    # Вычисление стандартных ошибок выборок
    se1 = np.std(sample1, ddof=1) / np.sqrt(len(sample1))
    se2 = np.std(sample2, ddof=1) / np.sqrt(len(sample2))

    # Вычисление статистики t
    t = (mean1 - mean2) / np.sqrt(se1**2 + se2**2)

    # Вычисление числа степеней свободы
    df = len(sample1) + len(sample2) - 2

    # Вычисление p-значения
    if alternative == 'two-sided':
        p_value = 2 * (1 - sps.t.cdf(np.abs(t), df))
    elif alternative == 'less':
        p_value = sps.t.cdf(t, df)
    elif alternative == 'greater':
        p_value = 1 - sps.t.cdf(t, df)
    else:
        raise ValueError("Недопустимое значение параметра alternative")

    return t, p_value

In [3]:
sample1 = np.random.normal(loc=0, scale=1, size=100)
sample2 = np.random.normal(loc=0.5, scale=1, size=100)

In [4]:
# Расчет t-критерия Стьюдента для двусторонней альтернативной гипотезы
t, p_value = calculate_t_test(sample1, sample2, alternative='two-sided')
print("Результаты для двусторонней альтернативной гипотезы:")
print("Статистика t:", t)
print("p-значение:", p_value)
if p_value < 0.05:
    print("Нулевая гипотеза отвергается")
else:
    print("Нулевая гипотеза не отвергается")
    
# Сравнение с scipy.stats.ttest_ind
t_scipy, p_value_scipy = sps.ttest_ind(sample1, sample2)
print("\nРезультаты scipy.stats.ttest_ind:")
print("Статистика t (scipy):", t_scipy)
print("p-значение (scipy):", p_value_scipy)

# Сравнение результатов
if np.isclose(t, t_scipy) and np.isclose(p_value, p_value_scipy):
    print("\nРезультаты совпадают с scipy.stats.ttest_ind")
else:
    print("\nРезультаты не совпадают с scipy.stats.ttest_ind")

Результаты для двусторонней альтернативной гипотезы:
Статистика t: -3.704186255041075
p-значение: 0.0002750356853737923
Нулевая гипотеза отвергается

Результаты scipy.stats.ttest_ind:
Статистика t (scipy): -3.704186255041075
p-значение (scipy): 0.0002750356853738739

Результаты совпадают с scipy.stats.ttest_ind


In [5]:
# Расчет t-критерия Стьюдента для альтернативной гипотезы mean1 > mean2
t_less, p_value_less = calculate_t_test(sample1, sample2, alternative='greater')
print("\nРезультаты для альтернативной гипотезы mean1 > mean2:")
print("Статистика t:", t_less)
print("p-значение:", p_value_less)
if p_value_less < 0.05:
    print("Нулевая гипотеза отвергается")
else:
    print("Нулевая гипотеза не отвергается")
    
# Сравнение с scipy.stats.ttest_ind
t_scipy, p_value_scipy = sps.ttest_ind(sample1, sample2, alternative='greater')
print("\nРезультаты scipy.stats.ttest_ind:")
print("Статистика t (scipy):", t_scipy)
print("p-значение (scipy):", p_value_scipy)

# Сравнение результатов
if np.isclose(t_less, t_scipy) and np.isclose(p_value_less, p_value_scipy):
    print("\nРезультаты совпадают с scipy.stats.ttest_ind")
else:
    print("\nРезультаты не совпадают с scipy.stats.ttest_ind")


Результаты для альтернативной гипотезы mean1 > mean2:
Статистика t: -3.704186255041075
p-значение: 0.9998624821573131
Нулевая гипотеза не отвергается

Результаты scipy.stats.ttest_ind:
Статистика t (scipy): -3.704186255041075
p-значение (scipy): 0.9998624821573131

Результаты совпадают с scipy.stats.ttest_ind


In [6]:
# Расчет t-критерия Стьюдента для альтернативной гипотезы mean1 < mean2
t_greater, p_value_greater = calculate_t_test(sample1, sample2, alternative='less')
print("\nРезультаты для альтернативной гипотезы mean1 < mean2:")
print("Статистика t:", t_greater)
print("p-значение:", p_value_greater)
if p_value_greater < 0.05:
    print("Нулевая гипотеза отвергается")
else:
    print("Нулевая гипотеза не отвергается")

# Сравнение с scipy.stats.ttest_ind
t_scipy, p_value_scipy = sps.ttest_ind(sample1, sample2, alternative='less')
print("\nРезультаты scipy.stats.ttest_ind:")
print("Статистика t (scipy):", t_scipy)
print("p-значение (scipy):", p_value_scipy)

# Сравнение результатов
if np.isclose(t_greater, t_scipy) and np.isclose(p_value_greater, p_value_scipy):
    print("\nРезультаты совпадают с scipy.stats.ttest_ind")
else:
    print("\nРезультаты не совпадают с scipy.stats.ttest_ind")


Результаты для альтернативной гипотезы mean1 < mean2:
Статистика t: -3.704186255041075
p-значение: 0.00013751784268693695
Нулевая гипотеза отвергается

Результаты scipy.stats.ttest_ind:
Статистика t (scipy): -3.704186255041075
p-значение (scipy): 0.00013751784268693695

Результаты совпадают с scipy.stats.ttest_ind


Реализовать bootstrap для оценки (через доверительные интервалы) медианных и средних значений распределений. Рассчитать для распределений: нормальное, экспоненциальное, смесь нормальных

In [7]:
def bootstrap(data, statistic, n_bootstrap, alpha):
    """
    Функция для оценки доверительного интервала через bootstrap.

    Аргументы:
    - data: массив с исходными данными
    - statistic: функция, вычисляющая статистику интересующей нас величины (например, np.mean или np.median)
    - n_bootstrap: количество bootstrap выборок
    - alpha: уровень значимости для расчета доверительного интервала

    Возвращает:
    - lower_bound: нижняя граница доверительного интервала
    - upper_bound: верхняя граница доверительного интервала
    """
    boot_statistics = np.zeros(n_bootstrap)
    for i in range(n_bootstrap):
        # Генерация bootstrap выборки путем выбора случайных элементов с возвращением
        boot_sample = np.random.choice(data, size=len(data), replace=True)
        # Вычисление статистики на bootstrap выборке
        boot_statistics[i] = statistic(boot_sample)
    
    # Расчет границ доверительного интервала 
    lower_bound = np.percentile(boot_statistics, alpha / 2 * 100)
    upper_bound = np.percentile(boot_statistics, (1 - alpha / 2) * 100)
    
    return lower_bound, upper_bound

def calculate_bootstrap_intervals(distribution, n_bootstrap=1000, alpha=0.05):
    """
    Функция для расчета доверительных интервалов среднего значения и медианы распределения через bootstrap.

    Аргументы:
    - distribution: массив с данными из распределения
    - n_bootstrap: количество bootstrap выборок
    - alpha: уровень значимости для расчета доверительного интервала

    Возвращает:
    - mean_interval: доверительный интервал для среднего значения
    - median_interval: доверительный интервал для медианы
    """
    mean_interval = bootstrap(distribution, np.mean, n_bootstrap, alpha)
    median_interval = bootstrap(distribution, np.median, n_bootstrap, alpha)

    return mean_interval, median_interval

# Нормальное распределение
np.random.seed(42)
normal_data = np.random.normal(loc=10, scale=2, size=1000)
normal_mean_interval, normal_median_interval = calculate_bootstrap_intervals(normal_data)
print("Нормальное распределение:")
print("Доверительный интервал медианы:", normal_median_interval)
print("Доверительный интервал среднего значения:", normal_mean_interval)

# Экспоненциальное распределение
np.random.seed(42)
exponential_data = np.random.exponential(scale=1, size=1000)
exponential_mean_interval, exponential_median_interval = calculate_bootstrap_intervals(exponential_data)
print("\nЭкспоненциальное распределение:")
print("Доверительный интервал медианы:", exponential_median_interval)
print("Доверительный интервал среднего значения:", exponential_mean_interval)

# Смесь нормальных распределений
np.random.seed(42)
# Генерация данных для смеси нормальных распределений
mixture_data = np.concatenate([np.random.normal(loc=-5, scale=1, size=500),
                                      np.random.normal(loc=5, scale=3, size=500)])
mixture_mean_interval, mixture_median_interval = calculate_bootstrap_intervals(mixture_data)
print("\nСмесь нормальных распределений:")
print("Доверительный интервал медианы:", mixture_median_interval)
print("Доверительный интервал среднего значения:", mixture_mean_interval)

Нормальное распределение:
Доверительный интервал медианы: (9.902824934205587, 10.18352315805587)
Доверительный интервал среднего значения: (9.921410775794877, 10.170046862565737)

Экспоненциальное распределение:
Доверительный интервал медианы: (0.6129559740510913, 0.739174927497751)
Доверительный интервал среднего значения: (0.9170481089177334, 1.0295461561350698)

Смесь нормальных распределений:
Доверительный интервал медианы: (-3.450214317964355, 0.5651261958394673)
Доверительный интервал среднего значения: (-0.2974600001949274, 0.3897967932732304)


Рассчитать мощность критерия для t-критерия и критерия Манна-Уитни для разных распределений и разном эффекте. Отдельно изучить случай, когда средние равны, а дисперсии сильно отличаются.

In [8]:
def calculate_power_ttest(distribution1, distribution2, n1, n2, alpha, n_exp=1000):
    reject_count = 0
    for _ in range(n_exp):
        x1 = distribution1.rvs(size=n1)
        x2 = distribution2.rvs(size=n2)
        _, p_value = sps.ttest_ind(x1, x2)
        if p_value < alpha:
            reject_count += 1
    power = reject_count / n_exp
    return power

def calculate_power_mannwhitney(distribution1, distribution2, n1, n2, alpha, n_exp=1000):
    reject_count = 0
    for _ in range(n_exp):
        x1 = distribution1.rvs(size=n1)
        x2 = distribution2.rvs(size=n2)
        _, p_value = sps.mannwhitneyu(x1, x2)
        if p_value < alpha:
            reject_count += 1
    power = reject_count / n_exp
    return power

In [9]:
effect_sizes = [0, 0.5, 1, 5, 10]
mean1 = 0
std = 1
sample_size = 100
alpha = 0.05

powers_ttest = []
powers_mannwhitney = []

for effect in effect_sizes:
    mean2 = mean1 + effect
    distribution1 = sps.norm(loc=mean1, scale=std)
    distribution2 = sps.norm(loc=mean2, scale=std)
    power_ttest = calculate_power_ttest(distribution1, distribution2, sample_size, sample_size, alpha)
    power_mannwhitney = calculate_power_mannwhitney(distribution1, distribution2, sample_size, sample_size, alpha)
    powers_ttest.append(power_ttest)
    powers_mannwhitney.append(power_mannwhitney)

print("Разные распределения с разными средними и равными дисперсиями")
print("Величины эффекта:", effect_sizes)
print("Мощность (t-критерий):", powers_ttest)
print("Мощность (критерий Манна-Уитни):", powers_mannwhitney)
print()

Разные распределения с разными средними и равными дисперсиями
Величины эффекта: [0, 0.5, 1, 5, 10]
Мощность (t-критерий): [0.057, 0.938, 1.0, 1.0, 1.0]
Мощность (критерий Манна-Уитни): [0.052, 0.917, 1.0, 1.0, 1.0]



### Вывод: 
все логично, когда разница в средних растет, то мощность растет. Когда разница в средних значительно возрастает, мощность критериев t-критерия и критерия Манна-Уитни также увеличивается, что означает более высокую вероятность отклонить нулевую гипотезу и обнаружить статистически значимый эффект. Это логично, так как большая разница в средних значит, что эффект является более выраженным и легче обнаруживается с помощью этих критериев.

In [10]:
effect_sizes = [0, 0.5, 1, 5, 10]
mean1 = 0
mean2 = mean1  # Средние равны
std1 = 1
std2 = 10
sample_size = 100
alpha = 0.05

powers_ttest = []
powers_mannwhitney = []

for effect in effect_sizes:
    distribution1 = sps.norm(loc=mean1, scale=std1)
    distribution2 = sps.norm(loc=mean2, scale=std2)
    power_ttest = calculate_power_ttest(distribution1, distribution2, sample_size, sample_size, alpha)
    power_mannwhitney = calculate_power_mannwhitney(distribution1, distribution2, sample_size, sample_size, alpha)
    powers_ttest.append(power_ttest)
    powers_mannwhitney.append(power_mannwhitney)

print("Средние равны, а дисперсии сильно отличаются")
print("Величины эффекта:", effect_sizes)
print("Мощность (t-критерий):", powers_ttest)
print("Мощность (критерий Манна-Уитни):", powers_mannwhitney)
print()

Средние равны, а дисперсии сильно отличаются
Величины эффекта: [0, 0.5, 1, 5, 10]
Мощность (t-критерий): [0.05, 0.048, 0.063, 0.043, 0.044]
Мощность (критерий Манна-Уитни): [0.077, 0.089, 0.089, 0.107, 0.101]



### Вывод:
В данном случае мощность критериев t-критерия и критерия Манна-Уитни особо не меняется. Возможно, это объясняется тем, что при большой разнице в дисперсиях, тяжелые хвосты распределения с большей дисперсией могут оказывать существенное влияние на оценку статистической значимости. В результате, критерии становятся менее чувствительными к наличию эффекта и мощность снижается.

Значит, когда средние равны, а дисперсии сильно отличаются, критерии t-критерия и Манна-Уитни могут иметь низкую мощность и могут быть менее эффективными в обнаружении статистически значимых различий между группами.

Оценить корректность t-критерия и критерия Манна-Уитни на разных распределениях.

Сгенерируем две выборки с нормальным распределением и затем вычислим p-значения для двух различных тестов: t-теста (ttest_ind) и теста Манна-Уитни (mannwhitneyu). Затем построим Q-Q графики для обоих тестов.

In [11]:
from scipy import stats

def compute_probabilities(size, n_exp, test_type):
    p_values = []
    probs = []
    alpha_values = np.arange(0, 1.01, 0.01)

    for _ in range(n_exp):
        x_a = stats.norm.rvs(loc=0, scale=1, size=size)
        x_b = stats.norm.rvs(loc=0, scale=1, size=size)
        
        if test_type == 'ttest':
            p_value = stats.ttest_ind(x_a, x_b, equal_var=False).pvalue
        elif test_type == 'mannwhitneyu':
            p_value = stats.mannwhitneyu(x_a, x_b).pvalue
        else:
            raise ValueError("Недопустимый тип теста. Должно быть 'ttest' или 'mannwhitneyu'.")
        
        p_values.append(p_value)

    p_values = np.array(p_values)

    for alpha_step in alpha_values:
        prob = np.mean(p_values < alpha_step)
        probs.append(prob)

    return probs

size = 100
n_exp = 1000

probs_ttest = compute_probabilities(size, n_exp, 'ttest')
probs_mannwhitneyu = compute_probabilities(size, n_exp, 'mannwhitneyu')

In [13]:
x = [0.01 * i for i in range(101)]
fig = go.Figure([go.Scatter(x=x, y=probs_ttest, mode="markers", name="p_value"),
                 go.Scatter(x=x, y=x, mode="lines", name="uniform")])
fig.update_layout(height=600, width=600, title="Q-Q plot T-test")

In [14]:
fig = go.Figure([go.Scatter(x=x, y=probs_mannwhitneyu, mode="markers", name="p_value"),
                 go.Scatter(x=x, y=x, mode="lines", name="uniform")])
fig.update_layout(height=600, width=600, title="Q-Q plot Mann-Whitney")

И для экспоненциального распределения:

In [15]:
from scipy import stats

def compute_probabilities(size, n_exp, test_type):
    p_values = []
    probs = []
    alpha_values = np.arange(0, 1.01, 0.01)

    for _ in range(n_exp):
        x_a = stats.expon.rvs(loc=0, scale=1, size=size)
        x_b = stats.expon.rvs(loc=0, scale=1, size=size)
        
        if test_type == 'ttest':
            p_value = stats.ttest_ind(x_a, x_b, equal_var=False).pvalue
        elif test_type == 'mannwhitneyu':
            p_value = stats.mannwhitneyu(x_a, x_b).pvalue
        else:
            raise ValueError("Недопустимый тип теста. Должно быть 'ttest' или 'mannwhitneyu'.")
        
        p_values.append(p_value)

    p_values = np.array(p_values)

    for alpha_step in alpha_values:
        prob = np.mean(p_values < alpha_step)
        probs.append(prob)

    return probs

size = 100
n_exp = 1000

probs_ttest = compute_probabilities(size, n_exp, 'ttest')
probs_mannwhitneyu = compute_probabilities(size, n_exp, 'mannwhitneyu')

In [16]:
fig = go.Figure([go.Scatter(x=x, y=probs_ttest, mode="markers", name="p_value"),
                 go.Scatter(x=x, y=x, mode="lines", name="uniform")])
fig.update_layout(height=600, width=600, title="Q-Q plot T-test")

In [17]:
fig = go.Figure([go.Scatter(x=x, y=probs_mannwhitneyu, mode="markers", name="p_value"),
                 go.Scatter(x=x, y=x, mode="lines", name="uniform")])
fig.update_layout(height=600, width=600, title="Q-Q plot Mann-Whitney")

С помощью анализа распределения p-значений можно оценить корректность использования статистических тестов. Если распределение p-значений для определенного теста близко к равномерному распределению, это может указывать на то, что тест сохраняет свойства статистической проверки гипотез.

Вывод: Таким образом, мы проанализировали, насколько близки распределения p-значений для тестов к равномерному распределению - проверка корректности использования этих тестов