In [44]:
from scipy.stats import mannwhitneyu, ttest_ind, shapiro
import pandas as pd
import numpy as np


def outliers(series: pd.Series, replace=np.nan):
    Q1, Q3 = np.percentile(series, [25, 75])
    IQR = Q3 - Q1
    High = Q3 + 3 * IQR
    return series.where(series.between(0, High), replace)


df = pd.read_csv("data4.csv", sep=';', decimal='.')
df.columns = df.columns.str.lower().str.replace(' ', '_')
# print(df.columns)

df['выручка'] = (df.groupby(['покупательская_активность', 'тип_товара'])
                 ['выручка'].transform(lambda x: x.fillna(x.median())))

df['выручка'] = outliers(df['выручка'])

df['выручка'] = (df.groupby(['покупательская_активность', 'тип_товара'])
                 ['выручка'].transform(lambda x: x.fillna(x.median())))


df_typed = df[df['тип_товара'] == 'товары для себя']
group_1 = df_typed[df_typed["покупательская_активность"] == "Снизилась"]
group_2 = df_typed[df_typed["покупательская_активность"] == "Прежний уровень"]

result = [['показатель', 'р-уровень', 'метод расчёта р-уровня']]
for col in df.columns[2:]:
    g_1, g_2 = group_1[col], group_2[col]
    if not (shapiro(g_1).pvalue >= 0.05 or shapiro(g_2).pvalue >= 0.05):
        res = mannwhitneyu(g_1, g_2)
        result.append([col, round(float(res.pvalue), 4), 'Манн-Уитни'])
    else:
        res = ttest_ind(g_1, g_2)
        result.append([col, round(float(res.pvalue), 4), 'Стьюдент'])
    # print(col, res)

print(result)

# ans = [['показатель', 'р-уровень', 'метод расчёта р-уровня'], ['история_продаж', 0.0042, 'Манн-Уитни'],
#        ['неоплаченные_товары', 0.0, 'Манн-Уитни'], ['выручка', 0.0, 'Манн-Уитни']]
# 
# res = [['показатель', 'р-уровень', 'метод расчёта р-уровня'], ['история_продаж', 0.0111, 'Манн-Уитни'],
#        ['неоплаченные_товары', 0.0, 'Манн-Уитни'], ['выручка', 0.0056, 'Манн-Уитни']]

['товары для себя']
['товары для себя']
[['показатель', 'р-уровень', 'метод расчёта р-уровня'], ['история_продаж', 0.0111, 'Манн-Уитни'], ['неоплаченные_товары', 0.0, 'Манн-Уитни'], ['выручка', 0.0056, 'Манн-Уитни']]
