In [1]:
import os
import numpy as np
import pickle
import pandas as pd 

from tqdm import tqdm

In [2]:
dir = [d for d in os.listdir('../experiments') if d!='logs']

In [3]:
methods = ['Upsampling_logistic', 'SMOTE_logistic', 'ADASYN_logistic', 'BORDELINE_logistic']

In [4]:
def generate_test_df(sample, metric='auc'):
    results = []
    for d in dir:
        path_main = '../experiments/' + d
        for method in methods:
            print(f'Metodo {method} em {d}')
            pct_gain_list = []
            for k in tqdm(range(50)):
                base_metrics = pickle.load(open(path_main + f'/metrics_base_log_{sample}_{k}.pkl', 'rb'))
                method_metrics = pickle.load(open(path_main + f'/{method}/target_0.5_{sample}_{k}.pkl', 'rb'))
                ba_list = []
                for k in range(len(base_metrics)):
                    br_score = base_metrics[k][metric]
                    ba_list.append(br_score)
                ba_model = []
                for k in range(len(method_metrics)):
                    br_score = method_metrics[k][metric]
                    ba_model.append(br_score)
                if metric=='brier_score':
                    pct_gain = (np.mean(ba_list) - np.array(ba_model))/(np.mean(ba_list)) * 100
                else:
                    pct_gain = (np.mean(ba_list) - np.array(ba_model))/(np.mean(ba_list)) * 100
                pct_gain_list.append(pct_gain)
            pct_gain_list = np.array(pct_gain_list)
            sigma_j = pct_gain_list.std(axis=1)
            sigma = pct_gain_list.mean(axis=1).std()

            sample_pct_mean = []
            print('Começando bootstrap')
            for B in range(1000):
                sample_pct = []
                sample_mu = np.random.normal(0, sigma, 50)
                for j in range(50):
                    sample_mu_j = sample_mu[j]
                    sample_pct_j = np.random.normal(sample_mu_j, sigma_j[j], 40)
                    sample_pct.extend(sample_pct_j.tolist())
                sample_pct_mean.append(np.mean(sample_pct))
            p_value = np.mean(np.abs(sample_pct_mean) > np.abs(pct_gain_list.mean()))
            results.append([d, method, pct_gain_list.mean(), np.median(pct_gain_list), p_value])
    return results

In [5]:
list_df = []
sample = 500
results = generate_test_df(sample, 'auc')
df = pd.DataFrame(results, columns=['dataset', 'method', 'mean', 'median', 'p_value'])

# Cria uma nova coluna 'mean_p' que é igual à coluna 'mean' onde 'p_value' < 0.01, e NaN caso contrário.
df['mean'] = df['mean'].round()
df.loc[df['mean']==0, 'mean'] = 0
df['mean_p'] = np.where(df['p_value'] < 0.01, df['mean'], np.nan)
df['mean_text'] = np.where(df['p_value'] < 0.01, df['mean'].astype(int).astype(str), df['mean'].astype(int).apply(lambda x:f'{x}*'))
df['facet_a'] = 'AUC'
df['facet_b'] = f'n={sample}'
list_df.append(df)


results = generate_test_df(sample, 'brier_score')
df = pd.DataFrame(results, columns=['dataset', 'method', 'mean', 'median', 'p_value'])

# Cria uma nova coluna 'mean_p' que é igual à coluna 'mean' onde 'p_value' < 0.01, e NaN caso contrário.
df['mean'] = df['mean'].round()
df.loc[df['mean']==0, 'mean'] = 0
df['mean_p'] = np.where(df['p_value'] < 0.01, df['mean'], np.nan)
df['mean_text'] = np.where(df['p_value'] < 0.01, df['mean'].astype(int).astype(str), df['mean'].astype(int).apply(lambda x:f'{x}*'))
df['facet_a'] = 'Brier Score'
df['facet_b'] = f'n={sample}'
list_df.append(df)

sample = 2000
results = generate_test_df(sample, 'auc')
df = pd.DataFrame(results, columns=['dataset', 'method', 'mean', 'median', 'p_value'])

# Cria uma nova coluna 'mean_p' que é igual à coluna 'mean' onde 'p_value' < 0.01, e NaN caso contrário.
df['mean'] = df['mean'].round()
df.loc[df['mean']==0, 'mean'] = 0
df['mean_p'] = np.where(df['p_value'] < 0.01, df['mean'], np.nan)
df['mean_text'] = np.where(df['p_value'] < 0.01, df['mean'].astype(int).astype(str), df['mean'].astype(int).apply(lambda x:f'{x}*'))
df['facet_a'] = 'AUC'
df['facet_b'] = f'n={sample}'
list_df.append(df)


results = generate_test_df(sample, 'brier_score')
df = pd.DataFrame(results, columns=['dataset', 'method', 'mean', 'median', 'p_value'])

# Cria uma nova coluna 'mean_p' que é igual à coluna 'mean' onde 'p_value' < 0.01, e NaN caso contrário.
df['mean'] = df['mean'].round()
df.loc[df['mean']==0, 'mean'] = 0
df['mean_p'] = np.where(df['p_value'] < 0.01, df['mean'], np.nan)
df['mean_text'] = np.where(df['p_value'] < 0.01, df['mean'].astype(int).astype(str), df['mean'].astype(int).apply(lambda x:f'{x}*'))
df['facet_a'] = 'Brier Score'
df['facet_b'] = f'n={sample}'
list_df.append(df)


df_heatmap = pd.concat(list_df)
df_heatmap["method"] = df_heatmap["method"].str.replace("_logistic", "")
df_heatmap.to_csv('heatmap_metrics.csv')

Metodo Upsampling_logistic em hatespeech


  0%|          | 0/50 [00:00<?, ?it/s]

100%|██████████| 50/50 [00:03<00:00, 15.06it/s]


Começando bootstrap
Metodo SMOTE_logistic em hatespeech


100%|██████████| 50/50 [00:03<00:00, 14.32it/s]


Começando bootstrap
Metodo ADASYN_logistic em hatespeech


100%|██████████| 50/50 [00:03<00:00, 14.27it/s]


Começando bootstrap
Metodo BORDELINE_logistic em hatespeech


100%|██████████| 50/50 [00:03<00:00, 16.22it/s]


Começando bootstrap
Metodo Upsampling_logistic em churn


100%|██████████| 50/50 [00:05<00:00,  8.75it/s]


Começando bootstrap
Metodo SMOTE_logistic em churn


100%|██████████| 50/50 [00:05<00:00,  8.76it/s]


Começando bootstrap
Metodo ADASYN_logistic em churn


100%|██████████| 50/50 [00:05<00:00,  8.73it/s]


Começando bootstrap
Metodo BORDELINE_logistic em churn


100%|██████████| 50/50 [00:05<00:00,  8.48it/s]


Começando bootstrap
Metodo Upsampling_logistic em default_credit


100%|██████████| 50/50 [00:04<00:00, 10.20it/s]


Começando bootstrap
Metodo SMOTE_logistic em default_credit


100%|██████████| 50/50 [00:04<00:00, 10.25it/s]


Começando bootstrap
Metodo ADASYN_logistic em default_credit


100%|██████████| 50/50 [00:04<00:00, 10.28it/s]


Começando bootstrap
Metodo BORDELINE_logistic em default_credit


100%|██████████| 50/50 [00:04<00:00, 10.19it/s]


Começando bootstrap
Metodo Upsampling_logistic em sentiment


100%|██████████| 50/50 [00:06<00:00,  8.21it/s]


Começando bootstrap
Metodo SMOTE_logistic em sentiment


100%|██████████| 50/50 [00:06<00:00,  8.21it/s]


Começando bootstrap
Metodo ADASYN_logistic em sentiment


100%|██████████| 50/50 [00:06<00:00,  8.26it/s]


Começando bootstrap
Metodo BORDELINE_logistic em sentiment


100%|██████████| 50/50 [00:05<00:00,  8.65it/s]


Começando bootstrap
Metodo Upsampling_logistic em diabetes


100%|██████████| 50/50 [00:06<00:00,  7.66it/s]


Começando bootstrap
Metodo SMOTE_logistic em diabetes


100%|██████████| 50/50 [00:06<00:00,  7.79it/s]


Começando bootstrap
Metodo ADASYN_logistic em diabetes


100%|██████████| 50/50 [00:06<00:00,  7.65it/s]


Começando bootstrap
Metodo BORDELINE_logistic em diabetes


100%|██████████| 50/50 [00:06<00:00,  7.87it/s]


Começando bootstrap
Metodo Upsampling_logistic em app_reviews


100%|██████████| 50/50 [00:02<00:00, 18.96it/s]


Começando bootstrap
Metodo SMOTE_logistic em app_reviews


100%|██████████| 50/50 [00:02<00:00, 18.86it/s]


Começando bootstrap
Metodo ADASYN_logistic em app_reviews


100%|██████████| 50/50 [00:02<00:00, 18.70it/s]


Começando bootstrap
Metodo BORDELINE_logistic em app_reviews


100%|██████████| 50/50 [00:02<00:00, 19.68it/s]


Começando bootstrap
Metodo Upsampling_logistic em marketing


100%|██████████| 50/50 [00:03<00:00, 14.50it/s]


Começando bootstrap
Metodo SMOTE_logistic em marketing


100%|██████████| 50/50 [00:03<00:00, 14.12it/s]


Começando bootstrap
Metodo ADASYN_logistic em marketing


100%|██████████| 50/50 [00:03<00:00, 14.53it/s]


Começando bootstrap
Metodo BORDELINE_logistic em marketing


100%|██████████| 50/50 [00:03<00:00, 14.43it/s]


Começando bootstrap
Metodo Upsampling_logistic em womens


100%|██████████| 50/50 [00:02<00:00, 19.42it/s]


Começando bootstrap
Metodo SMOTE_logistic em womens


100%|██████████| 50/50 [00:02<00:00, 20.41it/s]


Começando bootstrap
Metodo ADASYN_logistic em womens


100%|██████████| 50/50 [00:02<00:00, 19.43it/s]


Começando bootstrap
Metodo BORDELINE_logistic em womens


100%|██████████| 50/50 [00:02<00:00, 20.60it/s]


Começando bootstrap
Metodo Upsampling_logistic em hatespeech


100%|██████████| 50/50 [00:01<00:00, 28.36it/s]


Começando bootstrap
Metodo SMOTE_logistic em hatespeech


100%|██████████| 50/50 [00:01<00:00, 26.97it/s]


Começando bootstrap
Metodo ADASYN_logistic em hatespeech


100%|██████████| 50/50 [00:01<00:00, 26.19it/s]


Começando bootstrap
Metodo BORDELINE_logistic em hatespeech


100%|██████████| 50/50 [00:01<00:00, 28.23it/s]


Começando bootstrap
Metodo Upsampling_logistic em churn


100%|██████████| 50/50 [00:03<00:00, 16.66it/s]


Começando bootstrap
Metodo SMOTE_logistic em churn


100%|██████████| 50/50 [00:05<00:00,  9.52it/s]


Começando bootstrap
Metodo ADASYN_logistic em churn


100%|██████████| 50/50 [00:06<00:00,  8.24it/s]


Começando bootstrap
Metodo BORDELINE_logistic em churn


100%|██████████| 50/50 [00:05<00:00,  8.86it/s]


Começando bootstrap
Metodo Upsampling_logistic em default_credit


100%|██████████| 50/50 [00:04<00:00, 12.18it/s]


Começando bootstrap
Metodo SMOTE_logistic em default_credit


100%|██████████| 50/50 [00:06<00:00,  8.21it/s]


Começando bootstrap
Metodo ADASYN_logistic em default_credit


100%|██████████| 50/50 [00:07<00:00,  6.83it/s]


Começando bootstrap
Metodo BORDELINE_logistic em default_credit


100%|██████████| 50/50 [00:05<00:00,  8.58it/s]


Começando bootstrap
Metodo Upsampling_logistic em sentiment


100%|██████████| 50/50 [00:05<00:00,  8.79it/s]


Começando bootstrap
Metodo SMOTE_logistic em sentiment


100%|██████████| 50/50 [00:06<00:00,  7.59it/s]


Começando bootstrap
Metodo ADASYN_logistic em sentiment


100%|██████████| 50/50 [00:06<00:00,  8.08it/s]


Começando bootstrap
Metodo BORDELINE_logistic em sentiment


100%|██████████| 50/50 [00:06<00:00,  7.56it/s]


Começando bootstrap
Metodo Upsampling_logistic em diabetes


100%|██████████| 50/50 [00:06<00:00,  7.80it/s]


Começando bootstrap
Metodo SMOTE_logistic em diabetes


100%|██████████| 50/50 [00:05<00:00,  8.47it/s]


Começando bootstrap
Metodo ADASYN_logistic em diabetes


100%|██████████| 50/50 [00:06<00:00,  7.75it/s]


Começando bootstrap
Metodo BORDELINE_logistic em diabetes


100%|██████████| 50/50 [00:06<00:00,  7.88it/s]


Começando bootstrap
Metodo Upsampling_logistic em app_reviews


100%|██████████| 50/50 [00:05<00:00,  8.88it/s]


Começando bootstrap
Metodo SMOTE_logistic em app_reviews


100%|██████████| 50/50 [00:04<00:00, 11.03it/s]


Começando bootstrap
Metodo ADASYN_logistic em app_reviews


100%|██████████| 50/50 [00:04<00:00, 10.25it/s]


Começando bootstrap
Metodo BORDELINE_logistic em app_reviews


100%|██████████| 50/50 [00:04<00:00, 10.89it/s]


Começando bootstrap
Metodo Upsampling_logistic em marketing


100%|██████████| 50/50 [00:06<00:00,  7.74it/s]


Começando bootstrap
Metodo SMOTE_logistic em marketing


100%|██████████| 50/50 [00:08<00:00,  6.23it/s]


Começando bootstrap
Metodo ADASYN_logistic em marketing


100%|██████████| 50/50 [00:07<00:00,  6.81it/s]


Começando bootstrap
Metodo BORDELINE_logistic em marketing


100%|██████████| 50/50 [00:09<00:00,  5.43it/s]


Começando bootstrap
Metodo Upsampling_logistic em womens


100%|██████████| 50/50 [00:05<00:00,  9.67it/s]


Começando bootstrap
Metodo SMOTE_logistic em womens


100%|██████████| 50/50 [00:05<00:00,  9.43it/s]


Começando bootstrap
Metodo ADASYN_logistic em womens


100%|██████████| 50/50 [00:05<00:00,  9.53it/s]


Começando bootstrap
Metodo BORDELINE_logistic em womens


100%|██████████| 50/50 [00:04<00:00, 10.29it/s]


Começando bootstrap
Metodo Upsampling_logistic em hatespeech


100%|██████████| 50/50 [00:04<00:00, 11.71it/s]


Começando bootstrap
Metodo SMOTE_logistic em hatespeech


100%|██████████| 50/50 [00:04<00:00, 11.08it/s]


Começando bootstrap
Metodo ADASYN_logistic em hatespeech


100%|██████████| 50/50 [00:04<00:00, 11.17it/s]


Começando bootstrap
Metodo BORDELINE_logistic em hatespeech


100%|██████████| 50/50 [00:04<00:00, 10.98it/s]


Começando bootstrap
Metodo Upsampling_logistic em churn


100%|██████████| 50/50 [00:07<00:00,  6.44it/s]


Começando bootstrap
Metodo SMOTE_logistic em churn


100%|██████████| 50/50 [00:07<00:00,  6.75it/s]


Começando bootstrap
Metodo ADASYN_logistic em churn


100%|██████████| 50/50 [00:06<00:00,  8.11it/s]


Começando bootstrap
Metodo BORDELINE_logistic em churn


100%|██████████| 50/50 [00:07<00:00,  7.03it/s]


Começando bootstrap
Metodo Upsampling_logistic em default_credit


100%|██████████| 50/50 [00:04<00:00, 10.95it/s]


Começando bootstrap
Metodo SMOTE_logistic em default_credit


100%|██████████| 50/50 [00:04<00:00, 10.58it/s]


Começando bootstrap
Metodo ADASYN_logistic em default_credit


100%|██████████| 50/50 [00:04<00:00, 11.48it/s]


Começando bootstrap
Metodo BORDELINE_logistic em default_credit


100%|██████████| 50/50 [00:04<00:00, 11.15it/s]


Começando bootstrap
Metodo Upsampling_logistic em sentiment


100%|██████████| 50/50 [00:08<00:00,  6.10it/s]


Começando bootstrap
Metodo SMOTE_logistic em sentiment


100%|██████████| 50/50 [00:08<00:00,  5.68it/s]


Começando bootstrap
Metodo ADASYN_logistic em sentiment


100%|██████████| 50/50 [00:07<00:00,  6.63it/s]


Começando bootstrap
Metodo BORDELINE_logistic em sentiment


100%|██████████| 50/50 [00:07<00:00,  6.32it/s]


Começando bootstrap
Metodo Upsampling_logistic em diabetes


100%|██████████| 50/50 [00:08<00:00,  6.03it/s]


Começando bootstrap
Metodo SMOTE_logistic em diabetes


100%|██████████| 50/50 [00:07<00:00,  6.49it/s]


Começando bootstrap
Metodo ADASYN_logistic em diabetes


100%|██████████| 50/50 [00:07<00:00,  6.53it/s]


Começando bootstrap
Metodo BORDELINE_logistic em diabetes


100%|██████████| 50/50 [00:07<00:00,  6.75it/s]


Começando bootstrap
Metodo Upsampling_logistic em app_reviews


100%|██████████| 50/50 [00:05<00:00,  8.94it/s]


Começando bootstrap
Metodo SMOTE_logistic em app_reviews


100%|██████████| 50/50 [00:06<00:00,  7.67it/s]


Começando bootstrap
Metodo ADASYN_logistic em app_reviews


100%|██████████| 50/50 [00:05<00:00,  8.53it/s]


Começando bootstrap
Metodo BORDELINE_logistic em app_reviews


100%|██████████| 50/50 [00:05<00:00,  8.91it/s]


Começando bootstrap
Metodo Upsampling_logistic em marketing


100%|██████████| 50/50 [00:07<00:00,  6.96it/s]


Começando bootstrap
Metodo SMOTE_logistic em marketing


100%|██████████| 50/50 [00:07<00:00,  7.05it/s]


Começando bootstrap
Metodo ADASYN_logistic em marketing


100%|██████████| 50/50 [00:07<00:00,  6.28it/s]


Começando bootstrap
Metodo BORDELINE_logistic em marketing


100%|██████████| 50/50 [00:07<00:00,  7.10it/s]


Começando bootstrap
Metodo Upsampling_logistic em womens


100%|██████████| 50/50 [00:04<00:00, 10.38it/s]


Começando bootstrap
Metodo SMOTE_logistic em womens


100%|██████████| 50/50 [00:04<00:00, 10.48it/s]


Começando bootstrap
Metodo ADASYN_logistic em womens


100%|██████████| 50/50 [00:04<00:00, 10.20it/s]


Começando bootstrap
Metodo BORDELINE_logistic em womens


100%|██████████| 50/50 [00:05<00:00,  9.94it/s]


Começando bootstrap
Metodo Upsampling_logistic em hatespeech


100%|██████████| 50/50 [00:03<00:00, 13.24it/s]


Começando bootstrap
Metodo SMOTE_logistic em hatespeech


100%|██████████| 50/50 [00:02<00:00, 20.83it/s]


Começando bootstrap
Metodo ADASYN_logistic em hatespeech


100%|██████████| 50/50 [00:02<00:00, 22.87it/s]


Começando bootstrap
Metodo BORDELINE_logistic em hatespeech


100%|██████████| 50/50 [00:02<00:00, 23.86it/s]


Começando bootstrap
Metodo Upsampling_logistic em churn


100%|██████████| 50/50 [00:03<00:00, 14.84it/s]


Começando bootstrap
Metodo SMOTE_logistic em churn


100%|██████████| 50/50 [00:03<00:00, 15.28it/s]


Começando bootstrap
Metodo ADASYN_logistic em churn


100%|██████████| 50/50 [00:03<00:00, 16.53it/s]


Começando bootstrap
Metodo BORDELINE_logistic em churn


100%|██████████| 50/50 [00:03<00:00, 13.85it/s]


Começando bootstrap
Metodo Upsampling_logistic em default_credit


100%|██████████| 50/50 [00:02<00:00, 19.11it/s]


Começando bootstrap
Metodo SMOTE_logistic em default_credit


100%|██████████| 50/50 [00:02<00:00, 19.40it/s]


Começando bootstrap
Metodo ADASYN_logistic em default_credit


100%|██████████| 50/50 [00:02<00:00, 18.85it/s]


Começando bootstrap
Metodo BORDELINE_logistic em default_credit


100%|██████████| 50/50 [00:02<00:00, 17.50it/s]


Começando bootstrap
Metodo Upsampling_logistic em sentiment


100%|██████████| 50/50 [00:04<00:00, 12.26it/s]


Começando bootstrap
Metodo SMOTE_logistic em sentiment


100%|██████████| 50/50 [00:03<00:00, 12.57it/s]


Começando bootstrap
Metodo ADASYN_logistic em sentiment


100%|██████████| 50/50 [00:04<00:00, 12.06it/s]


Começando bootstrap
Metodo BORDELINE_logistic em sentiment


100%|██████████| 50/50 [00:03<00:00, 12.53it/s]


Começando bootstrap
Metodo Upsampling_logistic em diabetes


100%|██████████| 50/50 [00:04<00:00, 12.22it/s]


Começando bootstrap
Metodo SMOTE_logistic em diabetes


100%|██████████| 50/50 [00:04<00:00, 12.42it/s]


Começando bootstrap
Metodo ADASYN_logistic em diabetes


100%|██████████| 50/50 [00:07<00:00,  7.12it/s]


Começando bootstrap
Metodo BORDELINE_logistic em diabetes


100%|██████████| 50/50 [00:07<00:00,  6.88it/s]


Começando bootstrap
Metodo Upsampling_logistic em app_reviews


100%|██████████| 50/50 [00:05<00:00,  8.88it/s]


Começando bootstrap
Metodo SMOTE_logistic em app_reviews


100%|██████████| 50/50 [00:06<00:00,  7.92it/s]


Começando bootstrap
Metodo ADASYN_logistic em app_reviews


100%|██████████| 50/50 [00:05<00:00,  8.43it/s]


Começando bootstrap
Metodo BORDELINE_logistic em app_reviews


100%|██████████| 50/50 [00:06<00:00,  7.88it/s]


Começando bootstrap
Metodo Upsampling_logistic em marketing


100%|██████████| 50/50 [00:07<00:00,  6.44it/s]


Começando bootstrap
Metodo SMOTE_logistic em marketing


100%|██████████| 50/50 [00:07<00:00,  6.46it/s]


Começando bootstrap
Metodo ADASYN_logistic em marketing


100%|██████████| 50/50 [00:08<00:00,  6.24it/s]


Começando bootstrap
Metodo BORDELINE_logistic em marketing


100%|██████████| 50/50 [00:09<00:00,  5.36it/s]


Começando bootstrap
Metodo Upsampling_logistic em womens


100%|██████████| 50/50 [00:05<00:00,  8.45it/s]


Começando bootstrap
Metodo SMOTE_logistic em womens


100%|██████████| 50/50 [00:05<00:00,  9.15it/s]


Começando bootstrap
Metodo ADASYN_logistic em womens


100%|██████████| 50/50 [00:05<00:00,  9.34it/s]


Começando bootstrap
Metodo BORDELINE_logistic em womens


100%|██████████| 50/50 [00:05<00:00,  9.43it/s]


Começando bootstrap
