In [2]:
from time import perf_counter
import numpy as np,os
import pandas as pd
from collections import defaultdict
from sklearn.utils import shuffle
from sklearn.naive_bayes import GaussianNB
from sklearn.tree import DecisionTreeClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import RepeatedStratifiedKFold, StratifiedKFold
from imblearn.under_sampling import InstanceHardnessThreshold, RandomUnderSampler
from imblearn.pipeline import Pipeline

from sklearn.metrics import matthews_corrcoef, precision_recall_curve, auc, accuracy_score, precision_score, recall_score
import seaborn as sns,matplotlib.pyplot as plt

from library.configs import IMBS, CLFS, ENSEMBLES, CV, SCORERS
from library.utils import evaluate, read_data
from library.cleaners import kDN, ih_prob,FilteringEstimator

%load_ext autoreload
%autoreload 2

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


In [3]:
DATASETS = ['groovy-1_5_7.csv','jruby-1.4.0.csv','lucene-2.9.0.csv','jruby-1.7.0.preview1.csv','groovy-1_6_BETA_1.csv',
        'derby-10.2.1.6.csv','wicket-1.5.3.csv','camel-2.9.0.csv','camel-1.4.0.csv','activemq-5.8.0.csv']
DATASETS = [f for f in os.listdir("JIRA/") if 'csv' in f]
len(DATASETS)

32

In [4]:
from sklearn.base import BaseEstimator, TransformerMixin, ClassifierMixin, clone
class IHFilter(BaseEstimator, ClassifierMixin):
    def __init__(self,estimator,threshold=.5):
        self.estimator = estimator
        self.threshold = threshold
        
    def clean(self,X,Y,sample_weight):
        skf = StratifiedKFold(n_splits=5, shuffle=True)
        rf = RandomForestClassifier(n_estimators=50,n_jobs=4)
        
        probabilities = np.zeros(Y.shape[0], dtype=float)
        for train_index, test_index in skf.split(X,Y):
            rf.fit(X[train_index], Y[train_index])
            probs = rf.predict_proba(X[test_index])
            probabilities[test_index] = probs[range(len(test_index)), Y[test_index]]
            
        hardness = 1 - probabilities
        clean_idx = hardness <= self.threshold
        
        try:
            sample_weight = sample_weight[clean_idx]
        except:
            pass
        Xt,Yt = X[clean_idx],Y[clean_idx]
        return Xt,Yt,sample_weight
    
    def fit(self, X, Y,sample_weight=None):
        Xf,Yf,sample_weight = self.clean(X, Y, sample_weight)
#         a,b = np.unique(Y,return_counts=True)[1],np.unique(Yf,return_counts=True)[1]
#         print(a.max()/a.min(),b.max()/b.min(),a,b,Xf.shape,len(Xf)/len(X))
        assert len(np.unique(Yf))==2,"Pos class completely filtered out"
        try:
            self.estimator = self.estimator.fit(Xf, Yf,sample_weight=sample_weight)
        except TypeError as e:
            self.estimator = self.estimator.fit(Xf, Yf)
        return self

    @property
    def classes_(self):
        return self.estimator.classes_

    def predict(self, X):
        return self.estimator.predict(X)
    
    def predict_proba(self, X):
        return self.estimator.predict_proba(X) 

In [5]:
models = {}
for im,samp in IMBS.items():
    for c,clf in CLFS.items():
        models[(im,c)] = Pipeline([('samp',samp),('clf',IHFilter(clf))])
    
models.keys(),len(models)

(dict_keys([('smote', 'dt'), ('smote', 'lr'), ('smote', 'nb'), ('smote', 'svm'), ('smote', 'knn'), ('smote', 'rf'), ('rus', 'dt'), ('rus', 'lr'), ('rus', 'nb'), ('rus', 'svm'), ('rus', 'knn'), ('rus', 'rf'), ('wilson', 'dt'), ('wilson', 'lr'), ('wilson', 'nb'), ('wilson', 'svm'), ('wilson', 'knn'), ('wilson', 'rf'), ('tomek', 'dt'), ('tomek', 'lr'), ('tomek', 'nb'), ('tomek', 'svm'), ('tomek', 'knn'), ('tomek', 'rf'), ('None', 'dt'), ('None', 'lr'), ('None', 'nb'), ('None', 'svm'), ('None', 'knn'), ('None', 'rf')]),
 30)

In [6]:
cols = pd.MultiIndex.from_product([IMBS.keys(),CLFS.keys(),[f.__name__ for f in SCORERS]],names=['imb','clf','metric'])
df = pd.DataFrame(index=DATASETS,columns=cols)
#df = pd.read_csv("IHFilter.csv",header=[0,1,2],index_col=0)

In [8]:
%%time
for it,d in enumerate(DATASETS):
    X,y_noisy,y_real = read_data(d,stats=True)
    if df.loc[d,:].isna().sum()==0:
        print(f"SKIPPING {d}\n")
        continue
    for k in models:
        print(k)
        sd = perf_counter()
        r = evaluate(models[k],X,y_noisy,y_real,CV,SCORERS)
        for f in r:
            df.loc[d,(k[0],k[1],f)] = r[f].mean()
        print(round(perf_counter()-sd,2),[round(r[f].mean(),3) for f in r])
    print()
    df.to_csv("IHFilter.csv")

activemq-5.8.0.csv noise:0.058, imb:15.847,203,3217, Shape:(3420, 65)
('smote', 'dt')
80.03 [0.186, 0.266]
('smote', 'lr')
110.26 [0.255, 0.303]
('smote', 'nb')
59.44 [0.284, 0.402]
('smote', 'svm')
202.99 [0.246, 0.198]
('smote', 'knn')
46.85 [0.205, 0.294]
('smote', 'rf')
57.38 [0.268, 0.282]
('rus', 'dt')
31.73 [0.234, 0.469]
('rus', 'lr')
33.22 [0.258, 0.309]
('rus', 'nb')
30.23 [0.271, 0.457]
('rus', 'svm')
31.73 [0.251, 0.239]
('rus', 'knn')
31.49 [0.239, 0.411]
('rus', 'rf')
31.56 [0.255, 0.326]
('wilson', 'dt')
36.67 [0.233, 0.302]
('wilson', 'lr')
42.51 [0.277, 0.315]
('wilson', 'nb')
39.92 [0.296, 0.401]
('wilson', 'svm')
45.68 [0.301, 0.294]
('wilson', 'knn')
45.31 [0.266, 0.314]
('wilson', 'rf')
45.27 [0.271, 0.33]
('tomek', 'dt')
41.61 [0.258, 0.39]
('tomek', 'lr')
44.43 [0.257, 0.344]
('tomek', 'nb')
43.71 [0.304, 0.351]
('tomek', 'svm')
39.09 [0.264, 0.219]
('tomek', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


34.38 [0.238, 0.382]
('tomek', 'rf')
35.3 [0.283, 0.34]
('None', 'dt')
28.09 [0.264, 0.409]
('None', 'lr')
29.85 [0.255, 0.332]
('None', 'nb')
27.82 [0.307, 0.346]
('None', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


29.6 [0.255, 0.208]
('None', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


29.53 [0.22, 0.389]
('None', 'rf')
30.17 [0.276, 0.336]

groovy-1_6_BETA_1.csv noise:0.128, imb:6.017,117,704, Shape:(821, 65)
('smote', 'dt')
27.93 [0.34, 0.467]
('smote', 'lr')
30.24 [0.341, 0.367]
('smote', 'nb')
27.6 [0.264, 0.405]
('smote', 'svm')
33.48 [0.37, 0.369]
('smote', 'knn')
27.96 [0.305, 0.486]
('smote', 'rf')
30.45 [0.423, 0.462]
('rus', 'dt')
27.41 [0.311, 0.516]
('rus', 'lr')
27.71 [0.343, 0.39]
('rus', 'nb')
27.32 [0.257, 0.412]
('rus', 'svm')
27.52 [0.365, 0.37]
('rus', 'knn')
27.59 [0.345, 0.504]
('rus', 'rf')
28.77 [0.347, 0.472]
('wilson', 'dt')
28.03 [0.393, 0.509]
('wilson', 'lr')
29.29 [0.431, 0.397]
('wilson', 'nb')
28.07 [0.286, 0.412]
('wilson', 'svm')
28.63 [0.316, 0.388]
('wilson', 'knn')
28.25 [0.393, 0.507]
('wilson', 'rf')
30.47 [0.44, 0.475]
('tomek', 'dt')
32.95 [0.415, 0.497]
('tomek', 'lr')
34.25 [0.304, 0.413]
('tomek', 'nb')
31.16 [0.269, 0.41]
('tomek', 'svm')
32.3 [0.376, 0.395]
('tomek', 'knn')
31.57 [0.414, 0.443]
('tomek', 'rf')
33.99 [0.428

  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.5 [0.16, 0.558]
('tomek', 'nb')
29.49 [0.227, 0.499]
('tomek', 'svm')
30.23 [0.178, 0.313]
('tomek', 'knn')
30.02 [0.165, 0.569]
('tomek', 'rf')
31.61 [0.181, 0.499]
('None', 'dt')
27.4 [0.179, 0.631]
('None', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


30.4 [0.141, 0.543]
('None', 'nb')
27.66 [0.214, 0.498]
('None', 'svm')
28.25 [0.17, 0.308]
('None', 'knn')
28.07 [0.158, 0.594]
('None', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


29.03 [0.159, 0.492]

lucene-3.0.0.csv noise:0.185, imb:6.037,190,1147, Shape:(1337, 65)
('smote', 'dt')
28.07 [0.229, 0.385]
('smote', 'lr')
31.0 [0.331, 0.363]
('smote', 'nb')
27.41 [0.296, 0.313]
('smote', 'svm')
46.37 [0.354, 0.355]
('smote', 'knn')
28.35 [0.263, 0.38]
('smote', 'rf')
32.43 [0.249, 0.294]
('rus', 'dt')
27.68 [0.302, 0.511]
('rus', 'lr')
28.23 [0.346, 0.367]
('rus', 'nb')
27.37 [0.297, 0.36]
('rus', 'svm')
27.7 [0.348, 0.332]
('rus', 'knn')
27.4 [0.287, 0.42]
('rus', 'rf')
28.78 [0.348, 0.33]
('wilson', 'dt')
30.58 [0.317, 0.469]
('wilson', 'lr')
32.32 [0.341, 0.358]
('wilson', 'nb')
29.72 [0.306, 0.37]
('wilson', 'svm')
30.35 [0.322, 0.317]
('wilson', 'knn')
29.51 [0.3, 0.367]
('wilson', 'rf')
31.03 [0.335, 0.325]
('tomek', 'dt')
29.2 [0.183, 0.312]
('tomek', 'lr')
34.46 [0.181, 0.288]
('tomek', 'nb')
29.7 [0.279, 0.326]
('tomek', 'svm')
30.44 [0.168, 0.241]
('tomek', 'knn')
29.75 [0.119, 0.249]
('tomek', 'rf')
31.18 [0.124, 0.267]
('None', 'dt')
28.06 [0.177, 0.30

  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


72.29 [0.178, 0.338]
('tomek', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


73.39 [0.175, 0.249]
('tomek', 'nb')
71.48 [0.253, 0.259]
('tomek', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


74.29 [0.148, 0.112]
('tomek', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


80.48 [0.126, 0.306]
('tomek', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


72.18 [0.125, 0.243]
('None', 'dt')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


40.66 [0.178, 0.401]
('None', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


43.62 [0.144, 0.24]
('None', 'nb')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


40.79 [0.233, 0.261]
('None', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


44.44 [0.099, 0.107]
('None', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


49.97 [0.111, 0.311]
('None', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


43.52 [0.108, 0.247]

wicket-1.5.3.csv noise:0.064, imb:26.720,93,2485, Shape:(2578, 65)
('smote', 'dt')
43.04 [0.116, 0.163]
('smote', 'lr')
49.65 [0.163, 0.151]
('smote', 'nb')
40.98 [0.213, 0.33]
('smote', 'svm')
139.66 [0.153, 0.133]
('smote', 'knn')
43.03 [0.136, 0.202]
('smote', 'rf')
54.98 [0.136, 0.136]
('rus', 'dt')
27.89 [0.22, 0.46]
('rus', 'lr')
28.5 [0.217, 0.19]
('rus', 'nb')
27.59 [0.216, 0.427]
('rus', 'svm')
28.06 [0.221, 0.158]
('rus', 'knn')
27.96 [0.216, 0.376]
('rus', 'rf')
28.96 [0.22, 0.316]
('wilson', 'dt')
37.77 [0.14, 0.202]
('wilson', 'lr')
34.79 [0.13, 0.213]
('wilson', 'nb')
32.62 [0.208, 0.253]
('wilson', 'svm')
34.59 [0.142, 0.131]
('wilson', 'knn')
33.93 [0.123, 0.199]
('wilson', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


34.68 [0.125, 0.199]
('tomek', 'dt')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.88 [0.106, 0.331]
('tomek', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


34.49 [0.124, 0.222]
('tomek', 'nb')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.97 [0.09, 0.169]
('tomek', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.44 [0.09, 0.088]
('tomek', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.27 [0.114, 0.226]
('tomek', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.72 [0.112, 0.193]
('None', 'dt')
ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out
ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


27.76 [0.101, 0.304]
('None', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


28.4 [0.104, 0.22]
('None', 'nb')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


27.77 [0.037, 0.293]
('None', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


29.94 [0.079, 0.086]
('None', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


29.39 [0.077, 0.266]
('None', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


29.32 [0.12, 0.179]

lucene-3.1.csv noise:0.120, imb:7.477,331,2475, Shape:(2806, 65)
('smote', 'dt')
43.41 [0.158, 0.285]
('smote', 'lr')
50.76 [0.163, 0.233]
('smote', 'nb')
41.54 [0.184, 0.27]
('smote', 'svm')
115.72 [0.158, 0.135]
('smote', 'knn')
45.16 [0.149, 0.284]
('smote', 'rf')
52.34 [0.197, 0.155]
('rus', 'dt')
27.75 [0.154, 0.367]
('rus', 'lr')
29.23 [0.169, 0.219]
('rus', 'nb')
27.61 [0.191, 0.298]
('rus', 'svm')
28.46 [0.16, 0.139]
('rus', 'knn')
28.08 [0.162, 0.318]
('rus', 'rf')
29.36 [0.156, 0.243]
('wilson', 'dt')
33.81 [0.175, 0.307]
('wilson', 'lr')
36.74 [0.2, 0.228]
('wilson', 'nb')
34.02 [0.192, 0.279]
('wilson', 'svm')
38.26 [0.189, 0.174]
('wilson', 'knn')
35.35 [0.173, 0.247]
('wilson', 'rf')
37.37 [0.188, 0.185]
('tomek', 'dt')
33.13 [0.16, 0.226]
('tomek', 'lr')
37.78 [0.185, 0.209]
('tomek', 'nb')
34.64 [0.175, 0.264]
('tomek', 'svm')
42.61 [0.165, 0.178]
('tomek', 'knn')
34.93 [0.148, 0.161]
('tomek', 'rf')
37.21 [0.196, 0.184]
('None', 'dt')
29.61 [0.17, 

  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


29.39 [0.147, 0.578]
('tomek', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


30.72 [0.137, 0.504]
('tomek', 'nb')
29.49 [0.205, 0.396]
('tomek', 'svm')
29.75 [0.163, 0.321]
('tomek', 'knn')
29.82 [0.144, 0.557]
('tomek', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.12 [0.134, 0.474]
('None', 'dt')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


27.44 [0.127, 0.619]
('None', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


29.05 [0.124, 0.507]
('None', 'nb')
27.2 [0.194, 0.402]
('None', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


27.79 [0.139, 0.292]
('None', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


27.84 [0.122, 0.547]
('None', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


29.25 [0.108, 0.464]

camel-2.11.0.csv noise:0.024, imb:43.230,200,8646, Shape:(8846, 65)
('smote', 'dt')
76.95 [0.226, 0.179]
('smote', 'lr')
99.9 [0.169, 0.14]
('smote', 'nb')
68.68 [0.177, 0.267]
('smote', 'svm')
1295.0 [0.177, 0.13]
('smote', 'knn')
95.43 [0.175, 0.248]
('smote', 'rf')
111.87 [0.297, 0.281]
('rus', 'dt')
31.39 [0.153, 0.412]
('rus', 'lr')
31.39 [0.159, 0.134]
('rus', 'nb')
31.41 [0.151, 0.33]
('rus', 'svm')
32.28 [0.163, 0.135]
('rus', 'knn')
32.14 [0.176, 0.353]
('rus', 'rf')
32.86 [0.18, 0.246]
('wilson', 'dt')
80.12 [0.187, 0.235]
('wilson', 'lr')
83.08 [0.116, 0.167]
('wilson', 'nb')
79.53 [0.197, 0.255]
('wilson', 'svm')
88.7 [0.186, 0.144]
('wilson', 'knn')
88.3 [0.162, 0.204]
('wilson', 'rf')
83.57 [0.181, 0.19]
('tomek', 'dt')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


73.93 [0.076, 0.214]
('tomek', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


77.06 [0.035, 0.131]
('tomek', 'nb')
74.04 [0.147, 0.18]
('tomek', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


81.48 [0.037, 0.087]
('tomek', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


84.5 [0.055, 0.2]
('tomek', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


77.04 [0.076, 0.133]
('None', 'dt')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


42.94 [0.088, 0.256]
('None', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


52.35 [0.007, 0.108]
('None', 'nb')
46.52 [0.131, 0.158]
('None', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


49.61 [0.047, 0.083]
('None', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


52.67 [0.051, 0.21]
('None', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


44.99 [0.073, 0.12]

jruby-1.7.0.preview1.csv noise:0.099, imb:8.902,163,1451, Shape:(1614, 65)
('smote', 'dt')
32.49 [0.242, 0.362]
('smote', 'lr')
41.03 [0.25, 0.326]
('smote', 'nb')
31.71 [0.295, 0.442]
('smote', 'svm')
56.81 [0.278, 0.234]
('smote', 'knn')
32.15 [0.219, 0.382]
('smote', 'rf')
36.94 [0.3, 0.3]
('rus', 'dt')
31.34 [0.276, 0.474]
('rus', 'lr')
31.58 [0.287, 0.321]
('rus', 'nb')
31.33 [0.303, 0.474]
('rus', 'svm')
31.58 [0.302, 0.296]
('rus', 'knn')
31.5 [0.289, 0.43]
('rus', 'rf')
32.73 [0.279, 0.398]
('wilson', 'dt')
32.86 [0.323, 0.421]
('wilson', 'lr')
37.33 [0.322, 0.365]
('wilson', 'nb')
33.19 [0.306, 0.448]
('wilson', 'svm')
33.83 [0.329, 0.295]
('wilson', 'knn')
33.27 [0.309, 0.382]
('wilson', 'rf')
34.42 [0.321, 0.365]
('tomek', 'dt')
32.87 [0.295, 0.352]
('tomek', 'lr')
37.68 [0.294, 0.339]
('tomek', 'nb')
32.9 [0.321, 0.398]
('tomek', 'svm')
33.76 [0.307, 0.296]
('tomek', 'knn')
33.18 [0.339, 0.347]
('tomek', 'rf')
34.4 [0.306, 0.322]
('None', 'dt')
31.48 [0

  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


32.87 [0.123, 0.314]
('tomek', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


36.7 [0.102, 0.39]
('tomek', 'nb')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.08 [0.249, 0.385]
('tomek', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.4 [0.103, 0.16]
('tomek', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.3 [0.068, 0.345]
('tomek', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


34.34 [0.094, 0.325]
('None', 'dt')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.37 [0.078, 0.349]
('None', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.36 [0.079, 0.373]
('None', 'nb')
ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.16 [0.221, 0.36]
('None', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.96 [0.067, 0.144]
('None', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.96 [0.056, 0.349]
('None', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


32.77 [0.069, 0.336]

camel-2.10.0.csv noise:0.053, imb:24.447,311,7603, Shape:(7914, 65)
('smote', 'dt')
81.96 [0.164, 0.196]
('smote', 'lr')
94.59 [0.186, 0.206]
('smote', 'nb')
74.92 [0.242, 0.367]
('smote', 'svm')
1004.35 [0.173, 0.149]
('smote', 'knn')
86.25 [0.176, 0.251]
('smote', 'rf')
104.39 [0.234, 0.195]
('rus', 'dt')
31.5 [0.177, 0.431]
('rus', 'lr')
31.34 [0.197, 0.214]
('rus', 'nb')
31.38 [0.219, 0.415]
('rus', 'svm')
32.45 [0.207, 0.174]
('rus', 'knn')
32.37 [0.209, 0.362]
('rus', 'rf')
33.01 [0.2, 0.308]
('wilson', 'dt')
67.24 [0.252, 0.286]
('wilson', 'lr')
70.06 [0.278, 0.245]
('wilson', 'nb')
66.18 [0.286, 0.365]
('wilson', 'svm')
76.48 [0.279, 0.205]
('wilson', 'knn')
75.28 [0.269, 0.281]
('wilson', 'rf')
70.56 [0.266, 0.233]
('tomek', 'dt')
68.04 [0.131, 0.193]
('tomek', 'lr')
69.89 [0.184, 0.226]
('tomek', 'nb')
67.19 [0.284, 0.336]
('tomek', 'svm')
75.05 [0.17, 0.129]
('tomek', 'knn')
74.81 [0.157, 0.24]
('tomek', 'rf')
71.07 [0.139, 0.191]
('None', 'dt')
42.77 [

  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


52.17 [0.112, 0.21]
('None', 'nb')
43.53 [0.284, 0.332]
('None', 'svm')
49.97 [0.144, 0.115]
('None', 'knn')
50.24 [0.105, 0.232]
('None', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


45.03 [0.112, 0.181]

derby-10.2.1.6.csv noise:0.290, imb:9.906,180,1783, Shape:(1963, 65)
('smote', 'dt')
34.24 [0.285, 0.598]
('smote', 'lr')
49.57 [0.383, 0.64]
('smote', 'nb')
32.52 [0.438, 0.684]
('smote', 'svm')
80.01 [0.417, 0.662]
('smote', 'knn')
33.39 [0.305, 0.591]
('smote', 'rf')
39.78 [0.355, 0.686]
('rus', 'dt')
31.39 [0.387, 0.665]
('rus', 'lr')
31.57 [0.441, 0.691]
('rus', 'nb')
31.29 [0.453, 0.694]
('rus', 'svm')
31.8 [0.424, 0.684]
('rus', 'knn')
31.51 [0.418, 0.673]
('rus', 'rf')
32.74 [0.431, 0.669]
('wilson', 'dt')
34.21 [0.326, 0.646]
('wilson', 'lr')
39.85 [0.34, 0.699]
('wilson', 'nb')
34.15 [0.42, 0.676]
('wilson', 'svm')
35.58 [0.335, 0.638]
('wilson', 'knn')
34.63 [0.322, 0.669]
('wilson', 'rf')
35.95 [0.306, 0.679]
('tomek', 'dt')
34.01 [0.181, 0.632]
('tomek', 'lr')
39.04 [0.164, 0.639]
('tomek', 'nb')
34.04 [0.377, 0.664]
('tomek', 'svm')
34.9 [0.153, 0.466]
('tomek', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


34.55 [0.117, 0.64]
('tomek', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


35.94 [0.143, 0.647]
('None', 'dt')
31.63 [0.167, 0.658]
('None', 'lr')
32.68 [0.149, 0.631]
('None', 'nb')
31.24 [0.382, 0.669]
('None', 'svm')
32.44 [0.12, 0.476]
('None', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.96 [0.083, 0.642]
('None', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.38 [0.11, 0.642]

jruby-1.5.0.csv noise:0.218, imb:3.098,276,855, Shape:(1131, 65)
('smote', 'dt')
31.93 [0.292, 0.482]
('smote', 'lr')
32.71 [0.33, 0.406]
('smote', 'nb')
31.42 [0.346, 0.513]
('smote', 'svm')
39.75 [0.336, 0.298]
('smote', 'knn')
31.83 [0.288, 0.491]
('smote', 'rf')
34.32 [0.363, 0.434]
('rus', 'dt')
31.33 [0.288, 0.531]
('rus', 'lr')
31.45 [0.328, 0.432]
('rus', 'nb')
31.3 [0.332, 0.531]
('rus', 'svm')
31.89 [0.333, 0.341]
('rus', 'knn')
31.55 [0.323, 0.538]
('rus', 'rf')
32.85 [0.317, 0.466]
('wilson', 'dt')
32.26 [0.308, 0.544]
('wilson', 'lr')
32.79 [0.329, 0.44]
('wilson', 'nb')
32.09 [0.312, 0.537]
('wilson', 'svm')
33.0 [0.336, 0.348]
('wilson', 'knn')
32.15 [0.321, 0.53]
('wilson', 'rf')
33.59 [0.329, 0.487]
('tomek', 'dt')
32.29 [0.359, 0.486]
('tomek', 'lr')
34.79 [0.374, 0.438]
('tomek', 'nb')
32.2 [0.376, 0.501]
('tomek', 'svm')
33.37 [0.419, 0.398]
('tomek', 'knn')
32.37 [0.374, 0.499]
('tomek', 'rf')
33.86 [0.386, 0.442]
('None', 'dt')
31.45 [0.352, 0

  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


40.65 [0.125, 0.615]
('tomek', 'nb')
34.48 [0.381, 0.642]
('tomek', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


36.86 [0.141, 0.402]
('tomek', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


35.17 [0.059, 0.564]
('tomek', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


36.45 [0.114, 0.55]
('None', 'dt')
31.52 [0.111, 0.589]
('None', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


32.27 [0.089, 0.603]
('None', 'nb')
31.29 [0.375, 0.639]
('None', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


36.23 [0.108, 0.395]
('None', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


32.45 [0.034, 0.548]
('None', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.52 [0.089, 0.524]

lucene-2.9.0.csv noise:0.226, imb:3.921,278,1090, Shape:(1368, 65)
('smote', 'dt')
32.13 [0.294, 0.502]
('smote', 'lr')
36.62 [0.359, 0.46]
('smote', 'nb')
31.49 [0.325, 0.473]
('smote', 'svm')
46.31 [0.388, 0.457]
('smote', 'knn')
32.07 [0.306, 0.491]
('smote', 'rf')
35.54 [0.348, 0.423]
('rus', 'dt')
31.36 [0.316, 0.547]
('rus', 'lr')
31.39 [0.374, 0.483]
('rus', 'nb')
31.35 [0.321, 0.488]
('rus', 'svm')
30.35 [0.375, 0.452]
('rus', 'knn')
31.52 [0.326, 0.514]
('rus', 'rf')
32.96 [0.364, 0.445]
('wilson', 'dt')
32.81 [0.342, 0.559]
('wilson', 'lr')
35.9 [0.38, 0.497]
('wilson', 'nb')
32.83 [0.316, 0.509]
('wilson', 'svm')
34.09 [0.363, 0.456]
('wilson', 'knn')
33.08 [0.343, 0.519]
('wilson', 'rf')
34.29 [0.369, 0.449]
('tomek', 'dt')
32.83 [0.24, 0.441]
('tomek', 'lr')
37.12 [0.262, 0.446]
('tomek', 'nb')
32.75 [0.333, 0.478]
('tomek', 'svm')
35.21 [0.274, 0.428]
('tomek', 'knn')
33.01 [0.238, 0.402]
('tomek', 'rf')
34.55 [0.26, 0.422]
('None', 'dt')
31.61 [0.23

  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


32.58 [0.231, 0.357]
('tomek', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


32.5 [0.225, 0.538]
('tomek', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.65 [0.24, 0.482]
('None', 'dt')
31.4 [0.231, 0.576]
('None', 'lr')
31.37 [0.223, 0.577]
('None', 'nb')
31.29 [0.328, 0.55]
('None', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.78 [0.222, 0.352]
('None', 'knn')
31.71 [0.212, 0.527]
('None', 'rf')
32.9 [0.248, 0.481]

camel-1.4.0.csv noise:0.281, imb:3.174,363,1152, Shape:(1515, 65)
('smote', 'dt')
31.9 [0.263, 0.478]
('smote', 'lr')
35.11 [0.295, 0.473]
('smote', 'nb')
31.45 [0.324, 0.516]
('smote', 'svm')
48.84 [0.347, 0.443]
('smote', 'knn')
32.17 [0.269, 0.46]
('smote', 'rf')
35.19 [0.34, 0.462]
('rus', 'dt')
31.36 [0.29, 0.543]
('rus', 'lr')
31.37 [0.322, 0.508]
('rus', 'nb')
31.32 [0.337, 0.514]
('rus', 'svm')
32.21 [0.354, 0.49]
('rus', 'knn')
31.64 [0.346, 0.533]
('rus', 'rf')
32.89 [0.33, 0.49]
('wilson', 'dt')
32.96 [0.314, 0.563]
('wilson', 'lr')
36.86 [0.34, 0.525]
('wilson', 'nb')
33.1 [0.33, 0.523]
('wilson', 'svm')
33.96 [0.361, 0.481]
('wilson', 'knn')
33.22 [0.357, 0.557]
('wilson', 'rf')
34.47 [0.336, 0.508]
('tomek', 'dt')
33.15 [0.31, 0.487]
('tomek', 'lr')
38.07 [0.362, 0.498]
('tomek', 'nb')
33.03 [0.328, 0.52]
('tomek', 'svm')
34.96 [0.359, 0.475]
('tomek', 'knn')
33.48 [0.316, 0.485]

  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


38.21 [0.161, 0.453]
('tomek', 'nb')
33.51 [0.393, 0.489]
('tomek', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.87 [0.161, 0.228]
('tomek', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.96 [0.149, 0.444]
('tomek', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


35.07 [0.149, 0.404]
('None', 'dt')
31.47 [0.122, 0.431]
('None', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.37 [0.128, 0.423]
('None', 'nb')
31.31 [0.375, 0.483]
('None', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.99 [0.152, 0.218]
('None', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


32.06 [0.141, 0.449]
('None', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.11 [0.115, 0.386]

derby-10.5.1.1.csv noise:0.126, imb:14.028,180,2525, Shape:(2705, 65)
('smote', 'dt')
46.67 [0.265, 0.407]
('smote', 'lr')
58.57 [0.323, 0.454]
('smote', 'nb')
44.63 [0.377, 0.51]
('smote', 'svm')
126.88 [0.329, 0.418]
('smote', 'knn')
46.43 [0.303, 0.422]
('smote', 'rf')
53.92 [0.333, 0.454]
('rus', 'dt')
31.38 [0.311, 0.511]
('rus', 'lr')
31.31 [0.347, 0.461]
('rus', 'nb')
31.34 [0.371, 0.524]
('rus', 'svm')
31.66 [0.359, 0.477]
('rus', 'knn')
31.55 [0.327, 0.486]
('rus', 'rf')
32.68 [0.328, 0.444]
('wilson', 'dt')
36.57 [0.334, 0.481]
('wilson', 'lr')
40.71 [0.352, 0.475]
('wilson', 'nb')
36.26 [0.383, 0.508]
('wilson', 'svm')
38.5 [0.348, 0.434]
('wilson', 'knn')
37.23 [0.312, 0.462]
('wilson', 'rf')
38.75 [0.342, 0.47]
('tomek', 'dt')
35.9 [0.251, 0.493]
('tomek', 'lr')
42.1 [0.253, 0.464]
('tomek', 'nb')
35.51 [0.382, 0.504]
('tomek', 'svm')
37.7 [0.25, 0.354]
('tomek', 'knn')
36.83 [0.207, 0.465]
('tomek', 'rf')
38.07 [0.226, 0.458]
('None', 'dt')
31.81 [0.

  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


56.29 [0.086, 0.182]
('rus', 'dt')
31.33 [0.151, 0.368]
('rus', 'lr')
30.98 [0.192, 0.172]
('rus', 'nb')
31.2 [0.182, 0.332]
('rus', 'svm')
31.41 [0.194, 0.199]
('rus', 'knn')
31.42 [0.201, 0.301]
('rus', 'rf')
32.58 [0.174, 0.214]
('wilson', 'dt')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


35.82 [0.029, 0.241]
('wilson', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


40.08 [0.038, 0.195]
('wilson', 'nb')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


35.89 [0.082, 0.198]
('wilson', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


36.81 [0.023, 0.087]
('wilson', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


36.99 [0.022, 0.158]
('wilson', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


37.43 [0.021, 0.163]
('tomek', 'dt')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


34.64 [0.035, 0.411]
('tomek', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


39.78 [0.026, 0.198]
('tomek', 'nb')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


34.66 [0.014, 0.441]
('tomek', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


36.65 [0.012, 0.08]
('tomek', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


35.72 [0.0, 0.202]
('tomek', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


36.22 [0.0, 0.203]
('None', 'dt')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.34 [0.048, 0.431]
('None', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.79 [0.027, 0.189]
('None', 'nb')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.28 [0.026, 0.382]
('None', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


34.31 [0.004, 0.074]
('None', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


32.72 [0.0, 0.266]
('None', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


ERROR!!! Pos class completely filtered out


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


32.77 [0.0, 0.19]

hive-0.9.0.csv noise:0.179, imb:25.717,53,1363, Shape:(1416, 65)
('smote', 'dt')
32.64 [0.274, 0.491]
('smote', 'lr')
38.41 [0.366, 0.524]
('smote', 'nb')
31.89 [0.464, 0.606]
('smote', 'svm')
47.13 [0.37, 0.523]
('smote', 'knn')
32.09 [0.313, 0.472]
('smote', 'rf')
36.27 [0.329, 0.535]
('rus', 'dt')
31.27 [0.43, 0.594]
('rus', 'lr')
30.86 [0.438, 0.591]
('rus', 'nb')
31.35 [0.426, 0.597]
('rus', 'svm')
31.37 [0.445, 0.589]
('rus', 'knn')
31.41 [0.447, 0.607]
('rus', 'rf')
32.57 [0.447, 0.596]
('wilson', 'dt')
33.1 [0.318, 0.562]
('wilson', 'lr')
36.32 [0.314, 0.575]
('wilson', 'nb')
33.17 [0.455, 0.596]
('wilson', 'svm')
33.62 [0.314, 0.454]
('wilson', 'knn')
33.47 [0.273, 0.594]
('wilson', 'rf')
34.5 [0.304, 0.587]
('tomek', 'dt')
32.71 [0.207, 0.568]
('tomek', 'lr')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


35.3 [0.217, 0.564]
('tomek', 'nb')
32.77 [0.378, 0.578]
('tomek', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.21 [0.206, 0.349]
('tomek', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.05 [0.143, 0.577]
('tomek', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


34.14 [0.176, 0.547]
('None', 'dt')
31.49 [0.191, 0.547]
('None', 'lr')
31.63 [0.217, 0.559]
('None', 'nb')
31.28 [0.366, 0.579]
('None', 'svm')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.74 [0.201, 0.339]
('None', 'knn')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


31.72 [0.126, 0.57]
('None', 'rf')


  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)
  mcc = cov_ytyp / np.sqrt(cov_ytyt * cov_ypyp)


33.01 [0.151, 0.538]

CPU times: user 11h 9min 27s, sys: 25min 3s, total: 11h 34min 31s
Wall time: 10h 46min 29s
