### Trying different classifiers on data of syndromic patients and ID controls
Overview of this notebook:

First the deepface representations of the cropped images are read in from an Excel file. The data is then plotted by using either t-sne or PCA for dimension reduction. It is clear that there aren't two clear clusters.

In the rest of the notebook the following classifiers are tested: k-NN, SVM, Random Forest, Gradient Boosting, AdaBoost, Gaussian Naive Bayes. In the end also an ensemble of all these methods or some of them is tried. None outperforming the Gradient Boosting classifier. 

To normalize the data either Normalizer (unit form) or StandardScaler (z = (x - mean)/std) is used, without any specific difference in performance yet.  

In [1]:
import pandas as pd
import numpy as np
import csv
from tqdm import tqdm
import itertools
from sklearn.model_selection import cross_val_score, LeaveOneOut
from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import Normalizer, StandardScaler
from sklearn.ensemble import GradientBoostingClassifier, RandomForestClassifier, VotingClassifier, AdaBoostClassifier
from sklearn.svm import SVC
from sklearn.tree import DecisionTreeClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import roc_auc_score, accuracy_score, confusion_matrix, roc_curve
from sklearn.manifold import TSNE
from sklearn.decomposition import PCA
%matplotlib inline
import matplotlib.pyplot as plt
from datetime import date
from os.path import join, isfile
from os import listdir
import time
import seaborn as sns

In [2]:
def read_rep(syn_name, syn_csv, ID_csv, data_dir):
    
    # open directories
    syn_dir = data_dir+"\\{}-patients".format(syn_name)
    ID_dir = data_dir+ "\\{}-selected-ID-controls".format(syn_name)

    # get list of filenames
    files_syn = [f for f in listdir(syn_dir) if (isfile(join(syn_dir, f))) and ".jpg" in f]
    files_ID = [f for f in listdir(ID_dir) if (isfile(join(ID_dir, f))) and (".jpg" in f or ".JPG" in f) ]
    
    data = []
    labels = []

    for i, csv_file in enumerate([ID_csv, syn_csv]):
        with open (csv_file, newline='') as file:
            reader = csv.reader(file, delimiter=',')
            for row in reader:
                if row[0] in files_syn or row[0] in files_ID:
                    rep = list(map(float, row[1:]))
                    data.append(rep)
                    labels.append(i)

    return np.array(data), np.array(labels)

In [3]:
def read_rep2(syn_name, syn_csv, ID_csv, data_dir):
    
    # open directories
    syn_dir = data_dir+"\\{}-patients".format(syn_name)
    ID_dir = data_dir+ "\\{}-selected-ID-controls".format(syn_name)

    # get list of filenames
    files_syn = [f for f in listdir(syn_dir) if (isfile(join(syn_dir, f))) and ".jpg" in f]
    files_ID = [f for f in listdir(ID_dir) if (isfile(join(ID_dir, f))) and (".jpg" in f or ".JPG" in f) ]
    
    data = []
    labels = []

    for i, csv_file in enumerate([ID_csv, syn_csv]):
        with open (csv_file, newline='') as file:
            reader = csv.reader(file, delimiter=',')
            for row in reader:
                if row[0] in files_syn or row[0] + ".jpg" in files_ID or row[0] + ".JPG" in files_ID:
                    rep = list(map(float, row[1:]))
                    data.append(row)
                    labels.append(i)
    
    return np.array(data), np.array(labels)

In [4]:
def plot_pca_tsne(data, labels, lowest_age = -1, highest_age = -1):
    plt.figure(figsize=(12,6))
    plt.plot([1,2])

    # visualize data in tnse (men/women)
    X_embedded_tsne = TSNE(n_components=2, init='pca').fit_transform(data)

    plt.subplot(121)
    unique = list(set(labels))
    colors = [plt.cm.jet(float(i)/max(unique)) for i in unique]
    for i, u in enumerate(unique):
        xi = [X_embedded_tsne[j, 0] for j  in range(len(X_embedded_tsne[:,0])) if labels[j] == u]
        yi = [X_embedded_tsne[j, 1] for j  in range(len(X_embedded_tsne[:,1])) if labels[j] == u]
        plt.scatter(xi, yi, c=[colors[i]], label=str(u))
    plt.legend()
    plt.title("t-sne for age range {}-{}".format(lowest_age, highest_age))

    # visualize data in pca (men/women)
    X_embedded_pca = PCA(n_components=2).fit_transform(data)

    plt.subplot(122)
    unique = list(set(labels))
    colors = [plt.cm.jet(float(i)/max(unique)) for i in unique]
    for i, u in enumerate(unique):
        xi = [X_embedded_pca[j, 0] for j  in range(len(X_embedded_pca[:,0])) if labels[j] == u]
        yi = [X_embedded_pca[j, 1] for j  in range(len(X_embedded_pca[:,1])) if labels[j] == u]
        plt.scatter(xi, yi, c=[colors[i]], label=str(u))
    plt.legend()
    plt.title("pca for age range{}-{}".format(lowest_age, highest_age))

    plt.show()

In [5]:
def plot_roc_curve(y_true, y_pred): 
    fpr, tpr, thresholds = roc_curve(y_true, y_pred)
    plt.figure(1, figsize=(12,6))
    roc_auc = roc_auc_score(y_true, y_pred)
    plt.plot(fpr, tpr, lw=2, alpha=0.5, label='LOOCV ROC (AUC = %0.2f)' % (roc_auc))
    plt.plot([0, 1], [0, 1], linestyle='--', lw=2, color='k', label='Chance level', alpha=.8)
    plt.xlim([-0.05, 1.05])
    plt.ylim([-0.05, 1.05])
    plt.xlabel('False Positive Rate')
    plt.ylabel('True Positive Rate')
    plt.title('Receiver operating characteristic example')
    plt.legend(loc="lower right")
    plt.grid()
    plt.show()

In [6]:
def normalize(data, i):

    if i == 0:
        return data
    
    if i == 1:
        return Normalizer().fit_transform(data)
        
    if i == 2:
        return StandardScaler().fit_transform(data)

### Method 1: k-NN

In [7]:
def knn_classifier(data, labels):
    k_values = [3,5,7,9,11,13,15]
    best_aroc = 0
    best_k = 0

    for k in tqdm(k_values):
        # can't have more neighbors than samples
        if k < data.shape[0]:
            for i in [0, 1, 2]:
                data = normalize(data, i) 
                all_y, all_probs, all_preds = [], [], [] 
                loo = LeaveOneOut()

                # leave one out split and make prediction
                for train, test in loo.split(data):
                    all_y.append(labels[test])
                    model = KNeighborsClassifier(n_neighbors=k, weights='distance')
                    model = model.fit(data[train], labels[train])                
                    all_probs.append(model.predict_proba(data[test].reshape(1, -1))[:,1])
                    all_preds.append(model.predict(data[test].reshape(1, -1)))

                # based on all predictions make aroc curve and confusion matrix
                aroc = roc_auc_score(all_y, all_probs)
                tn, fp, fn, tp = confusion_matrix(all_y, all_preds).ravel()
                spec = tn / (tn+fp)  
                sens = tp / (tp+fn)

                if aroc > best_aroc:
                    best_aroc, best_spec, best_sens, best_norm = aroc, spec, sens, i 
                    best_k = k
                
    return best_k, best_norm, best_aroc, best_spec, best_sens

### Method 2: SVM

In [8]:
def svm_classifier(data, labels):
    kernels = ['linear', 'poly', 'rbf', 'sigmoid']
    best_aroc = 0
    best_kernel = None

    for k in tqdm(kernels):
        for i in [0, 1, 2]:
            
            data = normalize(data, i) 
            all_y, all_probs, all_preds = [], [], [] 
            loo = LeaveOneOut()
            
            # leave one out split and make prediction
            for train, test in loo.split(data):
                all_y.append(labels[test])
                model = SVC(kernel=k, probability=True)
                model = model.fit(data[train], labels[train])
                all_probs.append(model.predict_proba(data[test].reshape(1, -1))[:,1])
                all_preds.append(model.predict(data[test].reshape(1, -1)))

            # based on all predictions make aroc curve and confusion matrix
            aroc = roc_auc_score(all_y, all_probs)
            tn, fp, fn, tp = confusion_matrix(all_y, all_preds).ravel()
            spec = tn / (tn+fp)  
            sens = tp / (tp+fn)
               
            if aroc > best_aroc:
                best_aroc, best_spec, best_sens, best_norm = aroc, spec, sens, i 
                best_kernel = k
                
    return best_kernel, best_norm, best_aroc, best_spec, best_sens

### Method 3: Random Forest

In [9]:
def rf_classifier(data, labels):
    best_aroc = 0
    estimators = [5, 10, 20] #, 40, 60, 80]
    best_estimator_rf = 0
    best_norm = -1

    for est in tqdm(estimators):
        for i in [0, 1, 2]:
            
            data = normalize(data, i) 
            all_y, all_probs, all_preds = [], [], [] 
            loo = LeaveOneOut()
            
            # leave one out split and make prediction
            for train, test in loo.split(data):
                all_y.append(labels[test])
                model = RandomForestClassifier(n_estimators=est)
                model = model.fit(data[train], labels[train])
                all_probs.append(model.predict_proba(data[test].reshape(1, -1))[:,1])
                all_preds.append(model.predict(data[test].reshape(1, -1)))

            # based on all predictions make aroc curve and confusion matrix
            aroc = roc_auc_score(all_y, all_probs)
            tn, fp, fn, tp = confusion_matrix(all_y, all_preds).ravel()
            spec = tn / (tn+fp)  
            sens = tp / (tp+fn)
               
            if aroc > best_aroc:
                best_aroc, best_spec, best_sens, best_norm = aroc, spec, sens, i 
                best_estimator_rf = est
    
    return best_estimator_rf, best_norm, best_aroc, best_spec, best_sens

### Method 4: Gradient Boosting classifier

In [10]:
def gr_classifier(data, labels):
    best_aroc = 0
    estimators = [5, 10, 20] #, 40, 60, 80]
    best_estimator_gr = 0
    best_norm = -1

    for est in tqdm(estimators):
        for i in [0, 1, 2]:
            
            data = normalize(data, i) 
            all_y, all_probs, all_preds = [], [], [] 
            loo = LeaveOneOut()
            
            # leave one out split and make prediction
            for train, test in loo.split(data):
                all_y.append(labels[test])
                model = GradientBoostingClassifier(n_estimators=est)
                model = model.fit(data[train], labels[train])
                all_probs.append(model.predict_proba(data[test].reshape(1, -1))[:,1])
                all_preds.append(model.predict(data[test].reshape(1, -1)))

            # based on all predictions make aroc curve and confusion matrix
            aroc = roc_auc_score(all_y, all_probs)
            tn, fp, fn, tp = confusion_matrix(all_y, all_preds).ravel()
            spec = tn / (tn+fp)  
            sens = tp / (tp+fn)
               
            if aroc > best_aroc:
                best_aroc, best_spec, best_sens, best_norm = aroc, spec, sens, i 
                best_estimator_gr = est
                
#             if best_aroc > 0.8:
#                 print("tn {}, fp {}, fn {}, tp {}".format(tn, fp, fn, tp))
#                 print("aroc: {} , spec: {}, sens: {}".format(best_aroc, spec, sens))
#                 print("trees: {}, norm: {}".format(best_estimator_gr, best_norm))
#                 conf_matrix = [[tp, fp],
#                              [fn, tn]]
#                 df_cm = pd.DataFrame(conf_matrix, index = ["Syn_pred", "Control_pred"], columns = ["Syn", "Control"])
#                 plt.figure(figsize = (6, 6))
#                 sns_heat = sns.heatmap(df_cm, annot=True)
#                 plt.show()                
                
                                
    return best_estimator_gr, best_norm, best_aroc, best_spec, best_sens

### Method 5: AdaBoost

In [11]:
def ada_classifier(data, labels):
    best_aroc = 0
    estimators = [5, 10, 20 ] #, 40, 60, 80]
    best_estimator_ada = 0
    best_norm = -1

    for est in tqdm(estimators):
        for i in [0,1, 2]:
            
            data = normalize(data, i) 
            all_y, all_probs, all_preds = [], [], [] 
            loo = LeaveOneOut()
            
            # leave one out split and make prediction
            for train, test in loo.split(data):
                all_y.append(labels[test])
                model = AdaBoostClassifier(n_estimators=est)
                model = model.fit(data[train], labels[train])
                all_probs.append(model.predict_proba(data[test].reshape(1, -1))[:,1])
                all_preds.append(model.predict(data[test].reshape(1, -1)))

            # based on all predictions make aroc curve and confusion matrix
            aroc = roc_auc_score(all_y, all_probs)
            tn, fp, fn, tp = confusion_matrix(all_y, all_preds).ravel()
            spec = tn / (tn+fp)  
            sens = tp / (tp+fn)
               
            if aroc > best_aroc:
                best_aroc, best_spec, best_sens, best_norm = aroc, spec, sens, i 
                best_estimator_ada = est
                
    return best_estimator_ada, best_norm, best_aroc, best_spec, best_sens

In [12]:
def concatenate(syn_name, data_dir, data_combination, nr_feats): 

    method = "deepface"
    syn_csv = data_dir+"\\representations\{}-patients-{}.csv".format(syn_name, method)
    ID_csv  = data_dir+"\\representations\ID-controls-{}.csv".format(method)
    data_df, labels_df = read_rep(syn_name, syn_csv, ID_csv, data_dir)
    
    method = "dlib"
    syn_csv = data_dir+"\\representations\{}-patients-{}.csv".format(syn_name, method)
    ID_csv  = data_dir+"\\representations\ID-controls-{}.csv".format(method)
    data_dlib, labels_dlib = read_rep(syn_name, syn_csv, ID_csv, data_dir)

    
    if data_combination == 0: # or data_combination == 2 or data_combination == 3:
        # only deepface
        data = data_df
        labels = labels_df
    
    if data_combination == 1: # or data_combination == 2:
        # only dlib
        data, labels  = [], []
        for index, dlib_i in enumerate(data_dlib):
            if not all(v == 0 for v in dlib_i):
                #only if a face is found
                data.append(dlib_i) # concatenation of 4096 deepface + 2210 dlib
                labels.append(labels_dlib[index])
                
                
    if data_combination == 2 or data_combination == 3 or data_combination == 4:# or data_combination == 3 or data_combination == 4:
        # deepface + dlib (all features) 
        data, labels  = [], []
        for index, (df_i, dlib_i) in enumerate(zip(data_df, data_dlib)):
            if not all(v == 0 for v in dlib_i):
                #only if a face is found 
                if not isinstance(df_i, list):
                    df_i = df_i.tolist()
                if not isinstance(dlib_i, list):
                    dlib_i = dlib_i.tolist()  
                    
                data.append(df_i+dlib_i) # concatenation of 4096 deepface + 2210 dlib
                labels.append(labels_df[index])
                
                                               
    if data_combination == 3:
        # deepface + dlib (x most important features)
        # data, labels are already filled from the above if statement
                                               
        # using a Random Forest the x most important features are used                                   
        forest = RandomForestClassifier(n_estimators=10,random_state=0) # 10 has been found with best aroc scores
        forest.fit(data, labels)
        importances = forest.feature_importances_
        std = np.std([tree.feature_importances_ for tree in forest.estimators_],axis=0)
        indices = np.argsort(importances)[::-1]
        indices = indices[0:nr_feats] 

        data2 = []
        for row in data:
            data2.append(np.array(row)[indices])                                
        data = data2

                                               
    nr_comps = 0
    if data_combination == 4:
        # pca components that explain > 0.9 variance
        for i in range(0, np.array(data).shape[0]):
            pca = PCA(n_components=i)
            components = pca.fit_transform(data)    
            if sum(pca.explained_variance_ratio_) > 0.9:
                nr_comps = i
        
        pca = PCA(n_components=nr_comps)
        data = pca.fit_transform(data)       
        
    
    if data_combination == 5 or data_combination == 7:
        # openface 
        method = "openface"
        syn_csv = data_dir+"\\representations\{}-patients-{}.csv".format(syn_name, method)
        ID_csv  = data_dir+"\\representations\ID-controls-{}.csv".format(method)
        data_openface, labels_openface = read_rep2(syn_name, syn_csv, ID_csv, data_dir)
        
        data = []
        openface_names = data_openface[:,0]
        data_openface = np.array(data_openface)[:, 1:]
        for openface_i in data_openface:
            rep = [float(i) for i in openface_i.tolist()]
            data.append(rep)

        labels = np.array(labels_openface)
        
        
    if data_combination == 6 or data_combination == 7:
        # cfps        
        method = "cfps"
        syn_csv = data_dir+"\\representations\{}-patients-{}.csv".format(syn_name, method)
        ID_csv  = data_dir+"\\representations\ID-controls-{}.csv".format(method)
        data_cfps, labels_cfps = read_rep2(syn_name, syn_csv, ID_csv, data_dir)
        
        data = []
        cfps_names = data_cfps[:,0]
        data_cfps = np.array(data_cfps)[:, 1:]
        
        for cfps_i in data_cfps:
            rep = [float(i) for i in cfps_i.tolist()]
            data.append(rep)
            
        labels = np.array(labels_cfps)

        
    if data_combination == 7:
        # openface + cfps 
           
        matches = [i==j for i, j in zip(openface_names, cfps_names)]
        
        data, labels  = [], []
        for index, (openface_i, cfps_i) in enumerate(zip(data_openface, data_cfps)):
            if(matches[index]):
                if not isinstance(openface_i, list):
                    openface_i = openface_i.tolist()
                if not isinstance(cfps_i, list):
                    cfps_i = cfps_i.tolist()  
                    
                rep_list = openface_i+cfps_i
                rep = [float(i) for i in rep_list]
                data.append(rep) # concatenation of 128 openface + 340 cfps
                labels.append(labels_openface[index].astype(np.float64))
     
            
    
    if data_combination == 8:
        # facereader
        method = "facereader"
        syn_csv = data_dir+"\\representations\{}-patients-{}.csv".format(syn_name, method)  
        ID_csv  = data_dir+"\\representations\ID-controls-{}.csv".format(method)

        data_fr, labels_fr = read_rep(syn_name, syn_csv, ID_csv, data_dir)      
        
        data, labels  = [], []
        for index, fr_i in enumerate(data_fr):
            if not all(v == 0 for v in fr_i):
                data.append(fr_i)
                labels.append(labels_fr[index])
    
    return 0, np.array(data), np.array(labels)
    

In [13]:
def get_header(data_combination, nr_feats):
    if data_combination == 0:
        return "0: Classifying data with deepface representation\n\n"
        
    if data_combination == 1:
        return"1: Classifying data with dlib representation\n\n"
            
    if data_combination == 2:
        return "2: Classifying data with all deepface+dlib representations\n\n"
            
    if data_combination == 3:
        return "3: Classifying data with the {} most important features of deepface-dlib representations\n\n".format(nr_feats)
        
    if data_combination == 4:
        return "4: Classifying data with PCA components of deepface-dlib representation\n"
    
    if data_combination == 5:
        return "5: Classifying data with openface representation\n\n"
    
    if data_combination == 6:
        return "6: Classifying data with cfps representation\n\n"
    
    if data_combination == 7:
        return "7: Classifying data with openface+cfps representation\n\n"
    
    if data_combination == 8:
        return "8: Classifying data with facereader representation\n\n"

In [14]:
def main(GENERAL_DIR, syn_list, trial_nr):    
    
    #trial_nr = 4
    
    #syn_list = ['KDVS','ADNP', 'ANKRD11', 'CDK13', 'DEAF1', 'DYRK1A', 'EHMT1', 'FBXO11', 'SON', 'WAC', 'YY1']  # SPOP
    
    for syn_name in syn_list:
        
        today = date.today()
        start = time.time()

        data_dir = GENERAL_DIR + "\\{}".format(syn_name) 
        results_file = open("results/{}/{}-results-run-{}-{}.txt".format(syn_name, syn_name, trial_nr, today), "w")
        results_file.write("Syndrome that will be classified: {} \n\n".format(syn_name))
        print("Syndrome that will be classified: {} \n\n".format(syn_name))

        nr_feats = 300

        for data_combination in [0,1, 2, 3, 4, 5, 6, 7, 8]: 

            results_file.write(get_header(data_combination, nr_feats))
            print(get_header(data_combination, nr_feats))            

            nr_comps, data, labels = concatenate(syn_name, data_dir, data_combination, nr_feats) 
            
            if labels.tolist().count(1) <= 3:
                results_file.write("NO RESULTS as there are {} patients and {} controls with a representation\n\n".format(labels.tolist().count(1), labels.tolist().count(0)))
                continue
            
            print("Data shape: {} and labels shape: {}".format(data.shape, labels.shape))
            
            results_file.write("Shape of data: {} patients, {} controls, {} features \n\n".format(labels.tolist().count(1), labels.tolist().count(0), data.shape[1]))                          
            if data_combination == 4:
                results_file.write("Nr of pca components used: {}\n\n".format(nr_comps))

            # plot representation
            # plot_pca_tsne(data, labels, low_age, high_age)

            results_file.write("CLASSIFIER RESULTS for {} patients and controls \n".format(syn_name))

            k, knn_norm, knn_aroc, knn_spec, knn_sens = knn_classifier(data, labels)
            results_file.write("knn classifier (k = {}), normalize : {} \n    AROC: {:.4f}, spec: {:.4f}, sens: {:.4f}\n".format(k, knn_norm, knn_aroc, knn_spec, knn_sens))

            kernel, svm_norm, svm_aroc, svm_spec, svm_sens = svm_classifier(data, labels)
            results_file.write("svm classifier (k = {}), normalize : {} \n    AROC: {:.4f}, spec: {:.4f}, sens: {:.4f}\n".format(kernel, svm_norm, svm_aroc, svm_spec, svm_sens))

            n_trees_rf, rf_norm, rf_aroc, rf_spec, rf_sens = rf_classifier(data, labels)
            results_file.write("Random Forest classifier (trees = {}), normalize : {} \n    AROC: {:.4f}, spec: {:.4f}, sens: {:.4f}\n".format(n_trees_rf, rf_norm, rf_aroc, rf_spec, rf_sens))

            n_trees_gr, gr_norm, gr_aroc, gr_spec, gr_sens = gr_classifier(data, labels)
            results_file.write("Gradient Boost classifier (trees = {}), normalize : {} \n    AROC: {:.4f}, spec: {:.4f}, sens: {:.4f}\n".format(n_trees_gr, gr_norm, gr_aroc, gr_spec, gr_sens))

            n_trees_ada, ada_norm, ada_aroc, ada_spec, ada_sens = ada_classifier(data, labels)
            results_file.write("Ada Boost classifier (trees = {}), normalize : {} \n    AROC: {:.4f}, spec: {:.4f}, sens: {:.4f}\n".format(n_trees_ada, ada_norm, ada_aroc, ada_spec, ada_sens))

            results_file.write("\n")

        end = time.time()
        results_file.write("Running this whole file took {:.2f} hours".format((end-start)/3600.00))
        results_file.close()
        
    print("done running main file")
    
#main(trial_nr)
    

Syndrome that will be classified: KDVS 


0: Classifying data with deepface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (148, 4096) and labels shape: (148,)


100%|████████████████████████████████████████████| 7/7 [03:35<00:00, 30.79s/it]
100%|███████████████████████████████████████████| 4/4 [18:01<00:00, 270.36s/it]
100%|████████████████████████████████████████████| 3/3 [00:45<00:00, 15.19s/it]
100%|███████████████████████████████████████████| 3/3 [19:58<00:00, 399.61s/it]
100%|███████████████████████████████████████████| 3/3 [09:56<00:00, 198.93s/it]


1: Classifying data with dlib representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (146, 2210) and labels shape: (146,)


100%|████████████████████████████████████████████| 7/7 [01:30<00:00, 12.88s/it]
100%|███████████████████████████████████████████| 4/4 [09:03<00:00, 135.99s/it]
100%|████████████████████████████████████████████| 3/3 [00:42<00:00, 14.02s/it]
100%|███████████████████████████████████████████| 3/3 [15:03<00:00, 301.17s/it]
100%|███████████████████████████████████████████| 3/3 [07:16<00:00, 145.63s/it]


2: Classifying data with all deepface+dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (146, 6306) and labels shape: (146,)


100%|████████████████████████████████████████████| 7/7 [04:37<00:00, 39.65s/it]
100%|███████████████████████████████████████████| 4/4 [26:40<00:00, 400.15s/it]
100%|████████████████████████████████████████████| 3/3 [00:57<00:00, 19.30s/it]
100%|███████████████████████████████████████████| 3/3 [35:05<00:00, 701.89s/it]
100%|███████████████████████████████████████████| 3/3 [16:57<00:00, 339.25s/it]


3: Classifying data with the 300 most important features of deepface-dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (146, 300) and labels shape: (146,)


100%|████████████████████████████████████████████| 7/7 [00:16<00:00,  2.38s/it]
100%|████████████████████████████████████████████| 4/4 [01:10<00:00, 17.58s/it]
100%|████████████████████████████████████████████| 3/3 [00:24<00:00,  8.04s/it]
100%|████████████████████████████████████████████| 3/3 [01:47<00:00, 35.93s/it]
100%|████████████████████████████████████████████| 3/3 [01:03<00:00, 21.14s/it]


4: Classifying data with PCA components of deepface-dlib representation



  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (146, 145) and labels shape: (146,)


100%|████████████████████████████████████████████| 7/7 [00:10<00:00,  1.45s/it]
100%|████████████████████████████████████████████| 4/4 [00:35<00:00,  8.99s/it]
100%|████████████████████████████████████████████| 3/3 [00:22<00:00,  7.57s/it]
100%|████████████████████████████████████████████| 3/3 [01:07<00:00, 22.39s/it]
100%|████████████████████████████████████████████| 3/3 [00:44<00:00, 14.87s/it]


5: Classifying data with openface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (138, 128) and labels shape: (138,)


100%|████████████████████████████████████████████| 7/7 [00:08<00:00,  1.24s/it]
100%|████████████████████████████████████████████| 4/4 [00:25<00:00,  6.32s/it]
100%|████████████████████████████████████████████| 3/3 [00:19<00:00,  6.65s/it]
100%|████████████████████████████████████████████| 3/3 [00:52<00:00, 17.63s/it]
100%|████████████████████████████████████████████| 3/3 [00:37<00:00, 12.65s/it]


6: Classifying data with cfps representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (138, 340) and labels shape: (138,)


100%|████████████████████████████████████████████| 7/7 [00:15<00:00,  2.25s/it]
100%|████████████████████████████████████████████| 4/4 [01:07<00:00, 16.81s/it]
100%|████████████████████████████████████████████| 3/3 [00:22<00:00,  7.66s/it]
100%|████████████████████████████████████████████| 3/3 [02:07<00:00, 42.61s/it]
100%|████████████████████████████████████████████| 3/3 [01:11<00:00, 23.76s/it]


7: Classifying data with openface+cfps representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (138, 468) and labels shape: (138,)


100%|████████████████████████████████████████████| 7/7 [00:20<00:00,  2.87s/it]
100%|████████████████████████████████████████████| 4/4 [01:30<00:00, 22.55s/it]
100%|████████████████████████████████████████████| 3/3 [00:23<00:00,  7.98s/it]
100%|████████████████████████████████████████████| 3/3 [02:52<00:00, 57.64s/it]
100%|████████████████████████████████████████████| 3/3 [01:31<00:00, 30.65s/it]


8: Classifying data with facereader representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (123, 93) and labels shape: (123,)


100%|████████████████████████████████████████████| 7/7 [00:06<00:00,  1.10it/s]
100%|████████████████████████████████████████████| 4/4 [00:14<00:00,  3.55s/it]
100%|████████████████████████████████████████████| 3/3 [00:16<00:00,  5.54s/it]
100%|████████████████████████████████████████████| 3/3 [00:32<00:00, 10.85s/it]
100%|████████████████████████████████████████████| 3/3 [00:27<00:00,  9.11s/it]


Syndrome that will be classified: ADNP 


0: Classifying data with deepface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (54, 4096) and labels shape: (54,)


100%|████████████████████████████████████████████| 7/7 [00:09<00:00,  1.31s/it]
100%|████████████████████████████████████████████| 4/4 [00:56<00:00, 14.21s/it]
100%|████████████████████████████████████████████| 3/3 [00:08<00:00,  2.74s/it]
100%|████████████████████████████████████████████| 3/3 [01:45<00:00, 35.05s/it]
100%|████████████████████████████████████████████| 3/3 [01:07<00:00, 22.44s/it]


1: Classifying data with dlib representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (53, 2210) and labels shape: (53,)


100%|████████████████████████████████████████████| 7/7 [00:04<00:00,  1.60it/s]
100%|████████████████████████████████████████████| 4/4 [00:27<00:00,  6.89s/it]
100%|████████████████████████████████████████████| 3/3 [00:07<00:00,  2.56s/it]
100%|████████████████████████████████████████████| 3/3 [01:39<00:00, 33.01s/it]
100%|████████████████████████████████████████████| 3/3 [00:52<00:00, 17.64s/it]


2: Classifying data with all deepface+dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (53, 6306) and labels shape: (53,)


100%|████████████████████████████████████████████| 7/7 [00:12<00:00,  1.75s/it]
100%|████████████████████████████████████████████| 4/4 [01:20<00:00, 20.24s/it]
100%|████████████████████████████████████████████| 3/3 [00:09<00:00,  3.09s/it]
100%|████████████████████████████████████████████| 3/3 [03:08<00:00, 62.97s/it]
100%|████████████████████████████████████████████| 3/3 [01:58<00:00, 39.35s/it]


3: Classifying data with the 300 most important features of deepface-dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (53, 300) and labels shape: (53,)


100%|████████████████████████████████████████████| 7/7 [00:02<00:00,  3.27it/s]
100%|████████████████████████████████████████████| 4/4 [00:03<00:00,  1.05it/s]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.10s/it]
100%|████████████████████████████████████████████| 3/3 [00:11<00:00,  3.82s/it]
100%|████████████████████████████████████████████| 3/3 [00:11<00:00,  3.74s/it]


4: Classifying data with PCA components of deepface-dlib representation



  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (53, 52) and labels shape: (53,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  3.90it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  3.59it/s]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.03s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.66s/it]
100%|████████████████████████████████████████████| 3/3 [00:07<00:00,  2.59s/it]


5: Classifying data with openface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (46, 128) and labels shape: (46,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.30it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  2.98it/s]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.78s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.06s/it]
100%|████████████████████████████████████████████| 3/3 [00:07<00:00,  2.58s/it]


6: Classifying data with cfps representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (46, 340) and labels shape: (46,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  3.84it/s]
100%|████████████████████████████████████████████| 4/4 [00:03<00:00,  1.33it/s]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.84s/it]
100%|████████████████████████████████████████████| 3/3 [00:12<00:00,  4.05s/it]
100%|████████████████████████████████████████████| 3/3 [00:10<00:00,  3.65s/it]


7: Classifying data with openface+cfps representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (46, 468) and labels shape: (46,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  3.54it/s]
100%|████████████████████████████████████████████| 4/4 [00:03<00:00,  1.01it/s]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.86s/it]
100%|████████████████████████████████████████████| 3/3 [00:16<00:00,  5.42s/it]
100%|████████████████████████████████████████████| 3/3 [00:13<00:00,  4.35s/it]


8: Classifying data with facereader representation




 14%|██████▎                                     | 1/7 [00:00<00:01,  5.32it/s]

Data shape: (37, 93) and labels shape: (37,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.43it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  5.71it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.39s/it]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.19s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.86s/it]


Syndrome that will be classified: ANKRD11 


0: Classifying data with deepface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (48, 4096) and labels shape: (48,)


100%|████████████████████████████████████████████| 7/7 [00:07<00:00,  1.06s/it]
100%|████████████████████████████████████████████| 4/4 [00:40<00:00, 10.06s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.31s/it]
100%|████████████████████████████████████████████| 3/3 [01:26<00:00, 28.82s/it]
100%|████████████████████████████████████████████| 3/3 [00:51<00:00, 17.31s/it]


1: Classifying data with dlib representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (48, 2210) and labels shape: (48,)


100%|████████████████████████████████████████████| 7/7 [00:03<00:00,  1.83it/s]
100%|████████████████████████████████████████████| 4/4 [00:20<00:00,  5.01s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.22s/it]
100%|████████████████████████████████████████████| 3/3 [01:21<00:00, 27.14s/it]
100%|████████████████████████████████████████████| 3/3 [00:43<00:00, 14.46s/it]


2: Classifying data with all deepface+dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (48, 6306) and labels shape: (48,)


100%|████████████████████████████████████████████| 7/7 [00:10<00:00,  1.45s/it]
100%|████████████████████████████████████████████| 4/4 [01:00<00:00, 15.02s/it]
100%|████████████████████████████████████████████| 3/3 [00:07<00:00,  2.65s/it]
100%|████████████████████████████████████████████| 3/3 [02:39<00:00, 53.22s/it]
100%|████████████████████████████████████████████| 3/3 [01:34<00:00, 31.64s/it]


3: Classifying data with the 300 most important features of deepface-dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (48, 300) and labels shape: (48,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  3.64it/s]
100%|████████████████████████████████████████████| 4/4 [00:02<00:00,  1.39it/s]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.88s/it]
100%|████████████████████████████████████████████| 3/3 [00:09<00:00,  3.04s/it]
100%|████████████████████████████████████████████| 3/3 [00:09<00:00,  3.21s/it]


4: Classifying data with PCA components of deepface-dlib representation



  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (48, 47) and labels shape: (48,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.08it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  4.52it/s]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.82s/it]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.33s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.27s/it]


5: Classifying data with openface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (42, 128) and labels shape: (42,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.73it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  3.70it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.62s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.66s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.31s/it]


6: Classifying data with cfps representation




 14%|██████▎                                     | 1/7 [00:00<00:01,  5.83it/s]

Data shape: (30, 340) and labels shape: (30,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  6.23it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  3.96it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.15s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.62s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.96s/it]


7: Classifying data with openface+cfps representation


8: Classifying data with facereader representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (42, 93) and labels shape: (42,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.78it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  4.46it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.59s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.46s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.16s/it]


Syndrome that will be classified: CDK13 


0: Classifying data with deepface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (58, 4096) and labels shape: (58,)


100%|████████████████████████████████████████████| 7/7 [00:10<00:00,  1.47s/it]
100%|████████████████████████████████████████████| 4/4 [01:09<00:00, 17.32s/it]
100%|████████████████████████████████████████████| 3/3 [00:08<00:00,  2.96s/it]
100%|████████████████████████████████████████████| 3/3 [02:12<00:00, 44.27s/it]
100%|████████████████████████████████████████████| 3/3 [01:18<00:00, 26.00s/it]


1: Classifying data with dlib representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (57, 2210) and labels shape: (57,)


100%|████████████████████████████████████████████| 7/7 [00:04<00:00,  1.42it/s]
100%|████████████████████████████████████████████| 4/4 [00:31<00:00,  7.93s/it]
100%|████████████████████████████████████████████| 3/3 [00:08<00:00,  2.76s/it]
100%|████████████████████████████████████████████| 3/3 [01:53<00:00, 37.87s/it]
100%|████████████████████████████████████████████| 3/3 [01:00<00:00, 20.33s/it]


2: Classifying data with all deepface+dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (57, 6306) and labels shape: (57,)


100%|████████████████████████████████████████████| 7/7 [00:13<00:00,  1.95s/it]
100%|████████████████████████████████████████████| 4/4 [01:39<00:00, 24.80s/it]
100%|████████████████████████████████████████████| 3/3 [00:10<00:00,  3.38s/it]
100%|████████████████████████████████████████████| 3/3 [03:35<00:00, 71.68s/it]
100%|████████████████████████████████████████████| 3/3 [02:17<00:00, 45.80s/it]


3: Classifying data with the 300 most important features of deepface-dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (57, 300) and labels shape: (57,)


100%|████████████████████████████████████████████| 7/7 [00:02<00:00,  3.03it/s]
100%|████████████████████████████████████████████| 4/4 [00:04<00:00,  1.15s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.26s/it]
100%|████████████████████████████████████████████| 3/3 [00:12<00:00,  4.24s/it]
100%|████████████████████████████████████████████| 3/3 [00:12<00:00,  4.20s/it]


4: Classifying data with PCA components of deepface-dlib representation



  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (57, 56) and labels shape: (57,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  3.56it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  2.90it/s]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.20s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.71s/it]
100%|████████████████████████████████████████████| 3/3 [00:08<00:00,  2.86s/it]


5: Classifying data with openface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (38, 128) and labels shape: (38,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.18it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  4.53it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.44s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.44s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.03s/it]


6: Classifying data with cfps representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (38, 340) and labels shape: (38,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.74it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  2.18it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.50s/it]
100%|████████████████████████████████████████████| 3/3 [00:08<00:00,  2.85s/it]
100%|████████████████████████████████████████████| 3/3 [00:08<00:00,  2.78s/it]


7: Classifying data with openface+cfps representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (38, 468) and labels shape: (38,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.43it/s]
100%|████████████████████████████████████████████| 4/4 [00:02<00:00,  1.66it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.50s/it]
100%|████████████████████████████████████████████| 3/3 [00:10<00:00,  3.57s/it]
100%|████████████████████████████████████████████| 3/3 [00:09<00:00,  3.21s/it]


8: Classifying data with facereader representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (41, 93) and labels shape: (41,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.89it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  4.61it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.56s/it]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.31s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.10s/it]


Syndrome that will be classified: DEAF1 


0: Classifying data with deepface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (40, 4096) and labels shape: (40,)


100%|████████████████████████████████████████████| 7/7 [00:05<00:00,  1.31it/s]
100%|████████████████████████████████████████████| 4/4 [00:23<00:00,  5.79s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.84s/it]
100%|████████████████████████████████████████████| 3/3 [00:56<00:00, 18.89s/it]
100%|████████████████████████████████████████████| 3/3 [00:36<00:00, 12.19s/it]


1: Classifying data with dlib representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (40, 2210) and labels shape: (40,)


100%|████████████████████████████████████████████| 7/7 [00:02<00:00,  2.39it/s]
100%|████████████████████████████████████████████| 4/4 [00:11<00:00,  2.80s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.76s/it]
100%|████████████████████████████████████████████| 3/3 [00:50<00:00, 16.92s/it]
100%|████████████████████████████████████████████| 3/3 [00:30<00:00, 10.02s/it]


2: Classifying data with all deepface+dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (40, 6306) and labels shape: (40,)


100%|████████████████████████████████████████████| 7/7 [00:07<00:00,  1.04s/it]
100%|████████████████████████████████████████████| 4/4 [00:34<00:00,  8.69s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.02s/it]
100%|████████████████████████████████████████████| 3/3 [01:43<00:00, 34.35s/it]
100%|████████████████████████████████████████████| 3/3 [01:02<00:00, 20.85s/it]


3: Classifying data with the 300 most important features of deepface-dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (40, 300) and labels shape: (40,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.46it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  2.22it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.53s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.04s/it]
100%|████████████████████████████████████████████| 3/3 [00:07<00:00,  2.48s/it]


4: Classifying data with PCA components of deepface-dlib representation



  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (40, 39) and labels shape: (40,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.11it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  6.71it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.49s/it]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.03it/s]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.81s/it]


5: Classifying data with openface representation




 14%|██████▎                                     | 1/7 [00:00<00:01,  5.64it/s]

Data shape: (34, 128) and labels shape: (34,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.79it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  5.70it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.28s/it]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.20s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.79s/it]


6: Classifying data with cfps representation




 14%|██████▎                                     | 1/7 [00:00<00:01,  5.56it/s]

Data shape: (34, 340) and labels shape: (34,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.34it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  2.91it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.31s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.24s/it]
100%|████████████████████████████████████████████| 3/3 [00:07<00:00,  2.35s/it]


7: Classifying data with openface+cfps representation




 14%|██████▎                                     | 1/7 [00:00<00:01,  5.06it/s]

Data shape: (34, 468) and labels shape: (34,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.01it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  2.22it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.32s/it]
100%|████████████████████████████████████████████| 3/3 [00:08<00:00,  2.71s/it]
100%|████████████████████████████████████████████| 3/3 [00:08<00:00,  2.71s/it]


8: Classifying data with facereader representation




 14%|██████▎                                     | 1/7 [00:00<00:01,  5.80it/s]

Data shape: (33, 93) and labels shape: (33,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  6.06it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  7.04it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.26s/it]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.04it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.64s/it]


Syndrome that will be classified: DYRK1A 


0: Classifying data with deepface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (30, 4096) and labels shape: (30,)


100%|████████████████████████████████████████████| 7/7 [00:02<00:00,  2.50it/s]
100%|████████████████████████████████████████████| 4/4 [00:09<00:00,  2.49s/it]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.25s/it]
100%|████████████████████████████████████████████| 3/3 [00:25<00:00,  8.38s/it]
100%|████████████████████████████████████████████| 3/3 [00:20<00:00,  6.80s/it]


1: Classifying data with dlib representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (29, 2210) and labels shape: (29,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.06it/s]
100%|████████████████████████████████████████████| 4/4 [00:04<00:00,  1.11s/it]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.20s/it]
100%|████████████████████████████████████████████| 3/3 [00:22<00:00,  7.52s/it]
100%|████████████████████████████████████████████| 3/3 [00:16<00:00,  5.40s/it]


2: Classifying data with all deepface+dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (29, 6306) and labels shape: (29,)


100%|████████████████████████████████████████████| 7/7 [00:03<00:00,  1.79it/s]
100%|████████████████████████████████████████████| 4/4 [00:14<00:00,  3.60s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.34s/it]
100%|████████████████████████████████████████████| 3/3 [00:41<00:00, 13.85s/it]
100%|████████████████████████████████████████████| 3/3 [00:31<00:00, 10.45s/it]


3: Classifying data with the 300 most important features of deepface-dlib representations




 14%|██████▎                                     | 1/7 [00:00<00:00,  6.68it/s]

Data shape: (29, 300) and labels shape: (29,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  6.55it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  4.65it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.09s/it]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.00s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.62s/it]


4: Classifying data with PCA components of deepface-dlib representation



 14%|██████▎                                     | 1/7 [00:00<00:00,  7.10it/s]

Data shape: (29, 28) and labels shape: (29,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  7.19it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00, 11.78it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.07s/it]
100%|████████████████████████████████████████████| 3/3 [00:01<00:00,  1.77it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.26s/it]


5: Classifying data with openface representation




 14%|██████▎                                     | 1/7 [00:00<00:00,  7.74it/s]

Data shape: (22, 128) and labels shape: (22,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  9.56it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00, 12.22it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.23it/s]
100%|████████████████████████████████████████████| 3/3 [00:01<00:00,  1.84it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.09s/it]


6: Classifying data with cfps representation




 14%|██████▎                                     | 1/7 [00:00<00:00,  7.72it/s]

Data shape: (22, 340) and labels shape: (22,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  9.04it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  7.94it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.22it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.16it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.28s/it]


7: Classifying data with openface+cfps representation




 14%|██████▎                                     | 1/7 [00:00<00:00,  7.32it/s]

Data shape: (22, 468) and labels shape: (22,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  8.52it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  6.52it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.21it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.06s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.44s/it]


8: Classifying data with facereader representation




 14%|██████▎                                     | 1/7 [00:00<00:00,  6.53it/s]

Data shape: (24, 93) and labels shape: (24,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  8.52it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00, 12.78it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.13it/s]
100%|████████████████████████████████████████████| 3/3 [00:01<00:00,  1.73it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.12s/it]


Syndrome that will be classified: EHMT1 


0: Classifying data with deepface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (76, 4096) and labels shape: (76,)


100%|████████████████████████████████████████████| 7/7 [00:36<00:00,  5.20s/it]
100%|████████████████████████████████████████████| 4/4 [02:31<00:00, 37.98s/it]
100%|████████████████████████████████████████████| 3/3 [00:13<00:00,  4.57s/it]
100%|████████████████████████████████████████████| 3/3 [04:17<00:00, 85.98s/it]
100%|████████████████████████████████████████████| 3/3 [02:23<00:00, 47.96s/it]


1: Classifying data with dlib representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (76, 2210) and labels shape: (76,)


100%|████████████████████████████████████████████| 7/7 [00:17<00:00,  2.49s/it]
100%|████████████████████████████████████████████| 4/4 [01:05<00:00, 16.28s/it]
100%|████████████████████████████████████████████| 3/3 [00:12<00:00,  4.23s/it]
100%|████████████████████████████████████████████| 3/3 [03:37<00:00, 72.44s/it]
100%|████████████████████████████████████████████| 3/3 [01:49<00:00, 36.39s/it]


2: Classifying data with all deepface+dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (76, 6306) and labels shape: (76,)


100%|████████████████████████████████████████████| 7/7 [00:50<00:00,  7.15s/it]
100%|████████████████████████████████████████████| 4/4 [03:45<00:00, 56.39s/it]
100%|████████████████████████████████████████████| 3/3 [00:16<00:00,  5.40s/it]
100%|███████████████████████████████████████████| 3/3 [07:46<00:00, 155.55s/it]
100%|████████████████████████████████████████████| 3/3 [04:12<00:00, 84.03s/it]


3: Classifying data with the 300 most important features of deepface-dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (76, 300) and labels shape: (76,)


100%|████████████████████████████████████████████| 7/7 [00:04<00:00,  1.53it/s]
100%|████████████████████████████████████████████| 4/4 [00:10<00:00,  2.53s/it]
100%|████████████████████████████████████████████| 3/3 [00:09<00:00,  3.19s/it]
100%|████████████████████████████████████████████| 3/3 [00:24<00:00,  8.01s/it]
100%|████████████████████████████████████████████| 3/3 [00:19<00:00,  6.54s/it]


4: Classifying data with PCA components of deepface-dlib representation



  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (76, 75) and labels shape: (76,)


100%|████████████████████████████████████████████| 7/7 [00:02<00:00,  2.35it/s]
100%|████████████████████████████████████████████| 4/4 [00:03<00:00,  1.24it/s]
100%|████████████████████████████████████████████| 3/3 [00:09<00:00,  3.07s/it]
100%|████████████████████████████████████████████| 3/3 [00:11<00:00,  3.72s/it]
100%|████████████████████████████████████████████| 3/3 [00:13<00:00,  4.35s/it]


5: Classifying data with openface representation




 14%|██████▎                                     | 1/7 [00:00<00:00,  6.05it/s]

Data shape: (30, 128) and labels shape: (30,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  6.66it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  7.09it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.12s/it]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.03it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.52s/it]


6: Classifying data with cfps representation




 14%|██████▎                                     | 1/7 [00:00<00:01,  5.97it/s]

Data shape: (30, 340) and labels shape: (30,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  6.16it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  3.96it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.15s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.72s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.96s/it]


7: Classifying data with openface+cfps representation




 14%|██████▎                                     | 1/7 [00:00<00:00,  6.08it/s]

Data shape: (30, 468) and labels shape: (30,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.98it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  3.11it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.16s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.17s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.27s/it]


8: Classifying data with facereader representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (49, 93) and labels shape: (49,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.10it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  3.17it/s]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.88s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.95s/it]
100%|████████████████████████████████████████████| 3/3 [00:07<00:00,  2.62s/it]


Syndrome that will be classified: FBXO11 


0: Classifying data with deepface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (36, 4096) and labels shape: (36,)


100%|████████████████████████████████████████████| 7/7 [00:04<00:00,  1.55it/s]
100%|████████████████████████████████████████████| 4/4 [00:17<00:00,  4.40s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.64s/it]
100%|████████████████████████████████████████████| 3/3 [00:45<00:00, 15.20s/it]
100%|████████████████████████████████████████████| 3/3 [00:29<00:00,  9.96s/it]


1: Classifying data with dlib representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (36, 2210) and labels shape: (36,)


100%|████████████████████████████████████████████| 7/7 [00:02<00:00,  2.84it/s]
100%|████████████████████████████████████████████| 4/4 [00:08<00:00,  2.04s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.55s/it]
100%|████████████████████████████████████████████| 3/3 [00:40<00:00, 13.50s/it]
100%|████████████████████████████████████████████| 3/3 [00:24<00:00,  8.20s/it]


2: Classifying data with all deepface+dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (36, 6306) and labels shape: (36,)


100%|████████████████████████████████████████████| 7/7 [00:06<00:00,  1.14it/s]
100%|████████████████████████████████████████████| 4/4 [00:26<00:00,  6.74s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.80s/it]
100%|████████████████████████████████████████████| 3/3 [01:22<00:00, 27.63s/it]
100%|████████████████████████████████████████████| 3/3 [00:50<00:00, 16.87s/it]


3: Classifying data with the 300 most important features of deepface-dlib representations




 14%|██████▎                                     | 1/7 [00:00<00:01,  5.21it/s]

Data shape: (36, 300) and labels shape: (36,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.04it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  2.78it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.38s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.85s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.18s/it]


4: Classifying data with PCA components of deepface-dlib representation



  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (36, 35) and labels shape: (36,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.64it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  8.49it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.34s/it]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.23it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.61s/it]


5: Classifying data with openface representation




 14%|██████▎                                     | 1/7 [00:00<00:01,  5.83it/s]

Data shape: (32, 128) and labels shape: (32,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  6.33it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  6.17it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.20s/it]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.15s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.64s/it]


6: Classifying data with cfps representation




 14%|██████▎                                     | 1/7 [00:00<00:00,  6.12it/s]

Data shape: (32, 340) and labels shape: (32,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.84it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  3.35it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.23s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.99s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.15s/it]


7: Classifying data with openface+cfps representation




 14%|██████▎                                     | 1/7 [00:00<00:01,  5.35it/s]

Data shape: (32, 468) and labels shape: (32,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.57it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  2.63it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.24s/it]
100%|████████████████████████████████████████████| 3/3 [00:07<00:00,  2.50s/it]
100%|████████████████████████████████████████████| 3/3 [00:07<00:00,  2.46s/it]


8: Classifying data with facereader representation




 14%|██████▎                                     | 1/7 [00:00<00:00,  6.18it/s]

Data shape: (33, 93) and labels shape: (33,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  6.03it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  7.04it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.24s/it]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.06it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.63s/it]


Syndrome that will be classified: SON 


0: Classifying data with deepface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (38, 4096) and labels shape: (38,)


100%|████████████████████████████████████████████| 7/7 [00:04<00:00,  1.44it/s]
100%|████████████████████████████████████████████| 4/4 [00:20<00:00,  5.10s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.73s/it]
100%|████████████████████████████████████████████| 3/3 [00:45<00:00, 15.14s/it]
100%|████████████████████████████████████████████| 3/3 [00:33<00:00, 11.02s/it]


1: Classifying data with dlib representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (38, 2210) and labels shape: (38,)


100%|████████████████████████████████████████████| 7/7 [00:02<00:00,  2.65it/s]
100%|████████████████████████████████████████████| 4/4 [00:09<00:00,  2.41s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.66s/it]
100%|████████████████████████████████████████████| 3/3 [00:45<00:00, 15.30s/it]
100%|████████████████████████████████████████████| 3/3 [00:27<00:00,  9.08s/it]


2: Classifying data with all deepface+dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (38, 6306) and labels shape: (38,)


100%|████████████████████████████████████████████| 7/7 [00:06<00:00,  1.05it/s]
100%|████████████████████████████████████████████| 4/4 [00:31<00:00,  7.86s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.92s/it]
100%|████████████████████████████████████████████| 3/3 [01:24<00:00, 28.11s/it]
100%|████████████████████████████████████████████| 3/3 [00:56<00:00, 18.83s/it]


3: Classifying data with the 300 most important features of deepface-dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (38, 300) and labels shape: (38,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.70it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  2.47it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.46s/it]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.85s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.32s/it]


4: Classifying data with PCA components of deepface-dlib representation



  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (38, 37) and labels shape: (38,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.44it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  7.45it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.41s/it]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.13it/s]
100%|████████████████████████████████████████████| 3/3 [00:05<00:00,  1.73s/it]


5: Classifying data with openface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (38, 128) and labels shape: (38,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.17it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  4.30it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.45s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.49s/it]
100%|████████████████████████████████████████████| 3/3 [00:06<00:00,  2.05s/it]


6: Classifying data with cfps representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (38, 340) and labels shape: (38,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.75it/s]
100%|████████████████████████████████████████████| 4/4 [00:01<00:00,  2.20it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.47s/it]
100%|████████████████████████████████████████████| 3/3 [00:08<00:00,  2.86s/it]
100%|████████████████████████████████████████████| 3/3 [00:08<00:00,  2.74s/it]


7: Classifying data with openface+cfps representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (38, 468) and labels shape: (38,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.44it/s]
100%|████████████████████████████████████████████| 4/4 [00:02<00:00,  1.66it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.50s/it]
100%|████████████████████████████████████████████| 3/3 [00:11<00:00,  3.77s/it]
100%|████████████████████████████████████████████| 3/3 [00:09<00:00,  3.21s/it]


8: Classifying data with facereader representation




 14%|██████▎                                     | 1/7 [00:00<00:00,  6.48it/s]

Data shape: (29, 93) and labels shape: (29,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  7.07it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  9.20it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.08s/it]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.26it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.39s/it]


Syndrome that will be classified: WAC 


0: Classifying data with deepface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (28, 4096) and labels shape: (28,)


100%|████████████████████████████████████████████| 7/7 [00:02<00:00,  2.77it/s]
100%|████████████████████████████████████████████| 4/4 [00:08<00:00,  2.04s/it]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.14s/it]
100%|████████████████████████████████████████████| 3/3 [00:18<00:00,  6.22s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.34s/it]


1: Classifying data with dlib representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (28, 2210) and labels shape: (28,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.48it/s]
100%|████████████████████████████████████████████| 4/4 [00:03<00:00,  1.08it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.13s/it]
100%|████████████████████████████████████████████| 3/3 [00:18<00:00,  6.22s/it]
100%|████████████████████████████████████████████| 3/3 [00:15<00:00,  5.04s/it]


2: Classifying data with all deepface+dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (28, 6306) and labels shape: (28,)


100%|████████████████████████████████████████████| 7/7 [00:03<00:00,  2.08it/s]
100%|████████████████████████████████████████████| 4/4 [00:12<00:00,  3.21s/it]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.27s/it]
100%|████████████████████████████████████████████| 3/3 [00:39<00:00, 13.16s/it]
100%|████████████████████████████████████████████| 3/3 [00:28<00:00,  9.43s/it]


3: Classifying data with the 300 most important features of deepface-dlib representations




 14%|██████▎                                     | 1/7 [00:00<00:01,  5.48it/s]

Data shape: (28, 300) and labels shape: (28,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  6.75it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  5.24it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.05s/it]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.02it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.54s/it]


4: Classifying data with PCA components of deepface-dlib representation



 14%|██████▎                                     | 1/7 [00:00<00:00,  6.98it/s]

Data shape: (28, 27) and labels shape: (28,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  7.55it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00, 12.58it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.03s/it]
100%|████████████████████████████████████████████| 3/3 [00:01<00:00,  1.96it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.20s/it]


5: Classifying data with openface representation




100%|████████████████████████████████████████████| 7/7 [00:00<00:00, 33.37it/s]

Data shape: (10, 128) and labels shape: (10,)



100%|████████████████████████████████████████████| 4/4 [00:00<00:00, 39.68it/s]
100%|████████████████████████████████████████████| 3/3 [00:01<00:00,  2.69it/s]
100%|████████████████████████████████████████████| 3/3 [00:00<00:00,  6.56it/s]
100%|████████████████████████████████████████████| 3/3 [00:00<00:00, 16.74it/s]


6: Classifying data with cfps representation




 29%|████████████▌                               | 2/7 [00:00<00:00, 17.39it/s]

Data shape: (10, 340) and labels shape: (10,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00, 35.11it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00, 34.07it/s]
100%|████████████████████████████████████████████| 3/3 [00:01<00:00,  2.68it/s]
100%|████████████████████████████████████████████| 3/3 [00:00<00:00,  5.02it/s]
100%|████████████████████████████████████████████| 3/3 [00:00<00:00, 16.20it/s]
  0%|                                                    | 0/7 [00:00<?, ?it/s]

7: Classifying data with openface+cfps representation


Data shape: (10, 468) and labels shape: (10,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00, 33.21it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00, 34.84it/s]
100%|████████████████████████████████████████████| 3/3 [00:01<00:00,  2.61it/s]
100%|████████████████████████████████████████████| 3/3 [00:00<00:00,  4.73it/s]
100%|████████████████████████████████████████████| 3/3 [00:00<00:00, 16.03it/s]


8: Classifying data with facereader representation




 14%|██████▎                                     | 1/7 [00:00<00:00,  7.69it/s]

Data shape: (23, 93) and labels shape: (23,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  8.97it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00, 13.50it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.18it/s]
100%|████████████████████████████████████████████| 3/3 [00:01<00:00,  1.95it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.07s/it]


Syndrome that will be classified: YY1 


0: Classifying data with deepface representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (24, 4096) and labels shape: (24,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  4.10it/s]
100%|████████████████████████████████████████████| 4/4 [00:04<00:00,  1.18s/it]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.03it/s]
100%|████████████████████████████████████████████| 3/3 [00:15<00:00,  5.00s/it]
100%|████████████████████████████████████████████| 3/3 [00:11<00:00,  3.84s/it]


1: Classifying data with dlib representation




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (24, 2210) and labels shape: (24,)


100%|████████████████████████████████████████████| 7/7 [00:01<00:00,  5.57it/s]
100%|████████████████████████████████████████████| 4/4 [00:02<00:00,  1.56it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.05it/s]
100%|████████████████████████████████████████████| 3/3 [00:14<00:00,  4.97s/it]
100%|████████████████████████████████████████████| 3/3 [00:11<00:00,  3.80s/it]


2: Classifying data with all deepface+dlib representations




  0%|                                                    | 0/7 [00:00<?, ?it/s]

Data shape: (24, 6306) and labels shape: (24,)


100%|████████████████████████████████████████████| 7/7 [00:02<00:00,  2.85it/s]
100%|████████████████████████████████████████████| 4/4 [00:08<00:00,  2.02s/it]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.05s/it]
100%|████████████████████████████████████████████| 3/3 [00:27<00:00,  9.30s/it]
100%|████████████████████████████████████████████| 3/3 [00:19<00:00,  6.33s/it]


3: Classifying data with the 300 most important features of deepface-dlib representations




 14%|██████▎                                     | 1/7 [00:00<00:00,  7.51it/s]

Data shape: (24, 300) and labels shape: (24,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  8.38it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  7.10it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.13it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.30it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.27s/it]


4: Classifying data with PCA components of deepface-dlib representation



 14%|██████▎                                     | 1/7 [00:00<00:00,  7.74it/s]

Data shape: (24, 23) and labels shape: (24,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  8.87it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00, 15.65it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.13it/s]
100%|████████████████████████████████████████████| 3/3 [00:01<00:00,  2.34it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.02s/it]


5: Classifying data with openface representation




100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  8.76it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00, 10.89it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.12it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.49it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.18s/it]


Data shape: (24, 128) and labels shape: (24,)
6: Classifying data with cfps representation




 14%|██████▎                                     | 1/7 [00:00<00:00,  7.78it/s]

Data shape: (24, 340) and labels shape: (24,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  8.43it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  6.53it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.11it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.05it/s]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.38s/it]


7: Classifying data with openface+cfps representation


Data shape: (24, 468) and labels shape: (24,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00,  8.10it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00,  5.31it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.10it/s]
100%|████████████████████████████████████████████| 3/3 [00:03<00:00,  1.18s/it]
100%|████████████████████████████████████████████| 3/3 [00:04<00:00,  1.56s/it]


8: Classifying data with facereader representation




 14%|██████▎                                     | 1/7 [00:00<00:00,  7.44it/s]

Data shape: (20, 93) and labels shape: (20,)


100%|████████████████████████████████████████████| 7/7 [00:00<00:00, 10.56it/s]
100%|████████████████████████████████████████████| 4/4 [00:00<00:00, 16.86it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.35it/s]
100%|████████████████████████████████████████████| 3/3 [00:01<00:00,  2.39it/s]
100%|████████████████████████████████████████████| 3/3 [00:02<00:00,  1.06it/s]

done running main file





### Method 7: VotingClassifier with GridSearch

https://www.kaggle.com/rmferg/soft-voting-classifier
from sklearn.model_selection import train_test_split, GridSearchCV

X_train, X_test, y_train, y_test = train_test_split(data, labels, test_size=0.1, random_state=1)

sc = StandardScaler()
sc.fit(X_train)
X_train_std = sc.transform(X_train)
X_test_std = sc.transform(X_test)

import time
t0 = time.clock()

tree = DecisionTreeClassifier(random_state=1)
svm = SVC(probability=True, kernel='rbf')
knn = KNeighborsClassifier(p=2, metric='minkowski')
nb = GaussianNB()
eclf = VotingClassifier(estimators=[('tree', tree), ('svm', svm), ('knn', knn),('nb', nb)], voting='soft')

param_range10 = [.001, .01, 1, 10, 100]
param_range1 = list(range(3, 8))
param_grid = [{'svm__C':param_range10, 'svm__gamma':param_range10, 'tree__max_depth':param_range1, 
               'knn__n_neighbors':param_range1}]

gs = GridSearchCV(estimator=eclf, param_grid=param_grid, scoring='accuracy', cv=5)
gs = gs.fit(X_train_std, y_train)

print('Best accuracy score: %.3f \nBest parameters: %s' % (gs.best_score_, gs.best_params_))

clf = gs.best_estimator_
clf.fit(X_train_std, y_train)
t1 = time.clock()
print('Running time: %.3f' % (t1-t0))

from sklearn.metrics import confusion_matrix

y_pred = clf.predict(X_test_std)
print('ROC AUC: %.3f \nAccuracy: %.3f \nConfusion Matrix:' % (roc_auc_score(y_true=y_test, y_score=y_pred),
                                         accuracy_score(y_true=y_test, y_pred=y_pred)))
print(confusion_matrix(y_true=y_test, y_pred=y_pred))

### Method 7: Ensemble method

In [15]:
def ensemble_classifiers(k, kernel, n_trees_rf, n_trees_gr, n_trees_ada, data, labels):
    knn = KNeighborsClassifier(n_neighbors=k, weights='distance')
    svm = SVC(kernel=kernel, probability=True)
    random_forest = RandomForestClassifier(n_estimators=n_trees_rf) 
    gr_clf = GradientBoostingClassifier(n_estimators=n_trees_gr, learning_rate=1.0, max_depth=1, random_state=0)
    ada_clf = AdaBoostClassifier(n_estimators=n_trees_ada, random_state=0)
    nb = GaussianNB()

    classifiers = [('knn', knn), ('svm', svm),('gr_clf', gr_clf), ('random_forest', random_forest), ('nb', nb), ('ada_clf', ada_clf)]
    
    cv = int(len(labels)/2)

    classifier_combinations = []
    for L in range(1, len(classifiers)+1):
        for subset in itertools.combinations(classifiers, L):
            classifier_combinations.append(subset)
    
    best_ensemble_acc = 0
    best_classifier_com = None
    best_norm = -1
    best_vote = None

    for classifier_com in classifier_combinations:
    #for classifier_com in tqdm(classifier_combinations):
        
        for normalize in [0, 1, 2]:
            for vote_sort in ['soft', 'hard']:

                weights = np.ones(len(classifier_com)).tolist()
                ensemble_clf = VotingClassifier(estimators=classifier_com,
                                        voting=vote_sort,
                                        weights=weights)
                
                            
                mean_acc = cross_val_classifier(ensemble_clf, data, labels, normalize)
                
                clf_string = ""
                for clf in classifier_com:
                    clf_string  = clf_string + " " + clf[0]
                    
                print("Ensemble: {}".format(clf_string))
                print("With accuracy: {}".format(mean_acc))
                
                if mean_acc > best_ensemble_acc:
                    best_ensemble_acc = mean_acc
                    best_norm = normalize
                    best_vote = vote_sort
                    best_classifier_com = classifier_com
    
    return best_ensemble_acc, best_classifier_com, best_vote, best_norm