In [1]:
!date
import pandas as pd
import numpy as np
import scipy.stats
from scipy.stats import hypergeom
import sys
sys.path.append('../dev')
import os

import utils
import enrich
pd.options.display.max_colwidth = 100

Mon Feb 19 12:08:46 PST 2024


# Model Size Changes

In [2]:
x1 = pd.read_csv('../data/gocam_sizes_mouse.csv')
x2 = pd.read_csv('../data/gocam_sizes_mouse_ff.csv')
d = pd.Series(x2.sizes.values,index=x2.gocam).to_dict()
x1['sizes_ff'] = x1.gocam.apply(lambda x: d.get(x,'F'))
x1 = x1.query('sizes_ff != "F"')
x1['diff'] = x1['sizes_ff'] - x1['sizes']
x1.query('diff < 0')


Unnamed: 0,gocam,sizes,sizes_ff,diff
213,http://model.geneontology.org/R-HSA-4090294,12,9,-3
267,http://model.geneontology.org/R-HSA-3232118,10,9,-1
283,http://model.geneontology.org/R-HSA-3214858,10,9,-1
382,http://model.geneontology.org/R-HSA-69541,8,7,-1
446,http://model.geneontology.org/R-HSA-5649702,7,6,-1
492,http://model.geneontology.org/R-HSA-111465,6,5,-1
564,http://model.geneontology.org/R-HSA-9028731,5,4,-1
575,http://model.geneontology.org/R-HSA-9026527,5,4,-1
845,http://model.geneontology.org/R-HSA-2454202,3,2,-1


In [3]:
#absolute difference
s = x1['diff']
s = pd.to_numeric(s)
s.describe(percentiles = [0.25,0.5,0.75,0.95]).apply(lambda x: int(x))

count    1211
mean        5
std        19
min        -3
25%         0
50%         1
75%         4
95%        19
max       255
Name: diff, dtype: int64

In [4]:
#relative difference
s1 = -x1['diff']/x1['sizes_ff']*100
s1 = pd.to_numeric(s1)
s1.describe(percentiles = [.05,0.25,0.5,0.75,]).apply(lambda x: int(x))

count    1211
mean      -20
std        27
min       -98
5%        -76
25%       -40
50%        -3
75%         0
max        50
dtype: int64

# Comparing uniqueness of results across all datasets at varying FDRs

In [5]:
def drop_threshold(filename, id_type, method, thresholds):
    results = {}
    for a in thresholds:
        #r = set(enrich.enrich(genes, cancer_test_set, uniprot2input, gocam_sizes, Dict, FDR = a)[4].title.values)
        r = set(enrich.enrich_wrapper(filename, id_type, method = method, FDR = a).title.values)
        results[a]=r
    return results
    

In [6]:
import bokeh.io
import bokeh.plotting

bokeh.io.output_notebook()

In [7]:
path = '../test_data/processed'

datasets = {'Covid-19 Platelets':('Gene Symbol',['platelets_up.csv','platelets_down.csv']),
            'DCM Cardiomyocytes':('Gene Symbol',['LMNA_comb.csv','PKP2_comb.csv','RBM20_comb.csv','TTN_comb.csv','PVneg_comb.csv']),
            'DCM Fibroblasts':('Gene Symbol',['LMNA_FB_comb.csv','PKP2_FB_comb.csv','RBM20_FB_comb.csv','TTN_FB_comb.csv','PVneg_FB_comb.csv']),
            'Aging Brain Astrocytes':('Gene Symbol',['astro_HTH_up.csv','astro_CB_up.csv','astro_HTH_down.csv','astro_CB_down.csv']),
            'P97 Inhibitor':('uniprot',['P97.csv']),
            'Macrophage':('Gene Symbol',['mac_comb.csv']),
            'NASH':('Gene Symbol',['Goavere_S2.csv'])
           }
results_combined_s_ff = []
results_combined_s_nc = []
results_combined_ff_s = []
results_combined_ff_nc = []
results_combined_nc_s = []
results_combined_nc_ff = []

results_combined_sim_ff = []
results_combined_sim_nc = []
results_combined_sim_s = []
FDRs = [.05, .1,.15,.2,.3,.4,.5]
for paper,val in datasets.items():
    print(paper)
    symbol_type = val[0]
    datasets_ = val[1]
    
    s_ff_total = []
    s_nc_total = []
    ff_s_total = []
    ff_nc_total = []
    nc_s_total = []
    nc_ff_total = []
    for dataset in datasets_:
        filename = os.path.join(path,dataset)

        results_s = drop_threshold(filename, symbol_type, 'set', FDRs)
        results_ff = drop_threshold(filename, symbol_type, 'standard', FDRs)
        results_nc = drop_threshold(filename, symbol_type, 'ncHGT', FDRs)

        s_ff = []
        s_nc = []
        s_05 = results_s[.05]
        s_05_len = len(s_05)
        if s_05_len == 0:
            s_05_len = 1 #to prevent division of 0 / 0

        ff_s = []
        ff_nc = []
        ff_05 = results_ff[.05]
        ff_05_len = len(ff_05)
        if ff_05_len == 0:
            ff_05_len = 1 #to prevent division of 0 / 0

        nc_s = []
        nc_ff = []
        nc_05 = results_nc[.05]
        nc_05_len = len(nc_05)
        if nc_05_len == 0:
            nc_05_len = 1 #to prevent division of 0 / 0

        for a in FDRs:
            s_ff.append(len(s_05-results_ff[a])/s_05_len*100)
            ff_s.append(len(ff_05-results_s[a])/ff_05_len*100)
            s_nc.append(len(s_05-results_nc[a])/s_05_len*100)
            ff_nc.append(len(ff_05-results_nc[a])/ff_05_len*100)
            nc_ff.append(len(nc_05-results_ff[a])/nc_05_len*100)
            nc_s.append(len(nc_05-results_s[a])/nc_05_len*100)

        s_ff.append(len(s_05))
        s_nc.append(len(s_05))
        ff_s.append(len(ff_05))
        ff_nc.append(len(ff_05))
        nc_s.append(len(nc_05))
        nc_ff.append(len(nc_05))
    
        s_ff_total.append(s_ff)
        s_nc_total.append(s_nc)
        ff_s_total.append(ff_s)
        ff_nc_total.append(ff_nc)
        nc_s_total.append(nc_s)
        nc_ff_total.append(nc_ff)
    
    
    results_combined_s_ff.append(s_ff_total)
    results_combined_s_nc.append(s_nc_total)
    results_combined_ff_s.append(ff_s_total)
    results_combined_ff_nc.append(ff_nc_total)
    results_combined_nc_s.append(nc_s_total)
    results_combined_nc_ff.append(nc_ff_total)
        

Covid-19 Platelets


100%|██████████████████████████████████████| 482/482 [00:00<00:00, 15614.85it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████| 482/482 [00:00<00:00, 17834.72it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████| 482/482 [00:00<00:00, 16250.33it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████| 482/482 [00:00<00:00, 17928.83it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████| 482/482 [00:00<00:00, 17690.83it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████| 482/482 [00:00<00:00, 17870.51it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████| 482/482 [00:00<00:00, 17803.62it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████| 482/482 [00:00<00:00, 17039.09it/s]
100%|██████████████████████████████████████| 482/482 [00:00<00:00, 16536.92it/s]
100%|██████████████████████████████████████| 482/482 [00:00<00:00, 16771.23it/s]
100%|██████████████████████████████████████| 482/482 [00:00<00:00, 17000.55it/s]
100%|██████████████████████████████████████| 482/482 [00:00<00:00, 16710.65it/s]
100%|██████████████████████████████████████| 482/482 [00:00<00:00, 17055.34it/s]
100%|██████████████████████████████████████| 482/482 [00:00<00:00, 17373.69it/s]
100%|█████████████████████████████████████████| 482/482 [01:22<00:00,  5.83it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|█████████████████████████████████████████| 482/482 [01:24<00:00,  5.72it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|█████████████████████████████████████████| 482/482 [01:23<00:00,  5.78it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|█████████████████████████████████████████| 482/482 [01:24<00:00,  5.73it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|█████████████████████████████████████████| 482/482 [01:23<00:00,  5.76it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|█████████████████████████████████████████| 482/482 [01:23<00:00,  5.78it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|█████████████████████████████████████████| 482/482 [01:24<00:00,  5.74it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████| 436/436 [00:00<00:00, 17301.66it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|██████████████████████████████████████| 436/436 [00:00<00:00, 16102.68it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|██████████████████████████████████████| 436/436 [00:00<00:00, 17527.52it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|██████████████████████████████████████| 436/436 [00:00<00:00, 17221.66it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|██████████████████████████████████████| 436/436 [00:00<00:00, 17717.03it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|██████████████████████████████████████| 436/436 [00:00<00:00, 16497.66it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|██████████████████████████████████████| 436/436 [00:00<00:00, 17405.08it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|██████████████████████████████████████| 436/436 [00:00<00:00, 16782.76it/s]
100%|██████████████████████████████████████| 436/436 [00:00<00:00, 16930.05it/s]
100%|██████████████████████████████████████| 436/436 [00:00<00:00, 17124.26it/s]
100%|██████████████████████████████████████| 436/436 [00:00<00:00, 17006.10it/s]
100%|██████████████████████████████████████| 436/436 [00:00<00:00, 17332.66it/s]
100%|██████████████████████████████████████| 436/436 [00:00<00:00, 17399.61it/s]
100%|██████████████████████████████████████| 436/436 [00:00<00:00, 17012.11it/s]
100%|█████████████████████████████████████████| 436/436 [02:20<00:00,  3.09it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|█████████████████████████████████████████| 436/436 [02:21<00:00,  3.08it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|█████████████████████████████████████████| 436/436 [02:21<00:00,  3.08it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|█████████████████████████████████████████| 436/436 [04:29<00:00,  1.61it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|█████████████████████████████████████████| 436/436 [02:20<00:00,  3.10it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|█████████████████████████████████████████| 436/436 [02:20<00:00,  3.10it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|█████████████████████████████████████████| 436/436 [02:21<00:00,  3.09it/s]


Analysis run on 309 entities from 267 out of 1088 input genes
DCM Cardiomyocytes


100%|██████████████████████████████████████| 326/326 [00:00<00:00, 17586.63it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████| 326/326 [00:00<00:00, 17702.07it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████| 326/326 [00:00<00:00, 16739.42it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████| 326/326 [00:00<00:00, 17169.70it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████| 326/326 [00:00<00:00, 15915.62it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████| 326/326 [00:00<00:00, 17979.06it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████| 326/326 [00:00<00:00, 17584.60it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████| 326/326 [00:00<00:00, 17406.19it/s]
100%|██████████████████████████████████████| 326/326 [00:00<00:00, 16724.89it/s]
100%|██████████████████████████████████████| 326/326 [00:00<00:00, 16529.78it/s]
100%|██████████████████████████████████████| 326/326 [00:00<00:00, 16183.68it/s]
100%|██████████████████████████████████████| 326/326 [00:00<00:00, 16294.97it/s]
100%|██████████████████████████████████████| 326/326 [00:00<00:00, 16735.12it/s]
100%|██████████████████████████████████████| 326/326 [00:00<00:00, 16414.88it/s]
100%|█████████████████████████████████████████| 326/326 [02:10<00:00,  2.50it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|█████████████████████████████████████████| 326/326 [02:09<00:00,  2.51it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|█████████████████████████████████████████| 326/326 [02:10<00:00,  2.51it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|█████████████████████████████████████████| 326/326 [02:10<00:00,  2.51it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|█████████████████████████████████████████| 326/326 [02:09<00:00,  2.51it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|█████████████████████████████████████████| 326/326 [02:07<00:00,  2.55it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|█████████████████████████████████████████| 326/326 [02:06<00:00,  2.58it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████| 185/185 [00:00<00:00, 16908.83it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████| 185/185 [00:00<00:00, 17829.65it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████| 185/185 [00:00<00:00, 17487.29it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████| 185/185 [00:00<00:00, 17860.43it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████| 185/185 [00:00<00:00, 16825.60it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████| 185/185 [00:00<00:00, 17550.18it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████| 185/185 [00:00<00:00, 17659.62it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████| 185/185 [00:00<00:00, 17494.39it/s]
100%|██████████████████████████████████████| 185/185 [00:00<00:00, 17520.46it/s]
100%|██████████████████████████████████████| 185/185 [00:00<00:00, 17377.64it/s]
100%|██████████████████████████████████████| 185/185 [00:00<00:00, 17295.91it/s]
100%|██████████████████████████████████████| 185/185 [00:00<00:00, 17497.55it/s]
100%|██████████████████████████████████████| 185/185 [00:00<00:00, 17241.33it/s]
100%|██████████████████████████████████████| 185/185 [00:00<00:00, 17555.74it/s]
100%|█████████████████████████████████████████| 185/185 [01:18<00:00,  2.35it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|█████████████████████████████████████████| 185/185 [01:18<00:00,  2.35it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|█████████████████████████████████████████| 185/185 [01:18<00:00,  2.35it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|█████████████████████████████████████████| 185/185 [01:18<00:00,  2.35it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|█████████████████████████████████████████| 185/185 [01:18<00:00,  2.35it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|█████████████████████████████████████████| 185/185 [01:18<00:00,  2.36it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|█████████████████████████████████████████| 185/185 [01:18<00:00,  2.35it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17488.97it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17800.32it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17647.08it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17008.18it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17824.76it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17720.88it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17733.94it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17291.89it/s]
100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17550.52it/s]
100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17348.75it/s]
100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17499.82it/s]
100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17314.96it/s]
100%|██████████████████████████████████████| 195/195 [00:00<00:00, 17344.33it/s]
100%|██████████████████████████████████████| 195/195 [00:00<00:00, 16937.38it/s]
100%|█████████████████████████████████████████| 195/195 [01:13<00:00,  2.65it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|█████████████████████████████████████████| 195/195 [01:13<00:00,  2.66it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|█████████████████████████████████████████| 195/195 [01:13<00:00,  2.66it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|█████████████████████████████████████████| 195/195 [01:13<00:00,  2.66it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|█████████████████████████████████████████| 195/195 [01:13<00:00,  2.65it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|█████████████████████████████████████████| 195/195 [01:13<00:00,  2.66it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|█████████████████████████████████████████| 195/195 [01:13<00:00,  2.66it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17159.59it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17761.52it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17920.66it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17394.59it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17809.64it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17730.98it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17705.01it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████| 268/268 [00:00<00:00, 16912.52it/s]
100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17345.21it/s]
100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17186.09it/s]
100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17284.66it/s]
100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17427.77it/s]
100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17457.27it/s]
100%|██████████████████████████████████████| 268/268 [00:00<00:00, 17597.74it/s]
100%|█████████████████████████████████████████| 268/268 [01:39<00:00,  2.68it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|█████████████████████████████████████████| 268/268 [01:39<00:00,  2.68it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|█████████████████████████████████████████| 268/268 [01:40<00:00,  2.68it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|█████████████████████████████████████████| 268/268 [01:40<00:00,  2.68it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|█████████████████████████████████████████| 268/268 [01:39<00:00,  2.68it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|█████████████████████████████████████████| 268/268 [01:39<00:00,  2.68it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|█████████████████████████████████████████| 268/268 [01:39<00:00,  2.68it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17657.70it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17496.74it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17734.21it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17712.48it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17799.48it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17493.59it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17815.81it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17550.52it/s]
100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17061.79it/s]
100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17345.77it/s]
100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17497.42it/s]
100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17404.64it/s]
100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17680.68it/s]
100%|██████████████████████████████████████| 324/324 [00:00<00:00, 17683.67it/s]
100%|█████████████████████████████████████████| 324/324 [00:38<00:00,  8.37it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|█████████████████████████████████████████| 324/324 [00:38<00:00,  8.38it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|█████████████████████████████████████████| 324/324 [00:38<00:00,  8.40it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|█████████████████████████████████████████| 324/324 [00:38<00:00,  8.39it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|█████████████████████████████████████████| 324/324 [00:38<00:00,  8.38it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|█████████████████████████████████████████| 324/324 [00:38<00:00,  8.40it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|█████████████████████████████████████████| 324/324 [00:38<00:00,  8.39it/s]


Analysis run on 256 entities from 221 out of 686 input genes
DCM Fibroblasts


100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17884.92it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17866.68it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17960.36it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████| 401/401 [00:00<00:00, 16754.49it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17939.67it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17407.53it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17821.44it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17094.38it/s]
100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17483.35it/s]
100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17505.37it/s]
100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17610.03it/s]
100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17652.16it/s]
100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17432.43it/s]
100%|██████████████████████████████████████| 401/401 [00:00<00:00, 17634.03it/s]
100%|█████████████████████████████████████████| 401/401 [02:34<00:00,  2.60it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|█████████████████████████████████████████| 401/401 [02:34<00:00,  2.60it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|█████████████████████████████████████████| 401/401 [02:34<00:00,  2.60it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|█████████████████████████████████████████| 401/401 [02:34<00:00,  2.60it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|█████████████████████████████████████████| 401/401 [02:34<00:00,  2.60it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|█████████████████████████████████████████| 401/401 [02:34<00:00,  2.60it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|█████████████████████████████████████████| 401/401 [02:34<00:00,  2.60it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████| 358/358 [00:00<00:00, 17976.31it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████| 358/358 [00:00<00:00, 18017.07it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████| 358/358 [00:00<00:00, 17667.92it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████| 358/358 [00:00<00:00, 18017.07it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████| 358/358 [00:00<00:00, 16705.54it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████| 358/358 [00:00<00:00, 16434.75it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████| 358/358 [00:00<00:00, 18048.26it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████| 358/358 [00:00<00:00, 17564.58it/s]
100%|██████████████████████████████████████| 358/358 [00:00<00:00, 17580.00it/s]
100%|██████████████████████████████████████| 358/358 [00:00<00:00, 17590.30it/s]
100%|██████████████████████████████████████| 358/358 [00:00<00:00, 17493.37it/s]
100%|██████████████████████████████████████| 358/358 [00:00<00:00, 17647.57it/s]
100%|██████████████████████████████████████| 358/358 [00:00<00:00, 17497.65it/s]
100%|██████████████████████████████████████| 358/358 [00:00<00:00, 17568.69it/s]
100%|█████████████████████████████████████████| 358/358 [02:05<00:00,  2.85it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|█████████████████████████████████████████| 358/358 [02:05<00:00,  2.85it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|█████████████████████████████████████████| 358/358 [02:05<00:00,  2.85it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|█████████████████████████████████████████| 358/358 [02:05<00:00,  2.85it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|█████████████████████████████████████████| 358/358 [02:05<00:00,  2.85it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|█████████████████████████████████████████| 358/358 [02:05<00:00,  2.86it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|█████████████████████████████████████████| 358/358 [02:05<00:00,  2.85it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████| 283/283 [00:00<00:00, 18014.97it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17776.20it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17806.60it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17786.32it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17870.67it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17880.63it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17794.06it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17559.25it/s]
100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17547.05it/s]
100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17601.70it/s]
100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17448.52it/s]
100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17458.27it/s]
100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17328.04it/s]
100%|██████████████████████████████████████| 283/283 [00:00<00:00, 17191.02it/s]
100%|█████████████████████████████████████████| 283/283 [02:07<00:00,  2.22it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|█████████████████████████████████████████| 283/283 [02:07<00:00,  2.21it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|█████████████████████████████████████████| 283/283 [02:07<00:00,  2.22it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|█████████████████████████████████████████| 283/283 [02:07<00:00,  2.22it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|█████████████████████████████████████████| 283/283 [02:07<00:00,  2.22it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|█████████████████████████████████████████| 283/283 [02:07<00:00,  2.22it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|█████████████████████████████████████████| 283/283 [02:07<00:00,  2.22it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17849.42it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17004.58it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17723.44it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17894.52it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17763.49it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17795.21it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17537.13it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17454.81it/s]
100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17480.69it/s]
100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17665.47it/s]
100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17587.38it/s]
100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17611.57it/s]
100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17456.86it/s]
100%|██████████████████████████████████████| 461/461 [00:00<00:00, 17454.18it/s]
100%|█████████████████████████████████████████| 461/461 [02:49<00:00,  2.72it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|█████████████████████████████████████████| 461/461 [02:49<00:00,  2.72it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|█████████████████████████████████████████| 461/461 [02:49<00:00,  2.71it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|█████████████████████████████████████████| 461/461 [02:49<00:00,  2.72it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|█████████████████████████████████████████| 461/461 [02:49<00:00,  2.72it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|█████████████████████████████████████████| 461/461 [02:49<00:00,  2.72it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|█████████████████████████████████████████| 461/461 [02:50<00:00,  2.71it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17702.61it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17494.81it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17925.90it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17600.55it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17920.82it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17910.66it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17908.80it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17488.20it/s]
100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17621.65it/s]
100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17576.72it/s]
100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17480.13it/s]
100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17557.68it/s]
100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17631.98it/s]
100%|██████████████████████████████████████| 452/452 [00:00<00:00, 17182.29it/s]
100%|█████████████████████████████████████████| 452/452 [02:56<00:00,  2.56it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████| 452/452 [02:56<00:00,  2.55it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████| 452/452 [03:00<00:00,  2.50it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████| 452/452 [03:02<00:00,  2.47it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████| 452/452 [03:01<00:00,  2.49it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████| 452/452 [03:01<00:00,  2.49it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████| 452/452 [03:01<00:00,  2.49it/s]


Analysis run on 396 entities from 338 out of 1135 input genes
Aging Brain Astrocytes


100%|██████████████████████████████████████| 109/109 [00:00<00:00, 17359.48it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████| 109/109 [00:00<00:00, 17412.37it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████| 109/109 [00:00<00:00, 17379.27it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████| 109/109 [00:00<00:00, 17428.30it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████| 109/109 [00:00<00:00, 17071.03it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████| 109/109 [00:00<00:00, 17151.72it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████| 109/109 [00:00<00:00, 16805.59it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████| 109/109 [00:00<00:00, 16524.95it/s]
100%|██████████████████████████████████████| 109/109 [00:00<00:00, 16709.76it/s]
100%|██████████████████████████████████████| 109/109 [00:00<00:00, 17078.68it/s]
100%|██████████████████████████████████████| 109/109 [00:00<00:00, 17052.56it/s]
100%|██████████████████████████████████████| 109/109 [00:00<00:00, 17095.28it/s]
100%|██████████████████████████████████████| 109/109 [00:00<00:00, 16986.04it/s]
100%|██████████████████████████████████████| 109/109 [00:00<00:00, 14935.61it/s]
100%|████████████████████████████████████████| 109/109 [00:00<00:00, 193.49it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 193.78it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 207.80it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 208.84it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 210.61it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 208.68it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 207.24it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████| 254/254 [00:00<00:00, 16820.13it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████| 254/254 [00:00<00:00, 16632.89it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████| 254/254 [00:00<00:00, 17386.71it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████| 254/254 [00:00<00:00, 17697.78it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████| 254/254 [00:00<00:00, 16852.32it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████| 254/254 [00:00<00:00, 17577.48it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████| 254/254 [00:00<00:00, 17577.77it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████| 254/254 [00:00<00:00, 17196.98it/s]
100%|██████████████████████████████████████| 254/254 [00:00<00:00, 17240.40it/s]
100%|██████████████████████████████████████| 254/254 [00:00<00:00, 16801.29it/s]
100%|██████████████████████████████████████| 254/254 [00:00<00:00, 17130.07it/s]
100%|██████████████████████████████████████| 254/254 [00:00<00:00, 16977.74it/s]
100%|██████████████████████████████████████| 254/254 [00:00<00:00, 17258.83it/s]
100%|██████████████████████████████████████| 254/254 [00:00<00:00, 17469.10it/s]
100%|█████████████████████████████████████████| 254/254 [00:13<00:00, 18.48it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|█████████████████████████████████████████| 254/254 [00:14<00:00, 18.14it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|█████████████████████████████████████████| 254/254 [00:13<00:00, 18.33it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|█████████████████████████████████████████| 254/254 [00:13<00:00, 18.44it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|█████████████████████████████████████████| 254/254 [00:13<00:00, 18.38it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|█████████████████████████████████████████| 254/254 [00:13<00:00, 18.37it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|█████████████████████████████████████████| 254/254 [00:13<00:00, 18.36it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████| 163/163 [00:00<00:00, 17233.97it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████| 163/163 [00:00<00:00, 17608.15it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████| 163/163 [00:00<00:00, 17638.58it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████| 163/163 [00:00<00:00, 17633.58it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████| 163/163 [00:00<00:00, 17646.32it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████| 163/163 [00:00<00:00, 17609.96it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████| 163/163 [00:00<00:00, 17650.42it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████| 163/163 [00:00<00:00, 17170.77it/s]
100%|██████████████████████████████████████| 163/163 [00:00<00:00, 17069.60it/s]
100%|██████████████████████████████████████| 163/163 [00:00<00:00, 16879.11it/s]
100%|██████████████████████████████████████| 163/163 [00:00<00:00, 17401.54it/s]
100%|██████████████████████████████████████| 163/163 [00:00<00:00, 16982.68it/s]
100%|██████████████████████████████████████| 163/163 [00:00<00:00, 17101.62it/s]
100%|██████████████████████████████████████| 163/163 [00:00<00:00, 17316.47it/s]
100%|█████████████████████████████████████████| 163/163 [00:30<00:00,  5.32it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|█████████████████████████████████████████| 163/163 [00:30<00:00,  5.33it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|█████████████████████████████████████████| 163/163 [00:30<00:00,  5.30it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|█████████████████████████████████████████| 163/163 [00:30<00:00,  5.33it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|█████████████████████████████████████████| 163/163 [00:29<00:00,  5.44it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|█████████████████████████████████████████| 163/163 [00:30<00:00,  5.36it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|█████████████████████████████████████████| 163/163 [00:30<00:00,  5.35it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|████████████████████████████████████████| 89/89 [00:00<00:00, 16604.09it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████| 89/89 [00:00<00:00, 16975.58it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████| 89/89 [00:00<00:00, 16764.41it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████| 89/89 [00:00<00:00, 17939.88it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████| 89/89 [00:00<00:00, 17836.16it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████| 89/89 [00:00<00:00, 16691.69it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████| 89/89 [00:00<00:00, 17900.31it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████| 89/89 [00:00<00:00, 17132.18it/s]
100%|████████████████████████████████████████| 89/89 [00:00<00:00, 16802.14it/s]
100%|████████████████████████████████████████| 89/89 [00:00<00:00, 16881.16it/s]
100%|████████████████████████████████████████| 89/89 [00:00<00:00, 17020.47it/s]
100%|████████████████████████████████████████| 89/89 [00:00<00:00, 17053.13it/s]
100%|████████████████████████████████████████| 89/89 [00:00<00:00, 17171.58it/s]
100%|████████████████████████████████████████| 89/89 [00:00<00:00, 16942.45it/s]
100%|███████████████████████████████████████████| 89/89 [00:06<00:00, 14.64it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|███████████████████████████████████████████| 89/89 [00:06<00:00, 14.50it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|███████████████████████████████████████████| 89/89 [00:06<00:00, 14.77it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|███████████████████████████████████████████| 89/89 [00:06<00:00, 14.76it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|███████████████████████████████████████████| 89/89 [00:06<00:00, 14.73it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|███████████████████████████████████████████| 89/89 [00:06<00:00, 14.78it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|███████████████████████████████████████████| 89/89 [00:06<00:00, 14.75it/s]


Analysis run on 58 entities from 45 out of 190 input genes
P97 Inhibitor


100%|██████████████████████████████████████| 480/480 [00:00<00:00, 18091.24it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████| 480/480 [00:00<00:00, 18572.39it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████| 480/480 [00:00<00:00, 18374.58it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████| 480/480 [00:00<00:00, 17891.72it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████| 480/480 [00:00<00:00, 18458.81it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████| 480/480 [00:00<00:00, 18401.45it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████| 480/480 [00:00<00:00, 18363.35it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████| 480/480 [00:00<00:00, 17935.07it/s]
100%|██████████████████████████████████████| 480/480 [00:00<00:00, 18100.84it/s]
100%|██████████████████████████████████████| 480/480 [00:00<00:00, 18088.48it/s]
100%|██████████████████████████████████████| 480/480 [00:00<00:00, 18169.94it/s]
100%|██████████████████████████████████████| 480/480 [00:00<00:00, 18108.33it/s]
100%|██████████████████████████████████████| 480/480 [00:00<00:00, 18226.69it/s]
100%|██████████████████████████████████████| 480/480 [00:00<00:00, 18338.93it/s]
100%|█████████████████████████████████████████| 480/480 [00:44<00:00, 10.75it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|█████████████████████████████████████████| 480/480 [00:44<00:00, 10.82it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|█████████████████████████████████████████| 480/480 [00:44<00:00, 10.86it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|█████████████████████████████████████████| 480/480 [00:44<00:00, 10.85it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|█████████████████████████████████████████| 480/480 [00:43<00:00, 10.93it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|█████████████████████████████████████████| 480/480 [00:43<00:00, 10.97it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|█████████████████████████████████████████| 480/480 [00:43<00:00, 10.95it/s]


Analysis run on 338 entities from 270 out of 766 input genes
Macrophage


100%|██████████████████████████████████████| 667/667 [00:00<00:00, 17889.76it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|██████████████████████████████████████| 667/667 [00:00<00:00, 17700.73it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|██████████████████████████████████████| 667/667 [00:00<00:00, 17463.50it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|██████████████████████████████████████| 667/667 [00:00<00:00, 18392.32it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|███████████████████████████████████████| 667/667 [00:00<00:00, 8855.32it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|██████████████████████████████████████| 667/667 [00:00<00:00, 17520.37it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|██████████████████████████████████████| 667/667 [00:00<00:00, 17844.23it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|██████████████████████████████████████| 667/667 [00:00<00:00, 17456.31it/s]
100%|██████████████████████████████████████| 667/667 [00:00<00:00, 16708.38it/s]
100%|██████████████████████████████████████| 667/667 [00:00<00:00, 17202.24it/s]
100%|██████████████████████████████████████| 667/667 [00:00<00:00, 16913.44it/s]
100%|██████████████████████████████████████| 667/667 [00:00<00:00, 17493.64it/s]
100%|██████████████████████████████████████| 667/667 [00:00<00:00, 17833.77it/s]
100%|██████████████████████████████████████| 667/667 [00:00<00:00, 17779.03it/s]
100%|█████████████████████████████████████████| 667/667 [03:16<00:00,  3.39it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|█████████████████████████████████████████| 667/667 [03:16<00:00,  3.39it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|█████████████████████████████████████████| 667/667 [03:18<00:00,  3.37it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|█████████████████████████████████████████| 667/667 [03:16<00:00,  3.40it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|█████████████████████████████████████████| 667/667 [03:15<00:00,  3.41it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|█████████████████████████████████████████| 667/667 [03:15<00:00,  3.41it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|█████████████████████████████████████████| 667/667 [03:17<00:00,  3.38it/s]


Analysis run on 619 entities from 511 out of 1519 input genes
NASH


100%|████████████████████████████████████████| 98/98 [00:00<00:00, 16981.69it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████| 98/98 [00:00<00:00, 17415.55it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████| 98/98 [00:00<00:00, 17413.34it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████| 98/98 [00:00<00:00, 17156.05it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████| 98/98 [00:00<00:00, 17391.23it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████| 98/98 [00:00<00:00, 17339.15it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████| 98/98 [00:00<00:00, 17397.12it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████| 98/98 [00:00<00:00, 17037.30it/s]
100%|████████████████████████████████████████| 98/98 [00:00<00:00, 17093.98it/s]
100%|████████████████████████████████████████| 98/98 [00:00<00:00, 16617.82it/s]
100%|████████████████████████████████████████| 98/98 [00:00<00:00, 16868.10it/s]
100%|████████████████████████████████████████| 98/98 [00:00<00:00, 17072.68it/s]
100%|████████████████████████████████████████| 98/98 [00:00<00:00, 17108.92it/s]
100%|████████████████████████████████████████| 98/98 [00:00<00:00, 17103.22it/s]
100%|███████████████████████████████████████████| 98/98 [00:01<00:00, 80.06it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|███████████████████████████████████████████| 98/98 [00:01<00:00, 82.22it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|███████████████████████████████████████████| 98/98 [00:01<00:00, 81.88it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|███████████████████████████████████████████| 98/98 [00:01<00:00, 84.04it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|███████████████████████████████████████████| 98/98 [00:01<00:00, 84.19it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|███████████████████████████████████████████| 98/98 [00:01<00:00, 84.20it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|███████████████████████████████████████████| 98/98 [00:01<00:00, 81.31it/s]


Analysis run on 68 entities from 48 out of 118 input genes


Save data for figure 3

In [19]:
results_combined_s_ff[0]

[[50.0, 50.0, 50.0, 50.0, 50.0, 50.0, 50.0, 2],
 [100.0, 100.0, 100.0, 100.0, 86.66666666666667, 66.66666666666666, 60.0, 15]]

In [23]:
def make_table(results_combined):
    results = []
    for r in results_combined:
        for d in np.array(r):
            results.append(np.append(d[-1],d*d[-1]/100))
    results = np.array(results)
    print(results[:,:-1].sum(axis = 0))

Table 3

In [24]:
make_table(results_combined_ff_s)
make_table(results_combined_s_ff)

[159. 121. 118. 116. 116.  33.  11.   1.]
[80. 42. 42. 42. 40. 38. 34. 33.]


In [10]:
make_table(results_combined_nc_ff)
make_table(results_combined_ff_nc)
make_table(results_combined_nc_s)
make_table(results_combined_s_nc)

[181.  34.  20.  16.  13.  11.   9.   9.]
[159.  12.  12.  11.  11.  10.  10.   8.]
[181. 134. 133. 131. 129.  49.  27.  11.]
[80. 33. 29. 22. 21. 19. 15. 15.]


In [11]:
d = {'s_ff':results_combined_s_ff,'ff_s':results_combined_ff_s,'s_nc':results_combined_s_nc,
     'nc_s':results_combined_nc_s,'nc_ff':results_combined_nc_ff,'ff_nc':results_combined_ff_nc}
for k,v in d.items():
    df =[]
    for i, results in enumerate(v):
        for j, r in enumerate(results):
            df.append([i,j]+r)
    pd.DataFrame(df).set_index(0).to_csv(f'../figures/figure_3/{k}.csv',header = None)

In [12]:
X = pd.read_csv('../figures/figure_3/s_ff.csv',header=None)

In [13]:
def read_result_file(file):
    """ X: pd dataframe read from file. first column corresponds to paper index, second corresponds to dataset index within the paper
    y: corresponds to each paper
    """
    Y = []
    y = []
    X = pd.read_csv(file,header=None)
    
    for x in X.iterrows():
        if x[1][1] == 0:
            Y.append(y)
            y = []
        y.append(list(x[1][2:]))
    Y.append(y)
    Y = Y[1:]
    Y
    return Y

In [14]:
s_ff = read_result_file('../figures/figure_3/s_ff.csv')
s_nc = read_result_file('../figures/figure_3/s_nc.csv')
ff_s = read_result_file('../figures/figure_3/ff_s.csv')
ff_nc = read_result_file('../figures/figure_3/ff_nc.csv')
nc_ff = read_result_file('../figures/figure_3/nc_ff.csv')
nc_s = read_result_file('../figures/figure_3/nc_s.csv')

In [15]:
def group_results(combined):
    result = []
    for r in combined:
        result.append(np.array(r).mean(axis = 0))
    return result

In [25]:
def make_plot(method,complement_method,datasets,colors,results,FDRs):
    p = bokeh.plotting.figure(
    title=f"{method} Method at FDR=.05 vs {complement_method} Method",
    frame_height=500,
    frame_width=500,
    x_range=[0.05, 0.55],
    y_range=[-5, 110],
    y_axis_label = f'% unique results vs {complement_method} method',
    x_axis_label = f'FDR for {complement_method} method'
    )
    x = FDRs
    d = list(datasets.keys())
    for i in range(len(d)):
        vals = results[i][:-1]
        c = colors[i]
        if i == 0:
            label = d[i]+', mean = '+str(results[i][-1])
        else:
            label = d[i]+', '+str(results[i][-1])
        shift = np.random.randint(0,high=10)/10
        p.line(x,vals+shift,legend_label = label,color = c,alpha = 0.9, line_width = 2)
        p.circle(x,vals+shift,legend_label = label,color = c,alpha = 0.9, size = 4)
    p.xaxis.ticker=x
    p.grid.visible = False
    p.legend.location = 'top_right'
    p.legend.click_policy = 'hide'
    return p


In [26]:
colors = ['orange','crimson','red','salmon','purple','violet','orangered']
p1 = make_plot('Step','Gene List',datasets,colors,group_results(s_ff),FDRs)
p2 = make_plot('Gene List','Step',datasets,colors,group_results(ff_s),FDRs)
p3 = make_plot('Step',"Weighted Step",datasets,colors,group_results(s_nc),FDRs)
p4 = make_plot('Gene List',"Weighted Step",datasets,colors,group_results(ff_nc),FDRs)
p5 = make_plot("Weighted Step",'Step',datasets,colors,group_results(nc_s),FDRs)
p6 = make_plot("Weighted Step",'Gene List',datasets,colors,group_results(nc_ff),FDRs)

g = bokeh.layouts.grid([[p1,p2],[p3,p5],[p4,p6]])
bokeh.io.show(g)