In [1]:
!date
import pandas as pd
import numpy as np
import scipy.stats
from scipy.stats import hypergeom
import sys
sys.path.append('../dev')
import os

import utils
import enrich
pd.options.display.max_colwidth = 100

Tue Aug  1 11:11:58 PDT 2023


# Model Size Changes

In [2]:
x1 = pd.read_csv('../data/gocam_sizes_mouse.csv')
x2 = pd.read_csv('../data/gocam_sizes_mouse_ff.csv')
d = pd.Series(x2.sizes.values,index=x2.gocam).to_dict()
x1['sizes_ff'] = x1.gocam.apply(lambda x: d.get(x,'F'))
x1 = x1.query('sizes_ff != "F"')
x1['diff'] = x1['sizes_ff'] - x1['sizes']
x1.query('diff < 0')


Unnamed: 0,gocam,sizes,sizes_ff,diff
213,http://model.geneontology.org/R-HSA-4090294,12,9,-3
267,http://model.geneontology.org/R-HSA-3232118,10,9,-1
283,http://model.geneontology.org/R-HSA-3214858,10,9,-1
382,http://model.geneontology.org/R-HSA-69541,8,7,-1
446,http://model.geneontology.org/R-HSA-5649702,7,6,-1
492,http://model.geneontology.org/R-HSA-111465,6,5,-1
564,http://model.geneontology.org/R-HSA-9028731,5,4,-1
575,http://model.geneontology.org/R-HSA-9026527,5,4,-1
845,http://model.geneontology.org/R-HSA-2454202,3,2,-1


In [3]:
#absolute difference
s = x1['diff']
s = pd.to_numeric(s)
s.describe(percentiles = [0.25,0.5,0.75,0.95]).apply(lambda x: int(x))

count    1211
mean        5
std        19
min        -3
25%         0
50%         1
75%         4
95%        19
max       255
Name: diff, dtype: int64

In [None]:
#relative difference
s1 = -x1['diff']/x1['sizes_ff']*100
s1 = pd.to_numeric(s1)
s1.describe(percentiles = [.05,0.25,0.5,0.75,]).apply(lambda x: int(x))

count    1211
mean      -20
std        27
min       -98
5%        -76
25%       -40
50%        -3
75%         0
max        50
dtype: int64

# Comparing uniqueness of results across all datasets at varying FDRs

In [7]:
def drop_threshold(filename, id_type, method, thresholds):
    results = {}
    for a in thresholds:
        #r = set(enrich.enrich(genes, cancer_test_set, uniprot2input, gocam_sizes, Dict, FDR = a)[4].title.values)
        r = set(enrich.enrich_wrapper(filename, id_type, method = method, FDR = a).title.values)
        results[a]=r
    return results
    

In [8]:
import bokeh.io
import bokeh.plotting

bokeh.io.output_notebook()

In [24]:
path = '../test_data/processed'

datasets = {'Covid-19 Platelets':('Gene Symbol',['platelets_up.csv','platelets_down.csv']),
            'DCM Cardiomyocytes':('Gene Symbol',['LMNA_comb.csv','PKP2_comb.csv','RBM20_comb.csv','TTN_comb.csv','PVneg_comb.csv']),
            'DCM Fibroblasts':('Gene Symbol',['LMNA_FB_comb.csv','PKP2_FB_comb.csv','RBM20_FB_comb.csv','TTN_FB_comb.csv','PVneg_FB_comb.csv']),
            'Aging Brain Astrocytes':('Gene Symbol',['astro_HTH_up.csv','astro_CB_up.csv','astro_HTH_down.csv','astro_CB_down.csv']),
            'P97 Inhibitor':('uniprot',['P97.csv']),
            'Macrophage':('Gene Symbol',['mac_comb.csv']),
            'NASH':('Gene Symbol',['Goavere_S2.csv'])
           }
results_combined_s_ff = []
results_combined_s_nc = []
results_combined_ff_s = []
results_combined_ff_nc = []
results_combined_nc_s = []
results_combined_nc_ff = []

results_combined_sim_ff = []
results_combined_sim_nc = []
results_combined_sim_s = []
FDRs = [.1,.15,.2,.3,.4,.5]
for paper,val in datasets.items():
    print(paper)
    symbol_type = val[0]
    datasets_ = val[1]
    
    s_ff_total = []
    s_nc_total = []
    ff_s_total = []
    ff_nc_total = []
    nc_s_total = []
    nc_ff_total = []
    for dataset in datasets_:
        filename = os.path.join(path,dataset)

        results_s = drop_threshold(filename, symbol_type, 'set', FDRs)
        results_ff = drop_threshold(filename, symbol_type, 'standard', FDRs)
        results_nc = drop_threshold(filename, symbol_type, 'ncHGT', FDRs)

        s_ff = []
        s_nc = []
        s_05 = results_s[.1]
        s_05_len = len(s_05)
        if s_05_len == 0:
            s_05_len = 1 #to prevent division of 0 / 0

        ff_s = []
        ff_nc = []
        ff_05 = results_ff[.1]
        ff_05_len = len(ff_05)
        if ff_05_len == 0:
            ff_05_len = 1 #to prevent division of 0 / 0

        nc_s = []
        nc_ff = []
        nc_05 = results_nc[.1]
        nc_05_len = len(nc_05)
        if nc_05_len == 0:
            nc_05_len = 1 #to prevent division of 0 / 0

        for a in FDRs:
            s_ff.append(len(s_05-results_ff[a])/s_05_len*100)
            ff_s.append(len(ff_05-results_s[a])/ff_05_len*100)
            s_nc.append(len(s_05-results_nc[a])/s_05_len*100)
            ff_nc.append(len(ff_05-results_nc[a])/ff_05_len*100)
            nc_ff.append(len(nc_05-results_ff[a])/nc_05_len*100)
            nc_s.append(len(nc_05-results_s[a])/nc_05_len*100)

        s_ff.append(len(s_05))
        s_nc.append(len(s_05))
        ff_s.append(len(ff_05))
        ff_nc.append(len(ff_05))
        nc_s.append(len(nc_05))
        nc_ff.append(len(nc_05))
    
        s_ff_total.append(s_ff)
        s_nc_total.append(s_nc)
        ff_s_total.append(ff_s)
        ff_nc_total.append(ff_nc)
        nc_s_total.append(nc_s)
        nc_ff_total.append(nc_ff)
    
    
    results_combined_s_ff.append(s_ff_total)
    results_combined_s_nc.append(s_nc_total)
    results_combined_ff_s.append(ff_s_total)
    results_combined_ff_nc.append(ff_nc_total)
    results_combined_nc_s.append(nc_s_total)
    results_combined_nc_ff.append(nc_ff_total)
        

Covid-19 Platelets


100%|████████████████████████████████████| 482/482 [00:00<00:00, 18056.61it/s]


Analysis run on 424 entities from 365 out of 1172 input genes


100%|████████████████████████████████████| 482/482 [00:00<00:00, 18338.17it/s]


Analysis run on 424 entities from 365 out of 1172 input genes


100%|████████████████████████████████████| 482/482 [00:00<00:00, 18622.46it/s]


Analysis run on 424 entities from 365 out of 1172 input genes


100%|████████████████████████████████████| 482/482 [00:00<00:00, 18420.04it/s]


Analysis run on 424 entities from 365 out of 1172 input genes


100%|████████████████████████████████████| 482/482 [00:00<00:00, 18507.73it/s]


Analysis run on 424 entities from 365 out of 1172 input genes


100%|████████████████████████████████████| 482/482 [00:00<00:00, 18301.15it/s]


Analysis run on 424 entities from 365 out of 1172 input genes


100%|████████████████████████████████████| 482/482 [00:00<00:00, 18239.72it/s]
100%|████████████████████████████████████| 482/482 [00:00<00:00, 17944.42it/s]
100%|████████████████████████████████████| 482/482 [00:00<00:00, 17326.93it/s]
100%|████████████████████████████████████| 482/482 [00:00<00:00, 17822.77it/s]
100%|████████████████████████████████████| 482/482 [00:00<00:00, 18015.26it/s]
100%|████████████████████████████████████| 482/482 [00:00<00:00, 17931.53it/s]
100%|███████████████████████████████████████| 482/482 [01:18<00:00,  6.14it/s]


Analysis run on 424 entities from 365 out of 1172 input genes


100%|███████████████████████████████████████| 482/482 [01:18<00:00,  6.15it/s]


Analysis run on 424 entities from 365 out of 1172 input genes


100%|███████████████████████████████████████| 482/482 [01:18<00:00,  6.14it/s]


Analysis run on 424 entities from 365 out of 1172 input genes


100%|███████████████████████████████████████| 482/482 [01:18<00:00,  6.13it/s]


Analysis run on 424 entities from 365 out of 1172 input genes


100%|███████████████████████████████████████| 482/482 [01:18<00:00,  6.11it/s]


Analysis run on 424 entities from 365 out of 1172 input genes


100%|███████████████████████████████████████| 482/482 [01:18<00:00,  6.11it/s]


Analysis run on 424 entities from 365 out of 1172 input genes


100%|████████████████████████████████████| 436/436 [00:00<00:00, 18227.20it/s]


Analysis run on 310 entities from 267 out of 1088 input genes


100%|████████████████████████████████████| 436/436 [00:00<00:00, 17994.40it/s]


Analysis run on 310 entities from 267 out of 1088 input genes


100%|████████████████████████████████████| 436/436 [00:00<00:00, 18338.51it/s]


Analysis run on 310 entities from 267 out of 1088 input genes


100%|████████████████████████████████████| 436/436 [00:00<00:00, 17912.96it/s]


Analysis run on 310 entities from 267 out of 1088 input genes


100%|████████████████████████████████████| 436/436 [00:00<00:00, 18083.90it/s]


Analysis run on 310 entities from 267 out of 1088 input genes


100%|████████████████████████████████████| 436/436 [00:00<00:00, 18393.48it/s]


Analysis run on 310 entities from 267 out of 1088 input genes


100%|████████████████████████████████████| 436/436 [00:00<00:00, 18144.01it/s]
100%|████████████████████████████████████| 436/436 [00:00<00:00, 18066.39it/s]
100%|████████████████████████████████████| 436/436 [00:00<00:00, 17291.85it/s]
100%|████████████████████████████████████| 436/436 [00:00<00:00, 17838.18it/s]
100%|████████████████████████████████████| 436/436 [00:00<00:00, 17342.85it/s]
100%|████████████████████████████████████| 436/436 [00:00<00:00, 18089.81it/s]
100%|███████████████████████████████████████| 436/436 [02:14<00:00,  3.25it/s]


Analysis run on 310 entities from 267 out of 1088 input genes


100%|███████████████████████████████████████| 436/436 [02:14<00:00,  3.25it/s]


Analysis run on 310 entities from 267 out of 1088 input genes


100%|███████████████████████████████████████| 436/436 [02:12<00:00,  3.28it/s]


Analysis run on 310 entities from 267 out of 1088 input genes


100%|███████████████████████████████████████| 436/436 [02:13<00:00,  3.26it/s]


Analysis run on 310 entities from 267 out of 1088 input genes


100%|███████████████████████████████████████| 436/436 [02:13<00:00,  3.27it/s]


Analysis run on 310 entities from 267 out of 1088 input genes


100%|███████████████████████████████████████| 436/436 [02:13<00:00,  3.27it/s]


Analysis run on 310 entities from 267 out of 1088 input genes
DCM Cardiomyocytes


100%|████████████████████████████████████| 326/326 [00:00<00:00, 18316.72it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|████████████████████████████████████| 326/326 [00:00<00:00, 17077.91it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|████████████████████████████████████| 326/326 [00:00<00:00, 18066.71it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|████████████████████████████████████| 326/326 [00:00<00:00, 18420.11it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|████████████████████████████████████| 326/326 [00:00<00:00, 17440.38it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|████████████████████████████████████| 326/326 [00:00<00:00, 17111.90it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|████████████████████████████████████| 326/326 [00:00<00:00, 17986.39it/s]
100%|████████████████████████████████████| 326/326 [00:00<00:00, 17987.33it/s]
100%|████████████████████████████████████| 326/326 [00:00<00:00, 17945.55it/s]
100%|████████████████████████████████████| 326/326 [00:00<00:00, 16947.31it/s]
100%|████████████████████████████████████| 326/326 [00:00<00:00, 17907.24it/s]
100%|████████████████████████████████████| 326/326 [00:00<00:00, 17727.08it/s]
100%|███████████████████████████████████████| 326/326 [02:02<00:00,  2.66it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|███████████████████████████████████████| 326/326 [02:02<00:00,  2.67it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|███████████████████████████████████████| 326/326 [02:02<00:00,  2.66it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|███████████████████████████████████████| 326/326 [02:02<00:00,  2.67it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|███████████████████████████████████████| 326/326 [02:02<00:00,  2.67it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|███████████████████████████████████████| 326/326 [02:02<00:00,  2.67it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|████████████████████████████████████| 185/185 [00:00<00:00, 17989.20it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|████████████████████████████████████| 185/185 [00:00<00:00, 18248.54it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|████████████████████████████████████| 185/185 [00:00<00:00, 18409.60it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|████████████████████████████████████| 185/185 [00:00<00:00, 16482.49it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|████████████████████████████████████| 185/185 [00:00<00:00, 16847.15it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|████████████████████████████████████| 185/185 [00:00<00:00, 17484.14it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|████████████████████████████████████| 185/185 [00:00<00:00, 15512.41it/s]
100%|████████████████████████████████████| 185/185 [00:00<00:00, 17897.09it/s]
100%|████████████████████████████████████| 185/185 [00:00<00:00, 17765.96it/s]
100%|████████████████████████████████████| 185/185 [00:00<00:00, 16982.10it/s]
100%|████████████████████████████████████| 185/185 [00:00<00:00, 17022.34it/s]
100%|████████████████████████████████████| 185/185 [00:00<00:00, 17839.49it/s]
100%|███████████████████████████████████████| 185/185 [01:16<00:00,  2.43it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|███████████████████████████████████████| 185/185 [01:16<00:00,  2.42it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|███████████████████████████████████████| 185/185 [01:16<00:00,  2.42it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|███████████████████████████████████████| 185/185 [01:16<00:00,  2.42it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|███████████████████████████████████████| 185/185 [01:16<00:00,  2.42it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|███████████████████████████████████████| 185/185 [01:16<00:00,  2.43it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|████████████████████████████████████| 195/195 [00:00<00:00, 18148.30it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|████████████████████████████████████| 195/195 [00:00<00:00, 18335.86it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|████████████████████████████████████| 195/195 [00:00<00:00, 16682.43it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|████████████████████████████████████| 195/195 [00:00<00:00, 16921.26it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|████████████████████████████████████| 195/195 [00:00<00:00, 17356.85it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|████████████████████████████████████| 195/195 [00:00<00:00, 18241.39it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|████████████████████████████████████| 195/195 [00:00<00:00, 17875.02it/s]
100%|████████████████████████████████████| 195/195 [00:00<00:00, 17823.21it/s]
100%|████████████████████████████████████| 195/195 [00:00<00:00, 16987.34it/s]
100%|████████████████████████████████████| 195/195 [00:00<00:00, 16990.51it/s]
100%|████████████████████████████████████| 195/195 [00:00<00:00, 17888.31it/s]
100%|████████████████████████████████████| 195/195 [00:00<00:00, 17238.32it/s]
100%|███████████████████████████████████████| 195/195 [01:11<00:00,  2.72it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|███████████████████████████████████████| 195/195 [01:11<00:00,  2.72it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|███████████████████████████████████████| 195/195 [01:11<00:00,  2.72it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|███████████████████████████████████████| 195/195 [01:11<00:00,  2.74it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|███████████████████████████████████████| 195/195 [01:11<00:00,  2.74it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|███████████████████████████████████████| 195/195 [01:11<00:00,  2.74it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|████████████████████████████████████| 268/268 [00:00<00:00, 18282.37it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|████████████████████████████████████| 268/268 [00:00<00:00, 18481.67it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|████████████████████████████████████| 268/268 [00:00<00:00, 17050.53it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|████████████████████████████████████| 268/268 [00:00<00:00, 18027.87it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|████████████████████████████████████| 268/268 [00:00<00:00, 17876.20it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|████████████████████████████████████| 268/268 [00:00<00:00, 18409.93it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|████████████████████████████████████| 268/268 [00:00<00:00, 17839.32it/s]
100%|████████████████████████████████████| 268/268 [00:00<00:00, 18031.63it/s]
100%|████████████████████████████████████| 268/268 [00:00<00:00, 18061.76it/s]
100%|████████████████████████████████████| 268/268 [00:00<00:00, 18082.10it/s]
100%|████████████████████████████████████| 268/268 [00:00<00:00, 18115.61it/s]
100%|████████████████████████████████████| 268/268 [00:00<00:00, 17880.75it/s]
100%|███████████████████████████████████████| 268/268 [01:36<00:00,  2.77it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|███████████████████████████████████████| 268/268 [01:37<00:00,  2.76it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|███████████████████████████████████████| 268/268 [01:36<00:00,  2.77it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|███████████████████████████████████████| 268/268 [01:36<00:00,  2.76it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|███████████████████████████████████████| 268/268 [01:37<00:00,  2.75it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|███████████████████████████████████████| 268/268 [01:36<00:00,  2.76it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|████████████████████████████████████| 324/324 [00:00<00:00, 17393.06it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|████████████████████████████████████| 324/324 [00:00<00:00, 18153.28it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|████████████████████████████████████| 324/324 [00:00<00:00, 18388.85it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|████████████████████████████████████| 324/324 [00:00<00:00, 18383.13it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|████████████████████████████████████| 324/324 [00:00<00:00, 18331.06it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|████████████████████████████████████| 324/324 [00:00<00:00, 18283.46it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|████████████████████████████████████| 324/324 [00:00<00:00, 17886.63it/s]
100%|████████████████████████████████████| 324/324 [00:00<00:00, 18131.00it/s]
100%|████████████████████████████████████| 324/324 [00:00<00:00, 17996.06it/s]
100%|████████████████████████████████████| 324/324 [00:00<00:00, 18068.08it/s]
100%|████████████████████████████████████| 324/324 [00:00<00:00, 16333.98it/s]
100%|████████████████████████████████████| 324/324 [00:00<00:00, 17878.86it/s]
100%|███████████████████████████████████████| 324/324 [00:37<00:00,  8.65it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|███████████████████████████████████████| 324/324 [00:37<00:00,  8.64it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|███████████████████████████████████████| 324/324 [00:37<00:00,  8.66it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|███████████████████████████████████████| 324/324 [00:37<00:00,  8.66it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|███████████████████████████████████████| 324/324 [00:37<00:00,  8.66it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|███████████████████████████████████████| 324/324 [00:37<00:00,  8.62it/s]


Analysis run on 256 entities from 221 out of 686 input genes
DCM Fibroblasts


100%|████████████████████████████████████| 401/401 [00:00<00:00, 18468.39it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|████████████████████████████████████| 401/401 [00:00<00:00, 18295.62it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|████████████████████████████████████| 401/401 [00:00<00:00, 18106.34it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|████████████████████████████████████| 401/401 [00:00<00:00, 18488.48it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|████████████████████████████████████| 401/401 [00:00<00:00, 18145.60it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|████████████████████████████████████| 401/401 [00:00<00:00, 18284.48it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|████████████████████████████████████| 401/401 [00:00<00:00, 17936.23it/s]
100%|████████████████████████████████████| 401/401 [00:00<00:00, 18098.74it/s]
100%|████████████████████████████████████| 401/401 [00:00<00:00, 18168.54it/s]
100%|████████████████████████████████████| 401/401 [00:00<00:00, 18045.15it/s]
100%|████████████████████████████████████| 401/401 [00:00<00:00, 18197.63it/s]
100%|████████████████████████████████████| 401/401 [00:00<00:00, 18060.45it/s]
100%|███████████████████████████████████████| 401/401 [02:28<00:00,  2.69it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|███████████████████████████████████████| 401/401 [02:29<00:00,  2.69it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|███████████████████████████████████████| 401/401 [02:29<00:00,  2.67it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|███████████████████████████████████████| 401/401 [02:29<00:00,  2.68it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|███████████████████████████████████████| 401/401 [02:29<00:00,  2.68it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|███████████████████████████████████████| 401/401 [02:29<00:00,  2.68it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|████████████████████████████████████| 358/358 [00:00<00:00, 16839.31it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|████████████████████████████████████| 358/358 [00:00<00:00, 18336.31it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|████████████████████████████████████| 358/358 [00:00<00:00, 18419.54it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|████████████████████████████████████| 358/358 [00:00<00:00, 17686.85it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|████████████████████████████████████| 358/358 [00:00<00:00, 18162.43it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|████████████████████████████████████| 358/358 [00:00<00:00, 18501.24it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|████████████████████████████████████| 358/358 [00:00<00:00, 18235.66it/s]
100%|████████████████████████████████████| 358/358 [00:00<00:00, 18053.46it/s]
100%|████████████████████████████████████| 358/358 [00:00<00:00, 18225.26it/s]
100%|████████████████████████████████████| 358/358 [00:00<00:00, 18004.33it/s]
100%|████████████████████████████████████| 358/358 [00:00<00:00, 18066.28it/s]
100%|████████████████████████████████████| 358/358 [00:00<00:00, 17905.35it/s]
100%|███████████████████████████████████████| 358/358 [02:01<00:00,  2.94it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|███████████████████████████████████████| 358/358 [02:02<00:00,  2.93it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|███████████████████████████████████████| 358/358 [02:01<00:00,  2.94it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|███████████████████████████████████████| 358/358 [02:01<00:00,  2.94it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|███████████████████████████████████████| 358/358 [02:01<00:00,  2.94it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|███████████████████████████████████████| 358/358 [02:02<00:00,  2.93it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|████████████████████████████████████| 283/283 [00:00<00:00, 18124.45it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|████████████████████████████████████| 283/283 [00:00<00:00, 17352.36it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|████████████████████████████████████| 283/283 [00:00<00:00, 17405.79it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|████████████████████████████████████| 283/283 [00:00<00:00, 17888.72it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|████████████████████████████████████| 283/283 [00:00<00:00, 18201.99it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|████████████████████████████████████| 283/283 [00:00<00:00, 18170.22it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|████████████████████████████████████| 283/283 [00:00<00:00, 17215.45it/s]
100%|████████████████████████████████████| 283/283 [00:00<00:00, 18081.93it/s]
100%|████████████████████████████████████| 283/283 [00:00<00:00, 17956.64it/s]
100%|████████████████████████████████████| 283/283 [00:00<00:00, 17888.72it/s]
100%|████████████████████████████████████| 283/283 [00:00<00:00, 17886.29it/s]
100%|████████████████████████████████████| 283/283 [00:00<00:00, 17760.51it/s]
100%|███████████████████████████████████████| 283/283 [02:04<00:00,  2.28it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|███████████████████████████████████████| 283/283 [02:03<00:00,  2.28it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|███████████████████████████████████████| 283/283 [02:04<00:00,  2.28it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|███████████████████████████████████████| 283/283 [02:03<00:00,  2.28it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|███████████████████████████████████████| 283/283 [02:04<00:00,  2.28it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|███████████████████████████████████████| 283/283 [02:03<00:00,  2.28it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|████████████████████████████████████| 461/461 [00:00<00:00, 18184.48it/s]


Analysis run on 360 entities from 311 out of 1092 input genes


100%|████████████████████████████████████| 461/461 [00:00<00:00, 17899.32it/s]


Analysis run on 360 entities from 311 out of 1092 input genes


100%|████████████████████████████████████| 461/461 [00:00<00:00, 18178.84it/s]


Analysis run on 360 entities from 311 out of 1092 input genes


100%|████████████████████████████████████| 461/461 [00:00<00:00, 17846.95it/s]


Analysis run on 360 entities from 311 out of 1092 input genes


100%|████████████████████████████████████| 461/461 [00:00<00:00, 18425.87it/s]


Analysis run on 360 entities from 311 out of 1092 input genes


100%|████████████████████████████████████| 461/461 [00:00<00:00, 16168.63it/s]


Analysis run on 360 entities from 311 out of 1092 input genes


100%|████████████████████████████████████| 461/461 [00:00<00:00, 16329.62it/s]
100%|████████████████████████████████████| 461/461 [00:00<00:00, 17866.90it/s]
100%|████████████████████████████████████| 461/461 [00:00<00:00, 17958.00it/s]
100%|████████████████████████████████████| 461/461 [00:00<00:00, 17909.27it/s]
100%|████████████████████████████████████| 461/461 [00:00<00:00, 17891.70it/s]
100%|████████████████████████████████████| 461/461 [00:00<00:00, 17837.89it/s]
100%|███████████████████████████████████████| 461/461 [02:44<00:00,  2.80it/s]


Analysis run on 360 entities from 311 out of 1092 input genes


100%|███████████████████████████████████████| 461/461 [02:44<00:00,  2.80it/s]


Analysis run on 360 entities from 311 out of 1092 input genes


100%|███████████████████████████████████████| 461/461 [02:44<00:00,  2.80it/s]


Analysis run on 360 entities from 311 out of 1092 input genes


100%|███████████████████████████████████████| 461/461 [02:44<00:00,  2.80it/s]


Analysis run on 360 entities from 311 out of 1092 input genes


100%|███████████████████████████████████████| 461/461 [05:19<00:00,  1.44it/s]


Analysis run on 360 entities from 311 out of 1092 input genes


100%|███████████████████████████████████████████| 461/461 [58:42<00:00,  7.64s/it]


Analysis run on 360 entities from 311 out of 1092 input genes


100%|████████████████████████████████████████| 452/452 [00:00<00:00, 18178.05it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|████████████████████████████████████████| 452/452 [00:00<00:00, 15889.25it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|████████████████████████████████████████| 452/452 [00:00<00:00, 18382.16it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|████████████████████████████████████████| 452/452 [00:00<00:00, 18602.39it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|████████████████████████████████████████| 452/452 [00:00<00:00, 18600.93it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|████████████████████████████████████████| 452/452 [00:00<00:00, 18427.18it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|████████████████████████████████████████| 452/452 [00:00<00:00, 16829.94it/s]
100%|████████████████████████████████████████| 452/452 [00:00<00:00, 17443.78it/s]
100%|████████████████████████████████████████| 452/452 [00:00<00:00, 18281.83it/s]
100%|████████████████████████████████████████| 452/452 [00:00<00:00, 18221.38it/s]
100%|████████████████████████████████████████| 452/452 [00:00<00:00, 17780.48it/s]
100%|████████████████████████████████████████| 452/452 [00:00<00:00, 18130.77it/s]
100%|███████████████████████████████████████████| 452/452 [31:45<00:00,  4.22s/it]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████| 452/452 [1:16:57<00:00, 10.21s/it]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████| 452/452 [1:20:08<00:00, 10.64s/it]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|███████████████████████████████████████████| 452/452 [17:56<00:00,  2.38s/it]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|███████████████████████████████████████████| 452/452 [26:00<00:00,  3.45s/it]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|███████████████████████████████████████████| 452/452 [17:59<00:00,  2.39s/it]


Analysis run on 396 entities from 338 out of 1135 input genes
Aging Brain Astrocytes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 17057.65it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 17617.69it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 17827.92it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 17992.80it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 15952.38it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 17726.31it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 109/109 [00:00<00:00, 17472.93it/s]
100%|████████████████████████████████████████| 109/109 [00:00<00:00, 17350.91it/s]
100%|████████████████████████████████████████| 109/109 [00:00<00:00, 17423.65it/s]
100%|████████████████████████████████████████| 109/109 [00:00<00:00, 17653.75it/s]
100%|████████████████████████████████████████| 109/109 [00:00<00:00, 17751.77it/s]
100%|████████████████████████████████████████| 109/109 [00:00<00:00, 17714.63it/s]
100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 177.29it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 210.50it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 218.13it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 216.55it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 217.12it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 220.08it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████| 254/254 [00:00<00:00, 17538.70it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|████████████████████████████████████████| 254/254 [00:00<00:00, 18519.83it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|████████████████████████████████████████| 254/254 [00:00<00:00, 18329.92it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|████████████████████████████████████████| 254/254 [00:00<00:00, 18352.65it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|████████████████████████████████████████| 254/254 [00:00<00:00, 18315.74it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|████████████████████████████████████████| 254/254 [00:00<00:00, 18427.25it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|████████████████████████████████████████| 254/254 [00:00<00:00, 16349.30it/s]
100%|████████████████████████████████████████| 254/254 [00:00<00:00, 17956.10it/s]
100%|████████████████████████████████████████| 254/254 [00:00<00:00, 18110.55it/s]
100%|████████████████████████████████████████| 254/254 [00:00<00:00, 17921.36it/s]
100%|████████████████████████████████████████| 254/254 [00:00<00:00, 18043.68it/s]
100%|████████████████████████████████████████| 254/254 [00:00<00:00, 18059.90it/s]
100%|███████████████████████████████████████████| 254/254 [00:25<00:00,  9.89it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|███████████████████████████████████████████| 254/254 [00:36<00:00,  6.96it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|███████████████████████████████████████████| 254/254 [00:14<00:00, 17.68it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|███████████████████████████████████████████| 254/254 [00:38<00:00,  6.68it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|███████████████████████████████████████████| 254/254 [00:17<00:00, 14.31it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|███████████████████████████████████████████| 254/254 [00:13<00:00, 18.99it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|████████████████████████████████████████| 163/163 [00:00<00:00, 16804.02it/s]


Analysis run on 103 entities from 85 out of 286 input genes


100%|████████████████████████████████████████| 163/163 [00:00<00:00, 18466.13it/s]


Analysis run on 103 entities from 85 out of 286 input genes


100%|████████████████████████████████████████| 163/163 [00:00<00:00, 16059.18it/s]


Analysis run on 103 entities from 85 out of 286 input genes


100%|████████████████████████████████████████| 163/163 [00:00<00:00, 17489.23it/s]


Analysis run on 103 entities from 85 out of 286 input genes


100%|████████████████████████████████████████| 163/163 [00:00<00:00, 17949.79it/s]


Analysis run on 103 entities from 85 out of 286 input genes


100%|████████████████████████████████████████| 163/163 [00:00<00:00, 18206.00it/s]


Analysis run on 103 entities from 85 out of 286 input genes


100%|████████████████████████████████████████| 163/163 [00:00<00:00, 15949.04it/s]
100%|████████████████████████████████████████| 163/163 [00:00<00:00, 16546.58it/s]
100%|████████████████████████████████████████| 163/163 [00:00<00:00, 17876.57it/s]
100%|████████████████████████████████████████| 163/163 [00:00<00:00, 16598.80it/s]
100%|████████████████████████████████████████| 163/163 [00:00<00:00, 16800.30it/s]
100%|████████████████████████████████████████| 163/163 [00:00<00:00, 16530.18it/s]
100%|███████████████████████████████████████████| 163/163 [00:29<00:00,  5.58it/s]


Analysis run on 103 entities from 85 out of 286 input genes


100%|███████████████████████████████████████████| 163/163 [00:29<00:00,  5.55it/s]


Analysis run on 103 entities from 85 out of 286 input genes


100%|███████████████████████████████████████████| 163/163 [00:28<00:00,  5.63it/s]


Analysis run on 103 entities from 85 out of 286 input genes


100%|███████████████████████████████████████████| 163/163 [00:42<00:00,  3.86it/s]


Analysis run on 103 entities from 85 out of 286 input genes


100%|███████████████████████████████████████████| 163/163 [00:29<00:00,  5.52it/s]


Analysis run on 103 entities from 85 out of 286 input genes


100%|███████████████████████████████████████████| 163/163 [00:29<00:00,  5.45it/s]


Analysis run on 103 entities from 85 out of 286 input genes


100%|██████████████████████████████████████████| 89/89 [00:00<00:00, 16920.95it/s]


Analysis run on 59 entities from 45 out of 190 input genes


100%|██████████████████████████████████████████| 89/89 [00:00<00:00, 17810.63it/s]


Analysis run on 59 entities from 45 out of 190 input genes


100%|██████████████████████████████████████████| 89/89 [00:00<00:00, 17774.17it/s]


Analysis run on 59 entities from 45 out of 190 input genes


100%|██████████████████████████████████████████| 89/89 [00:00<00:00, 17871.17it/s]


Analysis run on 59 entities from 45 out of 190 input genes


100%|██████████████████████████████████████████| 89/89 [00:00<00:00, 15855.80it/s]


Analysis run on 59 entities from 45 out of 190 input genes


100%|██████████████████████████████████████████| 89/89 [00:00<00:00, 17198.48it/s]


Analysis run on 59 entities from 45 out of 190 input genes


100%|██████████████████████████████████████████| 89/89 [00:00<00:00, 17311.74it/s]
100%|██████████████████████████████████████████| 89/89 [00:00<00:00, 17111.76it/s]
100%|██████████████████████████████████████████| 89/89 [00:00<00:00, 17161.32it/s]
100%|██████████████████████████████████████████| 89/89 [00:00<00:00, 17437.90it/s]
100%|██████████████████████████████████████████| 89/89 [00:00<00:00, 13878.10it/s]
100%|██████████████████████████████████████████| 89/89 [00:00<00:00, 16381.12it/s]
100%|█████████████████████████████████████████████| 89/89 [00:05<00:00, 15.03it/s]


Analysis run on 59 entities from 45 out of 190 input genes


100%|█████████████████████████████████████████████| 89/89 [00:05<00:00, 15.26it/s]


Analysis run on 59 entities from 45 out of 190 input genes


100%|█████████████████████████████████████████████| 89/89 [00:05<00:00, 15.23it/s]


Analysis run on 59 entities from 45 out of 190 input genes


100%|█████████████████████████████████████████████| 89/89 [00:05<00:00, 15.28it/s]


Analysis run on 59 entities from 45 out of 190 input genes


100%|█████████████████████████████████████████████| 89/89 [00:05<00:00, 15.21it/s]


Analysis run on 59 entities from 45 out of 190 input genes


100%|█████████████████████████████████████████████| 89/89 [00:05<00:00, 15.23it/s]


Analysis run on 59 entities from 45 out of 190 input genes
P97 Inhibitor


100%|████████████████████████████████████████| 480/480 [00:00<00:00, 18525.57it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|████████████████████████████████████████| 480/480 [00:00<00:00, 18671.95it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|████████████████████████████████████████| 480/480 [00:00<00:00, 18552.88it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|████████████████████████████████████████| 480/480 [00:00<00:00, 18733.98it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|████████████████████████████████████████| 480/480 [00:00<00:00, 18423.17it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|████████████████████████████████████████| 480/480 [00:00<00:00, 18570.68it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|████████████████████████████████████████| 480/480 [00:00<00:00, 17594.79it/s]
100%|████████████████████████████████████████| 480/480 [00:00<00:00, 18217.62it/s]
100%|████████████████████████████████████████| 480/480 [00:00<00:00, 18254.46it/s]
100%|████████████████████████████████████████| 480/480 [00:00<00:00, 18178.97it/s]
100%|████████████████████████████████████████| 480/480 [00:00<00:00, 17727.25it/s]
100%|████████████████████████████████████████| 480/480 [00:00<00:00, 18229.33it/s]
100%|███████████████████████████████████████████| 480/480 [00:42<00:00, 11.27it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|███████████████████████████████████████████| 480/480 [00:42<00:00, 11.32it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|███████████████████████████████████████████| 480/480 [00:43<00:00, 11.15it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|███████████████████████████████████████████| 480/480 [00:42<00:00, 11.24it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|███████████████████████████████████████████| 480/480 [00:43<00:00, 11.05it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|███████████████████████████████████████████| 480/480 [00:44<00:00, 10.87it/s]


Analysis run on 338 entities from 270 out of 766 input genes
Macrophage


100%|████████████████████████████████████████| 667/667 [00:00<00:00, 18347.93it/s]


Analysis run on 620 entities from 511 out of 1519 input genes


100%|████████████████████████████████████████| 667/667 [00:00<00:00, 18565.39it/s]


Analysis run on 620 entities from 511 out of 1519 input genes


100%|████████████████████████████████████████| 667/667 [00:00<00:00, 18529.86it/s]


Analysis run on 620 entities from 511 out of 1519 input genes


100%|████████████████████████████████████████| 667/667 [00:00<00:00, 18600.70it/s]


Analysis run on 620 entities from 511 out of 1519 input genes


100%|████████████████████████████████████████| 667/667 [00:00<00:00, 18281.03it/s]


Analysis run on 620 entities from 511 out of 1519 input genes


100%|████████████████████████████████████████| 667/667 [00:00<00:00, 17763.45it/s]


Analysis run on 620 entities from 511 out of 1519 input genes


100%|████████████████████████████████████████| 667/667 [00:00<00:00, 17965.70it/s]
100%|████████████████████████████████████████| 667/667 [00:00<00:00, 18018.35it/s]
100%|████████████████████████████████████████| 667/667 [00:00<00:00, 18299.56it/s]
100%|████████████████████████████████████████| 667/667 [00:00<00:00, 18419.81it/s]
100%|████████████████████████████████████████| 667/667 [00:00<00:00, 18278.52it/s]
100%|████████████████████████████████████████| 667/667 [00:00<00:00, 17613.81it/s]
100%|███████████████████████████████████████████| 667/667 [03:10<00:00,  3.49it/s]


Analysis run on 620 entities from 511 out of 1519 input genes


100%|███████████████████████████████████████████| 667/667 [03:11<00:00,  3.49it/s]


Analysis run on 620 entities from 511 out of 1519 input genes


100%|███████████████████████████████████████████| 667/667 [03:10<00:00,  3.50it/s]


Analysis run on 620 entities from 511 out of 1519 input genes


100%|███████████████████████████████████████████| 667/667 [03:10<00:00,  3.50it/s]


Analysis run on 620 entities from 511 out of 1519 input genes


100%|███████████████████████████████████████████| 667/667 [03:11<00:00,  3.48it/s]


Analysis run on 620 entities from 511 out of 1519 input genes


100%|█████████████████████████████████████████| 667/667 [3:16:28<00:00, 17.67s/it]


Analysis run on 620 entities from 511 out of 1519 input genes
NASH


100%|██████████████████████████████████████████| 98/98 [00:00<00:00, 16278.88it/s]


Analysis run on 70 entities from 51 out of 121 input genes


100%|██████████████████████████████████████████| 98/98 [00:00<00:00, 16783.38it/s]


Analysis run on 70 entities from 51 out of 121 input genes


100%|██████████████████████████████████████████| 98/98 [00:00<00:00, 16036.90it/s]


Analysis run on 70 entities from 51 out of 121 input genes


100%|██████████████████████████████████████████| 98/98 [00:00<00:00, 16409.51it/s]


Analysis run on 70 entities from 51 out of 121 input genes


100%|██████████████████████████████████████████| 98/98 [00:00<00:00, 18134.73it/s]


Analysis run on 70 entities from 51 out of 121 input genes


100%|██████████████████████████████████████████| 98/98 [00:00<00:00, 15800.79it/s]


Analysis run on 70 entities from 51 out of 121 input genes


100%|██████████████████████████████████████████| 98/98 [00:00<00:00, 15565.64it/s]
100%|██████████████████████████████████████████| 98/98 [00:00<00:00, 15307.68it/s]
100%|██████████████████████████████████████████| 98/98 [00:00<00:00, 15814.17it/s]
100%|██████████████████████████████████████████| 98/98 [00:00<00:00, 17468.84it/s]
100%|██████████████████████████████████████████| 98/98 [00:00<00:00, 17085.45it/s]
100%|██████████████████████████████████████████| 98/98 [00:00<00:00, 17244.58it/s]
100%|█████████████████████████████████████████████| 98/98 [04:23<00:00,  2.69s/it]


Analysis run on 70 entities from 51 out of 121 input genes


100%|█████████████████████████████████████████████| 98/98 [00:01<00:00, 78.11it/s]


Analysis run on 70 entities from 51 out of 121 input genes


100%|█████████████████████████████████████████████| 98/98 [00:01<00:00, 77.73it/s]


Analysis run on 70 entities from 51 out of 121 input genes


100%|█████████████████████████████████████████████| 98/98 [00:01<00:00, 79.23it/s]


Analysis run on 70 entities from 51 out of 121 input genes


100%|█████████████████████████████████████████████| 98/98 [15:23<00:00,  9.42s/it]


Analysis run on 70 entities from 51 out of 121 input genes


100%|█████████████████████████████████████████████| 98/98 [00:01<00:00, 82.69it/s]


Analysis run on 70 entities from 51 out of 121 input genes


Save data for figure 3

In [11]:
def make_table(results_combined):
    results = []
    for r in results_combined:
        for d in np.array(r):
            results.append(np.append(d[-1],d*d[-1]/100))
    results = np.array(results)
    print(results[:,:-1].sum(axis = 0))

Table 2

In [25]:
make_table(results_combined_ff_s)
make_table(results_combined_s_ff)

[187. 144. 142. 140.  52.  29.  14.]
[96. 53. 53. 48. 47. 43. 42.]


In [62]:
make_table(results_combined_nc_ff)
make_table(results_combined_ff_nc)
make_table(results_combined_nc_s)
make_table(results_combined_s_nc)

[229.  65.  30.  18.  15.  13.  12.]
[187.  23.  21.  20.  18.  18.  16.]
[229. 176. 174. 171.  87.  65.  49.]
[96. 43. 36. 35. 31. 27. 25.]


In [26]:
d = {'s_ff':results_combined_s_ff,'ff_s':results_combined_ff_s,'s_nc':results_combined_s_nc,
     'nc_s':results_combined_nc_s,'nc_ff':results_combined_nc_ff,'ff_nc':results_combined_ff_nc}
for k,v in d.items():
    df =[]
    for i, results in enumerate(v):
        for j, r in enumerate(results):
            df.append([i,j]+r)
    pd.DataFrame(df).set_index(0).to_csv(f'../figures/figure_3/{k}.csv',header = None)

In [34]:
X = pd.read_csv('../figures/figure_3/s_ff.csv',header=None)

In [48]:
def read_result_file(file):
    """ X: pd dataframe read from file. first column corresponds to paper index, second corresponds to dataset index within the paper
    y: corresponds to each paper
    """
    Y = []
    y = []
    X = pd.read_csv(file,header=None)
    
    for x in X.iterrows():
        if x[1][1] == 0:
            Y.append(y)
            y = []
        y.append(list(x[1][2:]))
    Y.append(y)
    Y = Y[1:]
    Y
    return Y

In [51]:
s_ff = read_result_file('../figures/figure_3/s_ff.csv')
s_nc = read_result_file('../figures/figure_3/s_nc.csv')
ff_s = read_result_file('../figures/figure_3/ff_s.csv')
ff_nc = read_result_file('../figures/figure_3/ff_nc.csv')
nc_ff = read_result_file('../figures/figure_3/nc_ff.csv')
nc_s = read_result_file('../figures/figure_3/nc_s.csv')

In [27]:
def group_results(combined):
    result = []
    for r in combined:
        result.append(np.array(r).mean(axis = 0))
    return result

In [58]:
def make_plot(method,complement_method,datasets,colors,results,FDRs):
    p = bokeh.plotting.figure(
    title=f"{method} Method at FDR=.10 vs {complement_method} Method",
    frame_height=500,
    frame_width=500,
    x_range=[0.05, 0.55],
    y_range=[-5, 110],
    y_axis_label = f'% unique results vs {complement_method} method',
    x_axis_label = f'FDR for {complement_method} method'
    )
    x = FDRs
    d = list(datasets.keys())
    for i in range(len(d)):
        vals = results[i][:-1]
        c = colors[i]
        if i == 0:
            label = d[i]+', mean = '+str(results[i][-1])
        else:
            label = d[i]+', '+str(results[i][-1])
        shift = np.random.randint(0,high=10)/10
        p.line(x,vals+shift,legend_label = label,color = c,FDR = 0.9, line_width = 2)
        p.circle(x,vals+shift,legend_label = label,color = c,FDR = 0.9, size = 4)
    p.xaxis.ticker=x
    p.grid.visible = False
    p.legend.location = 'top_right'
    p.legend.click_policy = 'hide'
    return p


In [60]:
colors = ['orange','crimson','red','salmon','purple','violet','orangered']
p1 = make_plot('Step','Gene List',datasets,colors,group_results(s_ff),FDRs)
p2 = make_plot('Gene List','Step',datasets,colors,group_results(ff_s),FDRs)
p3 = make_plot('Step',"Weighted Step",datasets,colors,group_results(s_nc),FDRs)
p4 = make_plot('Gene List',"Weighted Step",datasets,colors,group_results(ff_nc),FDRs)
p5 = make_plot("Weighted Step",'Step',datasets,colors,group_results(nc_s),FDRs)
p6 = make_plot("Weighted Step",'Gene List',datasets,colors,group_results(nc_ff),FDRs)

g = bokeh.layouts.grid([[p1,p2],[p3,p5],[p4,p6]])
bokeh.io.show(g)