In [1]:
!date
import pandas as pd
import numpy as np
import scipy.stats
from scipy.stats import hypergeom
import sys
sys.path.append('../dev')
import os

import utils
import enrich
pd.options.display.max_colwidth = 100

Mon Aug 21 16:01:37 PDT 2023


# Model Size Changes

In [2]:
x1 = pd.read_csv('../data/gocam_sizes_mouse.csv')
x2 = pd.read_csv('../data/gocam_sizes_mouse_ff.csv')
d = pd.Series(x2.sizes.values,index=x2.gocam).to_dict()
x1['sizes_ff'] = x1.gocam.apply(lambda x: d.get(x,'F'))
x1 = x1.query('sizes_ff != "F"')
x1['diff'] = x1['sizes_ff'] - x1['sizes']
x1.query('diff < 0')


Unnamed: 0,gocam,sizes,sizes_ff,diff
213,http://model.geneontology.org/R-HSA-4090294,12,9,-3
267,http://model.geneontology.org/R-HSA-3232118,10,9,-1
283,http://model.geneontology.org/R-HSA-3214858,10,9,-1
382,http://model.geneontology.org/R-HSA-69541,8,7,-1
446,http://model.geneontology.org/R-HSA-5649702,7,6,-1
492,http://model.geneontology.org/R-HSA-111465,6,5,-1
564,http://model.geneontology.org/R-HSA-9028731,5,4,-1
575,http://model.geneontology.org/R-HSA-9026527,5,4,-1
845,http://model.geneontology.org/R-HSA-2454202,3,2,-1


In [3]:
#absolute difference
s = x1['diff']
s = pd.to_numeric(s)
s.describe(percentiles = [0.25,0.5,0.75,0.95]).apply(lambda x: int(x))

count    1211
mean        5
std        19
min        -3
25%         0
50%         1
75%         4
95%        19
max       255
Name: diff, dtype: int64

In [4]:
#relative difference
s1 = -x1['diff']/x1['sizes_ff']*100
s1 = pd.to_numeric(s1)
s1.describe(percentiles = [.05,0.25,0.5,0.75,]).apply(lambda x: int(x))

count    1211
mean      -20
std        27
min       -98
5%        -76
25%       -40
50%        -3
75%         0
max        50
dtype: int64

# Comparing uniqueness of results across all datasets at varying FDRs

In [5]:
def drop_threshold(filename, id_type, method, thresholds):
    results = {}
    for a in thresholds:
        #r = set(enrich.enrich(genes, cancer_test_set, uniprot2input, gocam_sizes, Dict, FDR = a)[4].title.values)
        r = set(enrich.enrich_wrapper(filename, id_type, method = method, FDR = a).title.values)
        results[a]=r
    return results
    

In [6]:
import bokeh.io
import bokeh.plotting

bokeh.io.output_notebook()

In [7]:
path = '../test_data/processed'

datasets = {'Covid-19 Platelets':('Gene Symbol',['platelets_up.csv','platelets_down.csv']),
            'DCM Cardiomyocytes':('Gene Symbol',['LMNA_comb.csv','PKP2_comb.csv','RBM20_comb.csv','TTN_comb.csv','PVneg_comb.csv']),
            'DCM Fibroblasts':('Gene Symbol',['LMNA_FB_comb.csv','PKP2_FB_comb.csv','RBM20_FB_comb.csv','TTN_FB_comb.csv','PVneg_FB_comb.csv']),
            'Aging Brain Astrocytes':('Gene Symbol',['astro_HTH_up.csv','astro_CB_up.csv','astro_HTH_down.csv','astro_CB_down.csv']),
            'P97 Inhibitor':('uniprot',['P97.csv']),
            'Macrophage':('Gene Symbol',['mac_comb.csv']),
            'NASH':('Gene Symbol',['Goavere_S2.csv'])
           }
results_combined_s_ff = []
results_combined_s_nc = []
results_combined_ff_s = []
results_combined_ff_nc = []
results_combined_nc_s = []
results_combined_nc_ff = []

results_combined_sim_ff = []
results_combined_sim_nc = []
results_combined_sim_s = []
FDRs = [.1,.15,.2,.3,.4,.5]
for paper,val in datasets.items():
    print(paper)
    symbol_type = val[0]
    datasets_ = val[1]
    
    s_ff_total = []
    s_nc_total = []
    ff_s_total = []
    ff_nc_total = []
    nc_s_total = []
    nc_ff_total = []
    for dataset in datasets_:
        filename = os.path.join(path,dataset)

        results_s = drop_threshold(filename, symbol_type, 'set', FDRs)
        results_ff = drop_threshold(filename, symbol_type, 'standard', FDRs)
        results_nc = drop_threshold(filename, symbol_type, 'ncHGT', FDRs)

        s_ff = []
        s_nc = []
        s_05 = results_s[.1]
        s_05_len = len(s_05)
        if s_05_len == 0:
            s_05_len = 1 #to prevent division of 0 / 0

        ff_s = []
        ff_nc = []
        ff_05 = results_ff[.1]
        ff_05_len = len(ff_05)
        if ff_05_len == 0:
            ff_05_len = 1 #to prevent division of 0 / 0

        nc_s = []
        nc_ff = []
        nc_05 = results_nc[.1]
        nc_05_len = len(nc_05)
        if nc_05_len == 0:
            nc_05_len = 1 #to prevent division of 0 / 0

        for a in FDRs:
            s_ff.append(len(s_05-results_ff[a])/s_05_len*100)
            ff_s.append(len(ff_05-results_s[a])/ff_05_len*100)
            s_nc.append(len(s_05-results_nc[a])/s_05_len*100)
            ff_nc.append(len(ff_05-results_nc[a])/ff_05_len*100)
            nc_ff.append(len(nc_05-results_ff[a])/nc_05_len*100)
            nc_s.append(len(nc_05-results_s[a])/nc_05_len*100)

        s_ff.append(len(s_05))
        s_nc.append(len(s_05))
        ff_s.append(len(ff_05))
        ff_nc.append(len(ff_05))
        nc_s.append(len(nc_05))
        nc_ff.append(len(nc_05))
    
        s_ff_total.append(s_ff)
        s_nc_total.append(s_nc)
        ff_s_total.append(ff_s)
        ff_nc_total.append(ff_nc)
        nc_s_total.append(nc_s)
        nc_ff_total.append(nc_ff)
    
    
    results_combined_s_ff.append(s_ff_total)
    results_combined_s_nc.append(s_nc_total)
    results_combined_ff_s.append(ff_s_total)
    results_combined_ff_nc.append(ff_nc_total)
    results_combined_nc_s.append(nc_s_total)
    results_combined_nc_ff.append(nc_ff_total)
        

Covid-19 Platelets


100%|██████████████████████████████████████████| 482/482 [00:00<00:00, 16759.97it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████████| 482/482 [00:00<00:00, 17801.90it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████████| 482/482 [00:00<00:00, 17924.22it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████████| 482/482 [00:00<00:00, 17580.98it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████████| 482/482 [00:00<00:00, 17393.87it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████████| 482/482 [00:00<00:00, 17787.33it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████████| 482/482 [00:00<00:00, 17932.80it/s]
100%|██████████████████████████████████████████| 482/482 [00:00<00:00, 18268.07it/s]
100%|██████████████████████████████████████████| 482/482 [00:00<00:00, 17736.92it/s]
100%|██████████████████████████████████████████| 482/482 [00:00<00:00, 17697.18it/s]
100%|██████████████████████████████████████████| 482/482 [00:00<00:00, 16066.81it/s]
100%|██████████████████████████████████████████| 482/482 [00:00<00:00, 17968.98it/s]
100%|█████████████████████████████████████████████| 482/482 [01:21<00:00,  5.94it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|█████████████████████████████████████████████| 482/482 [01:19<00:00,  6.09it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|█████████████████████████████████████████████| 482/482 [01:18<00:00,  6.13it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|█████████████████████████████████████████████| 482/482 [01:18<00:00,  6.14it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|█████████████████████████████████████████████| 482/482 [05:19<00:00,  1.51it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|█████████████████████████████████████████████| 482/482 [01:18<00:00,  6.11it/s]


Analysis run on 423 entities from 365 out of 1172 input genes


100%|██████████████████████████████████████████| 436/436 [00:00<00:00, 18175.03it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|██████████████████████████████████████████| 436/436 [00:00<00:00, 18731.67it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|██████████████████████████████████████████| 436/436 [00:00<00:00, 17862.40it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|██████████████████████████████████████████| 436/436 [00:00<00:00, 18056.76it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|███████████████████████████████████████████| 436/436 [00:00<00:00, 7437.86it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|██████████████████████████████████████████| 436/436 [00:00<00:00, 18726.87it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|██████████████████████████████████████████| 436/436 [00:00<00:00, 17787.17it/s]
100%|██████████████████████████████████████████| 436/436 [00:00<00:00, 17409.38it/s]
100%|██████████████████████████████████████████| 436/436 [00:00<00:00, 18007.69it/s]
100%|██████████████████████████████████████████| 436/436 [00:00<00:00, 17227.66it/s]
100%|██████████████████████████████████████████| 436/436 [00:00<00:00, 18398.29it/s]
100%|██████████████████████████████████████████| 436/436 [00:00<00:00, 17736.62it/s]
100%|█████████████████████████████████████████████| 436/436 [02:12<00:00,  3.28it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|█████████████████████████████████████████████| 436/436 [02:36<00:00,  2.79it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|█████████████████████████████████████████████| 436/436 [02:12<00:00,  3.28it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|█████████████████████████████████████████████| 436/436 [03:47<00:00,  1.92it/s]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|█████████████████████████████████████████████| 436/436 [15:27<00:00,  2.13s/it]


Analysis run on 309 entities from 267 out of 1088 input genes


100%|█████████████████████████████████████████████| 436/436 [02:13<00:00,  3.26it/s]


Analysis run on 309 entities from 267 out of 1088 input genes
DCM Cardiomyocytes


100%|██████████████████████████████████████████| 326/326 [00:00<00:00, 18195.09it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████████| 326/326 [00:00<00:00, 18534.21it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████████| 326/326 [00:00<00:00, 16530.58it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████████| 326/326 [00:00<00:00, 17519.48it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████████| 326/326 [00:00<00:00, 17524.20it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████████| 326/326 [00:00<00:00, 17927.90it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████████| 326/326 [00:00<00:00, 16870.16it/s]
100%|██████████████████████████████████████████| 326/326 [00:00<00:00, 18382.47it/s]
100%|██████████████████████████████████████████| 326/326 [00:00<00:00, 17896.22it/s]
100%|██████████████████████████████████████████| 326/326 [00:00<00:00, 16832.98it/s]
100%|██████████████████████████████████████████| 326/326 [00:00<00:00, 17481.85it/s]
100%|██████████████████████████████████████████| 326/326 [00:00<00:00, 17435.93it/s]
100%|█████████████████████████████████████████████| 326/326 [02:02<00:00,  2.66it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|█████████████████████████████████████████████| 326/326 [02:03<00:00,  2.63it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|█████████████████████████████████████████████| 326/326 [02:03<00:00,  2.64it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|█████████████████████████████████████████████| 326/326 [02:02<00:00,  2.65it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|█████████████████████████████████████████████| 326/326 [02:03<00:00,  2.64it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|█████████████████████████████████████████████| 326/326 [02:03<00:00,  2.63it/s]


Analysis run on 210 entities from 161 out of 633 input genes


100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 17115.08it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 18455.58it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 18271.32it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 18113.93it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 18257.56it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 18467.00it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 17102.63it/s]
100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 17013.38it/s]
100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 17779.80it/s]
100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 17535.51it/s]
100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 16033.93it/s]
100%|██████████████████████████████████████████| 185/185 [00:00<00:00, 17969.62it/s]
100%|█████████████████████████████████████████████| 185/185 [01:16<00:00,  2.40it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|█████████████████████████████████████████████| 185/185 [01:16<00:00,  2.41it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|█████████████████████████████████████████████| 185/185 [01:16<00:00,  2.41it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|█████████████████████████████████████████████| 185/185 [01:16<00:00,  2.41it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|█████████████████████████████████████████████| 185/185 [01:16<00:00,  2.41it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|█████████████████████████████████████████████| 185/185 [01:16<00:00,  2.41it/s]


Analysis run on 92 entities from 65 out of 309 input genes


100%|██████████████████████████████████████████| 195/195 [00:00<00:00, 17836.81it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████████| 195/195 [00:00<00:00, 18608.27it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████████| 195/195 [00:00<00:00, 18306.31it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████████| 195/195 [00:00<00:00, 18491.73it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████████| 195/195 [00:00<00:00, 17995.76it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████████| 195/195 [00:00<00:00, 18032.26it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████████| 195/195 [00:00<00:00, 18084.09it/s]
100%|██████████████████████████████████████████| 195/195 [00:00<00:00, 18154.74it/s]
100%|██████████████████████████████████████████| 195/195 [00:00<00:00, 17803.42it/s]
100%|██████████████████████████████████████████| 195/195 [00:00<00:00, 18212.55it/s]
100%|██████████████████████████████████████████| 195/195 [00:00<00:00, 18205.66it/s]
100%|██████████████████████████████████████████| 195/195 [00:00<00:00, 17850.44it/s]
100%|█████████████████████████████████████████████| 195/195 [01:11<00:00,  2.72it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|█████████████████████████████████████████████| 195/195 [01:11<00:00,  2.71it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|█████████████████████████████████████████████| 195/195 [01:11<00:00,  2.74it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|█████████████████████████████████████████████| 195/195 [01:11<00:00,  2.74it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|█████████████████████████████████████████████| 195/195 [01:19<00:00,  2.44it/s]


Analysis run on 135 entities from 103 out of 435 input genes


100%|█████████████████████████████████████████████| 195/195 [05:28<00:00,  1.68s/it]


Analysis run on 135 entities from 103 out of 435 input genes


100%|██████████████████████████████████████████| 268/268 [00:00<00:00, 17908.38it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████████| 268/268 [00:00<00:00, 17623.68it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████████| 268/268 [00:00<00:00, 17757.87it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████████| 268/268 [00:00<00:00, 18428.34it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████████| 268/268 [00:00<00:00, 18345.93it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████████| 268/268 [00:00<00:00, 18513.32it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████████| 268/268 [00:00<00:00, 16613.07it/s]
100%|██████████████████████████████████████████| 268/268 [00:00<00:00, 18020.35it/s]
100%|██████████████████████████████████████████| 268/268 [00:00<00:00, 18200.08it/s]
100%|██████████████████████████████████████████| 268/268 [00:00<00:00, 17983.16it/s]
100%|██████████████████████████████████████████| 268/268 [00:00<00:00, 17835.92it/s]
100%|██████████████████████████████████████████| 268/268 [00:00<00:00, 18124.08it/s]
100%|█████████████████████████████████████████████| 268/268 [01:38<00:00,  2.73it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|█████████████████████████████████████████████| 268/268 [01:37<00:00,  2.75it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|█████████████████████████████████████████████| 268/268 [01:38<00:00,  2.72it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|█████████████████████████████████████████████| 268/268 [01:37<00:00,  2.75it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|█████████████████████████████████████████████| 268/268 [01:37<00:00,  2.74it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|█████████████████████████████████████████████| 268/268 [01:37<00:00,  2.75it/s]


Analysis run on 139 entities from 103 out of 396 input genes


100%|██████████████████████████████████████████| 324/324 [00:00<00:00, 18580.18it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████████| 324/324 [00:00<00:00, 18112.63it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████████| 324/324 [00:00<00:00, 18435.25it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████████| 324/324 [00:00<00:00, 18594.93it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████████| 324/324 [00:00<00:00, 18502.77it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████████| 324/324 [00:00<00:00, 18540.89it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|██████████████████████████████████████████| 324/324 [00:00<00:00, 17355.96it/s]
100%|██████████████████████████████████████████| 324/324 [00:00<00:00, 17248.68it/s]
100%|██████████████████████████████████████████| 324/324 [00:00<00:00, 18164.68it/s]
100%|██████████████████████████████████████████| 324/324 [00:00<00:00, 18204.10it/s]
100%|██████████████████████████████████████████| 324/324 [00:00<00:00, 18287.64it/s]
100%|██████████████████████████████████████████| 324/324 [00:00<00:00, 18103.70it/s]
100%|█████████████████████████████████████████████| 324/324 [00:37<00:00,  8.60it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|█████████████████████████████████████████████| 324/324 [00:37<00:00,  8.62it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|█████████████████████████████████████████████| 324/324 [00:37<00:00,  8.64it/s]


Analysis run on 256 entities from 221 out of 686 input genes


100%|█████████████████████████████████████████████| 324/324 [18:11<00:00,  3.37s/it]


Analysis run on 256 entities from 221 out of 686 input genes


100%|█████████████████████████████████████████████| 324/324 [07:45<00:00,  1.44s/it]


Analysis run on 256 entities from 221 out of 686 input genes


100%|█████████████████████████████████████████████| 324/324 [02:46<00:00,  1.94it/s]


Analysis run on 256 entities from 221 out of 686 input genes
DCM Fibroblasts


100%|██████████████████████████████████████████| 401/401 [00:00<00:00, 18515.35it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████████| 401/401 [00:00<00:00, 18241.44it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████████| 401/401 [00:00<00:00, 18719.78it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████████| 401/401 [00:00<00:00, 18509.85it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████████| 401/401 [00:00<00:00, 17723.78it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████████| 401/401 [00:00<00:00, 17772.47it/s]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████████| 401/401 [00:00<00:00, 17429.36it/s]
100%|██████████████████████████████████████████| 401/401 [00:00<00:00, 18208.46it/s]
100%|██████████████████████████████████████████| 401/401 [00:00<00:00, 18231.56it/s]
100%|███████████████████████████████████████████| 401/401 [00:00<00:00, 7234.48it/s]
100%|██████████████████████████████████████████| 401/401 [00:00<00:00, 16841.56it/s]
100%|██████████████████████████████████████████| 401/401 [00:00<00:00, 17959.59it/s]
100%|█████████████████████████████████████████████| 401/401 [38:57<00:00,  5.83s/it]


Analysis run on 284 entities from 234 out of 872 input genes


100%|█████████████████████████████████████████████| 401/401 [15:14<00:00,  2.28s/it]


Analysis run on 284 entities from 234 out of 872 input genes


100%|█████████████████████████████████████████████| 401/401 [07:32<00:00,  1.13s/it]


Analysis run on 284 entities from 234 out of 872 input genes


100%|█████████████████████████████████████████████| 401/401 [06:50<00:00,  1.02s/it]


Analysis run on 284 entities from 234 out of 872 input genes


100%|█████████████████████████████████████████████| 401/401 [42:23<00:00,  6.34s/it]


Analysis run on 284 entities from 234 out of 872 input genes


100%|█████████████████████████████████████████████| 401/401 [33:33<00:00,  5.02s/it]


Analysis run on 284 entities from 234 out of 872 input genes


100%|██████████████████████████████████████████| 358/358 [00:00<00:00, 18464.16it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████████| 358/358 [00:00<00:00, 16702.38it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████████| 358/358 [00:00<00:00, 17637.41it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████████| 358/358 [00:00<00:00, 18640.66it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████████| 358/358 [00:00<00:00, 18597.48it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████████| 358/358 [00:00<00:00, 18463.02it/s]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████████| 358/358 [00:00<00:00, 17215.79it/s]
100%|██████████████████████████████████████████| 358/358 [00:00<00:00, 18108.11it/s]
100%|██████████████████████████████████████████| 358/358 [00:00<00:00, 17059.12it/s]
100%|██████████████████████████████████████████| 358/358 [00:00<00:00, 18296.99it/s]
100%|██████████████████████████████████████████| 358/358 [00:00<00:00, 16837.61it/s]
100%|██████████████████████████████████████████| 358/358 [00:00<00:00, 17338.24it/s]
100%|█████████████████████████████████████████████| 358/358 [46:19<00:00,  7.76s/it]


Analysis run on 239 entities from 191 out of 725 input genes


100%|█████████████████████████████████████████████| 358/358 [16:03<00:00,  2.69s/it]


Analysis run on 239 entities from 191 out of 725 input genes


100%|███████████████████████████████████████████| 358/358 [1:01:07<00:00, 10.25s/it]


Analysis run on 239 entities from 191 out of 725 input genes


100%|█████████████████████████████████████████████| 358/358 [11:31<00:00,  1.93s/it]


Analysis run on 239 entities from 191 out of 725 input genes


100%|█████████████████████████████████████████████| 358/358 [33:09<00:00,  5.56s/it]


Analysis run on 239 entities from 191 out of 725 input genes


100%|███████████████████████████████████████████| 358/358 [1:21:50<00:00, 13.72s/it]


Analysis run on 239 entities from 191 out of 725 input genes


100%|██████████████████████████████████████████| 283/283 [00:00<00:00, 18160.77it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████████| 283/283 [00:00<00:00, 15379.68it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████████| 283/283 [00:00<00:00, 18324.22it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████████| 283/283 [00:00<00:00, 18062.12it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████████| 283/283 [00:00<00:00, 18195.85it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████████| 283/283 [00:00<00:00, 18538.00it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████████| 283/283 [00:00<00:00, 17609.27it/s]
100%|██████████████████████████████████████████| 283/283 [00:00<00:00, 17986.30it/s]
100%|██████████████████████████████████████████| 283/283 [00:00<00:00, 18185.26it/s]
100%|██████████████████████████████████████████| 283/283 [00:00<00:00, 17969.42it/s]
100%|██████████████████████████████████████████| 283/283 [00:00<00:00, 17997.21it/s]
100%|██████████████████████████████████████████| 283/283 [00:00<00:00, 18278.23it/s]
100%|███████████████████████████████████████████| 283/283 [3:34:11<00:00, 45.41s/it]


Analysis run on 193 entities from 163 out of 625 input genes


100%|███████████████████████████████████████████| 283/283 [2:23:20<00:00, 30.39s/it]


Analysis run on 193 entities from 163 out of 625 input genes


100%|█████████████████████████████████████████████| 283/283 [28:43<00:00,  6.09s/it]


Analysis run on 193 entities from 163 out of 625 input genes


100%|█████████████████████████████████████████████| 283/283 [15:56<00:00,  3.38s/it]


Analysis run on 193 entities from 163 out of 625 input genes


100%|█████████████████████████████████████████████| 283/283 [03:51<00:00,  1.22it/s]


Analysis run on 193 entities from 163 out of 625 input genes


100%|█████████████████████████████████████████████| 283/283 [05:42<00:00,  1.21s/it]


Analysis run on 193 entities from 163 out of 625 input genes


100%|██████████████████████████████████████████| 461/461 [00:00<00:00, 18513.55it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████████| 461/461 [00:00<00:00, 18425.17it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████████| 461/461 [00:00<00:00, 18109.71it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████████| 461/461 [00:00<00:00, 18403.42it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|█████████████████████████████████████████████| 461/461 [00:06<00:00, 67.98it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████████| 461/461 [00:00<00:00, 18679.71it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████████| 461/461 [00:00<00:00, 17860.63it/s]
100%|██████████████████████████████████████████| 461/461 [00:00<00:00, 18206.91it/s]
100%|██████████████████████████████████████████| 461/461 [00:00<00:00, 18081.26it/s]
100%|██████████████████████████████████████████| 461/461 [00:00<00:00, 17935.85it/s]
100%|██████████████████████████████████████████| 461/461 [00:00<00:00, 17954.50it/s]
100%|██████████████████████████████████████████| 461/461 [00:00<00:00, 17461.59it/s]
100%|█████████████████████████████████████████████| 461/461 [33:53<00:00,  4.41s/it]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|█████████████████████████████████████████████| 461/461 [02:45<00:00,  2.79it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|█████████████████████████████████████████████| 461/461 [02:45<00:00,  2.79it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|█████████████████████████████████████████████| 461/461 [02:44<00:00,  2.80it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|█████████████████████████████████████████████| 461/461 [02:46<00:00,  2.77it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|█████████████████████████████████████████████| 461/461 [02:44<00:00,  2.80it/s]


Analysis run on 359 entities from 311 out of 1092 input genes


100%|██████████████████████████████████████████| 452/452 [00:00<00:00, 18561.05it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████████| 452/452 [00:00<00:00, 18699.27it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████████| 452/452 [00:00<00:00, 18463.25it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████████| 452/452 [00:00<00:00, 18655.29it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████████| 452/452 [00:00<00:00, 17802.35it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████████| 452/452 [00:00<00:00, 18476.93it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|██████████████████████████████████████████| 452/452 [00:00<00:00, 18327.07it/s]
100%|██████████████████████████████████████████| 452/452 [00:00<00:00, 18177.35it/s]
100%|██████████████████████████████████████████| 452/452 [00:00<00:00, 15706.40it/s]
100%|██████████████████████████████████████████| 452/452 [00:00<00:00, 17530.89it/s]
100%|██████████████████████████████████████████| 452/452 [00:00<00:00, 16600.63it/s]
100%|██████████████████████████████████████████| 452/452 [00:00<00:00, 16666.01it/s]
100%|█████████████████████████████████████████████| 452/452 [02:51<00:00,  2.63it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████████| 452/452 [03:36<00:00,  2.09it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████████| 452/452 [02:51<00:00,  2.64it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████████| 452/452 [02:51<00:00,  2.64it/s]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████████| 452/452 [23:21<00:00,  3.10s/it]


Analysis run on 396 entities from 338 out of 1135 input genes


100%|█████████████████████████████████████████████| 452/452 [04:55<00:00,  1.53it/s]


Analysis run on 396 entities from 338 out of 1135 input genes
Aging Brain Astrocytes


100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 17209.18it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 17691.32it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 18151.39it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 17771.78it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 16421.07it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 17629.24it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 17149.15it/s]
100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 17910.33it/s]
100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 17937.03it/s]
100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 17241.63it/s]
100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 17504.37it/s]
100%|██████████████████████████████████████████| 109/109 [00:00<00:00, 17160.73it/s]
100%|████████████████████████████████████████████| 109/109 [00:00<00:00, 202.05it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████████| 109/109 [00:00<00:00, 202.30it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████████| 109/109 [00:00<00:00, 197.06it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████████| 109/109 [00:00<00:00, 200.42it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████████| 109/109 [00:00<00:00, 202.34it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|████████████████████████████████████████████| 109/109 [00:00<00:00, 215.19it/s]


Analysis run on 39 entities from 30 out of 130 input genes


100%|██████████████████████████████████████████| 254/254 [00:00<00:00, 18479.35it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████████| 254/254 [00:00<00:00, 16791.50it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████████| 254/254 [00:00<00:00, 17397.50it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████████| 254/254 [00:00<00:00, 18506.32it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████████| 254/254 [00:00<00:00, 18265.18it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████████| 254/254 [00:00<00:00, 17393.81it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████████| 254/254 [00:00<00:00, 17278.71it/s]
100%|██████████████████████████████████████████| 254/254 [00:00<00:00, 16656.81it/s]
100%|██████████████████████████████████████████| 254/254 [00:00<00:00, 17165.40it/s]
100%|██████████████████████████████████████████| 254/254 [00:00<00:00, 17195.87it/s]
100%|██████████████████████████████████████████| 254/254 [00:00<00:00, 17590.83it/s]
100%|██████████████████████████████████████████| 254/254 [00:00<00:00, 17069.96it/s]
100%|█████████████████████████████████████████████| 254/254 [00:13<00:00, 19.32it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|█████████████████████████████████████████████| 254/254 [00:13<00:00, 19.26it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|█████████████████████████████████████████████| 254/254 [00:13<00:00, 19.42it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|█████████████████████████████████████████████| 254/254 [00:13<00:00, 19.50it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|█████████████████████████████████████████████| 254/254 [00:13<00:00, 19.32it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|█████████████████████████████████████████████| 254/254 [00:13<00:00, 19.31it/s]


Analysis run on 149 entities from 127 out of 415 input genes


100%|██████████████████████████████████████████| 163/163 [00:00<00:00, 18127.31it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████████| 163/163 [00:00<00:00, 18512.13it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████████| 163/163 [00:00<00:00, 18329.00it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████████| 163/163 [00:00<00:00, 18478.61it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████████| 163/163 [00:00<00:00, 18137.41it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████████| 163/163 [00:00<00:00, 18054.55it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|██████████████████████████████████████████| 163/163 [00:00<00:00, 17022.00it/s]
100%|██████████████████████████████████████████| 163/163 [00:00<00:00, 18242.92it/s]
100%|██████████████████████████████████████████| 163/163 [00:00<00:00, 17529.14it/s]
100%|██████████████████████████████████████████| 163/163 [00:00<00:00, 16633.13it/s]
100%|██████████████████████████████████████████| 163/163 [00:00<00:00, 17816.47it/s]
100%|██████████████████████████████████████████| 163/163 [00:00<00:00, 16988.16it/s]
100%|█████████████████████████████████████████████| 163/163 [00:29<00:00,  5.60it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|█████████████████████████████████████████████| 163/163 [00:28<00:00,  5.63it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|█████████████████████████████████████████████| 163/163 [00:29<00:00,  5.51it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|█████████████████████████████████████████████| 163/163 [00:28<00:00,  5.62it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|█████████████████████████████████████████████| 163/163 [00:29<00:00,  5.60it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|█████████████████████████████████████████████| 163/163 [00:28<00:00,  5.63it/s]


Analysis run on 102 entities from 85 out of 286 input genes


100%|████████████████████████████████████████████| 89/89 [00:00<00:00, 17474.63it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████████| 89/89 [00:00<00:00, 17926.10it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████████| 89/89 [00:00<00:00, 17478.72it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████████| 89/89 [00:00<00:00, 17950.23it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████████| 89/89 [00:00<00:00, 17914.05it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████████| 89/89 [00:00<00:00, 17977.03it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|████████████████████████████████████████████| 89/89 [00:00<00:00, 17228.65it/s]
100%|████████████████████████████████████████████| 89/89 [00:00<00:00, 15553.88it/s]
100%|████████████████████████████████████████████| 89/89 [00:00<00:00, 17637.28it/s]
100%|████████████████████████████████████████████| 89/89 [00:00<00:00, 17652.29it/s]
100%|████████████████████████████████████████████| 89/89 [00:00<00:00, 16293.89it/s]
100%|████████████████████████████████████████████| 89/89 [00:00<00:00, 17718.49it/s]
100%|███████████████████████████████████████████████| 89/89 [00:05<00:00, 15.16it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|███████████████████████████████████████████████| 89/89 [00:05<00:00, 15.28it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|███████████████████████████████████████████████| 89/89 [00:05<00:00, 15.28it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|███████████████████████████████████████████████| 89/89 [00:05<00:00, 15.24it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|███████████████████████████████████████████████| 89/89 [00:05<00:00, 15.28it/s]


Analysis run on 58 entities from 45 out of 190 input genes


100%|███████████████████████████████████████████████| 89/89 [00:05<00:00, 15.12it/s]


Analysis run on 58 entities from 45 out of 190 input genes
P97 Inhibitor


100%|██████████████████████████████████████████| 480/480 [00:00<00:00, 17017.16it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████████| 480/480 [00:00<00:00, 17680.86it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████████| 480/480 [00:00<00:00, 17675.73it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████████| 480/480 [00:00<00:00, 17481.27it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████████| 480/480 [00:00<00:00, 17776.40it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████████| 480/480 [00:00<00:00, 17945.79it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|██████████████████████████████████████████| 480/480 [00:00<00:00, 17233.91it/s]
100%|██████████████████████████████████████████| 480/480 [00:00<00:00, 18366.20it/s]
100%|██████████████████████████████████████████| 480/480 [00:00<00:00, 16928.16it/s]
100%|██████████████████████████████████████████| 480/480 [00:00<00:00, 16121.99it/s]
100%|██████████████████████████████████████████| 480/480 [00:00<00:00, 16285.66it/s]
100%|██████████████████████████████████████████| 480/480 [00:00<00:00, 17165.00it/s]
100%|█████████████████████████████████████████████| 480/480 [00:42<00:00, 11.22it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|█████████████████████████████████████████████| 480/480 [00:42<00:00, 11.29it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|█████████████████████████████████████████████| 480/480 [00:42<00:00, 11.30it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|█████████████████████████████████████████████| 480/480 [00:42<00:00, 11.25it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|█████████████████████████████████████████████| 480/480 [00:42<00:00, 11.26it/s]


Analysis run on 338 entities from 270 out of 766 input genes


100%|█████████████████████████████████████████████| 480/480 [00:42<00:00, 11.29it/s]


Analysis run on 338 entities from 270 out of 766 input genes
Macrophage


100%|██████████████████████████████████████████| 667/667 [00:00<00:00, 17262.75it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|██████████████████████████████████████████| 667/667 [00:00<00:00, 17632.90it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|██████████████████████████████████████████| 667/667 [00:00<00:00, 18778.24it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|██████████████████████████████████████████| 667/667 [00:00<00:00, 18715.05it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|██████████████████████████████████████████| 667/667 [00:00<00:00, 17947.37it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|██████████████████████████████████████████| 667/667 [00:00<00:00, 18711.30it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|███████████████████████████████████████████| 667/667 [00:00<00:00, 8810.31it/s]
100%|██████████████████████████████████████████| 667/667 [00:00<00:00, 17615.58it/s]
100%|██████████████████████████████████████████| 667/667 [00:00<00:00, 17308.99it/s]
100%|██████████████████████████████████████████| 667/667 [00:00<00:00, 17665.19it/s]
100%|██████████████████████████████████████████| 667/667 [00:00<00:00, 17371.98it/s]
100%|██████████████████████████████████████████| 667/667 [00:00<00:00, 18285.57it/s]
100%|█████████████████████████████████████████████| 667/667 [03:10<00:00,  3.50it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|█████████████████████████████████████████████| 667/667 [03:55<00:00,  2.84it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|█████████████████████████████████████████████| 667/667 [03:12<00:00,  3.46it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|█████████████████████████████████████████████| 667/667 [03:11<00:00,  3.48it/s]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|█████████████████████████████████████████████| 667/667 [45:49<00:00,  4.12s/it]


Analysis run on 619 entities from 511 out of 1519 input genes


100%|█████████████████████████████████████████████| 667/667 [03:58<00:00,  2.80it/s]


Analysis run on 619 entities from 511 out of 1519 input genes
NASH


100%|████████████████████████████████████████████| 98/98 [00:00<00:00, 16407.54it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████████| 98/98 [00:00<00:00, 16698.16it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████████| 98/98 [00:00<00:00, 17844.23it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████████| 98/98 [00:00<00:00, 18205.41it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████████| 98/98 [00:00<00:00, 17584.68it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████████| 98/98 [00:00<00:00, 17673.14it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|████████████████████████████████████████████| 98/98 [00:00<00:00, 17581.67it/s]
100%|████████████████████████████████████████████| 98/98 [00:00<00:00, 17808.66it/s]
100%|████████████████████████████████████████████| 98/98 [00:00<00:00, 17764.03it/s]
100%|████████████████████████████████████████████| 98/98 [00:00<00:00, 17397.86it/s]
100%|████████████████████████████████████████████| 98/98 [00:00<00:00, 17320.15it/s]
100%|████████████████████████████████████████████| 98/98 [00:00<00:00, 17244.58it/s]
100%|███████████████████████████████████████████████| 98/98 [00:01<00:00, 84.94it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|███████████████████████████████████████████████| 98/98 [00:01<00:00, 85.04it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|███████████████████████████████████████████████| 98/98 [00:01<00:00, 84.88it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|███████████████████████████████████████████████| 98/98 [00:01<00:00, 84.72it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|███████████████████████████████████████████████| 98/98 [00:01<00:00, 84.41it/s]


Analysis run on 68 entities from 48 out of 118 input genes


100%|███████████████████████████████████████████████| 98/98 [00:01<00:00, 84.83it/s]


Analysis run on 68 entities from 48 out of 118 input genes


Save data for figure 3

In [8]:
def make_table(results_combined):
    results = []
    for r in results_combined:
        for d in np.array(r):
            results.append(np.append(d[-1],d*d[-1]/100))
    results = np.array(results)
    print(results[:,:-1].sum(axis = 0))

Table 3

In [9]:
make_table(results_combined_ff_s)
make_table(results_combined_s_ff)

[177. 136. 134. 132.  46.  23.   8.]
[94. 53. 53. 50. 48. 44. 43.]


In [10]:
make_table(results_combined_nc_ff)
make_table(results_combined_ff_nc)
make_table(results_combined_nc_s)
make_table(results_combined_s_nc)

[228.  65.  30.  20.  16.  13.  13.]
[177.  14.  12.  11.  10.  10.   8.]
[228. 176. 174. 171.  87.  65.  49.]
[94. 42. 35. 34. 31. 27. 25.]


In [11]:
d = {'s_ff':results_combined_s_ff,'ff_s':results_combined_ff_s,'s_nc':results_combined_s_nc,
     'nc_s':results_combined_nc_s,'nc_ff':results_combined_nc_ff,'ff_nc':results_combined_ff_nc}
for k,v in d.items():
    df =[]
    for i, results in enumerate(v):
        for j, r in enumerate(results):
            df.append([i,j]+r)
    pd.DataFrame(df).set_index(0).to_csv(f'../figures/figure_3/{k}.csv',header = None)

In [12]:
X = pd.read_csv('../figures/figure_3/s_ff.csv',header=None)

In [13]:
def read_result_file(file):
    """ X: pd dataframe read from file. first column corresponds to paper index, second corresponds to dataset index within the paper
    y: corresponds to each paper
    """
    Y = []
    y = []
    X = pd.read_csv(file,header=None)
    
    for x in X.iterrows():
        if x[1][1] == 0:
            Y.append(y)
            y = []
        y.append(list(x[1][2:]))
    Y.append(y)
    Y = Y[1:]
    Y
    return Y

In [14]:
s_ff = read_result_file('../figures/figure_3/s_ff.csv')
s_nc = read_result_file('../figures/figure_3/s_nc.csv')
ff_s = read_result_file('../figures/figure_3/ff_s.csv')
ff_nc = read_result_file('../figures/figure_3/ff_nc.csv')
nc_ff = read_result_file('../figures/figure_3/nc_ff.csv')
nc_s = read_result_file('../figures/figure_3/nc_s.csv')

In [15]:
def group_results(combined):
    result = []
    for r in combined:
        result.append(np.array(r).mean(axis = 0))
    return result

In [18]:
def make_plot(method,complement_method,datasets,colors,results,FDRs):
    p = bokeh.plotting.figure(
    title=f"{method} Method at FDR=.10 vs {complement_method} Method",
    frame_height=500,
    frame_width=500,
    x_range=[0.05, 0.55],
    y_range=[-5, 110],
    y_axis_label = f'% unique results vs {complement_method} method',
    x_axis_label = f'FDR for {complement_method} method'
    )
    x = FDRs
    d = list(datasets.keys())
    for i in range(len(d)):
        vals = results[i][:-1]
        c = colors[i]
        if i == 0:
            label = d[i]+', mean = '+str(results[i][-1])
        else:
            label = d[i]+', '+str(results[i][-1])
        shift = np.random.randint(0,high=10)/10
        p.line(x,vals+shift,legend_label = label,color = c,alpha = 0.9, line_width = 2)
        p.circle(x,vals+shift,legend_label = label,color = c,alpha = 0.9, size = 4)
    p.xaxis.ticker=x
    p.grid.visible = False
    p.legend.location = 'top_right'
    p.legend.click_policy = 'hide'
    return p


In [19]:
colors = ['orange','crimson','red','salmon','purple','violet','orangered']
p1 = make_plot('Step','Gene List',datasets,colors,group_results(s_ff),FDRs)
p2 = make_plot('Gene List','Step',datasets,colors,group_results(ff_s),FDRs)
p3 = make_plot('Step',"Weighted Step",datasets,colors,group_results(s_nc),FDRs)
p4 = make_plot('Gene List',"Weighted Step",datasets,colors,group_results(ff_nc),FDRs)
p5 = make_plot("Weighted Step",'Step',datasets,colors,group_results(nc_s),FDRs)
p6 = make_plot("Weighted Step",'Gene List',datasets,colors,group_results(nc_ff),FDRs)

g = bokeh.layouts.grid([[p1,p2],[p3,p5],[p4,p6]])
bokeh.io.show(g)