# **In this notebook we run meK-Means, Leiden, K-Means, and GLUE on U/S matrices for benchmarking**

In [1]:
import h5py
import scanpy as sc
import anndata
import loompy as lp

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

import sys
import glob
import importlib

In [2]:
import networkx as nx
import scanpy as sc
import scglue

In [3]:
import sys
#sys.path.insert(0, '/home/tchari/test_monod/monod/src/')
sys.path.insert(0, '/home/tchari/monod/src/') #OR pip install monod

In [4]:
import monod
importlib.reload(monod)
from monod import preprocess, extract_data, cme_toolbox, analysis, mminference

In [5]:
from sklearn.metrics import adjusted_rand_score, adjusted_mutual_info_score
from sklearn.cluster import KMeans
from sklearn.neighbors import kneighbors_graph

import igraph as ig
import leidenalg as la

from itertools import chain

In [6]:
#Perform standard normalization (read-depth + log1p)
def norm_mat(mat,new_tot=1e4):
    '''
    mat: cell x gene matrix
    '''  
    tots = np.sum(mat,axis=1)
    divids = (new_tot/tots)[:,None]
    mat_norm = mat*divids
    mat_norm = np.log1p(mat_norm)
    
    mat_norm[np.isnan(mat_norm)] = 0
    
    return mat_norm

In [7]:
def get_graph(mat,neigh=30):
    A = kneighbors_graph(mat, neigh, mode='connectivity', include_self=True)
    sources, targets = A.nonzero()
    weights = A[sources, targets]
    if isinstance(weights, np.matrix):
        weights = weights.A1
    g = ig.Graph(directed=False) #True in scanpy, which is odd
    g.add_vertices(A.shape[0])  # this adds adjacency.shape[0] vertices
    g.add_edges(list(zip(sources, targets)))

    g.es['weight'] = weights
    
    return g

In [8]:
#FOR ALL PROGRAMS

num_runs = 3

**Download data and metadata for benchmarking**

In [17]:
#Metadata
!wget --content-disposition https://raw.githubusercontent.com/pachterlab/CGP_2023/main/metadata/meKMeans_data_samp_params.csv

--2024-05-28 14:12:50--  https://raw.githubusercontent.com/pachterlab/CGP_2023/main/metadata/meKMeans_data_samp_params.csv
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.108.133, 185.199.110.133, 185.199.109.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.108.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 1195 (1.2K) [text/plain]
Saving to: ‘meKMeans_data_samp_params.csv.1’


2024-05-28 14:12:51 (89.4 MB/s) - ‘meKMeans_data_samp_params.csv.1’ saved [1195/1195]



In [None]:
#Loom files for simulation and real data
!wget --content-disposition https://data.caltech.edu/records/mzs5b-72897/files/meK_sim_looms.tar.gz?download=1
!tar -xvf meK_sim_looms.tar.gz
!wget --content-disposition https://data.caltech.edu/records/2tsha-rcz19/files/meK_looms.tar.gz?download=1
!tar -xvf meK_looms.tar.gz

In [22]:
!wget --content-disposition https://data.caltech.edu/records/xpt49-74x73/files/gtf_2020_A.tar.gz?download=1
!tar -xvf gtf_2020_A.tar.gz

--2024-05-28 14:38:45--  https://data.caltech.edu/records/xpt49-74x73/files/gtf_2020_A.tar.gz?download=1
Resolving data.caltech.edu (data.caltech.edu)... 35.155.11.48
Connecting to data.caltech.edu (data.caltech.edu)|35.155.11.48|:443... connected.
HTTP request sent, awaiting response... 302 FOUND
Location: https://s3.us-west-2.amazonaws.com/caltechdata/8b/ef/bc04-0de6-4cc5-a457-1a20f686231a/data?response-content-type=application%2Foctet-stream&response-content-disposition=attachment%3B%20filename%3Dgtf_2020_A.tar.gz&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIARCVIVNNAP7NNDVEA%2F20240528%2Fus-west-2%2Fs3%2Faws4_request&X-Amz-Date=20240528T213845Z&X-Amz-Expires=60&X-Amz-SignedHeaders=host&X-Amz-Signature=9d96ad5fddb78a5e21fd335c8e5f8e24f805dc90d021a0ff30866322744b9a9b [following]
--2024-05-28 14:38:45--  https://s3.us-west-2.amazonaws.com/caltechdata/8b/ef/bc04-0de6-4cc5-a457-1a20f686231a/data?response-content-type=application%2Foctet-stream&response-content-disposition=attach

In [None]:
#Gene length annotations
!wget --content-disposition https://raw.githubusercontent.com/pachterlab/CGP_2023/main/references/gg_200524_mouse_genome_polyA_cum_1

#Human reference (GRCh38-2020-A) for also available
!wget --content-disposition https://raw.githubusercontent.com/pachterlab/CGP_2023/main/references/gg_200525_genome_polyA_cum_3


In [26]:
#Simulation gene annotations

!wget --content-disposition https://raw.githubusercontent.com/pachterlab/CGP_2023/main/references/sim_genome_polyA_cum_3_0
!wget --content-disposition https://raw.githubusercontent.com/pachterlab/CGP_2023/main/references/sim_genome_polyA_cum_3_1


--2024-05-28 14:52:45--  https://raw.githubusercontent.com/pachterlab/CGP_2023/main/references/sim_genome_polyA_cum_3_0
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.110.133, 185.199.109.133, 185.199.108.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.110.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 125592 (123K) [text/plain]
Saving to: ‘sim_genome_polyA_cum_3_0.1’


2024-05-28 14:52:45 (56.0 MB/s) - ‘sim_genome_polyA_cum_3_0.1’ saved [125592/125592]

--2024-05-28 14:52:45--  https://raw.githubusercontent.com/pachterlab/CGP_2023/main/references/sim_genome_polyA_cum_3_1
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.111.133, 185.199.109.133, 185.199.108.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.111.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 79635 (78K) [text/plain]
Saving to: ‘sim_geno

## **Run methods on benchmark data**

In [24]:
# ********* Get meK_looms.tar.gz and meKMeans_data_samp_params.csv *********

samps = pd.read_csv('meKMeans_data_samp_params.csv')
samps.head()

Unnamed: 0,Dataset,Transcrip,Clusters,Cu,Lam,GTF
0,allen_b08,/home/tchari/perturbCME/notebooks/gg_200524_mo...,10,-6.777778,-1.25,/home/ggorin/ref/refdata-gex-mm10-2020-A/genes...
1,allen_b02h01a02,/home/tchari/perturbCME/notebooks/gg_200524_mo...,11,-6.222222,-1.25,/home/ggorin/ref/refdata-gex-mm10-2020-A/genes...
2,cl3,/home/tchari/perturbCME/notebooks/gg_200525_ge...,3,-6.777778,-0.7,/home/ggorin/ref/refdata-gex-GRCh38-2020-A/gen...
3,cl5,/home/tchari/perturbCME/notebooks/gg_200525_ge...,5,-7.888889,-1.25,/home/ggorin/ref/refdata-gex-GRCh38-2020-A/gen...
4,brca1,/home/tchari/perturbCME/notebooks/gg_200524_mo...,-1,-6.777778,-0.7,/home/ggorin/ref/refdata-gex-mm10-2020-A/genes...


In [25]:
samps['Transcrip'] = [i.replace('/home/tchari/perturbCME/notebooks','.') for i in samps['Transcrip']]
samps['GTF'] = [i.replace('/home/ggorin/ref','.') for i in samps['GTF']]
samps.head()

Unnamed: 0,Dataset,Transcrip,Clusters,Cu,Lam,GTF
0,allen_b08,./gg_200524_mouse_genome_polyA_cum_1,10,-6.777778,-1.25,./refdata-gex-mm10-2020-A/genes/genes.gtf
1,allen_b02h01a02,./gg_200524_mouse_genome_polyA_cum_1,11,-6.222222,-1.25,./refdata-gex-mm10-2020-A/genes/genes.gtf
2,cl3,./gg_200525_genome_polyA_cum_3,3,-6.777778,-0.7,./refdata-gex-GRCh38-2020-A/genes/genes.gtf
3,cl5,./gg_200525_genome_polyA_cum_3,5,-7.888889,-1.25,./refdata-gex-GRCh38-2020-A/genes/genes.gtf
4,brca1,./gg_200524_mouse_genome_polyA_cum_1,-1,-6.777778,-0.7,./refdata-gex-mm10-2020-A/genes/genes.gtf


In [10]:
d_strings  = glob.glob('./hvg_objs_0215/*.loom')
d_strings 

['./hvg_objs_0215/cl5_357hvgs.loom',
 './hvg_objs_0215/cl5_1193all.loom',
 './hvg_objs_0215/allen_b02h01a02_359hvgs.loom',
 './hvg_objs_0215/cl3_466hvgs.loom',
 './hvg_objs_0215/allen_b08_682hvgs.loom',
 './hvg_objs_0215/allen_b02h01a02_2770all.loom',
 './hvg_objs_0215/cl3_1137all.loom',
 './hvg_objs_0215/allen_b08_1948all.loom']

In [11]:
datas = pd.unique(samps.Dataset)
datas

array(['allen_b08', 'allen_b02h01a02', 'cl3', 'cl5', 'brca1', 'pbmc',
       'e11e13'], dtype=object)

In [12]:
attribute_names =[('unspliced','spliced'),'gene_name','barcode']

In [None]:
!mkdir ./fits

### **meK-Means**

Test with correct K, over multiple rounds/seeds

In [13]:
# !rm -r /home/tchari/perturbCME/notebooks/fits/meKruns_0508

In [14]:
#For each loom in looms from ./hvg_objs

#!mkdir /home/tchari/perturbCME/notebooks/fits/meKruns_0317
!mkdir ./fits/meKruns_0508


dir_strings = []
data_strings = []
result_strings = []

#Save method, clustering, mat_in (U,S, etc), hyper (K or res), hvgs, data, ARI, AMI
meK_res = pd.DataFrame()
meths = []
result = []
mats = []
hyper = []
hvgs = []
data = []
ari = []
ami = []

for d in d_strings:
    
    #Get tech param by keyword (datas) in loom paths
    ind = [i in d for i in datas]
    
    #Inference params for sampling
    tech_tup = [list(samps.Cu[ind])[0],list(samps.Lam[ind])[0]]
    
    #Preprocessing params for filepaths
    trans = list(samps.Transcrip[ind])[0]
    k = list(samps.Clusters[ind])[0]
    data_name = list(samps.Dataset[ind])[0]
    
    
    ds = lp.connect(d)
    g_names = ds.ra[attribute_names[1]]
    num_genes = len(g_names)
    num_cells = len(ds.ca[attribute_names[2]])
    
    U = ds.layers['unspliced'][:,:].T
    S = ds.layers['spliced'][:,:].T


    true_labs = list(ds.ca['subclass_label'])
    ds.close()
    print(data_name+' with '+str(num_genes)+' genes')
    

    for n_run in range(num_runs):
        print(n_run)
        
        Ks = [k] 
        for clus in Ks:
           
            #Run Monod preprocessing to set up files for run, leave room for genes to be removed with low U/S
            dir_string,dataset_string = monod.preprocess.construct_batch([d], \
                                                         trans, \
                                                         [data_name], \
                                                         attribute_names=attribute_names,\
                                                         batch_location='./fits/meKruns_0508', \
                                                         meta=data_name+'_K'+str(clus)+'_n'+str(n_run)+'_'+str(num_genes), \
                                                         batch_id=1, \
                                                         n_genes=num_genes,exp_filter_threshold=None,
                                                                         viz=False,genes_to_fit=g_names)
                                                            #num_genes-60 or 100,genes_to_fit=markers
            dir_strings += [dir_string]
            data_strings += [dataset_string]
    
            #Set model and run meK-Means
            
            #Define bounds for params
            phys_lb = [-2.0, -1.8, -1.8 ] 
            phys_ub = [4.2, 2.5, 2.5] 
            samp_lb = tech_tup 
            samp_ub = tech_tup  
            gridsize = [1,1] #Already have tech params
        
    
            epochs = 10
    
            # ---------------- meK-Means Inference ---------------- 
            #Define model with bursty transcription and Poisson molecule capture/sampling
            fitmodel = monod.cme_toolbox.CMEModel('Bursty','Poisson')
    
            #Set up mminference parameters
            inference_parameters = monod.mminference.InferenceParameters(phys_lb,phys_ub,samp_lb,samp_ub,gridsize,\
                        dataset_string[0],fitmodel,k=clus,epochs=epochs,use_lengths = True,
                        gradient_params = {'max_iterations':5,'init_pattern':'moments','num_restarts':1})
    
            #Read in loom file with filtered barcodes
            search_data = monod.extract_data.extract_data(d, trans, data_name,
                        dataset_string[0], dir_string, viz=False, dataset_attr_names=attribute_names)
    
            #Run inference(fit_all_grid_points()) and Save result file strings
            full_result_string = inference_parameters.fit_all_grid_points(40,search_data) 
    
            result_strings.append(full_result_string)
            
    
            # ----------------  Save output ---------------- 
            #Read in results and get cluster assignments
            sr = [monod.analysis.load_search_results(i) for i in full_result_string]
            
            
            cat_assigns = np.array([None]*num_cells) #cat_assigns is empty list of length = no. cell barcodes
            for i in range(len(sr)):
                r = sr[i]
                cat_assigns[r.filt] = r.assigns #denotes which cluster (k), cells were assigned to
    
            print('No. clus: ',len(np.unique(cat_assigns)))
            
    
            meths += ['meK-Means']
            result += [cat_assigns]
            mats += ['U,S']
            hyper += [clus]
            hvgs += [num_genes]
            data += [data_name]
            ari += [adjusted_rand_score(true_labs,cat_assigns)]
            ami += [adjusted_mutual_info_score(true_labs,cat_assigns)]
            
            print('ARI: ',adjusted_rand_score(true_labs,cat_assigns))


meK_res['Method'] = meths
meK_res['Clustering'] = result
meK_res['Matrices'] = mats
meK_res['Hyperparam'] = hyper
meK_res['HVGs'] = hvgs
meK_res['Data'] = data
meK_res['ARI'] = ari
meK_res['AMI'] = ami
    

cl5 with 357 genes
0


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:11<00:00,  2.23s/it]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.00s/it]


mstep self.weights:  [0.31937103 0.19451221 0.22324614 0.11227217 0.15059845]
Q Function:  -1615805.358657694



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:09<00:00,  2.00s/it]


mstep self.weights:  [0.32040787 0.19540984 0.22220678 0.11192225 0.15005326]
Q Function:  -1583683.204032287



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.07s/it]


mstep self.weights:  [0.32084854 0.19576324 0.22176899 0.11064806 0.15097117]
Q Function:  -1597376.472250424



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.07s/it]


mstep self.weights:  [0.32099908 0.19577392 0.2211033  0.11111402 0.15100968]
Q Function:  -1584123.6783761529



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.05s/it]


mstep self.weights:  [0.32086814 0.19576318 0.22108351 0.11127879 0.15100639]
Q Function:  -1584137.6190702422



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.05s/it]


mstep self.weights:  [0.32074805 0.19576318 0.22111746 0.11133603 0.15103529]
Q Function:  -1584381.6957352818



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.04s/it]


mstep self.weights:  [0.32074801 0.19576318 0.22111749 0.11133604 0.15103528]
Q Function:  -1584381.695637062



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.02s/it]


mstep self.weights:  [0.32074801 0.19576318 0.22111749 0.11133604 0.15103528]
Q Function:  -1584381.6956371225



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.05s/it]


mstep self.weights:  [0.32074801 0.19576318 0.22111749 0.11133604 0.15103528]
Q Function:  -1584381.6956371223



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.05s/it]


mstep self.weights:  [0.32074801 0.19576318 0.22111749 0.11133604 0.15103528]
Q Function:  -1584381.6956371223

No. clus:  5
ARI:  0.9839601052752456
1


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.13s/it]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:09<00:00,  1.99s/it]


mstep self.weights:  [0.31937103 0.19451221 0.22324614 0.11227217 0.15059845]
Q Function:  -1615805.358657694



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.15s/it]


mstep self.weights:  [0.32040787 0.19540984 0.22220678 0.11192225 0.15005326]
Q Function:  -1583683.204032287



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.07s/it]


mstep self.weights:  [0.32084854 0.19576324 0.22176899 0.11064806 0.15097117]
Q Function:  -1597376.472250424



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.05s/it]


mstep self.weights:  [0.32099908 0.19577392 0.2211033  0.11111402 0.15100968]
Q Function:  -1584123.6783761529



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.05s/it]


mstep self.weights:  [0.32086814 0.19576318 0.22108351 0.11127879 0.15100639]
Q Function:  -1584137.6190702422



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.05s/it]


mstep self.weights:  [0.32074805 0.19576318 0.22111746 0.11133603 0.15103529]
Q Function:  -1584381.6957352818



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.05s/it]


mstep self.weights:  [0.32074801 0.19576318 0.22111749 0.11133604 0.15103528]
Q Function:  -1584381.695637062



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.04s/it]


mstep self.weights:  [0.32074801 0.19576318 0.22111749 0.11133604 0.15103528]
Q Function:  -1584381.6956371225



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.07s/it]


mstep self.weights:  [0.32074801 0.19576318 0.22111749 0.11133604 0.15103528]
Q Function:  -1584381.6956371223



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.05s/it]


mstep self.weights:  [0.32074801 0.19576318 0.22111749 0.11133604 0.15103528]
Q Function:  -1584381.6956371223

No. clus:  5
ARI:  0.9839601052752456
2


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.14s/it]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:09<00:00,  2.00s/it]


mstep self.weights:  [0.31937103 0.19451221 0.22324614 0.11227217 0.15059845]
Q Function:  -1615805.358657694



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:09<00:00,  1.99s/it]


mstep self.weights:  [0.32040787 0.19540984 0.22220678 0.11192225 0.15005326]
Q Function:  -1583683.204032287



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.09s/it]


mstep self.weights:  [0.32084854 0.19576324 0.22176899 0.11064806 0.15097117]
Q Function:  -1597376.472250424



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.08s/it]


mstep self.weights:  [0.32099908 0.19577392 0.2211033  0.11111402 0.15100968]
Q Function:  -1584123.6783761529



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.09s/it]


mstep self.weights:  [0.32086814 0.19576318 0.22108351 0.11127879 0.15100639]
Q Function:  -1584137.6190702422



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.05s/it]


mstep self.weights:  [0.32074805 0.19576318 0.22111746 0.11133603 0.15103529]
Q Function:  -1584381.6957352818



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.05s/it]


mstep self.weights:  [0.32074801 0.19576318 0.22111749 0.11133604 0.15103528]
Q Function:  -1584381.695637062



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.06s/it]


mstep self.weights:  [0.32074801 0.19576318 0.22111749 0.11133604 0.15103528]
Q Function:  -1584381.6956371225



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.06s/it]


mstep self.weights:  [0.32074801 0.19576318 0.22111749 0.11133604 0.15103528]
Q Function:  -1584381.6956371223



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:10<00:00,  2.07s/it]


mstep self.weights:  [0.32074801 0.19576318 0.22111749 0.11133604 0.15103528]
Q Function:  -1584381.6956371223

No. clus:  5
ARI:  0.9839601052752456
cl5 with 1193 genes
0


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:56<00:00, 11.37s/it]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.02s/it]


mstep self.weights:  [0.22283539 0.15030337 0.19396197 0.32192159 0.11097767]
Q Function:  -3576141.150686791



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.18s/it]


mstep self.weights:  [0.22256254 0.1508422  0.19448699 0.32108158 0.1110267 ]
Q Function:  -3517726.1548911748



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.06s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.2312419075



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.18s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.10s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.10s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.05s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.13s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.08s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.18s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547

No. clus:  5
ARI:  0.9831812872822658
1


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:56<00:00, 11.33s/it]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.14s/it]


mstep self.weights:  [0.22283539 0.15030337 0.19396197 0.32192159 0.11097767]
Q Function:  -3576141.150686791



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.11s/it]


mstep self.weights:  [0.22256254 0.1508422  0.19448699 0.32108158 0.1110267 ]
Q Function:  -3517726.1548911748



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.12s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.2312419075



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.16s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.15s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.12s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.06s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.18s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [01:03<00:00, 12.63s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.07s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547

No. clus:  5
ARI:  0.9831812872822658
2


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:56<00:00, 11.38s/it]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.14s/it]


mstep self.weights:  [0.22283539 0.15030337 0.19396197 0.32192159 0.11097767]
Q Function:  -3576141.150686791



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.15s/it]


mstep self.weights:  [0.22256254 0.1508422  0.19448699 0.32108158 0.1110267 ]
Q Function:  -3517726.1548911748



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [01:03<00:00, 12.61s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.2312419075



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.15s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.19s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.17s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.14s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:56<00:00, 11.21s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.12s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.16s/it]


mstep self.weights:  [0.22255911 0.15084227 0.19449041 0.32108216 0.11102606]
Q Function:  -3526577.231243547

No. clus:  5
ARI:  0.9831812872822658
allen_b02h01a02 with 359 genes
0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:11<00:00,  1.07s/it]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:11<00:00,  1.00s/it]


mstep self.weights:  [0.21577207 0.10276254 0.03082195 0.00252624 0.1909192  0.0947253
 0.07038177 0.06315663 0.0108155  0.16851916 0.04959966]
Q Function:  -9826754.474780131



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.05it/s]


mstep self.weights:  [0.21166299 0.10049048 0.03047035 0.00457097 0.18841695 0.09587166
 0.06585871 0.0599348  0.0128888  0.17090636 0.05892794]
Q Function:  -9298588.828052405



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.02it/s]


mstep self.weights:  [0.21075551 0.09730487 0.03048324 0.00887608 0.18753003 0.09625481
 0.06365713 0.05519318 0.01369542 0.17159979 0.06464995]
Q Function:  -9289439.954158183



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.04it/s]


mstep self.weights:  [0.21052738 0.09465565 0.03050425 0.01011312 0.18724265 0.09630343
 0.06219245 0.0539385  0.01389499 0.17180357 0.06882401]
Q Function:  -9287806.46108992



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.06it/s]


mstep self.weights:  [0.21047472 0.0927935  0.03050357 0.0124095  0.18721035 0.0962616
 0.0613107  0.0516731  0.01395137 0.17150642 0.07190516]
Q Function:  -9283826.825031478



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.00it/s]


mstep self.weights:  [0.21046454 0.0913422  0.03050469 0.01463715 0.18712377 0.09618454
 0.0608164  0.04950042 0.01396061 0.1712372  0.07422849]
Q Function:  -9281093.07752279



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.05it/s]


mstep self.weights:  [0.2104674  0.09008617 0.03050469 0.01802394 0.18709733 0.09575651
 0.06035888 0.04655175 0.01396062 0.17095639 0.07623632]
Q Function:  -9276870.136745956



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.06it/s]


mstep self.weights:  [0.21046849 0.08889485 0.03050469 0.01909401 0.18705818 0.09568237
 0.06016982 0.04557584 0.01396091 0.17066826 0.07792258]
Q Function:  -9278871.146699883



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.06it/s]


mstep self.weights:  [0.21046755 0.08805623 0.03050469 0.01973262 0.18706885 0.09572296
 0.06007121 0.04491838 0.01396    0.17025629 0.07924121]
Q Function:  -9278698.740942458



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.03it/s]


mstep self.weights:  [0.21046834 0.08756801 0.03050469 0.02005158 0.18708634 0.09564222
 0.06005828 0.04464499 0.01396063 0.16971215 0.08030278]
Q Function:  -9278342.419493085

No. clus:  11
ARI:  0.6856325470667358
1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:11<00:00,  1.04s/it]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.02it/s]


mstep self.weights:  [0.21577207 0.10276254 0.03082195 0.00252624 0.1909192  0.0947253
 0.07038177 0.06315663 0.0108155  0.16851916 0.04959966]
Q Function:  -9826754.474780131



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.04it/s]


mstep self.weights:  [0.21166299 0.10049048 0.03047035 0.00457097 0.18841695 0.09587166
 0.06585871 0.0599348  0.0128888  0.17090636 0.05892794]
Q Function:  -9298588.828052405



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.05it/s]


mstep self.weights:  [0.21075551 0.09730487 0.03048324 0.00887608 0.18753003 0.09625481
 0.06365713 0.05519318 0.01369542 0.17159979 0.06464995]
Q Function:  -9289439.954158183



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:11<00:00,  1.03s/it]


mstep self.weights:  [0.21052738 0.09465565 0.03050425 0.01011312 0.18724265 0.09630343
 0.06219245 0.0539385  0.01389499 0.17180357 0.06882401]
Q Function:  -9287806.46108992



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.06it/s]


mstep self.weights:  [0.21047472 0.0927935  0.03050357 0.0124095  0.18721035 0.0962616
 0.0613107  0.0516731  0.01395137 0.17150642 0.07190516]
Q Function:  -9283826.825031478



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:11<00:00,  1.04s/it]


mstep self.weights:  [0.21046454 0.0913422  0.03050469 0.01463715 0.18712377 0.09618454
 0.0608164  0.04950042 0.01396061 0.1712372  0.07422849]
Q Function:  -9281093.07752279



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.05it/s]


mstep self.weights:  [0.2104674  0.09008617 0.03050469 0.01802394 0.18709733 0.09575651
 0.06035888 0.04655175 0.01396062 0.17095639 0.07623632]
Q Function:  -9276870.136745956



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.04it/s]


mstep self.weights:  [0.21046849 0.08889485 0.03050469 0.01909401 0.18705818 0.09568237
 0.06016982 0.04557584 0.01396091 0.17066826 0.07792258]
Q Function:  -9278871.146699883



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.05it/s]


mstep self.weights:  [0.21046755 0.08805623 0.03050469 0.01973262 0.18706885 0.09572296
 0.06007121 0.04491838 0.01396    0.17025629 0.07924121]
Q Function:  -9278698.740942458



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.04it/s]


mstep self.weights:  [0.21046834 0.08756801 0.03050469 0.02005158 0.18708634 0.09564222
 0.06005828 0.04464499 0.01396063 0.16971215 0.08030278]
Q Function:  -9278342.419493085

No. clus:  11
ARI:  0.6856325470667358
2


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:11<00:00,  1.05s/it]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.04it/s]


mstep self.weights:  [0.21577207 0.10276254 0.03082195 0.00252624 0.1909192  0.0947253
 0.07038177 0.06315663 0.0108155  0.16851916 0.04959966]
Q Function:  -9826754.474780131



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.03it/s]


mstep self.weights:  [0.21166299 0.10049048 0.03047035 0.00457097 0.18841695 0.09587166
 0.06585871 0.0599348  0.0128888  0.17090636 0.05892794]
Q Function:  -9298588.828052405



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.05it/s]


mstep self.weights:  [0.21075551 0.09730487 0.03048324 0.00887608 0.18753003 0.09625481
 0.06365713 0.05519318 0.01369542 0.17159979 0.06464995]
Q Function:  -9289439.954158183



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:11<00:00,  1.02s/it]


mstep self.weights:  [0.21052738 0.09465565 0.03050425 0.01011312 0.18724265 0.09630343
 0.06219245 0.0539385  0.01389499 0.17180357 0.06882401]
Q Function:  -9287806.46108992



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:11<00:00,  1.01s/it]


mstep self.weights:  [0.21047472 0.0927935  0.03050357 0.0124095  0.18721035 0.0962616
 0.0613107  0.0516731  0.01395137 0.17150642 0.07190516]
Q Function:  -9283826.825031478



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.03it/s]


mstep self.weights:  [0.21046454 0.0913422  0.03050469 0.01463715 0.18712377 0.09618454
 0.0608164  0.04950042 0.01396061 0.1712372  0.07422849]
Q Function:  -9281093.07752279



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.05it/s]


mstep self.weights:  [0.2104674  0.09008617 0.03050469 0.01802394 0.18709733 0.09575651
 0.06035888 0.04655175 0.01396062 0.17095639 0.07623632]
Q Function:  -9276870.136745956



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.05it/s]


mstep self.weights:  [0.21046849 0.08889485 0.03050469 0.01909401 0.18705818 0.09568237
 0.06016982 0.04557584 0.01396091 0.17066826 0.07792258]
Q Function:  -9278871.146699883



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.05it/s]


mstep self.weights:  [0.21046755 0.08805623 0.03050469 0.01973262 0.18706885 0.09572296
 0.06007121 0.04491838 0.01396    0.17025629 0.07924121]
Q Function:  -9278698.740942458



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:10<00:00,  1.02it/s]


mstep self.weights:  [0.21046834 0.08756801 0.03050469 0.02005158 0.18708634 0.09564222
 0.06005828 0.04464499 0.01396063 0.16971215 0.08030278]
Q Function:  -9278342.419493085

No. clus:  11
ARI:  0.6856325470667358
cl3 with 466 genes
0


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:22<00:00,  7.36s/it]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:20<00:00,  6.77s/it]


mstep self.weights:  [0.34478933 0.35144124 0.30376943]
Q Function:  -680137.7422356517



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.56s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.45s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.46s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:20<00:00,  6.83s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.26s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.39s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.32s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.37s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.54s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644

No. clus:  3
ARI:  0.9898199303468975
1


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:21<00:00,  7.27s/it]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.30s/it]


mstep self.weights:  [0.34478933 0.35144124 0.30376943]
Q Function:  -680137.7422356517



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.46s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.43s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.36s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.27s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.27s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.31s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.42s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.23s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.21s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644

No. clus:  3
ARI:  0.9898199303468975
2


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:21<00:00,  7.15s/it]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.35s/it]


mstep self.weights:  [0.34478933 0.35144124 0.30376943]
Q Function:  -680137.7422356517



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.46s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.27s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.25s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.33s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:19<00:00,  6.38s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.26s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.25s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.32s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:18<00:00,  6.31s/it]


mstep self.weights:  [0.34478936 0.35144124 0.3037694 ]
Q Function:  -667795.4276879644

No. clus:  3
ARI:  0.9898199303468975
allen_b08 with 682 genes
0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:03<00:00,  6.39s/it]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:06<00:00,  6.60s/it]


mstep self.weights:  [0.22781375 0.13548999 0.10309426 0.20523186 0.05159408 0.06910854
 0.03472475 0.0461717  0.05617289 0.07059819]
Q Function:  -6192593.290006457



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:07<00:00,  6.71s/it]


mstep self.weights:  [0.2267685  0.1264369  0.1328808  0.18007394 0.05263875 0.06941743
 0.0346051  0.04557814 0.0574141  0.07418634]
Q Function:  -5842545.576147971



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:20<00:00,  8.10s/it]


mstep self.weights:  [0.22624132 0.12365277 0.13090597 0.17674821 0.05978011 0.06938346
 0.03462089 0.04548307 0.05796593 0.07521827]
Q Function:  -5834877.530734442



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:03<00:00,  6.34s/it]


mstep self.weights:  [0.22624275 0.12466362 0.12286874 0.18029412 0.06384345 0.06938347
 0.03436245 0.0449326  0.05820735 0.07520143]
Q Function:  -5842562.320167686



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:30<00:00,  9.05s/it]


mstep self.weights:  [0.22624275 0.12748939 0.09541899 0.19749712 0.06742068 0.06940885
 0.03425259 0.04844954 0.05829183 0.07552825]
Q Function:  -5854867.773965466



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:25<00:00,  8.58s/it]


mstep self.weights:  [0.22587817 0.12669082 0.10207757 0.19038961 0.06796361 0.06938345
 0.03458011 0.04959479 0.05835429 0.07508756]
Q Function:  -5831524.45211011



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:06<00:00,  6.65s/it]


mstep self.weights:  [0.22579306 0.12741904 0.09930016 0.19011932 0.06909489 0.06938345
 0.0346039  0.05086871 0.05859559 0.07482187]
Q Function:  -5837419.707924178



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:03<00:00,  6.38s/it]


mstep self.weights:  [0.22574421 0.12721499 0.09816603 0.1900435  0.06945421 0.06955904
 0.0346039  0.05191608 0.05897961 0.07431842]
Q Function:  -5837757.486119311



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:02<00:00,  6.27s/it]


mstep self.weights:  [0.22571579 0.12716307 0.09686567 0.18957692 0.07057892 0.06955965
 0.0346039  0.05245628 0.05937061 0.07410918]
Q Function:  -5837644.482731116



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:02<00:00,  6.24s/it]


mstep self.weights:  [0.22571579 0.12715431 0.09679689 0.18865169 0.07124002 0.06956267
 0.0346039  0.05279082 0.0593676  0.07411632]
Q Function:  -5836520.620534391

No. clus:  10
ARI:  0.5798177849988733
1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:03<00:00,  6.34s/it]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:06<00:00,  6.61s/it]


mstep self.weights:  [0.22781375 0.13548999 0.10309426 0.20523186 0.05159408 0.06910854
 0.03472475 0.0461717  0.05617289 0.07059819]
Q Function:  -6192593.290006457



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:07<00:00,  6.72s/it]


mstep self.weights:  [0.2267685  0.1264369  0.1328808  0.18007394 0.05263875 0.06941743
 0.0346051  0.04557814 0.0574141  0.07418634]
Q Function:  -5842545.576147971



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:18<00:00,  7.81s/it]


mstep self.weights:  [0.22624132 0.12365277 0.13090597 0.17674821 0.05978011 0.06938346
 0.03462089 0.04548307 0.05796593 0.07521827]
Q Function:  -5834877.530734442



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:02<00:00,  6.27s/it]


mstep self.weights:  [0.22624275 0.12466362 0.12286874 0.18029412 0.06384345 0.06938347
 0.03436245 0.0449326  0.05820735 0.07520143]
Q Function:  -5842562.320167686



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:25<00:00,  8.59s/it]


mstep self.weights:  [0.22624275 0.12748939 0.09541899 0.19749712 0.06742068 0.06940885
 0.03425259 0.04844954 0.05829183 0.07552825]
Q Function:  -5854867.773965466



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:25<00:00,  8.57s/it]


mstep self.weights:  [0.22587817 0.12669082 0.10207757 0.19038961 0.06796361 0.06938345
 0.03458011 0.04959479 0.05835429 0.07508756]
Q Function:  -5831524.45211011



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:07<00:00,  6.72s/it]


mstep self.weights:  [0.22579306 0.12741904 0.09930016 0.19011932 0.06909489 0.06938345
 0.0346039  0.05086871 0.05859559 0.07482187]
Q Function:  -5837419.707924178



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:26<00:00,  8.68s/it]


mstep self.weights:  [0.22574421 0.12721499 0.09816603 0.1900435  0.06945421 0.06955904
 0.0346039  0.05191608 0.05897961 0.07431842]
Q Function:  -5837757.486119311



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:18<00:00,  7.84s/it]


mstep self.weights:  [0.22571579 0.12716307 0.09686567 0.18957692 0.07057892 0.06955965
 0.0346039  0.05245628 0.05937061 0.07410918]
Q Function:  -5837644.482731116



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:04<00:00,  6.44s/it]


mstep self.weights:  [0.22571579 0.12715431 0.09679689 0.18865169 0.07124002 0.06956267
 0.0346039  0.05279082 0.0593676  0.07411632]
Q Function:  -5836520.620534391

No. clus:  10
ARI:  0.5798177849988733
2


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:06<00:00,  6.60s/it]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:10<00:00,  7.04s/it]


mstep self.weights:  [0.22781375 0.13548999 0.10309426 0.20523186 0.05159408 0.06910854
 0.03472475 0.0461717  0.05617289 0.07059819]
Q Function:  -6192593.290006457



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:39<00:00,  9.95s/it]


mstep self.weights:  [0.2267685  0.1264369  0.1328808  0.18007394 0.05263875 0.06941743
 0.0346051  0.04557814 0.0574141  0.07418634]
Q Function:  -5842545.576147971



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:25<00:00,  8.53s/it]


mstep self.weights:  [0.22624275 0.12466362 0.12286874 0.18029412 0.06384345 0.06938347
 0.03436245 0.0449326  0.05820735 0.07520143]
Q Function:  -5842562.320167686



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:52<00:00, 11.24s/it]


mstep self.weights:  [0.22624275 0.12748939 0.09541899 0.19749712 0.06742068 0.06940885
 0.03425259 0.04844954 0.05829183 0.07552825]
Q Function:  -5854867.773965466



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:49<00:00, 10.98s/it]


mstep self.weights:  [0.22587817 0.12669082 0.10207757 0.19038961 0.06796361 0.06938345
 0.03458011 0.04959479 0.05835429 0.07508756]
Q Function:  -5831524.45211011



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:26<00:00,  8.65s/it]


mstep self.weights:  [0.22579306 0.12741904 0.09930016 0.19011932 0.06909489 0.06938345
 0.0346039  0.05086871 0.05859559 0.07482187]
Q Function:  -5837419.707924178



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:23<00:00,  8.37s/it]


mstep self.weights:  [0.22574421 0.12721499 0.09816603 0.1900435  0.06945421 0.06955904
 0.0346039  0.05191608 0.05897961 0.07431842]
Q Function:  -5837757.486119311



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:28<00:00,  8.85s/it]


mstep self.weights:  [0.22571579 0.12716307 0.09686567 0.18957692 0.07057892 0.06955965
 0.0346039  0.05245628 0.05937061 0.07410918]
Q Function:  -5837644.482731116



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [01:23<00:00,  8.36s/it]


mstep self.weights:  [0.22571579 0.12715431 0.09679689 0.18865169 0.07124002 0.06956267
 0.0346039  0.05279082 0.0593676  0.07411632]
Q Function:  -5836520.620534391

No. clus:  10
ARI:  0.5798177849988733
allen_b02h01a02 with 2770 genes
0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [05:34<00:00, 30.40s/it]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [05:29<00:00, 29.97s/it]


mstep self.weights:  [0.213732   0.02312895 0.06265235 0.0834765  0.05482103 0.02960696
 0.14363006 0.09831095 0.03340072 0.17196081 0.08527966]
Q Function:  -41990608.60367512



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [05:32<00:00, 30.25s/it]


mstep self.weights:  [0.19965479 0.03104121 0.06037337 0.09313664 0.04732658 0.03195059
 0.14032117 0.09893124 0.03268369 0.14417093 0.12040978]
Q Function:  -40873138.34721061



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [05:50<00:00, 31.84s/it]


mstep self.weights:  [0.19426672 0.04634971 0.05931507 0.09341578 0.04972157 0.0318774
 0.13446809 0.09974102 0.03241188 0.13091173 0.12752105]
Q Function:  -40844600.361246556



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [05:46<00:00, 31.48s/it]


mstep self.weights:  [0.19190001 0.05315592 0.0583981  0.08976362 0.05517328 0.03186413
 0.13161084 0.1006904  0.03237634 0.11960779 0.13545955]
Q Function:  -40807520.645916365



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [05:37<00:00, 30.65s/it]


mstep self.weights:  [0.19571536 0.06359061 0.0575811  0.08317128 0.05828389 0.03189128
 0.12582832 0.10161098 0.03230471 0.12249705 0.12752542]
Q Function:  -40827369.313304536



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [05:29<00:00, 29.98s/it]


mstep self.weights:  [0.19632517 0.06234077 0.05684976 0.07887618 0.06051612 0.03189769
 0.12108955 0.10246595 0.0322804  0.12035849 0.13699992]
Q Function:  -40788852.172330484



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [05:22<00:00, 29.29s/it]


mstep self.weights:  [0.19766201 0.0577343  0.05585185 0.07755888 0.06214878 0.03189723
 0.1168926  0.10351422 0.03227832 0.12013613 0.14432568]
Q Function:  -40798630.6745473



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [05:27<00:00, 29.73s/it]


mstep self.weights:  [0.19908019 0.05431389 0.05600846 0.07700272 0.0632973  0.03189748
 0.1138927  0.10339664 0.03227847 0.12114804 0.14768411]
Q Function:  -40798315.92561555



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [05:29<00:00, 29.94s/it]


mstep self.weights:  [0.19922453 0.0508231  0.05665719 0.07650304 0.06400028 0.03189871
 0.11269663 0.10279071 0.03227671 0.12137084 0.15175826]
Q Function:  -40773733.62198424



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [05:38<00:00, 30.74s/it]


mstep self.weights:  [0.19933854 0.04967823 0.05635741 0.07622472 0.06448662 0.03189878
 0.11205046 0.10310258 0.03225864 0.12153056 0.15307347]
Q Function:  -40767524.50703657

No. clus:  11
ARI:  0.45708796166160365
1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [05:59<00:00, 32.66s/it]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [07:22<00:00, 40.23s/it]


mstep self.weights:  [0.213732   0.02312895 0.06265235 0.0834765  0.05482103 0.02960696
 0.14363006 0.09831095 0.03340072 0.17196081 0.08527966]
Q Function:  -41990608.60367512



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [02:53<00:00, 17.39s/it]


mstep self.weights:  [0.2246613  0.23568947 0.04386466 0.16416452 0.05111597 0.09994726
 0.0516418  0.03898845 0.02160548 0.06832108]
Q Function:  -11380833.563512173



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [02:54<00:00, 17.44s/it]


mstep self.weights:  [0.22448841 0.22589651 0.04447124 0.1743785  0.05112151 0.09967379
 0.05163626 0.03882033 0.02160548 0.06790796]
Q Function:  -11375535.612424206



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [02:54<00:00, 17.42s/it]


mstep self.weights:  [0.22448663 0.21778031 0.045357   0.1818463  0.05112152 0.09972889
 0.05163626 0.03864402 0.02160548 0.06779359]
Q Function:  -11379721.077344414

No. clus:  10
ARI:  0.5914880680043016
2


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [02:57<00:00, 17.71s/it]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [02:55<00:00, 17.56s/it]


mstep self.weights:  [0.22667538 0.27820603 0.06577009 0.0677374  0.04929936 0.12867637
 0.05231575 0.03814714 0.02351914 0.06965334]
Q Function:  -11934880.100216812



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [02:52<00:00, 17.25s/it]


mstep self.weights:  [0.22501317 0.30018435 0.06032778 0.06487338 0.05141175 0.11531902
 0.05165597 0.03899526 0.02195721 0.07026211]
Q Function:  -11430314.276538448



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [02:56<00:00, 17.70s/it]


mstep self.weights:  [0.22501317 0.3168325  0.05562866 0.06334978 0.05182043 0.10619638
 0.05136324 0.03899526 0.02179668 0.06900389]
Q Function:  -11434463.725380924



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [03:03<00:00, 18.40s/it]


mstep self.weights:  [0.22501326 0.31490855 0.05332032 0.07216542 0.05150561 0.1026072
 0.05180342 0.03899526 0.02159948 0.06808149]
Q Function:  -11414686.81240628



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [02:56<00:00, 17.67s/it]


mstep self.weights:  [0.22518516 0.30121794 0.04927148 0.09316207 0.05103732 0.10013953
 0.05219604 0.03899526 0.0216051  0.0671901 ]
Q Function:  -11410264.722936694



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [02:55<00:00, 17.53s/it]


mstep self.weights:  [0.22518882 0.27079186 0.04735342 0.12470643 0.05111563 0.1001536
 0.05199661 0.03899526 0.02160232 0.06809607]
Q Function:  -11415399.89200664



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [02:55<00:00, 17.50s/it]


mstep self.weights:  [0.22503465 0.24769647 0.04502643 0.14971143 0.05111548 0.1005512
 0.05181772 0.03899526 0.02160548 0.06844587]
Q Function:  -11399461.386157557



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [03:01<00:00, 18.14s/it]


mstep self.weights:  [0.2246613  0.23568947 0.04386466 0.16416452 0.05111597 0.09994726
 0.0516418  0.03898845 0.02160548 0.06832108]
Q Function:  -11380833.563512173



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [03:01<00:00, 18.11s/it]


mstep self.weights:  [0.22448841 0.22589651 0.04447124 0.1743785  0.05112151 0.09967379
 0.05163626 0.03882033 0.02160548 0.06790796]
Q Function:  -11375535.612424206



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [02:53<00:00, 17.39s/it]


mstep self.weights:  [0.22448663 0.21778031 0.045357   0.1818463  0.05112152 0.09972889
 0.05163626 0.03864402 0.02160548 0.06779359]
Q Function:  -11379721.077344414

No. clus:  10
ARI:  0.5914880680043016


In [None]:
new_assigns = []
for assigns in meK_res.Clustering:
    new = [str(x) for x in assigns]
    new = "|".join(new)
    new_assigns += [new]

meK_res['Clustering'] = new_assigns
meK_res.head()

Unnamed: 0,Method,Clustering,Matrices,Hyperparam,Genes,Data,ARI,AMI
0,meK-Means,4|4|2|4|4|4|3|3|4|4|2|2|4|4|4|4|4|4|4|4|2|4|4|...,"U,S",5,357,cl5,0.98396,0.969748
1,meK-Means,4|4|2|4|4|4|3|3|4|4|2|2|4|4|4|4|4|4|4|4|2|4|4|...,"U,S",5,357,cl5,0.98396,0.969748
2,meK-Means,4|4|2|4|4|4|3|3|4|4|2|2|4|4|4|4|4|4|4|4|2|4|4|...,"U,S",5,357,cl5,0.98396,0.969748
3,meK-Means,1|1|0|1|1|1|4|4|1|1|0|0|1|1|1|1|1|1|1|1|0|1|1|...,"U,S",5,1193,cl5,0.983181,0.970635
4,meK-Means,1|1|0|1|1|1|4|4|1|1|0|0|1|1|1|1|1|1|1|1|0|1|1|...,"U,S",5,1193,cl5,0.983181,0.970635


In [None]:
meK_res.to_csv('./fits/meKruns_0508/meK_bench_res.csv',index=None)

In [None]:
meK_res

Unnamed: 0,Method,Clustering,Matrices,Hyperparam,Genes,Data,ARI,AMI
0,meK-Means,4|4|2|4|4|4|3|3|4|4|2|2|4|4|4|4|4|4|4|4|2|4|4|...,"U,S",5,357,cl5,0.98396,0.969748
1,meK-Means,4|4|2|4|4|4|3|3|4|4|2|2|4|4|4|4|4|4|4|4|2|4|4|...,"U,S",5,357,cl5,0.98396,0.969748
2,meK-Means,4|4|2|4|4|4|3|3|4|4|2|2|4|4|4|4|4|4|4|4|2|4|4|...,"U,S",5,357,cl5,0.98396,0.969748
3,meK-Means,1|1|0|1|1|1|4|4|1|1|0|0|1|1|1|1|1|1|1|1|0|1|1|...,"U,S",5,1193,cl5,0.983181,0.970635
4,meK-Means,1|1|0|1|1|1|4|4|1|1|0|0|1|1|1|1|1|1|1|1|0|1|1|...,"U,S",5,1193,cl5,0.983181,0.970635
5,meK-Means,1|1|0|1|1|1|4|4|1|1|0|0|1|1|1|1|1|1|1|1|0|1|1|...,"U,S",5,1193,cl5,0.983181,0.970635
6,meK-Means,5|0|0|7|10|9|1|0|10|7|9|4|9|6|0|0|6|0|0|0|4|10...,"U,S",11,359,allen_b02h01a02,0.685633,0.788524
7,meK-Means,5|0|0|7|10|9|1|0|10|7|9|4|9|6|0|0|6|0|0|0|4|10...,"U,S",11,359,allen_b02h01a02,0.685633,0.788524
8,meK-Means,5|0|0|7|10|9|1|0|10|7|9|4|9|6|0|0|6|0|0|0|4|10...,"U,S",11,359,allen_b02h01a02,0.685633,0.788524
9,meK-Means,2|2|2|2|2|0|2|2|2|2|0|2|2|2|0|2|2|2|2|2|2|2|2|...,"U,S",3,466,cl3,0.98982,0.980961


### **GLUE**

In [13]:
!mkdir ./fits/GLUEruns_0507

mkdir: cannot create directory ‘/home/tchari/perturbCME/notebooks/fits/GLUEruns_0507’: File exists


In [None]:

#Save method, clustering, mat_in (U,S, etc), hyper (K or res), hvgs, data, ARI, AMI
GLUE_res = pd.DataFrame()
meths = []
result = []
mats = []
hyper = []
hvgs = []
data = []
ari = []
ami = []

for d in d_strings:


    #Get tech param by keyword (datas) in loom paths
    ind = [i in d for i in datas]
    

    #Preprocessing params for filepaths
    gtf = list(samps.GTF[ind])[0]
    k = list(samps.Clusters[ind])[0]
    data_name = list(samps.Dataset[ind])[0]
    
    
    ds = lp.connect(d)
    g_names = ds.ra[attribute_names[1]]
    num_genes = len(g_names)
    num_cells = len(ds.ca[attribute_names[2]])
    
    U = ds.layers['unspliced'][:,:].T
    S = ds.layers['spliced'][:,:].T


    true_labs = list(ds.ca['subclass_label'])
    ds.close()
    print(data_name+' with '+str(num_genes)+' genes')


    for n_run in range(num_runs):
        print(n_run)
        
        rnaU = anndata.AnnData(X=U.copy())
        rnaU.layers["counts"] = rnaU.X.copy()
        rnaU.var_names = g_names
        
        rnaS = anndata.AnnData(X=S.copy())
        rnaS.layers["counts"] = rnaS.X.copy()
        rnaS.var_names = g_names
    
        for r in [rnaU,rnaS]:
            sc.pp.normalize_total(r)
            sc.pp.log1p(r)
            sc.pp.scale(r)
            sc.tl.pca(r, n_comps=100, svd_solver="auto")
    
        scglue.data.get_gene_annotation(
        rnaU, gtf=gtf,
        gtf_by="gene_name"
        )
        scglue.data.get_gene_annotation(
        rnaS, gtf=gtf,
        gtf_by="gene_name"
        )

        
        if data_name == 'allen_b02h01a02':
            guidance = scglue.genomics.rna_anchored_prior_graph(rnaU, rnaS,propagate_highly_variable=False)
        else:
            #Conda installed version only has rna_anchored_prior_graph, but conda is suggested for install by authors
            guidance = scglue.genomics.rna_anchored_prior_graph(rnaS, rnaU,propagate_highly_variable=False) #Flip anchor for nucseq

        scglue.models.configure_dataset(
            rnaU, "NB", use_highly_variable=False,
            use_layer="counts", use_rep="X_pca"
        )

        scglue.models.configure_dataset(
            rnaS, "NB", use_highly_variable=False,
            use_layer="counts", use_rep="X_pca"
        )


        if data_name == 'allen_b02h01a02':
            guidance_hvf = guidance.subgraph(chain(
                rnaU.var.index,
                rnaS.var.index
            )).copy()

            glue = scglue.models.fit_SCGLUE(
                {"rnaU": rnaU, "rnaS": rnaS}, guidance_hvf,
                fit_kws={"directory": "glue"}
            )
            
        else : 
            guidance_hvf = guidance.subgraph(chain(
                rnaS.var.index,
                rnaU.var.index
            )).copy()

            glue = scglue.models.fit_SCGLUE(
                {"rnaS": rnaS, "rnaU": rnaU}, guidance_hvf,
                fit_kws={"directory": "glue"}
            )
            
        rnaS.obsm["X_glue"] = glue.encode_data("rnaS", rnaS)
        rnaU.obsm["X_glue"] = glue.encode_data("rnaU", rnaU)
        combined = anndata.concat([rnaU, rnaS],axis=1)

        res = [1]
        g_GLUE = get_graph(combined.X)
        partition_type = la.RBConfigurationVertexPartition
        #Make Knn graphs
        
        part = la.find_partition(g_GLUE, partition_type, 
                                    weights=np.array(g_GLUE.es['weight']).astype(np.float64), 
                                    n_iterations=-1, resolution_parameter=res[0])
        
        labels = np.array(part.membership)
        
        # ----- Save Results ---- ARI,AMI etc
        meths += ['GLUE-Leiden']
        result += [labels]
        hyper += [res[0]]
        hvgs += [num_genes]
        data += [data_name]
        ari += [adjusted_rand_score(true_labs,labels)]
        ami += [adjusted_mutual_info_score(true_labs,labels)]

        print('Leiden: ',adjusted_rand_score(true_labs,labels))
        
        #             print('No. clus Leiden: ',len(np.unique(labels)))
            
        mats += ['U,S']


        kmeans = KMeans(n_clusters=k).fit(combined.X)
        labs = kmeans.labels_
        
        meths += ['GLUE-K-Means']
        result += [labs]
        hyper += [k]
        hvgs += [num_genes]
        data += [data_name]
        ari += [adjusted_rand_score(true_labs,labs)]
        ami += [adjusted_mutual_info_score(true_labs,labs)]

        mats += ['U,S']

        print('K-means: ',adjusted_rand_score(true_labs,labs))



cl5 with 357 genes
0




  0%|          | 0/357 [00:00<?, ?it/s]

Epoch 00088: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00088: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00150: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00150: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00176: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00176: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 13:17:45,128 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00101: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00101: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00128: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00128: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00150: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00150: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 13:24:01,008 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.9712899473574214
K-means:  0.7351145928269527
1




  0%|          | 0/357 [00:00<?, ?it/s]

Epoch 00150: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00150: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00176: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00176: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 13:32:42,064 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00101: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00101: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00128: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00128: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00150: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00150: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 13:39:35,840 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.9712899473574214
K-means:  0.8230264935574121
2




  0%|          | 0/357 [00:00<?, ?it/s]

Epoch 00088: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00088: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00150: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00150: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00176: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00176: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 13:47:53,430 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00101: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00101: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00128: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00128: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00150: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00150: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 13:54:45,216 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.9712899473574214
K-means:  0.8512010218091303
cl5 with 1193 genes
0


  0%|          | 0/1193 [00:00<?, ?it/s]

Epoch 00054: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00054: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00088: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00088: reducing learning rate of group 0 to 2.0000e-05.


2024-05-07 14:13:54,382 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00131: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00131: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00151: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00151: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00176: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00176: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 14:42:50,472 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.8882786112244296
K-means:  0.9876953929875517
1


  0%|          | 0/1193 [00:00<?, ?it/s]

Epoch 00054: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00054: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00088: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00088: reducing learning rate of group 0 to 2.0000e-05.


2024-05-07 14:57:03,136 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00131: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00131: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00151: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00151: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00176: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00176: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 15:19:41,741 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.8882786112244296
K-means:  0.9876953929875517
2


  0%|          | 0/1193 [00:00<?, ?it/s]

Epoch 00054: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00054: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00088: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00088: reducing learning rate of group 0 to 2.0000e-05.


2024-05-07 15:32:04,441 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00131: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00131: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00151: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00151: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00176: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00176: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 15:56:13,189 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.8882786112244296
K-means:  0.48927811149794176
allen_b02h01a02 with 359 genes
0


  0%|          | 0/359 [00:00<?, ?it/s]

Epoch 00018: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00018: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00039: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00039: reducing learning rate of group 0 to 2.0000e-05.


2024-05-07 16:06:35,713 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00039: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00039: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00044: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00044: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00049: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00049: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00059: reducing learning rate of group 0 to 2.0000e-07.
Epoch 00059: reducing learning rate of group 0 to 2.0000e-07.


2024-05-07 16:22:05,213 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.6930208297201008
K-means:  0.6862958027675946
1


  0%|          | 0/359 [00:00<?, ?it/s]

Epoch 00018: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00018: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00039: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00039: reducing learning rate of group 0 to 2.0000e-05.


2024-05-07 16:31:17,238 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00039: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00039: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00044: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00044: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00049: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00049: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00059: reducing learning rate of group 0 to 2.0000e-07.
Epoch 00059: reducing learning rate of group 0 to 2.0000e-07.


2024-05-07 16:45:14,282 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.7183094570618987
K-means:  0.5788406716466464
2


  0%|          | 0/359 [00:00<?, ?it/s]

Epoch 00018: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00018: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00039: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00039: reducing learning rate of group 0 to 2.0000e-05.


2024-05-07 16:54:14,489 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00039: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00039: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00044: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00044: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00049: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00049: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00059: reducing learning rate of group 0 to 2.0000e-07.
Epoch 00059: reducing learning rate of group 0 to 2.0000e-07.


2024-05-07 17:07:17,773 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.692754766543932
K-means:  0.5693318144263902
cl3 with 466 genes
0


  0%|          | 0/466 [00:00<?, ?it/s]

Epoch 00254: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00254: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00419: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00419: reducing learning rate of group 0 to 2.0000e-05.


2024-05-07 17:13:49,817 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00419: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00419: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00499: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00499: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00586: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00586: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 17:21:37,671 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.9835645337762751
K-means:  0.9932934210739891
1


  0%|          | 0/466 [00:00<?, ?it/s]

Epoch 00254: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00254: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00419: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00419: reducing learning rate of group 0 to 2.0000e-05.


2024-05-07 17:28:16,759 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00419: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00419: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00499: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00499: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00586: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00586: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 17:36:50,745 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.9835645337762751
K-means:  0.9932934210739891
2


  0%|          | 0/466 [00:00<?, ?it/s]

Epoch 00254: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00254: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00419: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00419: reducing learning rate of group 0 to 2.0000e-05.


2024-05-07 17:47:45,799 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00419: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00419: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00499: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00499: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00586: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00586: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 18:00:56,503 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.9835645337762751
K-means:  0.5804070720316357
allen_b08 with 682 genes
0


  0%|          | 0/682 [00:00<?, ?it/s]

Epoch 00037: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00037: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00051: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00051: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00070: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00070: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 18:19:34,715 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00070: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00070: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00084: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00084: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00110: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00110: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 18:46:42,155 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.5492517882595516
K-means:  0.6295912093131983
1


  0%|          | 0/682 [00:00<?, ?it/s]

Epoch 00037: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00037: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00051: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00051: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00070: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00070: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 19:05:13,088 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00070: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00070: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00084: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00084: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00110: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00110: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 19:31:19,251 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.644595025950897
K-means:  0.6664669716817193
2


  0%|          | 0/682 [00:00<?, ?it/s]

Epoch 00037: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00037: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00051: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00051: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00070: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00070: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 19:47:47,436 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00070: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00070: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00084: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00084: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00110: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00110: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 20:10:44,348 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training
  utils.warn_names_duplicates("var")


Leiden:  0.6446114362334201
K-means:  0.6750873608684672
allen_b02h01a02 with 2770 genes
0


  0%|          | 0/2770 [00:00<?, ?it/s]

Epoch 00011: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00011: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00017: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00017: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00025: reducing learning rate of group 0 to 2.0000e-06.
Epoch 00025: reducing learning rate of group 0 to 2.0000e-06.


2024-05-07 20:30:39,932 ignite.handlers.early_stopping.EarlyStopping INFO: EarlyStopping: Stop training


Epoch 00025: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00025: reducing learning rate of group 0 to 2.0000e-04.
Epoch 00039: reducing learning rate of group 0 to 2.0000e-05.
Epoch 00039: reducing learning rate of group 0 to 2.0000e-05.


In [25]:
GLUE_res['Method'] = meths
GLUE_res['Clustering'] = result
GLUE_res['Matrices'] = mats
GLUE_res['Hyperparam'] = hyper
GLUE_res['HVGs'] = hvgs
GLUE_res['Data'] = data
GLUE_res['ARI'] = ari
GLUE_res['AMI'] = ami
GLUE_res.head()  

Unnamed: 0,Method,Clustering,Matrices,Hyperparam,HVGs,Data,ARI,AMI
0,GLUE-Leiden,"[3, 3, 1, 3, 3, 3, 4, 4, 3, 3, 1, 1, 3, 3, 3, ...","U,S",1,357,cl5,0.97129,0.951745
1,GLUE-K-Means,"[4, 4, 1, 4, 4, 4, 4, 4, 4, 4, 1, 1, 4, 4, 4, ...","U,S",5,357,cl5,0.735115,0.845281
2,GLUE-Leiden,"[3, 3, 1, 3, 3, 3, 4, 4, 3, 3, 1, 1, 3, 3, 3, ...","U,S",1,357,cl5,0.97129,0.951745
3,GLUE-K-Means,"[1, 1, 4, 1, 1, 1, 1, 1, 1, 1, 4, 4, 1, 1, 1, ...","U,S",5,357,cl5,0.823026,0.866763
4,GLUE-Leiden,"[3, 3, 1, 3, 3, 3, 4, 4, 3, 3, 1, 1, 3, 3, 3, ...","U,S",1,357,cl5,0.97129,0.951745


In [26]:
new_assigns = []
for assigns in GLUE_res.Clustering:
    new = [str(x) for x in assigns]
    new = "|".join(new)
    new_assigns += [new]

GLUE_res['Clustering'] = new_assigns
GLUE_res.head()

Unnamed: 0,Method,Clustering,Matrices,Hyperparam,HVGs,Data,ARI,AMI
0,GLUE-Leiden,3|3|1|3|3|3|4|4|3|3|1|1|3|3|3|3|3|4|3|3|1|3|3|...,"U,S",1,357,cl5,0.97129,0.951745
1,GLUE-K-Means,4|4|1|4|4|4|4|4|4|4|1|1|4|4|4|4|4|4|4|4|1|4|4|...,"U,S",5,357,cl5,0.735115,0.845281
2,GLUE-Leiden,3|3|1|3|3|3|4|4|3|3|1|1|3|3|3|3|3|4|3|3|1|3|3|...,"U,S",1,357,cl5,0.97129,0.951745
3,GLUE-K-Means,1|1|4|1|1|1|1|1|1|1|4|4|1|1|1|1|1|1|1|1|0|1|1|...,"U,S",5,357,cl5,0.823026,0.866763
4,GLUE-Leiden,3|3|1|3|3|3|4|4|3|3|1|1|3|3|3|3|3|4|3|3|1|3|3|...,"U,S",1,357,cl5,0.97129,0.951745


In [27]:
GLUE_res.to_csv('./fits/GLUEruns_0507/GLUE_res.csv',index=None)

In [29]:
# GLUE_res

### **Leiden & K-Means**


In [28]:
# ! rm -r /home/tchari/perturbCME/notebooks/fits/LeidKMeansruns_0209

In [17]:
#Make the U,S, U+S, Concat matrices, res 0.75,1,1.5,2

#!mkdir /home/tchari/perturbCME/notebooks/fits/LeidKMeansruns_0215
!mkdir ./fits/LeidKMeansruns_0508

#Save method, clustering, mat_in (U,S, etc), hyper (K or res), hvgs, data, ARI, AMI
LK_res = pd.DataFrame()
meths = []
result = []
mats = []
hyper = []
hvgs = []
data = []
ari = []
ami = []

for d in d_strings:
    
    #Get tech param by keyword (datas) in loom paths
    ind = [i in d for i in datas]
    
    k = list(samps.Clusters[ind])[0]
    data_name = list(samps.Dataset[ind])[0]
    
    
    ds = lp.connect(d)
    num_genes = len(ds.ra[attribute_names[1]])
    num_cells = len(ds.ca[attribute_names[2]])
    U = ds.layers[attribute_names[0][0]][:,:].T
    S = ds.layers[attribute_names[0][1]][:,:].T
    true_labs = list(ds.ca['subclass_label'])
    ds.close()
    print(data_name+' with '+str(num_genes)+' HVGs')
    
    res = [0.75,1,1.5,2]
    
    #Get U,S,U_p_S,U_c_S
        
    #Norm mats
    U_norm = norm_mat(U)
    S_norm = norm_mat(S)
    U_p_S_norm = norm_mat(U+S)
    U_c_S_norm = norm_mat(np.concatenate([U,S],axis=1))
    
    g_U = get_graph(U_norm)
    g_S = get_graph(S_norm)
    g_U_p_S = get_graph(U_p_S_norm)
    g_U_c_S = get_graph(U_c_S_norm)

    for n_run in range(num_runs):
        print(n_run)
    
        # -------- Fit Leiden -------
        for r in res:
            
            partition_type = la.RBConfigurationVertexPartition
            #Make Knn graphs
            for g in [g_U,g_S,g_U_p_S,g_U_c_S]:
                part = la.find_partition(g, partition_type, 
                                            weights=np.array(g.es['weight']).astype(np.float64), 
                                            n_iterations=-1, resolution_parameter=r)
    
                labels = np.array(part.membership)
                
                # ----- Save Results ---- ARI,AMI etc
                meths += ['Leiden']
                result += [labels]
                hyper += [r]
                hvgs += [num_genes]
                data += [data_name]
                ari += [adjusted_rand_score(true_labs,labels)]
                ami += [adjusted_mutual_info_score(true_labs,labels)]
                
    #             print('No. clus Leiden: ',len(np.unique(labels)))
                
            mats += ['U','S','U+S','UcatS']
            
            
            
        # -------- Fit K-Means with k -------
        
        for x in [U_norm,S_norm,U_p_S_norm,U_c_S_norm]:
            kmeans = KMeans(n_clusters=k, random_state=0).fit(x)
            labs = kmeans.labels_
            
            meths += ['K-Means']
            result += [labs]
            hyper += [k]
            hvgs += [num_genes]
            data += [data_name]
            ari += [adjusted_rand_score(true_labs,labs)]
            ami += [adjusted_mutual_info_score(true_labs,labs)]
            
    #         print('No. clus K-Means: ',len(np.unique(labs)))
            
        mats += ['U','S','U+S','UcatS']

    
LK_res['Method'] = meths
LK_res['Clustering'] = result
LK_res['Matrices'] = mats
LK_res['Hyperparam'] = hyper
LK_res['HVGs'] = hvgs
LK_res['Data'] = data
LK_res['ARI'] = ari
LK_res['AMI'] = ami

mkdir: cannot create directory ‘/home/tchari/perturbCME/notebooks/fits/LeidKMeansruns_0508’: File exists
cl5 with 357 HVGs


  divids = (new_tot/tots)[:,None]
  mat_norm = mat*divids


0
1
2
cl5 with 1193 HVGs
0
1
2
allen_b02h01a02 with 359 HVGs
0
1
2
cl3 with 466 HVGs
0
1
2
allen_b08 with 682 HVGs
0
1
2
allen_b02h01a02 with 2770 HVGs
0
1
2
cl3 with 1137 HVGs
0
1
2
allen_b08 with 1948 HVGs
0
1
2


In [19]:
new_assigns = []
for assigns in LK_res.Clustering:
    new = [str(x) for x in assigns]
    new = "|".join(new)
    new_assigns += [new]

LK_res['Clustering'] = new_assigns
print(LK_res.head())

LK_res.to_csv('./fits/LeidKMeansruns_0508/LK_bench_res.csv',index=None)

   Method                                         Clustering Matrices  \
0  Leiden  3|3|1|3|3|3|4|4|3|3|1|1|3|3|3|3|3|3|3|3|1|3|3|...        U   
1  Leiden  3|3|1|3|3|3|4|4|3|3|1|1|3|3|3|3|3|3|3|3|1|3|3|...        S   
2  Leiden  3|3|1|3|3|3|4|4|3|3|1|1|3|3|3|3|3|3|3|3|1|3|3|...      U+S   
3  Leiden  3|3|1|3|3|3|4|4|3|3|1|1|3|3|3|3|3|3|3|3|1|3|3|...    UcatS   
4  Leiden  3|3|1|3|3|3|4|4|3|3|1|1|3|3|3|3|3|3|3|3|1|3|3|...        U   

   Hyperparam  HVGs Data       ARI       AMI  
0        0.75   357  cl5  0.950284  0.918657  
1        0.75   357  cl5  0.986832  0.975747  
2        0.75   357  cl5  0.965610  0.946640  
3        0.75   357  cl5  0.965702  0.947080  
4        1.00   357  cl5  0.946577  0.913621  


In [None]:
#LeidKMeansruns_0508

In [None]:
#Save method, clustering, mat_in (U,S, etc), hyper (K or res), hvgs, data, ARI, NMI
# LK_res.to_csv('./fits/LeidKMeansruns_0209/LeidKMeans_bench_results.csv',index=None)
# LK_res.head()



## **Run Methods on Simulated Data**

In [9]:
d_strings  = glob.glob('./home/tchari/counts/meKMeans_sims/loom/*.loom')
d_strings 

['/home/tchari/counts/meKMeans_sims/loom/drop_1perc_sim_k8.loom',
 '/home/tchari/counts/meKMeans_sims/loom/drop_1perc_sim_k8_n1.loom',
 '/home/tchari/counts/meKMeans_sims/loom/drop_20perc_sim_k8_n0.loom',
 '/home/tchari/counts/meKMeans_sims/loom/drop_5perc_sim_k8_n0.loom',
 '/home/tchari/counts/meKMeans_sims/loom/drop_20perc_sim_k8_n2.loom',
 '/home/tchari/counts/meKMeans_sims/loom/drop_1perc_sim_k8_n0.loom',
 '/home/tchari/counts/meKMeans_sims/loom/drop_5perc_sim_k8_n2.loom',
 '/home/tchari/counts/meKMeans_sims/loom/drop_1perc_sim_k8_n2.loom',
 '/home/tchari/counts/meKMeans_sims/loom/drop_5perc_sim_k8.loom',
 '/home/tchari/counts/meKMeans_sims/loom/drop_20perc_sim_k8.loom',
 '/home/tchari/counts/meKMeans_sims/loom/negctrl_sim_k1.loom',
 '/home/tchari/counts/meKMeans_sims/loom/b_beta_sim_k8_0508.loom',
 '/home/tchari/counts/meKMeans_sims/loom/drop_5perc_sim_k8_n1.loom',
 '/home/tchari/counts/meKMeans_sims/loom/k_gamma_sim_k8_0508.loom',
 '/home/tchari/counts/meKMeans_sims/loom/drop_20p

In [10]:
attribute_names =[('unspliced','spliced'),'gene_name','barcode']

In [11]:
datas = ['negctrl_sim_k1','b_beta_sim_k8','k_gamma_sim_k8']

In [12]:
#Not doing dropout data for now
sub_d_strings = ['./home/tchari/counts/meKMeans_sims/loom/negctrl_sim_k1.loom',
                './home/tchari/counts/meKMeans_sims/loom/b_beta_sim_k8.loom',
                './home/tchari/counts/meKMeans_sims/loom/k_gamma_sim_k8.loom']
sub_d_strings

['/home/tchari/counts/meKMeans_sims/loom/negctrl_sim_k1.loom',
 '/home/tchari/counts/meKMeans_sims/loom/b_beta_sim_k8.loom',
 '/home/tchari/counts/meKMeans_sims/loom/k_gamma_sim_k8.loom']

In [13]:
samp = [-6.777777777777778, -1.25]

### **GLUE**

In [79]:
!mkdir ./fits/GLUEruns_0507

mkdir: cannot create directory ‘/home/tchari/perturbCME/notebooks/fits/GLUEruns_0507’: File exists


In [80]:
gtfs_sim = ['./refdata-gex-GRCh38-2020-A/genes/genes.gtf']*3

In [82]:

#Save method, clustering, mat_in (U,S, etc), hyper (K or res), hvgs, data, ARI, AMI
GLUE_res = pd.DataFrame()
meths = []
result = []
mats = []
hyper = []
hvgs = []
data = []
ari = []
ami = []

for d in sub_d_strings:


    #Get tech param by keyword (datas) in loom paths
    ind = [i in d for i in datas]
    

    #Preprocessing params for filepaths
    gtf = np.array(gtfs_sim)[ind][0]

    data_name = np.array(datas)[ind][0]
    
    
    ds = lp.connect(d)
    g_names = ds.ra[attribute_names[1]]
    num_genes = len(g_names)
    num_cells = len(ds.ca[attribute_names[2]])
    
    U = ds.layers['unspliced'][:,:].T
    S = ds.layers['spliced'][:,:].T


    true_labs = list(ds.ca['subclass_label'])
    ds.close()

        
    print(data_name+' with '+str(num_genes)+' genes')


    for n_run in range(num_runs): #num_runs
        print(n_run)
        
        rnaU = anndata.AnnData(X=U.copy())
        rnaU.layers["counts"] = rnaU.X.copy()
        rnaU.var_names = g_names
        
        rnaS = anndata.AnnData(X=S.copy())
        rnaS.layers["counts"] = rnaS.X.copy()
        rnaS.var_names = g_names
    
        for r in [rnaU,rnaS]:
            sc.pp.normalize_total(r)
            sc.pp.log1p(r)
            sc.pp.scale(r)
            sc.tl.pca(r, n_comps=100, svd_solver="auto")
    
        scglue.data.get_gene_annotation(
        rnaU, gtf=gtf,
        gtf_by="gene_name"
        )
        scglue.data.get_gene_annotation(
        rnaS, gtf=gtf,
        gtf_by="gene_name"
        )

        
        #In case gtf mapping didn't work (not actually necessary for U/S, but there is no option to not use mapping)
        rnaU.var.chromStart[~np.isfinite(rnaU.var.chromStart)] = range(np.sum(~np.isfinite(rnaU.var.chromStart)))
        rnaS.var.chromStart[~np.isfinite(rnaS.var.chromStart)] = range(np.sum(~np.isfinite(rnaS.var.chromStart)))

        rnaU.var.chromEnd[~np.isfinite(rnaU.var.chromEnd)] = range(50,np.sum(~np.isfinite(rnaU.var.chromEnd))+50)
        rnaS.var.chromEnd[~np.isfinite(rnaS.var.chromEnd)] = range(50,np.sum(~np.isfinite(rnaS.var.chromEnd))+50)
        
        
        guidance = scglue.genomics.rna_anchored_prior_graph(rnaS, rnaU,gene_region="gene_body",propagate_highly_variable=False) 

        scglue.models.configure_dataset(
            rnaU, "NB", use_highly_variable=False,
            use_layer="counts", use_rep="X_pca"
        )

        scglue.models.configure_dataset(
            rnaS, "NB", use_highly_variable=False,
            use_layer="counts", use_rep="X_pca"
        )



        guidance_hvf = guidance.subgraph(chain(
            rnaS.var.index,
            rnaU.var.index
        )).copy()

        glue = scglue.models.fit_SCGLUE(
            {"rnaS": rnaS, "rnaU": rnaU}, guidance_hvf,
            fit_kws={"directory": "glue"}
        )
            
        rnaS.obsm["X_glue"] = glue.encode_data("rnaS", rnaS)
        rnaU.obsm["X_glue"] = glue.encode_data("rnaU", rnaU)
        combined = anndata.concat([rnaU, rnaS],axis=1)

        res = [1]
        g_GLUE = get_graph(combined.X)
        partition_type = la.RBConfigurationVertexPartition
        #Make Knn graphs
        
        part = la.find_partition(g_GLUE, partition_type, 
                                    weights=np.array(g_GLUE.es['weight']).astype(np.float64), 
                                    n_iterations=-1, resolution_parameter=res[0])
        
        labels = np.array(part.membership)
        
        # ----- Save Results ---- ARI,AMI etc
        meths += ['GLUE-Leiden']
        result += [labels]
        hyper += [res[0]]
        hvgs += [num_genes]
        data += [data_name]
        ari += [adjusted_rand_score(true_labs,labels)]
        ami += [adjusted_mutual_info_score(true_labs,labels)]

        print('Leiden: ',adjusted_rand_score(true_labs,labels))
        
        #             print('No. clus Leiden: ',len(np.unique(labels)))
            
        mats += ['U,S']

        if 'negctrl' in d:
            k = len(np.unique(labels)) 
            print('Negctrl k: ',k)
        else:
            k = len(np.unique(true_labs))


        kmeans = KMeans(n_clusters=k).fit(combined.X)
        labs = kmeans.labels_
        
        meths += ['GLUE-K-Means']
        result += [labs]
        hyper += [k]
        hvgs += [num_genes]
        data += [data_name]
        ari += [adjusted_rand_score(true_labs,labs)]
        ami += [adjusted_mutual_info_score(true_labs,labs)]

        mats += ['U,S']

        print('K-means: ',adjusted_rand_score(true_labs,labs))



A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  rnaU.var.chromStart[~np.isfinite(rnaU.var.chromStart)] = range(np.sum(~np.isfinite(rnaU.var.chromStart)))


In [None]:
GLUE_res['Method'] = meths
GLUE_res['Clustering'] = result
GLUE_res['Matrices'] = mats
GLUE_res['Hyperparam'] = hyper
GLUE_res['HVGs'] = hvgs
GLUE_res['Data'] = data
GLUE_res['ARI'] = ari
GLUE_res['AMI'] = ami
GLUE_res.head()  

In [None]:
new_assigns = []
for assigns in GLUE_res.Clustering:
    new = [str(x) for x in assigns]
    new = "|".join(new)
    new_assigns += [new]

GLUE_res['Clustering'] = new_assigns
GLUE_res.head()

In [None]:
GLUE_res.to_csv('./fits/GLUEruns_0507/GLUE_sim_res.csv',index=None)

In [76]:
GLUE_res

Unnamed: 0,Method,Clustering,Matrices,Hyperparam,HVGs,Data,ARI,AMI
0,GLUE-Leiden,3|5|5|1|2|7|4|6|3|2|3|4|1|1|0|1|8|1|0|3|3|4|3|...,"U,S",1,1100,negctrl_sim_k1,0.0,0.0
1,GLUE-K-Means,9|9|3|3|2|3|2|9|9|2|3|3|2|3|2|2|3|2|3|2|3|3|3|...,"U,S",13,1100,negctrl_sim_k1,0.0,0.0
2,GLUE-Leiden,0|1|2|2|1|8|2|1|9|1|2|5|0|6|3|5|5|4|6|5|2|6|4|...,"U,S",1,1100,negctrl_sim_k1,0.0,0.0
3,GLUE-K-Means,6|8|13|6|2|7|8|6|11|6|2|5|8|11|2|8|5|6|6|6|6|6...,"U,S",14,1100,negctrl_sim_k1,0.0,0.0
4,GLUE-Leiden,4|6|6|1|7|5|3|1|7|1|4|6|9|4|6|5|5|0|12|1|4|5|1...,"U,S",1,1100,negctrl_sim_k1,0.0,0.0
5,GLUE-K-Means,3|5|12|6|6|5|5|5|5|5|5|5|12|1|3|5|5|5|5|3|5|5|...,"U,S",13,1100,negctrl_sim_k1,0.0,0.0
6,GLUE-Leiden,5|5|1|5|5|5|5|2|2|2|2|5|5|3|5|2|5|5|5|5|0|5|1|...,"U,S",1,1100,b_beta_sim_k8,0.604021,0.542391
7,GLUE-K-Means,6|6|6|6|6|6|6|6|6|6|6|6|6|6|6|6|6|6|6|6|6|6|6|...,"U,S",10,1100,b_beta_sim_k8,0.350181,0.610326
8,GLUE-Leiden,3|5|1|5|5|5|5|5|5|5|5|5|5|0|5|5|5|5|5|5|0|5|1|...,"U,S",1,1100,b_beta_sim_k8,0.575602,0.524579
9,GLUE-K-Means,2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|...,"U,S",10,1100,b_beta_sim_k8,0.744723,0.828498


### **Leiden and K-Means**

In [48]:
#Run Leiden + K-Means first, with K=Leiden # of clus for neg control

#Make the U,S, U+S, Concat matrices, res 0.75,1,1.5,2

#!mkdir /home/tchari/perturbCME/notebooks/fits/LeidKMeansruns_0306
!mkdir ./fits/LeidKMeansruns_0508

#Save method, clustering, mat_in (U,S, etc), hyper (K or res), hvgs, data, ARI, AMI
LK_res = pd.DataFrame()
meths = []
result = []
mats = []
hyper = []
hvgs = []
data = []
ari = []
ami = []

for d in sub_d_strings:
    
    #Get tech param by keyword (datas) in loom paths
    ind = [i in d for i in datas]
    

    data_name = np.array(datas)[ind][0]
    
    
    ds = lp.connect(d)
    num_genes = len(ds.ra[attribute_names[1]])
    num_cells = len(ds.ca[attribute_names[2]])
    U = ds.layers[attribute_names[0][0]][:,:].T
    S = ds.layers[attribute_names[0][1]][:,:].T
    true_labs = list(ds.ca['subclass_label'])
    ds.close()
    print(data_name+' with '+str(num_genes)+' HVGs')
    
    
    res = [1]
    
    #Get U,S,U_p_S,U_c_S
        
    #Norm mats
    U_norm = norm_mat(U)
    S_norm = norm_mat(S)
    U_p_S_norm = norm_mat(U+S)
    U_c_S_norm = norm_mat(np.concatenate([U,S],axis=1))
    
    g_U = get_graph(U_norm)
    g_S = get_graph(S_norm)
    g_U_p_S = get_graph(U_p_S_norm)
    g_U_c_S = get_graph(U_c_S_norm)
    
    # -------- Fit Leiden -------
    for n_run in range(num_runs):
        print(n_run)
        
        for r in res:
            
            partition_type = la.RBConfigurationVertexPartition
            #Make Knn graphs
            for g in [g_U,g_S,g_U_p_S,g_U_c_S]:
                part = la.find_partition(g, partition_type, 
                                            weights=np.array(g.es['weight']).astype(np.float64), 
                                            n_iterations=-1, resolution_parameter=r)
    
                labels = np.array(part.membership)
                
                # ----- Save Results ---- ARI,AMI etc
                meths += ['Leiden']
                result += [labels]
                hyper += [r]
                hvgs += [num_genes]
                data += [data_name]
                ari += [adjusted_rand_score(true_labs,labels)]
                ami += [adjusted_mutual_info_score(true_labs,labels)]
                
    #             print('No. clus Leiden: ',len(np.unique(labels)))
                
            mats += ['U','S','U+S','UcatS']
            
            
            
        # -------- Fit K-Means with k -------
        if 'negctrl' in d:
            k = len(np.unique(labels)) 
            print('Negctrl k: ',k)
        else:
            k = len(np.unique(true_labs))
            
        
        for x in [U_norm,S_norm,U_p_S_norm,U_c_S_norm]:
            kmeans = KMeans(n_clusters=k, random_state=0).fit(x)
            labs = kmeans.labels_
            
            meths += ['K-Means']
            result += [labs]
            hyper += [k]
            hvgs += [num_genes]
            data += [data_name]
            ari += [adjusted_rand_score(true_labs,labs)]
            ami += [adjusted_mutual_info_score(true_labs,labs)]
            
    #         print('No. clus K-Means: ',len(np.unique(labs)))
            
        mats += ['U','S','U+S','UcatS']

    
LK_res['Method'] = meths
LK_res['Clustering'] = result
LK_res['Matrices'] = mats
LK_res['Hyperparam'] = hyper
LK_res['HVGs'] = hvgs
LK_res['Data'] = data
LK_res['ARI'] = ari
LK_res['AMI'] = ami

mkdir: cannot create directory ‘/home/tchari/perturbCME/notebooks/fits/LeidKMeansruns_0508’: File exists
negctrl_sim_k1 with 1100 HVGs
0
Negctrl k:  10
1
Negctrl k:  10
2
Negctrl k:  10
b_beta_sim_k8_0508 with 1100 HVGs
0
1
2
k_gamma_sim_k8_0508 with 700 HVGs
0
1
2


In [90]:
# LK_res

In [91]:
# LK_res.to_pickle('./fits/LeidKMeansruns_0306/LK_sim_results.pkl') #0301
# #unpickled_df = pd.read_pickle("./meK_res.pkl")

new_assigns = []
for assigns in LK_res.Clustering:
    new = [str(x) for x in assigns]
    new = "|".join(new)
    new_assigns += [new]

LK_res['Clustering'] = new_assigns
print(LK_res.head())
LK_res.to_csv('./fits/LeidKMeansruns_0508/LK_sim_res.csv',index=None)

    Method                                         Clustering Matrices  \
0   Leiden  8|4|2|10|5|0|4|1|2|3|0|3|4|4|1|3|5|9|0|8|0|2|5...        U   
1   Leiden  8|2|2|6|11|3|10|1|0|4|1|0|0|0|11|8|9|8|6|7|1|2...        S   
2   Leiden  9|2|2|6|5|2|3|0|5|7|6|8|13|6|8|4|6|14|1|6|3|7|...      U+S   
3   Leiden  2|6|2|0|3|2|8|9|2|5|5|2|2|5|5|1|0|0|9|2|1|2|4|...    UcatS   
4  K-Means  5|6|4|8|10|1|3|9|10|8|6|7|1|8|2|4|8|10|9|6|4|0...        U   

   Hyperparam  HVGs            Data  ARI  AMI  
0           1  1100  negctrl_sim_k1  0.0  0.0  
1           1  1100  negctrl_sim_k1  0.0  0.0  
2           1  1100  negctrl_sim_k1  0.0  0.0  
3           1  1100  negctrl_sim_k1  0.0  0.0  
4          11  1100  negctrl_sim_k1  0.0  0.0  


### **Run meK-Means**

In [14]:
transcriptomes = ['./sim_genome_polyA_cum_3_0',
                  './sim_genome_polyA_cum_3_0',
                 './sim_genome_polyA_cum_3_1']

In [76]:
# !rm -r /home/tchari/perturbCME/notebooks/fits/meKruns_0508

In [77]:
#For each loom in looms from ./hvg_objs


#!mkdir /home/tchari/perturbCME/notebooks/fits/meKruns_0306
!mkdir ./fits/meKruns_0508


dir_strings = []
data_strings = []
result_strings = []

#Save method, clustering, mat_in (U,S, etc), hyper (K or res), hvgs, data, ARI, AMI
meK_res = pd.DataFrame()
meths = []
result = []
mats = []
hyper = []
hvgs = []
data = []
ari = []
ami = []

for d in sub_d_strings:
    
    #Get tech param by keyword (datas) in loom paths
    ind = [i in d for i in datas]
    
    #Inference params for sampling
    tech_tup = samp
    
    #Preprocessing params for filepaths
    trans = np.array(transcriptomes)[ind][0]

    data_name = np.array(datas)[ind][0]
    
    
    ds = lp.connect(d)
    g_names = ds.ra[attribute_names[1]]
    num_genes = len(g_names)
    num_cells = len(ds.ca[attribute_names[2]])
    
    U = ds.layers['unspliced'][:,:].T
    S = ds.layers['spliced'][:,:].T
    true_labs = list(ds.ca['subclass_label'])
    ds.close()

    
    print(data_name+' with '+str(num_genes)+' genes')
    
    
    if 'negctrl' in d:
        Ks = [10] 
    else:
        Ks = [len(np.unique(true_labs))]


    for n_run in range(num_runs):
        print(n_run)

        for clus in Ks:
           
            #Run Monod preprocessing to set up files for run, leave room for genes to be removed with low U/S
            dir_string,dataset_string = monod.preprocess.construct_batch([d], \
                                                         trans, \
                                                         [data_name], \
                                                         attribute_names=attribute_names,\
                                                         batch_location='./fits/meKruns_0508', \
                                                         meta=data_name+'_K'+str(clus)+'_n'+str(n_run), \
                                                         batch_id=1, \
                                                         n_genes=num_genes,exp_filter_threshold=None,
                                                                         viz=False,genes_to_fit=g_names)
                                                            #num_genes-60 or 100,genes_to_fit=markers
            dir_strings += [dir_string]
            data_strings += [dataset_string]
    
            #Set model and run meK-Means
            
            #Define bounds for params
            phys_lb = [-3.0, -3, -3 ] 
            phys_ub = [4.2, 2.5, 2.5] 
            samp_lb = tech_tup 
            samp_ub = tech_tup  
            gridsize = [1,1] #Already have tech params
        
    
            epochs = 10
    
            # ---------------- meK-Means Inference ---------------- 
            #Define model with bursty transcription and Poisson molecule capture/sampling
            fitmodel = monod.cme_toolbox.CMEModel('Bursty','Poisson')
    
            #Set up mminference parameters
            inference_parameters = monod.mminference.InferenceParameters(phys_lb,phys_ub,samp_lb,samp_ub,gridsize,\
                        dataset_string[0],fitmodel,k=clus,epochs=epochs,use_lengths = True,
                        gradient_params = {'max_iterations':5,'init_pattern':'moments','num_restarts':1}) #'max_iterations':5,
     
            #Read in loom file with filtered barcodes
            search_data = monod.extract_data.extract_data(d, trans, data_name,
                        dataset_string[0], dir_string, viz=False, dataset_attr_names=attribute_names)
    
            #Run inference(fit_all_grid_points()) and Save result file strings
            full_result_string = inference_parameters.fit_all_grid_points(40,search_data) 
    
            result_strings.append(full_result_string)
            
    
            # ----------------  Save output ---------------- 
            #Read in results and get cluster assignments
            sr = [monod.analysis.load_search_results(i) for i in full_result_string]
            
            
            cat_assigns = np.array([None]*num_cells) #cat_assigns is empty list of length = no. cell barcodes
            for i in range(len(sr)):
                r = sr[i]
                cat_assigns[r.filt] = r.assigns #denotes which cluster (k), cells were assigned to
    
            print('No. clus: ',len(np.unique(cat_assigns)))
            
    
            meths += ['meK-Means']
            result += [cat_assigns]
            mats += ['U,S']
            hyper += [clus]
            hvgs += [num_genes]
            data += [data_name]
            ari += [adjusted_rand_score(true_labs,cat_assigns)]
            ami += [adjusted_mutual_info_score(true_labs,cat_assigns)]
            
            print('ARI: ',adjusted_rand_score(true_labs,cat_assigns))


meK_res['Method'] = meths
meK_res['Clustering'] = result
meK_res['Matrices'] = mats
meK_res['Hyperparam'] = hyper
meK_res['HVGs'] = hvgs
meK_res['Data'] = data
meK_res['ARI'] = ari
meK_res['AMI'] = ami
    

mkdir: cannot create directory ‘/home/tchari/perturbCME/notebooks/fits/meKruns_0508’: File exists
b_beta_sim_k8_0508 with 1100 genes
0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [00:54<00:00,  5.44s/it]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [00:55<00:00,  5.56s/it]


mstep self.weights:  [0.08400601 0.10127548 0.067235   0.16039482 0.09310088 0.0758468
 0.08820123 0.15261623 0.14524506 0.03207848]
Q Function:  -7495628.465515942



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [00:53<00:00,  5.34s/it]


mstep self.weights:  [0.03974661 0.10266688 0.02871869 0.19774811 0.10022851 0.01392622
 0.09215071 0.1613732  0.22683954 0.03660154]
Q Function:  -7442729.3306443915



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9/9 [00:53<00:00,  5.96s/it]


mstep self.weights:  [3.44447536e-02 1.01046705e-01 9.14095968e-04 2.01565665e-01
 1.00401116e-01 1.33781404e-07 9.78600331e-02 1.60544336e-01
 2.64838442e-01 3.83847202e-02]
Q Function:  -7435094.825969257



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 8/8 [00:53<00:00,  6.71s/it]


mstep self.weights:  [2.57677290e-02 1.00389069e-01 2.00000000e-10 2.01896681e-01
 1.00462028e-01 2.00000311e-10 1.05139124e-01 1.60344459e-01
 2.67675002e-01 3.83259066e-02]
Q Function:  -7437654.826600649



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 8/8 [00:50<00:00,  6.28s/it]


mstep self.weights:  [1.13747985e-02 1.00453392e-01 2.00000000e-10 2.03814879e-01
 1.00622286e-01 2.00000000e-10 1.08816299e-01 1.60793409e-01
 2.75738256e-01 3.83866791e-02]
Q Function:  -7438524.071489416



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 8/8 [00:58<00:00,  7.26s/it]


mstep self.weights:  [1.60651160e-03 1.00337459e-01 2.00000000e-10 2.04023336e-01
 1.00651148e-01 2.00000000e-10 1.15910240e-01 1.60649138e-01
 2.78441176e-01 3.83809899e-02]
Q Function:  -7440443.505523298



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:49<00:00,  7.13s/it]


mstep self.weights:  [2.00000000e-10 1.00231563e-01 2.00000000e-10 2.04866559e-01
 1.00599625e-01 2.00000008e-10 1.19801003e-01 1.60664418e-01
 2.75457546e-01 3.83792865e-02]
Q Function:  -7442700.660373992



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:50<00:00,  7.22s/it]


mstep self.weights:  [2.00000000e-10 1.00178546e-01 2.00000000e-10 2.03219546e-01
 1.00395254e-01 2.00000000e-10 1.25069627e-01 1.60525835e-01
 2.72148265e-01 3.84629264e-02]
Q Function:  -7438373.951968523



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:55<00:00,  7.99s/it]


mstep self.weights:  [2.00000000e-10 1.00052923e-01 2.00000000e-10 2.01789785e-01
 1.00370453e-01 2.00000005e-10 1.30067924e-01 1.60573096e-01
 2.68625947e-01 3.85198711e-02]
Q Function:  -7442058.784233332



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:50<00:00,  7.26s/it]


mstep self.weights:  [2.00000000e-10 1.00342818e-01 2.00000000e-10 2.01278394e-01
 1.00394070e-01 2.00000010e-10 1.32383956e-01 1.60464678e-01
 2.67661175e-01 3.74749075e-02]
Q Function:  -7446240.575532218

No. clus:  7
ARI:  0.9373999425593051
1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [00:52<00:00,  5.25s/it]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [00:58<00:00,  5.83s/it]


mstep self.weights:  [0.08400601 0.10127548 0.067235   0.16039482 0.09310088 0.0758468
 0.08820123 0.15261623 0.14524506 0.03207848]
Q Function:  -7495628.465515942



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [00:56<00:00,  5.66s/it]


mstep self.weights:  [0.03974661 0.10266688 0.02871869 0.19774811 0.10022851 0.01392622
 0.09215071 0.1613732  0.22683954 0.03660154]
Q Function:  -7442729.3306443915



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9/9 [00:53<00:00,  5.92s/it]


mstep self.weights:  [3.44447536e-02 1.01046705e-01 9.14095968e-04 2.01565665e-01
 1.00401116e-01 1.33781404e-07 9.78600331e-02 1.60544336e-01
 2.64838442e-01 3.83847202e-02]
Q Function:  -7435094.825969257



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 8/8 [00:55<00:00,  6.96s/it]


mstep self.weights:  [2.57677290e-02 1.00389069e-01 2.00000000e-10 2.01896681e-01
 1.00462028e-01 2.00000311e-10 1.05139124e-01 1.60344459e-01
 2.67675002e-01 3.83259066e-02]
Q Function:  -7437654.826600649



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 8/8 [00:51<00:00,  6.39s/it]


mstep self.weights:  [1.13747985e-02 1.00453392e-01 2.00000000e-10 2.03814879e-01
 1.00622286e-01 2.00000000e-10 1.08816299e-01 1.60793409e-01
 2.75738256e-01 3.83866791e-02]
Q Function:  -7438524.071489416



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 8/8 [00:53<00:00,  6.63s/it]


mstep self.weights:  [1.60651160e-03 1.00337459e-01 2.00000000e-10 2.04023336e-01
 1.00651148e-01 2.00000000e-10 1.15910240e-01 1.60649138e-01
 2.78441176e-01 3.83809899e-02]
Q Function:  -7440443.505523298



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:56<00:00,  8.09s/it]


mstep self.weights:  [2.00000000e-10 1.00231563e-01 2.00000000e-10 2.04866559e-01
 1.00599625e-01 2.00000008e-10 1.19801003e-01 1.60664418e-01
 2.75457546e-01 3.83792865e-02]
Q Function:  -7442700.660373992



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:51<00:00,  7.37s/it]


mstep self.weights:  [2.00000000e-10 1.00178546e-01 2.00000000e-10 2.03219546e-01
 1.00395254e-01 2.00000000e-10 1.25069627e-01 1.60525835e-01
 2.72148265e-01 3.84629264e-02]
Q Function:  -7438373.951968523



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:49<00:00,  7.12s/it]


mstep self.weights:  [2.00000000e-10 1.00052923e-01 2.00000000e-10 2.01789785e-01
 1.00370453e-01 2.00000005e-10 1.30067924e-01 1.60573096e-01
 2.68625947e-01 3.85198711e-02]
Q Function:  -7442058.784233332



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:55<00:00,  7.90s/it]


mstep self.weights:  [2.00000000e-10 1.00342818e-01 2.00000000e-10 2.01278394e-01
 1.00394070e-01 2.00000010e-10 1.32383956e-01 1.60464678e-01
 2.67661175e-01 3.74749075e-02]
Q Function:  -7446240.575532218

No. clus:  7
ARI:  0.9373999425593051
2


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [00:57<00:00,  5.79s/it]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [00:57<00:00,  5.73s/it]


mstep self.weights:  [0.08400601 0.10127548 0.067235   0.16039482 0.09310088 0.0758468
 0.08820123 0.15261623 0.14524506 0.03207848]
Q Function:  -7495628.465515942



100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [00:57<00:00,  5.76s/it]


mstep self.weights:  [0.03974661 0.10266688 0.02871869 0.19774811 0.10022851 0.01392622
 0.09215071 0.1613732  0.22683954 0.03660154]
Q Function:  -7442729.3306443915



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9/9 [00:52<00:00,  5.84s/it]


mstep self.weights:  [3.44447536e-02 1.01046705e-01 9.14095968e-04 2.01565665e-01
 1.00401116e-01 1.33781404e-07 9.78600331e-02 1.60544336e-01
 2.64838442e-01 3.83847202e-02]
Q Function:  -7435094.825969257



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 8/8 [00:55<00:00,  6.90s/it]


mstep self.weights:  [2.57677290e-02 1.00389069e-01 2.00000000e-10 2.01896681e-01
 1.00462028e-01 2.00000311e-10 1.05139124e-01 1.60344459e-01
 2.67675002e-01 3.83259066e-02]
Q Function:  -7437654.826600649



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 8/8 [00:50<00:00,  6.31s/it]


mstep self.weights:  [1.13747985e-02 1.00453392e-01 2.00000000e-10 2.03814879e-01
 1.00622286e-01 2.00000000e-10 1.08816299e-01 1.60793409e-01
 2.75738256e-01 3.83866791e-02]
Q Function:  -7438524.071489416



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 8/8 [00:52<00:00,  6.56s/it]


mstep self.weights:  [1.60651160e-03 1.00337459e-01 2.00000000e-10 2.04023336e-01
 1.00651148e-01 2.00000000e-10 1.15910240e-01 1.60649138e-01
 2.78441176e-01 3.83809899e-02]
Q Function:  -7440443.505523298



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:49<00:00,  7.03s/it]


mstep self.weights:  [2.00000000e-10 1.00231563e-01 2.00000000e-10 2.04866559e-01
 1.00599625e-01 2.00000008e-10 1.19801003e-01 1.60664418e-01
 2.75457546e-01 3.83792865e-02]
Q Function:  -7442700.660373992



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:54<00:00,  7.80s/it]


mstep self.weights:  [2.00000000e-10 1.00178546e-01 2.00000000e-10 2.03219546e-01
 1.00395254e-01 2.00000000e-10 1.25069627e-01 1.60525835e-01
 2.72148265e-01 3.84629264e-02]
Q Function:  -7438373.951968523



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:50<00:00,  7.21s/it]


mstep self.weights:  [2.00000000e-10 1.00052923e-01 2.00000000e-10 2.01789785e-01
 1.00370453e-01 2.00000005e-10 1.30067924e-01 1.60573096e-01
 2.68625947e-01 3.85198711e-02]
Q Function:  -7442058.784233332



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:52<00:00,  7.47s/it]


mstep self.weights:  [2.00000000e-10 1.00342818e-01 2.00000000e-10 2.01278394e-01
 1.00394070e-01 2.00000010e-10 1.32383956e-01 1.60464678e-01
 2.67661175e-01 3.74749075e-02]
Q Function:  -7446240.575532218

No. clus:  7
ARI:  0.9373999425593051
k_gamma_sim_k8_0508 with 700 genes
0


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.02s/it]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:23<00:00,  4.67s/it]


mstep self.weights:  [0.03063632 0.43846722 0.14722274 0.08960667 0.29406705]
Q Function:  -3380168.242166882



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:23<00:00,  4.73s/it]


mstep self.weights:  [0.02920238 0.44117647 0.14726821 0.08823529 0.29411765]
Q Function:  -3366667.6810440025



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.17s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.786433951



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:23<00:00,  4.70s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.785928087



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:23<00:00,  4.69s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:23<00:00,  4.76s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:23<00:00,  4.70s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.12s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:24<00:00,  4.80s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.01s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864

No. clus:  5
ARI:  0.9997582173383175
1


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.12s/it]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.05s/it]


mstep self.weights:  [0.03063632 0.43846722 0.14722274 0.08960667 0.29406705]
Q Function:  -3380168.242166882



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.03s/it]


mstep self.weights:  [0.02920238 0.44117647 0.14726821 0.08823529 0.29411765]
Q Function:  -3366667.6810440025



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.05s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.786433951



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:24<00:00,  4.88s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.785928087



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:23<00:00,  4.72s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.07s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.10s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:24<00:00,  4.82s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.03s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:23<00:00,  4.79s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864

No. clus:  5
ARI:  0.9997582173383175
2


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:24<00:00,  4.85s/it]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.13s/it]


mstep self.weights:  [0.03063632 0.43846722 0.14722274 0.08960667 0.29406705]
Q Function:  -3380168.242166882



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:23<00:00,  4.72s/it]


mstep self.weights:  [0.02920238 0.44117647 0.14726821 0.08823529 0.29411765]
Q Function:  -3366667.6810440025



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.13s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.786433951



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:23<00:00,  4.77s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.785928087



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.15s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:23<00:00,  4.70s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.14s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.02s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.19s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864



100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:25<00:00,  5.16s/it]


mstep self.weights:  [0.0291177  0.44117648 0.14735289 0.08823529 0.29411765]
Q Function:  -3367212.7859280864

No. clus:  5
ARI:  0.9997582173383175


In [27]:
meK_res

Unnamed: 0,Method,Clustering,Matrices,Hyperparam,Genes,Data,ARI,AMI
0,meK-Means,"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...","U,S",10,1100,negctrl_sim_k1,1.0,1.0
1,meK-Means,"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...","U,S",10,1100,negctrl_sim_k1,1.0,1.0
2,meK-Means,"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...","U,S",10,1100,negctrl_sim_k1,1.0,1.0
3,meK-Means,"[8, 2, 2, 5, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, ...","U,S",10,1100,b_beta_sim_k8,0.905348,0.898194
4,meK-Means,"[8, 2, 2, 5, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, ...","U,S",10,1100,b_beta_sim_k8,0.905348,0.898194
5,meK-Means,"[8, 2, 2, 5, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, ...","U,S",10,1100,b_beta_sim_k8,0.905348,0.898194
6,meK-Means,"[3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, ...","U,S",5,700,k_gamma_sim_k8,0.987825,0.972969
7,meK-Means,"[3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, ...","U,S",5,700,k_gamma_sim_k8,0.987825,0.972969
8,meK-Means,"[3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, ...","U,S",5,700,k_gamma_sim_k8,0.987825,0.972969


In [244]:
meK_res

Unnamed: 0,Method,Clustering,Matrices,Hyperparam,Genes,Data,ARI,AMI
0,meK-Means,"[7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, ...","U,S",10,1100,b_beta_sim_k8,0.977105,0.957871
1,meK-Means,"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...","U,S",5,700,k_gamma_sim_k8,0.987584,0.972653


In [28]:
new_assigns = []
for assigns in meK_res.Clustering:
    new = [str(x) for x in assigns]
    new = "|".join(new)
    new_assigns += [new]

meK_res['Clustering'] = new_assigns
meK_res.head()

Unnamed: 0,Method,Clustering,Matrices,Hyperparam,Genes,Data,ARI,AMI
0,meK-Means,0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|...,"U,S",10,1100,negctrl_sim_k1,1.0,1.0
1,meK-Means,0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|...,"U,S",10,1100,negctrl_sim_k1,1.0,1.0
2,meK-Means,0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|...,"U,S",10,1100,negctrl_sim_k1,1.0,1.0
3,meK-Means,8|2|2|5|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|5|...,"U,S",10,1100,b_beta_sim_k8,0.905348,0.898194
4,meK-Means,8|2|2|5|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|2|5|...,"U,S",10,1100,b_beta_sim_k8,0.905348,0.898194


In [29]:
meK_res.to_csv('./fits/meKruns_0508/meK_sim_res.csv',index=None)

In [83]:
# meK_res

In [254]:
# meK_res.to_pickle('./fits/meKruns_0306/meK_sim_results.pkl') #0301
# #unpickled_df = pd.read_pickle("./meK_res.pkl")