# Description

It combines all clustering solutions generated into a single consolidated solution using consensus clustering.

# Environment variables

In [1]:
from IPython.display import display

# set numpy n_jobs to 1, since I'll be using n_jobs later
NUMPY_N_JOBS = 1
display(NUMPY_N_JOBS)

1

In [2]:
%env MKL_NUM_THREADS=$NUMPY_N_JOBS
%env OPEN_BLAS_NUM_THREADS=$NUMPY_N_JOBS
%env NUMEXPR_NUM_THREADS=$NUMPY_N_JOBS
%env OMP_NUM_THREADS=$NUMPY_N_JOBS

env: MKL_NUM_THREADS=1
env: OPEN_BLAS_NUM_THREADS=1
env: NUMEXPR_NUM_THREADS=1
env: OMP_NUM_THREADS=1


# Modules loading

In [3]:
%load_ext autoreload
%autoreload 2

In [4]:
from pathlib import Path

import numpy as np
import pandas as pd

import conf

# Settings

In [5]:
RANDOM_GENERATOR = np.random.default_rng(12345)

## Consensus clustering

In [6]:
CLUSTERING_OPTIONS = {}

CLUSTERING_OPTIONS["K_MIN"] = 2
CLUSTERING_OPTIONS["K_MAX"] = 40

display(CLUSTERING_OPTIONS)

{'K_MIN': 2, 'K_MAX': 40}

In [7]:
# output dir for this notebook
RESULTS_DIR = Path(conf.RESULTS["CLUSTERING_DIR"], "consensus_clustering").resolve()
RESULTS_DIR.mkdir(parents=True, exist_ok=True)

display(RESULTS_DIR)

PosixPath('/home/miltondp/projects/labs/greenelab/phenoplier/base3/results/clustering/consensus_clustering')

# Load ensemble

In [8]:
output_file = Path(RESULTS_DIR, "ensemble.npy").resolve()
display(output_file)

PosixPath('/home/miltondp/projects/labs/greenelab/phenoplier/base3/results/clustering/consensus_clustering/ensemble.npy')

In [9]:
full_ensemble = np.load(output_file)

In [10]:
display(full_ensemble.shape)

(4428, 3749)

# Load ensemble coassociation distance matrix

In [11]:
output_file = Path(RESULTS_DIR, "ensemble_coassoc_matrix.npy").resolve()
display(output_file)

PosixPath('/home/miltondp/projects/labs/greenelab/phenoplier/base3/results/clustering/consensus_clustering/ensemble_coassoc_matrix.npy')

In [12]:
ensemble_coassoc_matrix = np.load(output_file)

In [13]:
display(ensemble_coassoc_matrix.shape)

(3749, 3749)

In [14]:
display(ensemble_coassoc_matrix)

array([[0.        , 0.05615942, 0.05389493, ..., 0.59986413, 0.66171429,
        0.66757246],
       [0.05615942, 0.        , 0.02740036, ..., 0.60122283, 0.65988571,
        0.66530797],
       [0.05389493, 0.02740036, 0.        , ..., 0.59782609, 0.66102857,
        0.66281703],
       ...,
       [0.59986413, 0.60122283, 0.59782609, ..., 0.        , 0.6699339 ,
        0.66531165],
       [0.66171429, 0.65988571, 0.66102857, ..., 0.6699339 , 0.        ,
        0.58650558],
       [0.66757246, 0.66530797, 0.66281703, ..., 0.66531165, 0.58650558,
        0.        ]])

# Consensus clustering

In [15]:
from concurrent.futures import ProcessPoolExecutor, as_completed

from tqdm import tqdm

from clustering.ensembles.utils import (
    run_method_and_compute_agreement,
)
from clustering.ensembles.eac import (
    eac_single_coassoc_matrix,
    eac_complete_coassoc_matrix,
    eac_average_coassoc_matrix,
)
from clustering.ensembles.spectral import scc

Define spectral consensus clustering methods with delta values found in pre-analysis:

In [16]:
def scc_020(coassoc_distance_matrix, k):
    return scc(coassoc_distance_matrix, k, delta=0.20, ensemble_is_coassoc_matrix=True)


def scc_025(coassoc_distance_matrix, k):
    return scc(coassoc_distance_matrix, k, delta=0.25, ensemble_is_coassoc_matrix=True)


def scc_030(coassoc_distance_matrix, k):
    return scc(coassoc_distance_matrix, k, delta=0.30, ensemble_is_coassoc_matrix=True)


def scc_050(coassoc_distance_matrix, k):
    return scc(coassoc_distance_matrix, k, delta=0.50, ensemble_is_coassoc_matrix=True)

In [17]:
all_consensus_methods = set(
    (
        eac_single_coassoc_matrix,
        eac_complete_coassoc_matrix,
        eac_average_coassoc_matrix,
        scc_020,
        scc_025,
        scc_030,
        scc_050,
    )
)
display(all_consensus_methods)

{<function clustering.ensembles.eac.eac_average_coassoc_matrix(coassoc_matrix, k)>,
 <function clustering.ensembles.eac.eac_complete_coassoc_matrix(coassoc_matrix, k)>,
 <function clustering.ensembles.eac.eac_single_coassoc_matrix(coassoc_matrix, k)>,
 <function __main__.scc_020(coassoc_distance_matrix, k)>,
 <function __main__.scc_025(coassoc_distance_matrix, k)>,
 <function __main__.scc_030(coassoc_distance_matrix, k)>,
 <function __main__.scc_050(coassoc_distance_matrix, k)>}

In [18]:
consensus_results = []

with ProcessPoolExecutor(max_workers=conf.GENERAL["N_JOBS"]) as executor:
    tasks = {
        executor.submit(
            run_method_and_compute_agreement,
            m,
            ensemble_coassoc_matrix,
            full_ensemble,
            k,
        ): (m.__name__, k)
        for m in all_consensus_methods
        for k in range(CLUSTERING_OPTIONS["K_MIN"], CLUSTERING_OPTIONS["K_MAX"] + 1)
    }

    for future in tqdm(as_completed(tasks), total=len(tasks), disable=False, ncols=100):
        method_name, k = tasks[future]
        part, performance_values = future.result()

        method_results = {
            "method": method_name,
            "partition": part,
            "k": k,
        }
        method_results.update(performance_values)

        consensus_results.append(method_results)

  0%|                                                                       | 0/273 [00:00<?, ?it/s]

  0%|▏                                                            | 1/273 [00:25<1:53:51, 25.12s/it]

  1%|▍                                                            | 2/273 [00:26<1:21:52, 18.13s/it]

  1%|▋                                                              | 3/273 [00:28<58:40, 13.04s/it]

  1%|▉                                                            | 4/273 [00:51<1:12:44, 16.22s/it]

  2%|█▏                                                             | 5/273 [00:55<56:02, 12.55s/it]

  2%|█▍                                                             | 6/273 [00:57<41:09,  9.25s/it]

  3%|█▌                                                           | 7/273 [01:21<1:00:46, 13.71s/it]

  3%|█▊                                                             | 8/273 [01:25<47:55, 10.85s/it]

  3%|██                                                             | 9/273 [01:28<37:27,  8.51s/it]

  4%|██▎                                                           | 10/273 [01:54<59:39, 13.61s/it]

  4%|██▍                                                           | 11/273 [01:58<47:38, 10.91s/it]

  4%|██▋                                                           | 12/273 [02:02<37:49,  8.70s/it]

  5%|██▉                                                           | 13/273 [02:28<59:53, 13.82s/it]

  5%|███▏                                                          | 14/273 [02:33<48:34, 11.25s/it]

  5%|███▍                                                          | 15/273 [02:39<41:19,  9.61s/it]

  6%|███▌                                                        | 16/273 [03:05<1:02:24, 14.57s/it]

  6%|███▊                                                          | 17/273 [03:10<50:42, 11.88s/it]

  7%|████                                                          | 18/273 [03:19<46:00, 10.82s/it]

  7%|████▏                                                       | 19/273 [03:44<1:03:38, 15.04s/it]

  7%|████▌                                                         | 20/273 [03:51<53:24, 12.67s/it]

  8%|████▊                                                         | 21/273 [04:00<49:34, 11.80s/it]

  8%|████▊                                                       | 22/273 [04:28<1:08:59, 16.49s/it]

  8%|█████▏                                                        | 23/273 [04:33<54:41, 13.13s/it]

  9%|█████▍                                                        | 24/273 [04:43<50:27, 12.16s/it]

  9%|█████▍                                                      | 25/273 [05:11<1:10:12, 16.99s/it]

 10%|█████▉                                                        | 26/273 [05:19<58:07, 14.12s/it]

 10%|██████▏                                                       | 27/273 [05:29<53:02, 12.94s/it]

 10%|██████▏                                                     | 28/273 [05:57<1:11:54, 17.61s/it]

 11%|██████▎                                                     | 29/273 [06:06<1:01:07, 15.03s/it]

 11%|██████▊                                                       | 30/273 [06:18<56:38, 13.99s/it]

 11%|██████▊                                                     | 31/273 [06:47<1:14:49, 18.55s/it]

 12%|███████                                                     | 32/273 [06:56<1:02:08, 15.47s/it]

 12%|███████▍                                                      | 33/273 [07:08<58:47, 14.70s/it]

 12%|███████▍                                                    | 34/273 [07:38<1:16:49, 19.29s/it]

 13%|███████▋                                                    | 35/273 [07:47<1:04:15, 16.20s/it]

 13%|███████▉                                                    | 36/273 [08:01<1:00:47, 15.39s/it]

 14%|████████▏                                                   | 37/273 [08:33<1:20:02, 20.35s/it]

 14%|████████▎                                                   | 38/273 [08:42<1:06:36, 17.00s/it]

 14%|████████▌                                                   | 39/273 [08:55<1:01:19, 15.72s/it]

 15%|█████████                                                     | 40/273 [08:57<44:48, 11.54s/it]

 15%|█████████▎                                                    | 41/273 [09:06<42:33, 11.01s/it]

 15%|█████████▌                                                    | 42/273 [09:20<45:49, 11.90s/it]

 16%|█████████▊                                                    | 43/273 [09:22<34:20,  8.96s/it]

 16%|█████████▉                                                    | 44/273 [09:34<37:41,  9.87s/it]

 16%|██████████▏                                                   | 45/273 [09:49<42:48, 11.26s/it]

 17%|██████████▍                                                   | 46/273 [09:52<32:51,  8.68s/it]

 17%|██████████▋                                                   | 47/273 [10:04<37:07,  9.86s/it]

 18%|██████████▉                                                   | 48/273 [10:19<42:39, 11.38s/it]

 18%|███████████▏                                                  | 49/273 [10:22<33:20,  8.93s/it]

 18%|███████████▎                                                  | 50/273 [10:35<37:44, 10.16s/it]

 19%|███████████▌                                                  | 51/273 [10:51<43:44, 11.82s/it]

 19%|███████████▊                                                  | 52/273 [10:54<34:15,  9.30s/it]

 19%|████████████                                                  | 53/273 [11:09<39:55, 10.89s/it]

 20%|████████████▎                                                 | 54/273 [11:25<45:17, 12.41s/it]

 20%|████████████▍                                                 | 55/273 [11:29<36:03,  9.92s/it]

 21%|████████████▋                                                 | 56/273 [11:44<41:37, 11.51s/it]

 21%|████████████▉                                                 | 57/273 [12:01<46:42, 12.98s/it]

 21%|█████████████▏                                                | 58/273 [12:05<37:08, 10.37s/it]

 22%|█████████████▍                                                | 59/273 [12:20<42:20, 11.87s/it]

 22%|█████████████▋                                                | 60/273 [12:37<47:26, 13.36s/it]

 22%|█████████████▊                                                | 61/273 [12:42<38:17, 10.84s/it]

 23%|██████████████                                                | 62/273 [12:58<43:42, 12.43s/it]

 23%|██████████████▎                                               | 63/273 [13:15<48:24, 13.83s/it]

 23%|██████████████▌                                               | 64/273 [13:21<39:18, 11.29s/it]

 24%|██████████████▊                                               | 65/273 [13:37<44:41, 12.89s/it]

 24%|██████████████▉                                               | 66/273 [13:55<48:59, 14.20s/it]

 25%|███████████████▏                                              | 67/273 [14:01<40:47, 11.88s/it]

 25%|███████████████▍                                              | 68/273 [14:19<46:18, 13.55s/it]

 25%|███████████████▋                                              | 69/273 [14:36<49:58, 14.70s/it]

 26%|███████████████▉                                              | 70/273 [14:43<42:02, 12.42s/it]

 26%|████████████████                                              | 71/273 [15:01<47:20, 14.06s/it]

 26%|████████████████▎                                             | 72/273 [15:19<50:59, 15.22s/it]

 27%|████████████████▌                                             | 73/273 [15:26<42:45, 12.83s/it]

 27%|████████████████▊                                             | 74/273 [15:44<47:59, 14.47s/it]

 27%|█████████████████                                             | 75/273 [16:03<51:41, 15.66s/it]

 28%|█████████████████▎                                            | 76/273 [16:11<43:41, 13.31s/it]

 28%|█████████████████▍                                            | 77/273 [16:30<48:59, 15.00s/it]

 29%|█████████████████▋                                            | 78/273 [16:36<39:52, 12.27s/it]

 29%|█████████████████▉                                            | 79/273 [16:49<40:43, 12.60s/it]

 29%|██████████████████▏                                           | 80/273 [16:55<34:41, 10.78s/it]

 30%|██████████████████▍                                           | 81/273 [17:02<30:16,  9.46s/it]

 30%|██████████████████▌                                           | 82/273 [17:17<36:00, 11.31s/it]

 30%|██████████████████▊                                           | 83/273 [17:24<31:33,  9.96s/it]

 31%|███████████████████                                           | 84/273 [17:30<27:15,  8.65s/it]

 31%|███████████████████▎                                          | 85/273 [17:46<33:58, 10.84s/it]

 32%|███████████████████▌                                          | 86/273 [17:53<30:27,  9.77s/it]

 32%|███████████████████▊                                          | 87/273 [17:59<26:38,  8.59s/it]

 32%|███████████████████▉                                          | 88/273 [18:15<33:37, 10.91s/it]

 33%|████████████████████▏                                         | 89/273 [18:24<31:30, 10.27s/it]

 33%|████████████████████▍                                         | 90/273 [18:29<26:33,  8.71s/it]

 33%|████████████████████▋                                         | 91/273 [18:46<33:41, 11.10s/it]

 34%|████████████████████▉                                         | 92/273 [18:56<32:38, 10.82s/it]

 34%|█████████████████████                                         | 93/273 [19:01<27:33,  9.19s/it]

 34%|█████████████████████▎                                        | 94/273 [19:18<34:27, 11.55s/it]

 35%|█████████████████████▌                                        | 95/273 [19:29<33:12, 11.19s/it]

 35%|█████████████████████▊                                        | 96/273 [19:34<27:26,  9.30s/it]

 36%|██████████████████████                                        | 97/273 [19:52<35:24, 12.07s/it]

 36%|██████████████████████▎                                       | 98/273 [20:04<34:39, 11.89s/it]

 36%|██████████████████████▍                                       | 99/273 [20:08<27:46,  9.58s/it]

 37%|██████████████████████▎                                      | 100/273 [20:27<36:08, 12.53s/it]

 37%|██████████████████████▌                                      | 101/273 [20:39<35:01, 12.22s/it]

 37%|██████████████████████▊                                      | 102/273 [20:43<28:11,  9.89s/it]

 38%|███████████████████████                                      | 103/273 [21:03<36:43, 12.96s/it]

 38%|███████████████████████▏                                     | 104/273 [21:15<35:32, 12.62s/it]

 38%|███████████████████████▍                                     | 105/273 [21:21<29:43, 10.62s/it]

 39%|███████████████████████▋                                     | 106/273 [21:41<37:18, 13.40s/it]

 39%|███████████████████████▉                                     | 107/273 [21:53<35:56, 12.99s/it]

 40%|████████████████████████▏                                    | 108/273 [21:59<30:05, 10.94s/it]

 40%|████████████████████████▎                                    | 109/273 [22:20<38:04, 13.93s/it]

 40%|████████████████████████▌                                    | 110/273 [22:33<37:03, 13.64s/it]

 41%|████████████████████████▊                                    | 111/273 [22:39<30:13, 11.19s/it]

 41%|█████████████████████████                                    | 112/273 [23:01<38:49, 14.47s/it]

 41%|█████████████████████████▏                                   | 113/273 [23:15<38:41, 14.51s/it]

 42%|█████████████████████████▍                                   | 114/273 [23:20<30:47, 11.62s/it]

 42%|█████████████████████████▋                                   | 115/273 [23:43<39:15, 14.91s/it]

 42%|█████████████████████████▉                                   | 116/273 [23:58<38:57, 14.89s/it]

 43%|██████████████████████████▏                                  | 117/273 [24:04<32:31, 12.51s/it]

 43%|██████████████████████████▎                                  | 118/273 [24:07<24:22,  9.44s/it]

 44%|██████████████████████████▌                                  | 119/273 [24:23<29:10, 11.37s/it]

 44%|██████████████████████████▊                                  | 120/273 [24:30<26:02, 10.21s/it]

 44%|███████████████████████████                                  | 121/273 [24:34<21:16,  8.40s/it]

 45%|███████████████████████████▎                                 | 122/273 [24:51<27:13, 10.82s/it]

 45%|███████████████████████████▍                                 | 123/273 [24:59<25:04, 10.03s/it]

 45%|███████████████████████████▋                                 | 124/273 [25:04<20:51,  8.40s/it]

 46%|███████████████████████████▉                                 | 125/273 [25:20<27:00, 10.95s/it]

 46%|████████████████████████████▏                                | 126/273 [25:30<25:45, 10.52s/it]

 47%|████████████████████████████▍                                | 127/273 [25:35<21:25,  8.80s/it]

 47%|████████████████████████████▌                                | 128/273 [25:52<27:34, 11.41s/it]

 47%|████████████████████████████▊                                | 129/273 [26:02<26:11, 10.92s/it]

 48%|█████████████████████████████                                | 130/273 [26:07<21:54,  9.19s/it]

 48%|█████████████████████████████▎                               | 131/273 [26:25<28:02, 11.85s/it]

 48%|█████████████████████████████▍                               | 132/273 [26:36<26:50, 11.42s/it]

 49%|█████████████████████████████▋                               | 133/273 [26:42<23:08,  9.92s/it]

 49%|█████████████████████████████▉                               | 134/273 [27:01<29:05, 12.56s/it]

 49%|██████████████████████████████▏                              | 135/273 [27:12<27:43, 12.05s/it]

 50%|██████████████████████████████▍                              | 136/273 [27:18<23:54, 10.47s/it]

 50%|██████████████████████████████▌                              | 137/273 [27:37<29:31, 13.02s/it]

 51%|██████████████████████████████▊                              | 138/273 [27:49<28:02, 12.46s/it]

 51%|███████████████████████████████                              | 139/273 [27:56<24:38, 11.03s/it]

 51%|███████████████████████████████▎                             | 140/273 [28:15<29:53, 13.48s/it]

 52%|███████████████████████████████▌                             | 141/273 [28:27<28:16, 12.85s/it]

 52%|███████████████████████████████▋                             | 142/273 [28:35<25:06, 11.50s/it]

 52%|███████████████████████████████▉                             | 143/273 [28:55<30:18, 13.99s/it]

 53%|████████████████████████████████▏                            | 144/273 [29:06<28:27, 13.24s/it]

 53%|████████████████████████████████▍                            | 145/273 [29:16<25:53, 12.13s/it]

 53%|████████████████████████████████▌                            | 146/273 [29:38<31:50, 15.04s/it]

 54%|████████████████████████████████▊                            | 147/273 [29:50<29:29, 14.04s/it]

 54%|█████████████████████████████████                            | 148/273 [30:00<26:51, 12.89s/it]

 55%|█████████████████████████████████▎                           | 149/273 [30:23<32:58, 15.96s/it]

 55%|█████████████████████████████████▌                           | 150/273 [30:35<30:22, 14.81s/it]

 55%|█████████████████████████████████▋                           | 151/273 [30:46<27:42, 13.63s/it]

 56%|█████████████████████████████████▉                           | 152/273 [31:09<33:26, 16.58s/it]

 56%|██████████████████████████████████▏                          | 153/273 [31:22<30:41, 15.34s/it]

 56%|██████████████████████████████████▍                          | 154/273 [31:33<27:55, 14.08s/it]

 57%|██████████████████████████████████▋                          | 155/273 [31:58<34:24, 17.49s/it]

 57%|██████████████████████████████████▊                          | 156/273 [32:00<24:44, 12.69s/it]

 58%|███████████████████████████████████                          | 157/273 [32:11<23:51, 12.34s/it]

 58%|███████████████████████████████████▎                         | 158/273 [32:26<25:08, 13.12s/it]

 58%|███████████████████████████████████▌                         | 159/273 [32:29<19:07, 10.06s/it]

 59%|███████████████████████████████████▊                         | 160/273 [32:43<21:01, 11.16s/it]

 59%|███████████████████████████████████▉                         | 161/273 [32:59<23:37, 12.65s/it]

 59%|████████████████████████████████████▏                        | 162/273 [33:04<18:56, 10.24s/it]

 60%|████████████████████████████████████▍                        | 163/273 [33:18<21:01, 11.47s/it]

 60%|████████████████████████████████████▋                        | 164/273 [33:36<24:11, 13.31s/it]

 60%|████████████████████████████████████▊                        | 165/273 [33:41<19:52, 11.04s/it]

 61%|█████████████████████████████████████                        | 166/273 [33:56<21:43, 12.19s/it]

 61%|█████████████████████████████████████▎                       | 167/273 [34:16<25:15, 14.30s/it]

 62%|█████████████████████████████████████▌                       | 168/273 [34:23<21:14, 12.14s/it]

 62%|█████████████████████████████████████▊                       | 169/273 [34:39<23:03, 13.30s/it]

 62%|█████████████████████████████████████▉                       | 170/273 [34:59<26:18, 15.33s/it]

 63%|██████████████████████████████████████▏                      | 171/273 [35:07<22:19, 13.14s/it]

 63%|██████████████████████████████████████▍                      | 172/273 [35:23<23:43, 14.09s/it]

 63%|██████████████████████████████████████▋                      | 173/273 [35:44<27:01, 16.21s/it]

 64%|██████████████████████████████████████▉                      | 174/273 [35:53<23:01, 13.95s/it]

 64%|███████████████████████████████████████                      | 175/273 [36:09<24:01, 14.71s/it]

 64%|███████████████████████████████████████▎                     | 176/273 [36:32<27:42, 17.14s/it]

 65%|███████████████████████████████████████▌                     | 177/273 [36:41<23:28, 14.67s/it]

 65%|███████████████████████████████████████▊                     | 178/273 [36:58<24:24, 15.41s/it]

 66%|███████████████████████████████████████▉                     | 179/273 [37:22<28:06, 17.94s/it]

 66%|████████████████████████████████████████▏                    | 180/273 [37:32<24:03, 15.52s/it]

 66%|████████████████████████████████████████▍                    | 181/273 [37:49<24:29, 15.98s/it]

 67%|████████████████████████████████████████▋                    | 182/273 [38:14<28:11, 18.58s/it]

 67%|████████████████████████████████████████▉                    | 183/273 [38:24<24:16, 16.18s/it]

 67%|█████████████████████████████████████████                    | 184/273 [38:42<24:35, 16.58s/it]

 68%|█████████████████████████████████████████▎                   | 185/273 [39:07<28:09, 19.19s/it]

 68%|█████████████████████████████████████████▌                   | 186/273 [39:18<24:16, 16.74s/it]

 68%|█████████████████████████████████████████▊                   | 187/273 [39:37<24:48, 17.30s/it]

 69%|██████████████████████████████████████████                   | 188/273 [40:03<28:16, 19.96s/it]

 69%|██████████████████████████████████████████▏                  | 189/273 [40:14<24:22, 17.41s/it]

 70%|██████████████████████████████████████████▍                  | 190/273 [40:33<24:50, 17.95s/it]

 70%|██████████████████████████████████████████▋                  | 191/273 [41:01<28:23, 20.77s/it]

 70%|██████████████████████████████████████████▉                  | 192/273 [41:13<24:23, 18.06s/it]

 71%|███████████████████████████████████████████                  | 193/273 [41:32<24:36, 18.46s/it]

 71%|███████████████████████████████████████████▎                 | 194/273 [41:56<26:42, 20.28s/it]

 71%|███████████████████████████████████████████▌                 | 195/273 [42:00<19:56, 15.34s/it]

 72%|███████████████████████████████████████████▊                 | 196/273 [42:13<18:34, 14.47s/it]

 72%|████████████████████████████████████████████                 | 197/273 [42:22<16:25, 12.96s/it]

 73%|████████████████████████████████████████████▏                | 198/273 [42:26<12:56, 10.36s/it]

 73%|████████████████████████████████████████████▍                | 199/273 [42:41<14:20, 11.63s/it]

 73%|████████████████████████████████████████████▋                | 200/273 [42:51<13:30, 11.11s/it]

 74%|████████████████████████████████████████████▉                | 201/273 [42:55<10:57,  9.13s/it]

 74%|█████████████████████████████████████████████▏               | 202/273 [43:09<12:30, 10.57s/it]

 74%|█████████████████████████████████████████████▎               | 203/273 [43:21<12:43, 10.91s/it]

 75%|█████████████████████████████████████████████▌               | 204/273 [43:26<10:28,  9.11s/it]

 75%|█████████████████████████████████████████████▊               | 205/273 [43:39<11:31, 10.17s/it]

 75%|██████████████████████████████████████████████               | 206/273 [43:52<12:21, 11.07s/it]

 76%|██████████████████████████████████████████████▎              | 207/273 [43:57<10:13,  9.30s/it]

 76%|██████████████████████████████████████████████▍              | 208/273 [44:10<11:24, 10.53s/it]

 77%|██████████████████████████████████████████████▋              | 209/273 [44:24<12:11, 11.43s/it]

 77%|██████████████████████████████████████████████▉              | 210/273 [44:29<10:05,  9.62s/it]

 77%|███████████████████████████████████████████████▏             | 211/273 [44:43<11:14, 10.89s/it]

 78%|███████████████████████████████████████████████▎             | 212/273 [44:57<12:01, 11.82s/it]

 78%|███████████████████████████████████████████████▌             | 213/273 [45:03<10:00, 10.01s/it]

 78%|███████████████████████████████████████████████▊             | 214/273 [45:17<11:03, 11.24s/it]

 79%|████████████████████████████████████████████████             | 215/273 [45:32<12:00, 12.42s/it]

 79%|████████████████████████████████████████████████▎            | 216/273 [45:39<10:06, 10.64s/it]

 79%|████████████████████████████████████████████████▍            | 217/273 [45:55<11:22, 12.19s/it]

 80%|████████████████████████████████████████████████▋            | 218/273 [46:10<12:04, 13.17s/it]

 80%|████████████████████████████████████████████████▉            | 219/273 [46:17<10:06, 11.24s/it]

 81%|█████████████████████████████████████████████████▏           | 220/273 [46:32<11:00, 12.47s/it]

 81%|█████████████████████████████████████████████████▍           | 221/273 [46:49<11:54, 13.75s/it]

 81%|█████████████████████████████████████████████████▌           | 222/273 [46:58<10:29, 12.33s/it]

 82%|█████████████████████████████████████████████████▊           | 223/273 [47:14<11:07, 13.34s/it]

 82%|██████████████████████████████████████████████████           | 224/273 [47:31<11:49, 14.48s/it]

 82%|██████████████████████████████████████████████████▎          | 225/273 [47:39<09:59, 12.50s/it]

 83%|██████████████████████████████████████████████████▍          | 226/273 [47:57<11:08, 14.23s/it]

 83%|██████████████████████████████████████████████████▋          | 227/273 [48:15<11:52, 15.48s/it]

 84%|██████████████████████████████████████████████████▉          | 228/273 [48:23<09:59, 13.32s/it]

 84%|███████████████████████████████████████████████████▏         | 229/273 [48:43<11:08, 15.19s/it]

 84%|███████████████████████████████████████████████████▍         | 230/273 [49:03<11:58, 16.72s/it]

 85%|███████████████████████████████████████████████████▌         | 231/273 [49:11<09:42, 13.87s/it]

 85%|███████████████████████████████████████████████████▊         | 232/273 [49:31<10:43, 15.70s/it]

 85%|████████████████████████████████████████████████████         | 233/273 [49:53<11:47, 17.70s/it]

 86%|████████████████████████████████████████████████████▎        | 234/273 [49:53<08:08, 12.54s/it]

 86%|████████████████████████████████████████████████████▌        | 235/273 [50:00<06:44, 10.65s/it]

 86%|████████████████████████████████████████████████████▋        | 236/273 [50:16<07:39, 12.42s/it]

 87%|████████████████████████████████████████████████████▉        | 237/273 [50:18<05:30,  9.19s/it]

 87%|█████████████████████████████████████████████████████▏       | 238/273 [50:25<05:00,  8.58s/it]

 88%|█████████████████████████████████████████████████████▍       | 239/273 [50:42<06:15, 11.04s/it]

 88%|█████████████████████████████████████████████████████▋       | 240/273 [50:44<04:34,  8.32s/it]

 88%|█████████████████████████████████████████████████████▊       | 241/273 [50:51<04:18,  8.08s/it]

 89%|██████████████████████████████████████████████████████       | 242/273 [51:08<05:32, 10.74s/it]

 89%|██████████████████████████████████████████████████████▎      | 243/273 [51:11<04:09,  8.32s/it]

 89%|██████████████████████████████████████████████████████▌      | 244/273 [51:19<03:57,  8.17s/it]

 90%|██████████████████████████████████████████████████████▋      | 245/273 [51:36<05:03, 10.85s/it]

 90%|██████████████████████████████████████████████████████▉      | 246/273 [51:39<03:49,  8.49s/it]

 90%|███████████████████████████████████████████████████████▏     | 247/273 [51:47<03:39,  8.43s/it]

 91%|███████████████████████████████████████████████████████▍     | 248/273 [52:05<04:38, 11.14s/it]

 91%|███████████████████████████████████████████████████████▋     | 249/273 [52:08<03:30,  8.76s/it]

 92%|███████████████████████████████████████████████████████▊     | 250/273 [52:16<03:21,  8.75s/it]

 92%|████████████████████████████████████████████████████████     | 251/273 [52:34<04:12, 11.48s/it]

 92%|████████████████████████████████████████████████████████▎    | 252/273 [52:38<03:09,  9.04s/it]

 93%|████████████████████████████████████████████████████████▌    | 253/273 [52:47<03:02,  9.11s/it]

 93%|████████████████████████████████████████████████████████▊    | 254/273 [53:05<03:45, 11.86s/it]

 93%|████████████████████████████████████████████████████████▉    | 255/273 [53:09<02:48,  9.35s/it]

 94%|█████████████████████████████████████████████████████████▏   | 256/273 [53:18<02:40,  9.44s/it]

 94%|█████████████████████████████████████████████████████████▍   | 257/273 [53:37<03:15, 12.19s/it]

 95%|█████████████████████████████████████████████████████████▋   | 258/273 [53:41<02:25,  9.69s/it]

 95%|█████████████████████████████████████████████████████████▊   | 259/273 [53:51<02:16,  9.76s/it]

 95%|██████████████████████████████████████████████████████████   | 260/273 [54:10<02:42, 12.49s/it]

 96%|██████████████████████████████████████████████████████████▎  | 261/273 [54:14<02:00, 10.00s/it]

 96%|██████████████████████████████████████████████████████████▌  | 262/273 [54:24<01:51, 10.09s/it]

 96%|██████████████████████████████████████████████████████████▊  | 263/273 [54:43<02:08, 12.80s/it]

 97%|██████████████████████████████████████████████████████████▉  | 264/273 [54:48<01:32, 10.31s/it]

 97%|███████████████████████████████████████████████████████████▏ | 265/273 [54:59<01:23, 10.45s/it]

 97%|███████████████████████████████████████████████████████████▍ | 266/273 [55:18<01:32, 13.15s/it]

 98%|███████████████████████████████████████████████████████████▋ | 267/273 [55:23<01:03, 10.61s/it]

 98%|███████████████████████████████████████████████████████████▉ | 268/273 [55:34<00:54, 10.84s/it]

 99%|████████████████████████████████████████████████████████████ | 269/273 [55:54<00:53, 13.47s/it]

 99%|████████████████████████████████████████████████████████████▎| 270/273 [55:59<00:32, 10.95s/it]

 99%|████████████████████████████████████████████████████████████▌| 271/273 [56:11<00:22, 11.24s/it]

100%|████████████████████████████████████████████████████████████▊| 272/273 [56:30<00:13, 13.63s/it]

100%|█████████████████████████████████████████████████████████████| 273/273 [56:35<00:00, 11.00s/it]

100%|█████████████████████████████████████████████████████████████| 273/273 [56:35<00:00, 12.44s/it]




In [19]:
consensus_results = pd.DataFrame(consensus_results)

In [20]:
display(consensus_results.shape)

(273, 12)

In [21]:
consensus_results.head()

Unnamed: 0,method,partition,k,ari_mean,ari_median,ari_std,ami_mean,ami_median,ami_std,nmi_mean,nmi_median,nmi_std
0,scc_030,"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...",2,0.225462,0.010357,0.350445,0.236081,0.054698,0.322846,0.238314,0.056364,0.322127
1,scc_030,"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...",4,0.225381,0.010368,0.350167,0.232825,0.059509,0.30476,0.237129,0.063543,0.303123
2,scc_030,"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...",3,0.161708,0.063624,0.183089,0.230107,0.183277,0.117991,0.234523,0.18713,0.117597
3,scc_030,"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...",5,0.234826,0.013491,0.352296,0.250994,0.074993,0.303274,0.256369,0.079998,0.301111
4,scc_030,"[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ...",6,0.172859,0.061933,0.193501,0.248806,0.193558,0.134298,0.255571,0.200307,0.132916


## Testing

In [22]:
assert not consensus_results.isna().any().any()

In [23]:
# check that the number of clusters in the partitions are the expected ones
_real_k_values = consensus_results["partition"].apply(lambda x: np.unique(x).shape[0])
display(_real_k_values)
assert np.all(consensus_results["k"].values == _real_k_values.values)

0       2
1       4
2       3
3       5
4       6
       ..
268    36
269    37
270    38
271    39
272    40
Name: partition, Length: 273, dtype: int64

## Save

In [24]:
output_file = Path(RESULTS_DIR, "consensus_clustering_runs.pkl").resolve()
display(output_file)

PosixPath('/home/miltondp/projects/labs/greenelab/phenoplier/base3/results/clustering/consensus_clustering/consensus_clustering_runs.pkl')

In [25]:
consensus_results.to_pickle(output_file)