In [1]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import multiprocessing

Import data:

In [2]:
data = pd.read_csv('../tsne_umap_tutorials/data/APOGEEDR17_GAIAEDR3_noflagfilter.csv', delimiter=',')

# data = pd.read_csv('APOGEEDR17_GAIAEDR3_noflagfilter.csv', delimiter=',')

Preprocessing (same step as for VAE...)

In [3]:
# Spatial:
ra = data["RA"]   #APOGEE
dec = data["DEC"]   #APOGEE

# Identification:
apogee_ID = data["# APOGEE_ID_"]   #APOGEE
gaia_ID = data["GAIAEDR3_SOURCE_ID"]  # Gaia

# Kinematic:
parallax = data["GAIAEDR3_PARALLAX"]  # Gaia
pmra = data["GAIAEDR3_PMRA"]  # Gaia
pmra_err = data["GAIAEDR3_PMRA_ERROR"]  # Gaia
pmdec = data["GAIAEDR3_PMDEC"]  # Gaia
pmdec_err = data["GAIAEDR3_PMDEC_ERROR"]  # Gaia
RV = data["VHELIO_AVG"]   #APOGEE
RV_err = data["VERR"]   #APOGEE
#dist = data["dist"]   #APOGEE no dist in this dataset?
#dist_err = data["dist_err"]   #APOGEE
jr = data["jr"]   #APOGEE
jr_err = data["jr_err"]   #APOGEE
jz = data["jz"]   #APOGEE
jz_err = data["jz_err"]   #APOGEE
#jphi = data["jphi"]   #APOGEE no jphi in this dataset?
#jphi_err = data["jphi_err"]    #APOGEE

# # Spectral (useful for filtering):
TEFF_ERR = data["TEFF_ERR"]   #APOGEE
TEFF = data["TEFF"]   #APOGEE
LOGG_ERR = data["LOGG_ERR"]   #APOGEE
LOGG = data["LOGG"]   #APOGEE
SNR = data["SNR"]   #APOGEE
ASPCAPFLAG = data["ASPCAPFLAG"]
STARFLAG = data["STARFLAG"]

# # Chemical abundances from astroNN:
FE_H = data['FE_H'] 
C_FE = data['C_FE']
CI_FE = data['CI_FE']
N_FE = data['N_FE']
O_FE = data['O_FE']
MG_FE = data['MG_FE']
AL_FE = data['AL_FE']
SI_FE = data['SI_FE']
P_FE = data['P_FE']
S_FE = data['S_FE']
K_FE = data['K_FE']
CA_FE = data['CA_FE']
TI_FE = data['TI_FE']
TIII_FE = data['TIII_FE']
V_FE = data['V_FE']
CR_FE = data['CR_FE']
MN_FE = data['MN_FE']
CO_FE = data['CO_FE']
NI_FE = data['NI_FE']

# # Chemical abundance errors from astroNN:
FE_H_err = data["FE_H_ERR"] 
C_FE_err = data['C_FE_ERR']
CI_FE_err = data['CI_FE_ERR']
N_FE_err = data['N_FE_ERR']
O_FE_err = data['O_FE_ERR']
MG_FE_err = data['MG_FE_ERR']
AL_FE_err = data['AL_FE_ERR']
SI_FE_err = data['SI_FE_ERR']
P_FE_err = data['P_FE_ERR']
S_FE_err = data['S_FE_ERR']
K_FE_err = data['K_FE_ERR']
CA_FE_err = data['CA_FE_ERR']
TI_FE_err = data['TI_FE_ERR']
TIII_FE_err = data['TIII_FE_ERR']
V_FE_err = data['V_FE_ERR']
CR_FE_err = data['CR_FE_ERR']
MN_FE_err = data['MN_FE_ERR']
CO_FE_err = data['CO_FE_ERR']
NI_FE_err = data['NI_FE_ERR']

# # Number of stars in the initial sample of APOGEE DR16: 
print("There are {} stars in our initial sample".format(len(ra)))

cols = [ra, dec, apogee_ID, gaia_ID, parallax, pmra, pmra_err, pmdec, pmdec_err, RV, RV_err, #dist, dist_err,
         jr, jr_err,# jphi, jphi_err,
        jz, jz_err, TEFF, TEFF_ERR, LOGG, LOGG_ERR, SNR, ASPCAPFLAG, STARFLAG, FE_H, FE_H_err, C_FE, 
         C_FE_err, CI_FE, CI_FE_err, N_FE, N_FE_err, O_FE, O_FE_err, MG_FE, MG_FE_err, AL_FE, AL_FE_err, SI_FE,
         SI_FE_err, P_FE, P_FE_err, S_FE, S_FE_err, K_FE, K_FE_err, CA_FE, CA_FE_err, TI_FE, TI_FE_err, TIII_FE,
         TIII_FE_err, V_FE, V_FE_err, CR_FE, CR_FE_err, MN_FE, MN_FE_err, CO_FE, CO_FE_err, NI_FE, NI_FE_err]

There are 370060 stars in our initial sample


In [4]:
aspcapflags_filter = np.array(cols[20])==0
starflags_filter = np.array(cols[21])==0

filters = aspcapflags_filter*starflags_filter


filtered_data = []
for c in cols:
    a = np.array(c)[filters]
    filtered_data.append(a)
    
print("There are {} stars in our filtered sample".format(len(filtered_data[0])))

There are 144767 stars in our filtered sample


In [5]:
FE_H_filtered, C_FE_filtered, CI_FE_filtered = filtered_data[22], filtered_data[24], filtered_data[26]
N_FE_filtered, O_FE_filtered, MG_FE_filtered = filtered_data[28], filtered_data[30], filtered_data[32]
AL_FE_filtered, SI_FE_filtered, P_FE_filtered = filtered_data[34], filtered_data[36], filtered_data[38]
S_FE_filtered, K_FE_filtered, CA_FE_filtered = filtered_data[40], filtered_data[42], filtered_data[44]
TI_FE_filtered, TIII_FE_filtered, V_FE_filtered = filtered_data[46], filtered_data[48], filtered_data[50]
CR_FE_filtered, MN_FE_filtered, CO_FE_filtered, NI_FE_filtered = filtered_data[52], filtered_data[54], filtered_data[56], filtered_data[58]
RV_filtered  = filtered_data[9]

In [6]:
FE_H_err, C_FE_err, CI_FE_err = filtered_data[23], filtered_data[25], filtered_data[27]
N_FE_err, O_FE_err, MG_FE_err = filtered_data[29], filtered_data[31], filtered_data[33]
AL_FE_err, SI_FE_err, P_FE_err = filtered_data[35], filtered_data[37], filtered_data[39]
S_FE_err, K_FE_err, CA_FE_err = filtered_data[41], filtered_data[43], filtered_data[45]
TI_FE_err, TIII_FE_err, V_FE_err = filtered_data[47], filtered_data[49], filtered_data[51]
CR_FE_err, MN_FE_err, CO_FE_err, NI_FE_err = filtered_data[53], filtered_data[55], filtered_data[57], filtered_data[59]
RV_err  = filtered_data[10]

In [7]:
train_size = round(0.8 * len(filtered_data[0]))
test_size = round(0.1 * len(filtered_data[0]))
validation_size = round(0.1 * len(filtered_data[0]))

training_labels_raw = np.transpose(np.array([FE_H_filtered[:train_size], C_FE_filtered[:train_size], CI_FE_filtered[:train_size], 
                                        N_FE_filtered[:train_size], O_FE_filtered[:train_size], MG_FE_filtered[:train_size],
                                        AL_FE_filtered[:train_size], SI_FE_filtered[:train_size], P_FE_filtered[:train_size],
                                        S_FE_filtered[:train_size], K_FE_filtered[:train_size], CA_FE_filtered[:train_size],
                                        TI_FE_filtered[:train_size], TIII_FE_filtered[:train_size], V_FE_filtered[:train_size], 
                                        CR_FE_filtered[:train_size], MN_FE_filtered[:train_size], CO_FE_filtered[:train_size], NI_FE_filtered[:train_size]]))

error_training_labels_raw = np.transpose(np.array([FE_H_err[:train_size], C_FE_err[:train_size], CI_FE_err[:train_size], 
                                        N_FE_err[:train_size], O_FE_err[:train_size], MG_FE_err[:train_size],
                                        AL_FE_err[:train_size], SI_FE_err[:train_size], P_FE_err[:train_size],
                                        S_FE_err[:train_size], K_FE_err[:train_size], CA_FE_err[:train_size],
                                        TI_FE_err[:train_size], TIII_FE_err[:train_size], V_FE_err[:train_size], 
                                        CR_FE_err[:train_size], MN_FE_err[:train_size], CO_FE_err[:train_size], NI_FE_err[:train_size]]))


test_labels_raw = np.transpose(np.array([FE_H_filtered[train_size: train_size + test_size], C_FE_filtered[train_size: train_size + test_size], 
                                     CI_FE_filtered[train_size: train_size + test_size], N_FE_filtered[train_size: train_size + test_size],
                                     O_FE_filtered[train_size: train_size + test_size], MG_FE_filtered[train_size: train_size + test_size],
                                        AL_FE_filtered[train_size: train_size + test_size], SI_FE_filtered[train_size: train_size + test_size], 
                                     P_FE_filtered[train_size: train_size + test_size], S_FE_filtered[train_size: train_size + test_size], 
                                     K_FE_filtered[train_size: train_size + test_size], CA_FE_filtered[train_size: train_size + test_size],
                                        TI_FE_filtered[train_size: train_size + test_size], TIII_FE_filtered[train_size: train_size + test_size], 
                                     V_FE_filtered[train_size: train_size + test_size], CR_FE_filtered[train_size: train_size + test_size], 
                                     MN_FE_filtered[train_size: train_size + test_size], CO_FE_filtered[train_size: train_size + test_size], 
                                     NI_FE_filtered[train_size: train_size + test_size]]))
                                     
                                     
error_test_labels_raw = np.transpose(np.array([FE_H_err[train_size: train_size + test_size], C_FE_err[train_size: train_size + test_size], CI_FE_err[train_size: train_size + test_size], 
                                        N_FE_err[train_size: train_size + test_size], O_FE_err[train_size: train_size + test_size], MG_FE_err[train_size: train_size + test_size],
                                        AL_FE_err[train_size: train_size + test_size], SI_FE_err[train_size: train_size + test_size], P_FE_err[train_size: train_size + test_size],
                                        S_FE_err[train_size: train_size + test_size], K_FE_err[train_size: train_size + test_size], CA_FE_err[train_size: train_size + test_size],
                                        TI_FE_err[train_size: train_size + test_size], TIII_FE_err[train_size: train_size + test_size], V_FE_err[train_size: train_size + test_size], 
                                        CR_FE_err[train_size: train_size + test_size], MN_FE_err[train_size: train_size + test_size], CO_FE_err[train_size: train_size + test_size], NI_FE_err[train_size: train_size + test_size]]))


validation_labels_raw = np.transpose(np.array([FE_H_filtered[train_size + test_size: train_size + test_size + validation_size], C_FE_filtered[train_size + test_size: train_size + test_size + validation_size], 
                                     CI_FE_filtered[train_size + test_size: train_size + test_size + validation_size], N_FE_filtered[train_size + test_size: train_size + test_size + validation_size],
                                     O_FE_filtered[train_size + test_size: train_size + test_size + validation_size], MG_FE_filtered[train_size + test_size: train_size + test_size + validation_size],
                                        AL_FE_filtered[train_size + test_size: train_size + test_size + validation_size], SI_FE_filtered[train_size + test_size: train_size + test_size + validation_size], 
                                     P_FE_filtered[train_size + test_size: train_size + test_size + validation_size], S_FE_filtered[train_size + test_size: train_size + test_size + validation_size], 
                                     K_FE_filtered[train_size + test_size: train_size + test_size + validation_size], CA_FE_filtered[train_size + test_size: train_size + test_size + validation_size],
                                        TI_FE_filtered[train_size + test_size: train_size + test_size + validation_size], TIII_FE_filtered[train_size + test_size: train_size + test_size + validation_size], 
                                     V_FE_filtered[train_size + test_size: train_size + test_size + validation_size], CR_FE_filtered[train_size + test_size: train_size + test_size + validation_size], 
                                     MN_FE_filtered[train_size + test_size: train_size + test_size + validation_size], CO_FE_filtered[train_size + test_size: train_size + test_size + validation_size], 
                                     NI_FE_filtered[train_size + test_size: train_size + test_size + validation_size]]))
                                     
                                     
error_validation_labels_raw = np.transpose(np.array([FE_H_err[train_size + test_size: train_size + test_size + validation_size], C_FE_err[train_size + test_size: train_size + test_size + validation_size], CI_FE_err[train_size + test_size: train_size + test_size + validation_size], 
                                        N_FE_err[train_size + test_size: train_size + test_size + validation_size], O_FE_err[train_size + test_size: train_size + test_size + validation_size], MG_FE_err[train_size + test_size: train_size + test_size + validation_size],
                                        AL_FE_err[train_size + test_size: train_size + test_size + validation_size], SI_FE_err[train_size + test_size: train_size + test_size + validation_size], P_FE_err[train_size + test_size: train_size + test_size + validation_size],
                                        S_FE_err[train_size + test_size: train_size + test_size + validation_size], K_FE_err[train_size + test_size: train_size + test_size + validation_size], CA_FE_err[train_size + test_size: train_size + test_size + validation_size],
                                        TI_FE_err[train_size + test_size: train_size + test_size + validation_size], TIII_FE_err[train_size + test_size: train_size + test_size + validation_size], V_FE_err[train_size + test_size: train_size + test_size + validation_size], 
                                        CR_FE_err[train_size + test_size: train_size + test_size + validation_size], MN_FE_err[train_size + test_size: train_size + test_size + validation_size], CO_FE_err[train_size + test_size: train_size + test_size + validation_size], NI_FE_err[train_size + test_size: train_size + test_size + validation_size]]))


In [8]:
full_training_labels_raw = np.c_[training_labels_raw, error_training_labels_raw]
full_test_labels_raw = np.c_[test_labels_raw, error_test_labels_raw]
full_validation_labels_raw = np.c_[validation_labels_raw, error_validation_labels_raw]

In [9]:
full_training_labels_raw.shape, full_test_labels_raw.shape, full_validation_labels_raw.shape

((115814, 38), (14477, 38), (14476, 38))

In [10]:
np.min(full_training_labels_raw.T, axis=1), np.max(full_training_labels_raw.T, axis=1)

(array([-1.951497  , -2.1234312 , -2.119044  , -0.18978369, -0.7124527 ,
        -0.15558027, -0.47890055, -0.15707995, -0.97891414, -0.6047195 ,
        -2.2741165 , -0.40278423, -1.2907453 , -0.6157368 , -1.1658391 ,
        -1.391077  , -0.64225805, -3.6896837 , -0.2965148 ,  0.01358107,
         0.01762647,  0.02378747,  0.01708818,  0.01984493,  0.02071843,
         0.02232191,  0.01871411,  0.05818468,  0.01897749,  0.03516773,
         0.02518716,  0.02486172,  0.02255343,  0.0375476 ,  0.02254345,
         0.02762588,  0.01909786,  0.02221127]),
 array([5.7460123e-01, 8.3517190e-01, 5.6674075e-01, 3.6616602e+00,
        5.5585840e-01, 5.1025960e-01, 4.8934165e-01, 4.5210746e-01,
        7.5247210e+00, 9.0582700e-01, 1.0242985e+00, 2.7282690e-01,
        5.9501344e-01, 8.7636330e-01, 8.6697330e-01, 3.3210137e-01,
        3.5304812e-01, 5.6587050e-01, 2.1270613e-01, 4.5790780e-01,
        1.2761971e+00, 1.6784387e+00, 1.8850280e+01, 5.6260234e-01,
        5.5715760e-01, 6.7058295

In [11]:
err_threshold = 3 # remove errors that are larger than this...
err_mask_train = np.all(np.abs(full_training_labels_raw) < err_threshold, axis=1)
err_mask_test = np.all(np.abs(full_test_labels_raw) < err_threshold, axis=1)
err_mask_validation = np.all(np.abs(full_validation_labels_raw) < err_threshold, axis=1)

Remove unreasonably huge error bars/abundance estimates:

In [12]:
full_training_labels = full_training_labels_raw[err_mask_train]
full_test_labels = full_test_labels_raw[err_mask_test]
full_validation_labels = full_validation_labels_raw[err_mask_validation]

In [13]:
full_training_labels.shape, full_test_labels.shape, full_validation_labels.shape

((114885, 38), (14374, 38), (14326, 38))

In [14]:
np.min(full_training_labels.T, axis=1), np.max(full_training_labels.T, axis=1)

(array([-1.8320073 , -1.2602895 , -2.119044  , -0.18978369, -0.7124527 ,
        -0.1388877 , -0.47890055, -0.13207644, -0.97891414, -0.5242982 ,
        -0.7713039 , -0.40278423, -1.2907453 , -0.6157368 , -1.1658391 ,
        -1.0536897 , -0.64225805, -1.1330373 , -0.2965148 ,  0.01358107,
         0.01762647,  0.02378747,  0.01708818,  0.01984493,  0.02071843,
         0.02232191,  0.01871411,  0.05818468,  0.01897749,  0.03516773,
         0.02518716,  0.02486172,  0.02255343,  0.0375476 ,  0.02254345,
         0.02762588,  0.01909786,  0.02221127]),
 array([0.57460123, 0.81556314, 0.56674075, 1.5901425 , 0.5558584 ,
        0.5102596 , 0.48934165, 0.45210746, 1.0318542 , 0.905827  ,
        1.0242985 , 0.262527  , 0.59501344, 0.8763633 , 0.8669733 ,
        0.27449507, 0.35304812, 0.5658705 , 0.21270613, 0.35667247,
        0.48992783, 1.637775  , 1.0633858 , 0.46304193, 0.43964195,
        0.55135024, 0.46292186, 2.998515  , 0.55373484, 2.87389   ,
        1.0069572 , 0.7626475 , 

In [15]:
from sklearn.preprocessing import StandardScaler

Manual scaler to standardize (equivalent to StandardScaler):

In [16]:
# standardized_pca_array = []
# standardization_means = np.zeros(len(np.array(x_df_transpose)))
# standardization_sigmas = np.zeros(len(np.array(x_df_transpose)))

# for i, param in enumerate(np.array(x_df_transpose)):
#     mean, sigma = np.mean(param), np.std(param)
#     norm = (param - mean)/sigma
#     standardized_pca_array.append(norm)
#     standardization_means[i] = mean
#     standardization_sigmas[i] = sigma

StandardScaler to standardize (same method used for t-SNE/UMAP):

In [17]:
# split abundances and errors into separate datasets
training_labels_abundances = full_training_labels[:, :19]
training_labels_errors = full_training_labels[:, 19:]

# split abundances and errors into separate datasets
test_labels_abundances = full_test_labels[:, :19]
test_labels_errors = full_test_labels[:, 19:]

# split abundances and errors into separate datasets
validation_labels_abundances = full_validation_labels[:, :19]
validation_labels_errors = full_validation_labels[:, 19:]

standardized_abundance_training_arr = StandardScaler().fit_transform(training_labels_abundances)
standardized_abundance_test_arr = StandardScaler().fit_transform(test_labels_abundances)
standardized_abundance_validation_arr = StandardScaler().fit_transform(validation_labels_abundances)

Begin UMAP:

# UMAP:

In [None]:
import umap.umap_ as umap

# n neighbors, minimum distances and mses
# 4 major hyperparameters are neighbors, components, metric, min_dist
n_neighbors_ls = [2, 3, 5, 10, 20, 50, 100, 200, 500, 1000]
min_dists = [0.0, 0.02, 0.05, 0.1, 0.2, 0.5, 0.8, 0.99]
training_mses = np.zeros((len(n_neighbors_ls), len(min_dists)))
test_mses = np.zeros((len(n_neighbors_ls), len(min_dists)))

# sweep
for i, n_neighbors in enumerate(n_neighbors_ls):
    for j, min_dist in enumerate(min_dists):
        print(n_neighbors, min_dist)
        # fit using *training* data
        # all default except neighbors/distances, unique=True and pca embedding since spectral seems to fail for some of them...
        reducer = umap.UMAP(n_neighbors=n_neighbors, n_components=2, metric='euclidean', 
                            n_epochs=1000, learning_rate=1.0, init='pca', min_dist=min_dist, 
                            verbose=True, n_jobs=multiprocessing.cpu_count() - 1, unique=True)  
        fit_umap = reducer.fit(standardized_abundance_training_arr)
        # embed *train* and *test* data
        embed_train = fit_umap.transform(standardized_abundance_training_arr)
        embed_test = fit_umap.transform(standardized_abundance_test_arr)
        # reconstruct *train* and *test* data and record MSE
        reconstruction_training = fit_umap.inverse_transform(embed_train)
        reconstruction_test = fit_umap.inverse_transform(embed_test)
        # record
        training_mses[i, j] = np.mean((standardized_abundance_training_arr - reconstruction_training) ** 2) * 1000  # MSE multiplied by 1000 to match the VAE ones
        test_mses[i, j] = np.mean((standardized_abundance_test_arr - reconstruction_test) ** 2) * 1000  # MSE multiplied by 1000 to match the VAE ones

  from .autonotebook import tqdm as notebook_tqdm
2025-04-26 11:20:08.853458: I tensorflow/core/util/port.cc:153] oneDNN custom operations are on. You may see slightly different numerical results due to floating-point round-off errors from different computation orders. To turn them off, set the environment variable `TF_ENABLE_ONEDNN_OPTS=0`.
2025-04-26 11:20:08.854827: I external/local_xla/xla/tsl/cuda/cudart_stub.cc:32] Could not find cuda drivers on your machine, GPU will not be used.
2025-04-26 11:20:08.859932: I external/local_xla/xla/tsl/cuda/cudart_stub.cc:32] Could not find cuda drivers on your machine, GPU will not be used.
2025-04-26 11:20:08.876251: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:477] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
E0000 00:00:1745680808.903603  156945 cuda_dnn.cc:8310] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has

2 0.0
UMAP(init='pca', min_dist=0.0, n_epochs=1000, n_jobs=95, n_neighbors=2, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 11:20:12 2025 Construct fuzzy simplicial set
Sat Apr 26 11:20:12 2025 Finding Nearest Neighbors
Sat Apr 26 11:20:12 2025 Building RP forest with 22 trees
Sat Apr 26 11:20:19 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	Stopping threshold met -- exiting after 2 iterations
Sat Apr 26 11:20:30 2025 Finished Nearest Neighbor Search
Sat Apr 26 11:20:33 2025 Construct embedding


Epochs completed:   2%| ██▊                                                                                                                                                                       17/1000 [00:01]

	completed  0  /  1000 epochs


Epochs completed:  13%| █████████████████████▊                                                                                                                                                   130/1000 [00:02]

	completed  100  /  1000 epochs


Epochs completed:  23%| ██████████████████████████████████████▏                                                                                                                                  227/1000 [00:03]

	completed  200  /  1000 epochs


Epochs completed:  32%| ██████████████████████████████████████████████████████▍                                                                                                                  324/1000 [00:03]

	completed  300  /  1000 epochs


Epochs completed:  42%| ██████████████████████████████████████████████████████████████████████▉                                                                                                  422/1000 [00:04]

	completed  400  /  1000 epochs


Epochs completed:  52%| ████████████████████████████████████████████████████████████████████████████████████████                                                                                 524/1000 [00:04]

	completed  500  /  1000 epochs


Epochs completed:  62%| ████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                622/1000 [00:05]

	completed  600  /  1000 epochs


Epochs completed:  72%| ████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                718/1000 [00:06]

	completed  700  /  1000 epochs


Epochs completed:  82%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                816/1000 [00:06]

	completed  800  /  1000 epochs


Epochs completed:  93%| ████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉            934/1000 [00:07]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:07]


Sat Apr 26 11:20:41 2025 Finished embedding
Sat Apr 26 11:20:45 2025 Worst tree score: 0.14639857
Sat Apr 26 11:20:45 2025 Mean tree score: 0.14835507
Sat Apr 26 11:20:45 2025 Best tree score: 0.15026331
Sat Apr 26 11:20:48 2025 Forward diversification reduced edges from 229770 to 229770
Sat Apr 26 11:20:50 2025 Reverse diversification reduced edges from 229770 to 229770
Sat Apr 26 11:20:52 2025 Degree pruning reduced edges from 196124 to 192721
Sat Apr 26 11:20:52 2025 Resorting data and graph based on tree order
Sat Apr 26 11:20:52 2025 Building and compiling search function


Epochs completed:  67%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                        223/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs
	completed  198  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [18:06]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [02:13]


2 0.02
UMAP(init='pca', min_dist=0.02, n_epochs=1000, n_jobs=95, n_neighbors=2, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 11:49:08 2025 Construct fuzzy simplicial set
Sat Apr 26 11:49:08 2025 Finding Nearest Neighbors
Sat Apr 26 11:49:08 2025 Building RP forest with 22 trees
Sat Apr 26 11:49:08 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	Stopping threshold met -- exiting after 2 iterations
Sat Apr 26 11:49:10 2025 Finished Nearest Neighbor Search
Sat Apr 26 11:49:10 2025 Construct embedding


Epochs completed:   0%|                                                                                                                                                                            0/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  13%| █████████████████████▎                                                                                                                                                   127/1000 [00:00]

	completed  100  /  1000 epochs


Epochs completed:  22%| █████████████████████████████████████▍                                                                                                                                   223/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  32%| █████████████████████████████████████████████████████▌                                                                                                                   319/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  44%| █████████████████████████████████████████████████████████████████████████▍                                                                                               437/1000 [00:02]

	completed  400  /  1000 epochs


Epochs completed:  52%| ███████████████████████████████████████████████████████████████████████████████████████▊                                                                                 523/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  62%| ████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                620/1000 [00:03]

	completed  600  /  1000 epochs


Epochs completed:  73%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                              732/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  83%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                              828/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  92%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍             925/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 11:49:16 2025 Finished embedding
Sat Apr 26 11:49:19 2025 Worst tree score: 0.14510162
Sat Apr 26 11:49:19 2025 Mean tree score: 0.14824390
Sat Apr 26 11:49:19 2025 Best tree score: 0.15081168
Sat Apr 26 11:49:20 2025 Forward diversification reduced edges from 229770 to 229770
Sat Apr 26 11:49:20 2025 Reverse diversification reduced edges from 229770 to 229770
Sat Apr 26 11:49:20 2025 Degree pruning reduced edges from 196108 to 192716
Sat Apr 26 11:49:20 2025 Resorting data and graph based on tree order
Sat Apr 26 11:49:20 2025 Building and compiling search function


Epochs completed:  61%| ███████████████████████████████████████████████████████████████████████████████████████████████████████                                                                   203/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs
	completed  198  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [17:16]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [02:09]


2 0.05
UMAP(init='pca', min_dist=0.05, n_epochs=1000, n_jobs=95, n_neighbors=2, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 12:16:53 2025 Construct fuzzy simplicial set
Sat Apr 26 12:16:53 2025 Finding Nearest Neighbors
Sat Apr 26 12:16:53 2025 Building RP forest with 22 trees
Sat Apr 26 12:16:53 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	Stopping threshold met -- exiting after 2 iterations
Sat Apr 26 12:16:55 2025 Finished Nearest Neighbor Search
Sat Apr 26 12:16:55 2025 Construct embedding


Epochs completed:   0%|                                                                                                                                                                            0/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  12%| ████████████████████▋                                                                                                                                                    123/1000 [00:00]

	completed  100  /  1000 epochs


Epochs completed:  22%| ████████████████████████████████████▉                                                                                                                                    220/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  32%| █████████████████████████████████████████████████████▎                                                                                                                   317/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  42%| ██████████████████████████████████████████████████████████████████████▋                                                                                                  421/1000 [00:02]

	completed  400  /  1000 epochs


Epochs completed:  52%| ██████████████████████████████████████████████████████████████████████████████████████▊                                                                                  517/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  63%| █████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                               629/1000 [00:04]

	completed  600  /  1000 epochs


Epochs completed:  73%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                               726/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  82%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                               822/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  92%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍             925/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 12:17:01 2025 Finished embedding
Sat Apr 26 12:17:04 2025 Worst tree score: 0.14534535
Sat Apr 26 12:17:04 2025 Mean tree score: 0.14802747
Sat Apr 26 12:17:04 2025 Best tree score: 0.15056796
Sat Apr 26 12:17:05 2025 Forward diversification reduced edges from 229770 to 229770
Sat Apr 26 12:17:05 2025 Reverse diversification reduced edges from 229770 to 229770
Sat Apr 26 12:17:05 2025 Degree pruning reduced edges from 196080 to 192639
Sat Apr 26 12:17:05 2025 Resorting data and graph based on tree order
Sat Apr 26 12:17:05 2025 Building and compiling search function


Epochs completed:  30%| ███████████████████████████████████████████████████▎                                                                                                                      101/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs
	completed  198  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [17:31]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [02:09]


2 0.1
UMAP(init='pca', n_epochs=1000, n_jobs=95, n_neighbors=2, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 12:43:48 2025 Construct fuzzy simplicial set
Sat Apr 26 12:43:48 2025 Finding Nearest Neighbors
Sat Apr 26 12:43:48 2025 Building RP forest with 22 trees
Sat Apr 26 12:43:48 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	Stopping threshold met -- exiting after 2 iterations
Sat Apr 26 12:43:49 2025 Finished Nearest Neighbor Search
Sat Apr 26 12:43:50 2025 Construct embedding


Epochs completed:   0%|                                                                                                                                                                            0/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  13%| █████████████████████▎                                                                                                                                                   127/1000 [00:00]

	completed  100  /  1000 epochs


Epochs completed:  22%| █████████████████████████████████████▍                                                                                                                                   223/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  33%| ██████████████████████████████████████████████████████▊                                                                                                                  326/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  42%| ███████████████████████████████████████████████████████████████████████                                                                                                  423/1000 [00:02]

	completed  400  /  1000 epochs


Epochs completed:  52%| ███████████████████████████████████████████████████████████████████████████████████████▎                                                                                 520/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  63%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                              632/1000 [00:04]

	completed  600  /  1000 epochs


Epochs completed:  73%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                              728/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  83%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                             831/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  93%| ████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████             929/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 12:43:56 2025 Finished embedding
Sat Apr 26 12:43:59 2025 Worst tree score: 0.14529312
Sat Apr 26 12:43:59 2025 Mean tree score: 0.14827080
Sat Apr 26 12:43:59 2025 Best tree score: 0.14988902
Sat Apr 26 12:44:00 2025 Forward diversification reduced edges from 229770 to 229770
Sat Apr 26 12:44:00 2025 Reverse diversification reduced edges from 229770 to 229770
Sat Apr 26 12:44:00 2025 Degree pruning reduced edges from 196184 to 192719
Sat Apr 26 12:44:00 2025 Resorting data and graph based on tree order
Sat Apr 26 12:44:00 2025 Building and compiling search function


Epochs completed:  68%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      227/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs
	completed  198  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [17:56]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [02:14]


2 0.2
UMAP(init='pca', min_dist=0.2, n_epochs=1000, n_jobs=95, n_neighbors=2, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 13:10:36 2025 Construct fuzzy simplicial set
Sat Apr 26 13:10:36 2025 Finding Nearest Neighbors
Sat Apr 26 13:10:36 2025 Building RP forest with 22 trees
Sat Apr 26 13:10:36 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	Stopping threshold met -- exiting after 2 iterations
Sat Apr 26 13:10:38 2025 Finished Nearest Neighbor Search
Sat Apr 26 13:10:38 2025 Construct embedding


Epochs completed:   2%| ██▋                                                                                                                                                                       16/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  13%| █████████████████████▌                                                                                                                                                   128/1000 [00:00]

	completed  100  /  1000 epochs


Epochs completed:  22%| █████████████████████████████████████▋                                                                                                                                   224/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  32%| ██████████████████████████████████████████████████████▎                                                                                                                  323/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  42%| ██████████████████████████████████████████████████████████████████████▍                                                                                                  419/1000 [00:02]

	completed  400  /  1000 epochs


Epochs completed:  53%| █████████████████████████████████████████████████████████████████████████████████████████▍                                                                               532/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  63%| █████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               628/1000 [00:04]

	completed  600  /  1000 epochs


Epochs completed:  73%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                              727/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  83%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                             829/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  93%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌             926/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 13:10:45 2025 Finished embedding
Sat Apr 26 13:10:48 2025 Worst tree score: 0.14683379
Sat Apr 26 13:10:48 2025 Mean tree score: 0.14886151
Sat Apr 26 13:10:48 2025 Best tree score: 0.15115115
Sat Apr 26 13:10:48 2025 Forward diversification reduced edges from 229770 to 229770
Sat Apr 26 13:10:48 2025 Reverse diversification reduced edges from 229770 to 229770
Sat Apr 26 13:10:48 2025 Degree pruning reduced edges from 196102 to 192678
Sat Apr 26 13:10:48 2025 Resorting data and graph based on tree order
Sat Apr 26 13:10:48 2025 Building and compiling search function


Epochs completed:  64%| ████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                              213/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs
	completed  198  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [18:00]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [02:14]


2 0.5
UMAP(init='pca', min_dist=0.5, n_epochs=1000, n_jobs=95, n_neighbors=2, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 13:37:26 2025 Construct fuzzy simplicial set
Sat Apr 26 13:37:26 2025 Finding Nearest Neighbors
Sat Apr 26 13:37:26 2025 Building RP forest with 22 trees
Sat Apr 26 13:37:27 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	Stopping threshold met -- exiting after 2 iterations
Sat Apr 26 13:37:28 2025 Finished Nearest Neighbor Search
Sat Apr 26 13:37:28 2025 Construct embedding


Epochs completed:   2%| ██▌                                                                                                                                                                       15/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  13%| █████████████████████▎                                                                                                                                                   127/1000 [00:00]

	completed  100  /  1000 epochs


Epochs completed:  22%| █████████████████████████████████████▍                                                                                                                                   223/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  34%| █████████████████████████████████████████████████████████▎                                                                                                               341/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  42%| ██████████████████████████████████████████████████████████████████████▍                                                                                                  419/1000 [00:02]

	completed  400  /  1000 epochs


Epochs completed:  52%| ███████████████████████████████████████████████████████████████████████████████████████                                                                                  518/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  63%| █████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                               630/1000 [00:03]

	completed  600  /  1000 epochs


Epochs completed:  73%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                              727/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  83%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                              828/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  93%| ████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍            931/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 13:37:35 2025 Finished embedding
Sat Apr 26 13:37:38 2025 Worst tree score: 0.14575445
Sat Apr 26 13:37:38 2025 Mean tree score: 0.14837367
Sat Apr 26 13:37:38 2025 Best tree score: 0.15041128
Sat Apr 26 13:37:38 2025 Forward diversification reduced edges from 229770 to 229770
Sat Apr 26 13:37:38 2025 Reverse diversification reduced edges from 229770 to 229770
Sat Apr 26 13:37:38 2025 Degree pruning reduced edges from 196090 to 192654
Sat Apr 26 13:37:38 2025 Resorting data and graph based on tree order
Sat Apr 26 13:37:38 2025 Building and compiling search function


Epochs completed:  32%| ██████████████████████████████████████████████████████▊                                                                                                                   108/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs
	completed  198  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [18:29]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [02:19]


2 0.8
UMAP(init='pca', min_dist=0.8, n_epochs=1000, n_jobs=95, n_neighbors=2, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 14:04:47 2025 Construct fuzzy simplicial set
Sat Apr 26 14:04:47 2025 Finding Nearest Neighbors
Sat Apr 26 14:04:47 2025 Building RP forest with 22 trees
Sat Apr 26 14:04:47 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	Stopping threshold met -- exiting after 2 iterations
Sat Apr 26 14:04:48 2025 Finished Nearest Neighbor Search
Sat Apr 26 14:04:49 2025 Construct embedding


Epochs completed:   1%| ██▎                                                                                                                                                                       14/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  12%| █████████████████████                                                                                                                                                    125/1000 [00:00]

	completed  100  /  1000 epochs


Epochs completed:  22%| █████████████████████████████████████▋                                                                                                                                   224/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  32%| ██████████████████████████████████████████████████████▌                                                                                                                  325/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  42%| ██████████████████████████████████████████████████████████████████████▋                                                                                                  421/1000 [00:02]

	completed  400  /  1000 epochs


Epochs completed:  52%| ██████████████████████████████████████████████████████████████████████████████████████▊                                                                                  517/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  63%| █████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                               630/1000 [00:04]

	completed  600  /  1000 epochs


Epochs completed:  73%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                             734/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  82%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                               820/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  93%| ████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌            932/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 14:04:55 2025 Finished embedding
Sat Apr 26 14:04:58 2025 Worst tree score: 0.14551943
Sat Apr 26 14:04:58 2025 Mean tree score: 0.14807574
Sat Apr 26 14:04:58 2025 Best tree score: 0.15017626
Sat Apr 26 14:04:59 2025 Forward diversification reduced edges from 229770 to 229770
Sat Apr 26 14:04:59 2025 Reverse diversification reduced edges from 229770 to 229770
Sat Apr 26 14:04:59 2025 Degree pruning reduced edges from 196122 to 192771
Sat Apr 26 14:04:59 2025 Resorting data and graph based on tree order
Sat Apr 26 14:04:59 2025 Building and compiling search function


Epochs completed:  66%| ████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                         221/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs
	completed  198  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [18:22]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [02:19]


2 0.99
UMAP(init='pca', min_dist=0.99, n_epochs=1000, n_jobs=95, n_neighbors=2, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 14:31:58 2025 Construct fuzzy simplicial set
Sat Apr 26 14:31:58 2025 Finding Nearest Neighbors
Sat Apr 26 14:31:58 2025 Building RP forest with 22 trees
Sat Apr 26 14:31:59 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	Stopping threshold met -- exiting after 2 iterations
Sat Apr 26 14:32:00 2025 Finished Nearest Neighbor Search
Sat Apr 26 14:32:00 2025 Construct embedding


Epochs completed:   2%| ██▋                                                                                                                                                                       16/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  12%| ████████████████████▎                                                                                                                                                    121/1000 [00:00]

	completed  100  /  1000 epochs


Epochs completed:  22%| ████████████████████████████████████▌                                                                                                                                    218/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  33%| ███████████████████████████████████████████████████████▍                                                                                                                 330/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  43%| ███████████████████████████████████████████████████████████████████████▌                                                                                                 426/1000 [00:02]

	completed  400  /  1000 epochs


Epochs completed:  52%| ███████████████████████████████████████████████████████████████████████████████████████▊                                                                                 523/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  63%| █████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                               630/1000 [00:03]

	completed  600  /  1000 epochs


Epochs completed:  73%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                               726/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  82%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                               822/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  92%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏              918/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 14:32:07 2025 Finished embedding
Sat Apr 26 14:32:10 2025 Worst tree score: 0.14515385
Sat Apr 26 14:32:10 2025 Mean tree score: 0.14835982
Sat Apr 26 14:32:10 2025 Best tree score: 0.14987161
Sat Apr 26 14:32:10 2025 Forward diversification reduced edges from 229770 to 229770
Sat Apr 26 14:32:10 2025 Reverse diversification reduced edges from 229770 to 229770
Sat Apr 26 14:32:10 2025 Degree pruning reduced edges from 196046 to 192600
Sat Apr 26 14:32:10 2025 Resorting data and graph based on tree order
Sat Apr 26 14:32:10 2025 Building and compiling search function


Epochs completed:  65%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                             215/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs
	completed  198  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [16:50]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [01:47]


3 0.0
UMAP(init='pca', min_dist=0.0, n_epochs=1000, n_jobs=95, n_neighbors=3, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 14:56:39 2025 Construct fuzzy simplicial set
Sat Apr 26 14:56:39 2025 Finding Nearest Neighbors
Sat Apr 26 14:56:39 2025 Building RP forest with 22 trees
Sat Apr 26 14:56:40 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	 3  /  17
	Stopping threshold met -- exiting after 3 iterations
Sat Apr 26 14:56:42 2025 Finished Nearest Neighbor Search
Sat Apr 26 14:56:42 2025 Construct embedding


Epochs completed:   0%|                                                                                                                                                                            0/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  12%| ████████████████████▎                                                                                                                                                    121/1000 [00:00]

	completed  100  /  1000 epochs


Epochs completed:  23%| ██████████████████████████████████████▉                                                                                                                                  232/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  32%| █████████████████████████████████████████████████████▉                                                                                                                   321/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  43%| ████████████████████████████████████████████████████████████████████████▋                                                                                                433/1000 [00:02]

	completed  400  /  1000 epochs


Epochs completed:  52%| ███████████████████████████████████████████████████████████████████████████████████████▎                                                                                 520/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  63%| █████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                               627/1000 [00:04]

	completed  600  /  1000 epochs


Epochs completed:  72%| ████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                719/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  83%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                              826/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  92%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌              920/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 14:56:48 2025 Finished embedding
Sat Apr 26 14:56:51 2025 Worst tree score: 0.23414719
Sat Apr 26 14:56:51 2025 Mean tree score: 0.23763803
Sat Apr 26 14:56:51 2025 Best tree score: 0.24141533
Sat Apr 26 14:56:52 2025 Forward diversification reduced edges from 344655 to 306733
Sat Apr 26 14:56:52 2025 Reverse diversification reduced edges from 306733 to 306733
Sat Apr 26 14:56:52 2025 Degree pruning reduced edges from 306918 to 297999
Sat Apr 26 14:56:52 2025 Resorting data and graph based on tree order
Sat Apr 26 14:56:52 2025 Building and compiling search function


Epochs completed:  53%| ████████████████████████████████████████████████████████████████████████████████████████▊                                                                                 175/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  198  /  333 epochs
	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [14:32]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [01:45]


3 0.02
UMAP(init='pca', min_dist=0.02, n_epochs=1000, n_jobs=95, n_neighbors=3, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 15:18:01 2025 Construct fuzzy simplicial set
Sat Apr 26 15:18:01 2025 Finding Nearest Neighbors
Sat Apr 26 15:18:01 2025 Building RP forest with 22 trees
Sat Apr 26 15:18:01 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	 3  /  17
	Stopping threshold met -- exiting after 3 iterations
Sat Apr 26 15:18:03 2025 Finished Nearest Neighbor Search
Sat Apr 26 15:18:03 2025 Construct embedding


Epochs completed:   0%|                                                                                                                                                                            0/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  12%| █████████████████████                                                                                                                                                    125/1000 [00:00]

	completed  100  /  1000 epochs


Epochs completed:  22%| ████████████████████████████████████▎                                                                                                                                    216/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  32%| █████████████████████████████████████████████████████▌                                                                                                                   319/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  43%| ████████████████████████████████████████████████████████████████████████▌                                                                                                432/1000 [00:02]

	completed  400  /  1000 epochs


Epochs completed:  52%| ███████████████████████████████████████████████████████████████████████████████████████                                                                                  518/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  63%| █████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                               627/1000 [00:03]

	completed  600  /  1000 epochs


Epochs completed:  72%| ████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                720/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  81%| ████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                812/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  92%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉              922/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 15:18:10 2025 Finished embedding
Sat Apr 26 15:18:12 2025 Worst tree score: 0.23412978
Sat Apr 26 15:18:12 2025 Mean tree score: 0.23742122
Sat Apr 26 15:18:12 2025 Best tree score: 0.24010967
Sat Apr 26 15:18:13 2025 Forward diversification reduced edges from 344655 to 306837
Sat Apr 26 15:18:13 2025 Reverse diversification reduced edges from 306837 to 306837
Sat Apr 26 15:18:13 2025 Degree pruning reduced edges from 306878 to 297982
Sat Apr 26 15:18:13 2025 Resorting data and graph based on tree order
Sat Apr 26 15:18:13 2025 Building and compiling search function


Epochs completed:  55%| ████████████████████████████████████████████████████████████████████████████████████████████▎                                                                             182/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  198  /  333 epochs
	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [14:41]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [01:45]


3 0.05
UMAP(init='pca', min_dist=0.05, n_epochs=1000, n_jobs=95, n_neighbors=3, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 15:39:32 2025 Construct fuzzy simplicial set
Sat Apr 26 15:39:32 2025 Finding Nearest Neighbors
Sat Apr 26 15:39:32 2025 Building RP forest with 22 trees
Sat Apr 26 15:39:32 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	 3  /  17
	Stopping threshold met -- exiting after 3 iterations
Sat Apr 26 15:39:34 2025 Finished Nearest Neighbor Search
Sat Apr 26 15:39:34 2025 Construct embedding


Epochs completed:   0%|                                                                                                                                                                            0/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  12%| ███████████████████▉                                                                                                                                                     119/1000 [00:00]

	completed  100  /  1000 epochs


Epochs completed:  22%| █████████████████████████████████████▎                                                                                                                                   222/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  32%| ██████████████████████████████████████████████████████▌                                                                                                                  325/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  43%| ████████████████████████████████████████████████████████████████████████▌                                                                                                432/1000 [00:03]

	completed  400  /  1000 epochs


Epochs completed:  53%| ████████████████████████████████████████████████████████████████████████████████████████▌                                                                                527/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  62%| ████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                620/1000 [00:04]

	completed  600  /  1000 epochs


Epochs completed:  73%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                              731/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  83%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                              826/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  94%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍           937/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 15:39:41 2025 Finished embedding
Sat Apr 26 15:39:43 2025 Worst tree score: 0.23593158
Sat Apr 26 15:39:43 2025 Mean tree score: 0.23786909
Sat Apr 26 15:39:43 2025 Best tree score: 0.23954389
Sat Apr 26 15:39:44 2025 Forward diversification reduced edges from 344655 to 306751
Sat Apr 26 15:39:44 2025 Reverse diversification reduced edges from 306751 to 306751
Sat Apr 26 15:39:44 2025 Degree pruning reduced edges from 306854 to 297971
Sat Apr 26 15:39:44 2025 Resorting data and graph based on tree order
Sat Apr 26 15:39:44 2025 Building and compiling search function


Epochs completed:  26%| ████████████████████████████████████████████▍                                                                                                                              87/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  198  /  333 epochs
	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [14:23]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [01:45]


3 0.1
UMAP(init='pca', n_epochs=1000, n_jobs=95, n_neighbors=3, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 16:00:46 2025 Construct fuzzy simplicial set
Sat Apr 26 16:00:46 2025 Finding Nearest Neighbors
Sat Apr 26 16:00:46 2025 Building RP forest with 22 trees
Sat Apr 26 16:00:46 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	 3  /  17
	Stopping threshold met -- exiting after 3 iterations
Sat Apr 26 16:00:48 2025 Finished Nearest Neighbor Search
Sat Apr 26 16:00:48 2025 Construct embedding


Epochs completed:   0%|                                                                                                                                                                            0/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  12%| ████████████████████▊                                                                                                                                                    124/1000 [00:00]

	completed  100  /  1000 epochs


Epochs completed:  23%| ██████████████████████████████████████▏                                                                                                                                  227/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  32%| █████████████████████████████████████████████████████▉                                                                                                                   321/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  42%| █████████████████████████████████████████████████████████████████████▉                                                                                                   416/1000 [00:02]

	completed  400  /  1000 epochs


Epochs completed:  53%| ████████████████████████████████████████████████████████████████████████████████████████▎                                                                                526/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  62%| ███████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                 619/1000 [00:03]

	completed  600  /  1000 epochs


Epochs completed:  71%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                 713/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  83%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                             830/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  91%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌               914/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 16:00:55 2025 Finished embedding
Sat Apr 26 16:00:58 2025 Worst tree score: 0.23452148
Sat Apr 26 16:00:58 2025 Mean tree score: 0.23825802
Sat Apr 26 16:00:58 2025 Best tree score: 0.24081473
Sat Apr 26 16:00:59 2025 Forward diversification reduced edges from 344655 to 306707
Sat Apr 26 16:00:59 2025 Reverse diversification reduced edges from 306707 to 306707
Sat Apr 26 16:00:59 2025 Degree pruning reduced edges from 306738 to 297809
Sat Apr 26 16:00:59 2025 Resorting data and graph based on tree order
Sat Apr 26 16:00:59 2025 Building and compiling search function


Epochs completed:  52%| ███████████████████████████████████████████████████████████████████████████████████████▊                                                                                  173/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  198  /  333 epochs
	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [14:35]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [01:47]


3 0.2
UMAP(init='pca', min_dist=0.2, n_epochs=1000, n_jobs=95, n_neighbors=3, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 16:22:14 2025 Construct fuzzy simplicial set
Sat Apr 26 16:22:14 2025 Finding Nearest Neighbors
Sat Apr 26 16:22:14 2025 Building RP forest with 22 trees
Sat Apr 26 16:22:15 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	 3  /  17
	Stopping threshold met -- exiting after 3 iterations
Sat Apr 26 16:22:17 2025 Finished Nearest Neighbor Search
Sat Apr 26 16:22:17 2025 Construct embedding


Epochs completed:   0%|                                                                                                                                                                            0/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  12%| ███████████████████▍                                                                                                                                                     116/1000 [00:00]

	completed  100  /  1000 epochs


Epochs completed:  22%| █████████████████████████████████████▍                                                                                                                                   223/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  32%| █████████████████████████████████████████████████████▍                                                                                                                   318/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  42%| ███████████████████████████████████████████████████████████████████████▏                                                                                                 424/1000 [00:02]

	completed  400  /  1000 epochs


Epochs completed:  52%| ██████████████████████████████████████████████████████████████████████████████████████▊                                                                                  517/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  62%| ████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                621/1000 [00:04]

	completed  600  /  1000 epochs


Epochs completed:  73%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                              728/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  82%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                               821/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  93%| ████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏            930/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 16:22:23 2025 Finished embedding
Sat Apr 26 16:22:26 2025 Worst tree score: 0.23574009
Sat Apr 26 16:22:26 2025 Mean tree score: 0.23806178
Sat Apr 26 16:22:26 2025 Best tree score: 0.24162423
Sat Apr 26 16:22:27 2025 Forward diversification reduced edges from 344655 to 306649
Sat Apr 26 16:22:27 2025 Reverse diversification reduced edges from 306649 to 306649
Sat Apr 26 16:22:27 2025 Degree pruning reduced edges from 306670 to 297793
Sat Apr 26 16:22:27 2025 Resorting data and graph based on tree order
Sat Apr 26 16:22:27 2025 Building and compiling search function


Epochs completed:  27%| █████████████████████████████████████████████▍                                                                                                                             89/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  198  /  333 epochs
	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [14:45]
Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [01:49]


3 0.5
UMAP(init='pca', min_dist=0.5, n_epochs=1000, n_jobs=95, n_neighbors=3, unique=True, verbose=True)
Unique=True -> Number of data points reduced from  114885  to  114885
Most common duplicate is 62991  with a count of  1
Sat Apr 26 16:43:52 2025 Construct fuzzy simplicial set
Sat Apr 26 16:43:52 2025 Finding Nearest Neighbors
Sat Apr 26 16:43:52 2025 Building RP forest with 22 trees
Sat Apr 26 16:43:53 2025 NN descent for 17 iterations
	 1  /  17
	 2  /  17
	 3  /  17
	Stopping threshold met -- exiting after 3 iterations
Sat Apr 26 16:43:55 2025 Finished Nearest Neighbor Search
Sat Apr 26 16:43:55 2025 Construct embedding


Epochs completed:   0%|                                                                                                                                                                            0/1000 [00:00]

	completed  0  /  1000 epochs


Epochs completed:  13%| ██████████████████████▎                                                                                                                                                  133/1000 [00:01]

	completed  100  /  1000 epochs


Epochs completed:  22%| █████████████████████████████████████▋                                                                                                                                   224/1000 [00:01]

	completed  200  /  1000 epochs


Epochs completed:  33%| ██████████████████████████████████████████████████████▊                                                                                                                  326/1000 [00:02]

	completed  300  /  1000 epochs


Epochs completed:  43%| ████████████████████████████████████████████████████████████████████████▍                                                                                                431/1000 [00:02]

	completed  400  /  1000 epochs


Epochs completed:  52%| ███████████████████████████████████████████████████████████████████████████████████████▎                                                                                 520/1000 [00:03]

	completed  500  /  1000 epochs


Epochs completed:  62%| █████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                625/1000 [00:04]

	completed  600  /  1000 epochs


Epochs completed:  74%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             735/1000 [00:04]

	completed  700  /  1000 epochs


Epochs completed:  83%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                              828/1000 [00:05]

	completed  800  /  1000 epochs


Epochs completed:  92%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏              918/1000 [00:05]

	completed  900  /  1000 epochs


Epochs completed: 100%| ███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 1000/1000 [00:06]


Sat Apr 26 16:44:01 2025 Finished embedding
Sat Apr 26 16:44:04 2025 Worst tree score: 0.23409496
Sat Apr 26 16:44:04 2025 Mean tree score: 0.23772626
Sat Apr 26 16:44:04 2025 Best tree score: 0.23988336
Sat Apr 26 16:44:04 2025 Forward diversification reduced edges from 344655 to 306811
Sat Apr 26 16:44:04 2025 Reverse diversification reduced edges from 306811 to 306811
Sat Apr 26 16:44:04 2025 Degree pruning reduced edges from 306788 to 297968
Sat Apr 26 16:44:04 2025 Resorting data and graph based on tree order
Sat Apr 26 16:44:05 2025 Building and compiling search function


Epochs completed:  52%| ███████████████████████████████████████████████████████████████████████████████████████▎                                                                                  172/333 [00:00]

	completed  0  /  333 epochs
	completed  33  /  333 epochs
	completed  66  /  333 epochs
	completed  99  /  333 epochs
	completed  132  /  333 epochs
	completed  165  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [00:00]


	completed  198  /  333 epochs
	completed  231  /  333 epochs
	completed  264  /  333 epochs
	completed  297  /  333 epochs
	completed  330  /  333 epochs


Epochs completed: 100%| █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ 333/333 [14:45]
Epochs completed:  65%| ██████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                           218/333 [01:13]

In [None]:
# np.save('umap_mses.npy', mses)

In [None]:
def umap_mse(params, training_arr=standardized_abundance_training_arr, test_arr=standardized_abundance_test_arr, 
             components=2, metric='euclidean', epochs=200, learning_rate=1.0, initialization='pca'):
    """
    Get the MSE for UMAP given params, components, metric, epochs, learning rate, initialization
    and a set of training and test data

    params is tuple of n_neighbors, min_dist
    """
    # unpack params
    n_neighbors, min_dist = params
    # fit using *training* data
    reducer = umap.UMAP(n_neighbors=n_neighbors, n_components=components, metric=metric, 
                        n_epochs=epochs, learning_rate=learning_rate, init=initialization, min_dist=min_dist, 
                        verbose=True, n_jobs=multiprocessing.cpu_count() - 1, unique=True)  
    fit_umap = reducer.fit(training_arr)
    # embed *test* data
    embedding = fit_umap.transform(test_arr)
    # reconstruct *test* data and record MSE of it
    reconstruction = fit_umap.inverse_transform(embedding)
    # return MSE
    return np.mean((test_arr - reconstruction) ** 2) * 1000

In [None]:
# n_neighbors, min_dist = 1000, 0.99
# # fit using *training* data
# reducer = umap.UMAP(n_neighbors=n_neighbors, n_components=2, metric='euclidean', 
#                     n_epochs=200, learning_rate=1.0, init='pca', min_dist=min_dist, 
#                     verbose=True, n_jobs=multiprocessing.cpu_count() - 1, unique=True) 
# fit_umap = reducer.fit(standardized_abundance_training_arr)
# # embed *test* data
# embed_train = fit_umap.transform(standardized_abundance_training_arr)
# embedding = fit_umap.transform(standardized_abundance_test_arr)
# # reconstruct *test* data and record MSE of it
# reconstruction_train = fit_umap.inverse_transform(embed_train)
# reconstruction = fit_umap.inverse_transform(embedding)
# # return MSE
# np.mean((standardized_abundance_training_arr - reconstruction_train) ** 2) * 1000, np.mean((standardized_abundance_test_arr - reconstruction) ** 2) * 1000

In [None]:
# umap_mse((1000, 0.99), epochs=1000)