tSZ DeepSet

Learn electron pressure in clusters from a gravity-only simulation. The network architecture consists mostly of DeepSets and MLPs, enabling a modular, interpretable design that operates directly on the simulation representation as a set of dark matter (DM) particles.

Dependencies

cosmological simulation with gravity-only and full-physics runs from same initial conditions. We used IllustrisTNG 300-1.
halo finder. We used Rockstar.
PyTorch
Optuna
Voxelize for create_boxes.py
group_particles for collect_particles.cpp

Use guide

Code that needs to be compiled:
- collect_particles.cpp: compile into both collect_particles_DM and collect_particles_TNG executables, depending on whether preprocessor macros DM or TNG are defined. This script finds the simulation particles in the vicinity of halos.
- sort_particles.cpp into sort_particles executable.
- prtfinder.cpp into libprtfinder.so.
WORKFLOW describes the steps that need to be taken for pre-processing of the simulation data. The required scripts are:
Optional: run create_normalization.py and analyse_normalization.py, if used on a different simulation than IllustrisTNG 300-1. The output can be used to tweak the hardcoded numbers in normalization.py to bring inputs to zero mean, unit variance.
Internal data handling is defined in
The cluster-scale scalars and vectors are defined in
Runtime configuration is defined in cfg.py. The idea is that this module is populated from either command line settings or the environment variable TSZ_DEEP_SET_CFG by init_proc.py. For later reference, archive_cfg.py is used. Quite often we set default arguments to something from cfg.py, this is implemented in default_from_cfg.py.
There is some basic support for distributed training, although more work would be required to get this to work. Currently training is fast enough on a single GPU and the required RAM per training process is about 60G. Some possibly buggy definitions to set up the distributed environment are in mpi_env_types.py.
The network architecture is defined in
- network.py combined architecture
- network_batt12.py GNFW module
- network_origin.py Origin module
- network_local.py Local module
- network_vae.py Stochastic module
- network_decoder.py Aggregator module
- network_deformer.py deviations from spherical symmetry
- network_encoder.py cluster-scale vector DeepSet
- network_scalarencoder.py cluster-scale scalar DeepSet
- network_mlp.py single MLP
- network_layer.py DeepSet primitive
Initialization of the network in init_model.py.
Driver code is in
- training.py Can be directly executed with command line arguments setting the cfg.py settings.
- testing.py To test a trained model on either validation or testing set.
- optuna_driver.py Wrapper around training.py with Optuna sampling.
The files generate_cl_*.py are used for Optuna hyperparameter searches.
Auxiliary files for training:
Auxiliary files for testing:
Files paper_plot_*.py were used to generate publication figures.
Various other files are there, most are buggy and not for use. In particular, anything with FOF in the name was for our initial attempt to work with friends-of-friends instead of Rockstar halos.

Name		Name	Last commit message	Last commit date
Latest commit History 630 Commits
OLD_FOF		OLD_FOF
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
WORKFLOW		WORKFLOW
analyse_normalization.py		analyse_normalization.py
archive_cfg.py		archive_cfg.py
ascii_to_hdf5.py		ascii_to_hdf5.py
basis.py		basis.py
bin_residuals.py		bin_residuals.py
cartoon.png		cartoon.png
cfg.py		cfg.py
collect_particles.cpp		collect_particles.cpp
create_Nlocal_statistics.py		create_Nlocal_statistics.py
create_Nprt.py		create_Nprt.py
create_boxes.py		create_boxes.py
create_halo_catalog.py		create_halo_catalog.py
create_normalization.py		create_normalization.py
create_normalization.sh		create_normalization.sh
create_residuals.py		create_residuals.py
cubify_prediction.py		cubify_prediction.py
data_batch.py		data_batch.py
data_item.py		data_item.py
data_loader.py		data_loader.py
data_modes.py		data_modes.py
data_set.py		data_set.py
default_from_cfg.py		default_from_cfg.py
fit_origin.py		fit_origin.py
fit_spherical_model.py		fit_spherical_model.py
fixed_len_vec.py		fixed_len_vec.py
generate_cl_alldeterministic.py		generate_cl_alldeterministic.py
generate_cl_batt1264.py		generate_cl_batt1264.py
generate_cl_encoder.py		generate_cl_encoder.py
generate_cl_encoderscalarencoder.py		generate_cl_encoderscalarencoder.py
generate_cl_local.py		generate_cl_local.py
generate_cl_local64.py		generate_cl_local64.py
generate_cl_local64_more.py		generate_cl_local64_more.py
generate_cl_local64_more_200epochs.py		generate_cl_local64_more_200epochs.py
generate_cl_localdecoder.py		generate_cl_localdecoder.py
generate_cl_localdecoderorigin.py		generate_cl_localdecoderorigin.py
generate_cl_localembedded.py		generate_cl_localembedded.py
generate_cl_localorigin64.py		generate_cl_localorigin64.py
generate_cl_localorigin64_again.py		generate_cl_localorigin64_again.py
generate_cl_localorigin64_again_200epochs.py		generate_cl_localorigin64_again_200epochs.py
generate_cl_localorigin64_again_200epochs_wbasis.py		generate_cl_localorigin64_again_200epochs_wbasis.py
generate_cl_localorigin64_more.py		generate_cl_localorigin64_more.py
generate_cl_localorigin64_more_200epochs.py		generate_cl_localorigin64_more_200epochs.py
generate_cl_localoriginscalarencoder64.py		generate_cl_localoriginscalarencoder64.py
generate_cl_localoriginscalarencoder64_more.py		generate_cl_localoriginscalarencoder64_more.py
generate_cl_localoriginscalarencoder64_more_200epochs.py		generate_cl_localoriginscalarencoder64_more_200epochs.py
generate_cl_only_dens64.py		generate_cl_only_dens64.py
generate_cl_only_sphsym64.py		generate_cl_only_sphsym64.py
generate_cl_origin.py		generate_cl_origin.py
generate_cl_origin64.py		generate_cl_origin64.py
generate_cl_origin64_Oct12.py		generate_cl_origin64_Oct12.py
generate_cl_origindecoder.py		generate_cl_origindecoder.py
generate_cl_origindecoder2.py		generate_cl_origindecoder2.py
generate_cl_origindeformer.py		generate_cl_origindeformer.py
generate_cl_origindeformer64.py		generate_cl_origindeformer64.py
generate_cl_origindeformer64_wdropout.py		generate_cl_origindeformer64_wdropout.py
generate_cl_origindeformer64_wdropout_again.py		generate_cl_origindeformer64_wdropout_again.py
generate_cl_originencoder.py		generate_cl_originencoder.py
generate_cl_scalarencoder.py		generate_cl_scalarencoder.py
generate_cl_vae64.py		generate_cl_vae64.py
generate_cl_vae64_200epochs.py		generate_cl_vae64_200epochs.py
generate_cl_vae64_200epochs_usekld.py		generate_cl_vae64_200epochs_usekld.py
generate_cl_vae64_200epochs_usekld_onelatent.py		generate_cl_vae64_200epochs_usekld_onelatent.py
get_compute_time.py		get_compute_time.py
get_data_size_FOF.py		get_data_size_FOF.py
global_fields.py		global_fields.py
halo.py		halo.py
halo_catalog.py		halo_catalog.py
init_model.py		init_model.py
init_proc.py		init_proc.py
merge_dicts.py		merge_dicts.py
mpi_env_types.py		mpi_env_types.py
network.py		network.py
network_batt12.py		network_batt12.py
network_decoder.py		network_decoder.py
network_deformer.py		network_deformer.py
network_encoder.py		network_encoder.py
network_layer.py		network_layer.py
network_local.py		network_local.py
network_mlp.py		network_mlp.py
network_origin.py		network_origin.py
network_scalarencoder.py		network_scalarencoder.py
network_vae.py		network_vae.py
normalization.py		normalization.py
optuna_driver.py		optuna_driver.py
paper_plot_PDF.py		paper_plot_PDF.py
paper_plot_cartoon_DM.py		paper_plot_cartoon_DM.py
paper_plot_cartoon_TNG.py		paper_plot_cartoon_TNG.py
paper_plot_cartoon_b12.py		paper_plot_cartoon_b12.py
paper_plot_cartoon_cfg.py		paper_plot_cartoon_cfg.py
paper_plot_cartoon_list_residuals.py		paper_plot_cartoon_list_residuals.py
paper_plot_cartoon_residuals.py		paper_plot_cartoon_residuals.py
paper_plot_get_indices.py		paper_plot_get_indices.py
paper_plot_images.py		paper_plot_images.py
paper_plot_profiles.py		paper_plot_profiles.py
paper_plot_scatterloss.py		paper_plot_scatterloss.py

License

leanderthiele/tSZ_DeepSet

Folders and files

Latest commit

History