# desilike

## Código común para especificar likelihoods de DESI (clustering)

### Introducción general

# [Un poco de] Contexto

En los tiempos de BOSS/eBOSS ($\leq$ 2020), los códigos para análisis "estándares" básicamente eran construidos por individuos (o un equipo dedicado muy pequeño), resultando en publicaciones con primera autoría.

Mucho trabajo (desde mitigación de efectos sistemáticos observacionales hasta estimación de parámetros cosmológicos), concentrado en pocos individuos.

$\Rightarrow$ análisis estándar de un set de datos espectroscópicos = 3 años de trabajo para un estudiante de doctorado

Este nivel de organización solía ser suficiente... porque la incertidumbre estadística era la fuente de error predominante

# DESI

DESI está recolectando 10x más datos que todos los experimentos espectroscópicos previos combinados.

$\Rightarrow$ Los resultados obtenidos con DESI tendrán un impacto importante en el panorama cosmológico. Tienen el respaldo de toda la colabotación. En práctica, los análisis estándar resultarán en publicaciones alfabéticas como parte de los proyectos clave de DESI.

El trabajo necesario para considerar apropiadamente los errores sistemáticos que se encuentran por debajo de los errores estadísticos es mucho más pesado. Este trabajo se distribuirá entre muchas personas.

El proyecto DESI es más largo que un doctorado. Queremos reducir al mínimo la cantidad de tiempo necesaria para que una contribución valga la pena en DESI a meses, no años. Para esto, debemos asegurarnos de que cualquier trabajo novedoso se beneficie de, y se base en, trabajo previo. 

$\Rightarrow$ Debemos organizarnos de una manera distinta que antes: tener herramientas estándares compartidas para nuestros códigos de análisis, y que los colaboradores puedan trabajar con ellas y mejorarlas. 

La idea es que hacer estudios específicos y mejorar los códigos lleven a publicaciones de primer autoría, mientras que el análisis completo con el código estándar sea el pilar para las publicaciones alfabéticas. 

Un análisis básico estándar que antes tomaba 6 meses construir desde cero, ahora toma $\ll$ 1 mes para un estudiante nuevo de doctorado con herramientas a la mano.

# Comunidad

En años recientes, la comunidad ha puesto énfasis en la reproducibilidad (por ejemplo, código público, revistas que requieran acceso a los datos, la política de publicaciones de DESI requiere que los códigos utilizados para reproducir figuras/gráficos sean hechos públicos, etc.).

DESI será juzgado por la comunidad científica de acuerdo a la reproducibilidad de los resultados de sus análisis estándar --- los cuales serán usados por la comunidad como base para comenzar estudios más profundos, no estándares.

$\Rightarrow$ Necesitamos preparar herramientas y códigos que estén suficientemente bien documentados, y sean fáciles de manejar, para que nuestrxs compañerxs en cosmología puedan reproducir los resultados de análisis de DESI.

# Lo que tenemos hasta ahora

Un ambiente, configurado en NERSC, que contiene [la mayoría de] los paquetes requeridos para correr los análisis estándares de DESI Y1 (disponible públicamente en https://github.com/cosmodesi)

```
source /global/common/software/desi/users/adematti/cosmodesi_environment.sh main  # cargar el ambiente
# Es posible que también se quiera configurar el kernel para uso en Jupyter para reproducir gráficas
${COSMODESIMODULES}/install_jupyter_kernel.sh main  # Esto sólo es necesario hacerlo una vez
```

Contains (in addition to standard Python packages):
- [cosmoprimo](https://github.com/cosmodesi/cosmoprimo): primordial cosmology (class, camb, isitgr, fftlog, interpolator, BAO filtering)
- [pycorr](https://github.com/cosmodesi/pycorr): correlation function estimation
- [pypower](https://github.com/cosmodesi/pypower): power spectrum (and window function) estimation
- [pyrecon](https://github.com/cosmodesi/pyrecon): standard BAO reconstruction
- [mockfactory](https://github.com/cosmodesi/mockfactory): tools to be build fast mocks
- [desilike](https://github.com/cosmodesi/desilike): DESI likelihoods, Fisher, bindings with cosmological samplers (Cobaya, CosmoSIS, MontePython)
- Cobaya, CosmoSIS (standard library), CLASS, Planck likelihoods, etc.

Next in line are pipelining tools (e.g. [https://github.com/adematti/desipipe](https://github.com/adematti/desipipe)).

# desilike

## Misión #1: Especificar las likelihoods (estándar) de DESI 
- Fits comprimidos y directos, $P(k)$ and $\xi(s)$.

- Tomar en cuenta matrices ventana, colisión de fibras, etc.

- Todo hecho en Python.

- Automático / fácil de conectar a códigos populares de inferencia cosmológica (MontePython, CosmoSIS, Cobaya)

$\Rightarrow$ Equivalente, por ejemplo, al paquete de likelihoods de Planck

## Mission #2: Coordinar el trabajo de inferencia cosmológica

Hacer que la interfaz entre colaboradores trabajando en modelos de teoría, sistemáticos observacionales (como las colisiones entre las fibras ópticas), blinding, etc.

Para esto: optimizadores, samplers, emuladores, marginalización analítica, análisis de Fisher, muestreo de importancia, todo usando MPI

# desilike - pensando en el futuro

- Y1 es solamente... 1/5 de DESI!

- En Y3, los análisis estándar deben incluir cross-correlations y estadísticas más allá de 2-pt

- En Y5, los análisis estándar deben incluir constraints combinados de clustering, weak lensing y peculiar velocities.

Necesitamos una estructura común para definir y combinar todos estos observables.
**desilike** fue diseñado con este propósito.

# desilike - en resumen

Para especificar una likelihood para el espectro de potencias o los multipolos de la función de correlación, sólo hay que elegir:
- template

- teoría

- observable

## Template

- Directo: DirectPowerSpectrumTemplate

- BAO: BAOPowerSpectrumTemplate

- ShapeFit: ShapeFitPowerSpectrumTemplate

- Standard (à la BOSS/eBOSS): StandardPowerSpectrumTemplate

- WiggleSplit (BAO wiggles shifted independently from AP): WiggleSplitPowerSpectrumTemplate

- $P_{\theta\theta}$ (band power linear velocity power spectrum): BandVelocityPowerSpectrumTemplate

## Teoría

Actualmente disponibles (para la mayoría de ellos, la contraparte en función de correlación es cambiar PowerSpectrum por CorrelationFunction: ...PowerSpectrumMultipoles $\Rightarrow$ ...CorrelationFunctionMultipoles):

- Simple Kaiser model: KaiserTracerPowerSpectrumMultipoles

- Velocileptors: LPTVelocileptorsTracerPowerSpectrumMultipoles (plus other flavors)

- PyBird: PyBirdTracerPowerSpectrumMultipoles

- FOLPS: FOLPSTracerPowerSpectrumMultipoles

- TNS 1 loop: TNSTracerPowerSpectrumMultipoles

- empirical BAO: DampedBAOWigglesPowerSpectrumMultipoles

- PNG (scale-dependent bias): PNGTracerPowerSpectrumMultipoles

- ¡Ingrese su código propio aquí!

## Observable

- Multipolos del espectro de potencias: TracerPowerSpectrumMultipolesObservable

- Multipolos de la función de correlación: TracerCorrelationFunctionMultipolesObservable
    
Para re-utilizar mediciones comprimidas:

- BAO compression: BAOCompressionObservable

- ShapeFit compression: ShapeFitCompressionObservable

- standard compression: StandardCompressionObservable

- WiggleSplit compression: WiggleSplitCompressionObservable

- $P_{\theta\theta}$ compression: BandVelocityCompressionObservable

## Ejemplo: fit LRG con mocks de primera generación de caja cúbica

Ver [https://github.com/cosmodesi/desi-y1-kp7/tree/main/mock_challenge_y1](https://github.com/cosmodesi/desi-y1-kp7/tree/main/mock_challenge_y1) para un ejemplo ejecutable

### Definir la likelihood

In [None]:
from desilike.theories.galaxy_clustering import ShapeFitPowerSpectrumTemplate,\
                                                FOLPSTracerPowerSpectrumMultipoles
from desilike.observables.galaxy_clustering import TracerPowerSpectrumMultipolesObservable
from desilike.likelihoods import ObservablesGaussianLikelihood

template = ShapeFitPowerSpectrumTemplate(z=0.8)
theory = FOLPSTracerPowerSpectrumMultipoles(template=template)
observable = TracerPowerSpectrumMultipolesObservable(klim={0: [0.02, 0.18, 0.005], 2: [0.02, 0.18, 0.005]},
                                                     data='/global/cfs/cdirs/desi/cosmosim/KP45/MC/Clustering/AbacusSummit/CubicBox/LRG/Pk/Pre/jmena/nmesh_512/pypower_format/Pk_AbacusSummit_base_*.npy',
                                                     covariance='/global/cfs/cdirs/desi/cosmosim/KP45/MC/Clustering/EZmock/CubicBox/LRG/Pk/jmena/nmesh_512/pypower_format/Pk_EZmock_B2000G512Z0.8N8015724_b0.385d4r169c0.3_seed*.npy',
                                                     wmatrix='/global/cfs/cdirs/desi/users/adematti/desi_mock_challenge/FirstGenMocks/AbacusSummit/CubicBox/ELG/z1.100/window_nmesh512_los-x.npy',
                                                     kinlim=(0., 0.25),  # just to restrict input theory k's
                                                     theory=theory)
# Here we could give a list of several observables + joint covariance matrix
likelihood = ObservablesGaussianLikelihood(observables=[observable],
                                           scale_covariance=1. / 25.)
# We can also sum up independent likelihoods (likelihood1 + likelihood2)
# Call likelihood
likelihood(qpar=0.99, qper=1.01)

### Emular la teoría

Tip: Ejecutar con varios procesos MPI!

In [None]:
from desilike.emulators import Emulator, TaylorEmulatorEngine, EmulatedCalculator

# theory.pt = Parte de teoría de perturbación, sólo depende de los parámetros del template (qpar, qper, df, dm)
emulator = Emulator(theory.pt, engine=TaylorEmulatorEngine(method='finite', order=4))
emulator.set_samples()
emulator.fit()
pt = emulator.to_calculator()
# emulator.save(emulator_fn); pt = EmulatedCalculator.load(emulator_fn)

# Reemplazar la parte de teoría de perturbación con la nueva!
theory.init.update(pt=pt)

### Sample

Tip: Ejecutar con varios procesos MPI!

In [None]:
from desilike.samplers import EmceeSampler

sampler = EmceeSampler(likelihood, chains=8, nwalkers=40, seed=42, save_fn='chain_*.npy')
chains = sampler.run(min_iterations=2000, check={'max_eigen_gr': 0.03})

In [None]:
### Re-cargar las chains y concatenarlas
from desilike.samples import Chain

chain = Chain.concatenate([Chain.load('chain_{:d}.npy'.format(i)).remove_burnin(0.5)[::10]
                           for i in range(8)])
# Si se desea convertir a formato GetDist:
chain.to_getdist()

### Usar las mediciones con compresión para hacer inferencia de las posteriors

In [None]:
from desilike.observables.galaxy_clustering import ShapeFitCompressionObservable

observable = ShapeFitCompressionObservable(data=chain, covariance=chain,
                                           params=['qpar', 'qper', 'dm', 'df'], z=0.8)
likelihood = ObservablesGaussianLikelihood(observables=[observable])

sampler = EmceeSampler(likelihood, chains=8, nwalkers=40, seed=42, save_fn='chain_shapefit_*.npy')
chains = sampler.run(min_iterations=2000, check={'max_eigen_gr': 0.03})

# desilike - Trabajo actual y próximo

- Validación de la implementación de modelos de perturbación (FOLPS, velocileptors, pybird)

<div>
<center>
<img src="figures/comparison_desilike_folps_shapefit.png" width="200"/>
<center>
</div>


- Una vez se encuentren disponibles los mocks de segunda generación, estaremos listxs para investigar la combinación de mediciones de estadísticas de 2 puntos pre y post reconstrucción

- Preparación para Y3: cross-correlations, 3-pt, etc.

- Además, análisis no estándares: [turn-over scale](https://github.com/cosmodesi/desilike/blob/main/nb/turnover_examples.ipynb)

# Material

This tutorial in [https://github.com/cosmodesi/desilike-tutorials](https://github.com/cosmodesi/desilike-tutorials)

[desilike docs](https://desilike.readthedocs.io/), en particular [getting started](https://desilike.readthedocs.io/en/latest/user/getting_started.html)

[desilike notebooks](https://github.com/cosmodesi/desilike/tree/main/nb)

Aplicaciones prácticas: Ejemplos de los beneficios de MPI!

[Aplicación al mock challenge (velocileptors, pybird, folps)](https://github.com/cosmodesi/desi-y1-kp7/tree/main/mock_challenge_y1)

[Aplicación de inferenica cosmológica con los mocks de Y1](https://github.com/cosmodesi/desi-y1-kp7/tree/main/mock_y1)

[Aplicación a los forecasts de DESI Y5/Y1](https://github.com/cosmodesi/desilike/tree/main/nb) (Uendert Andrade)

[Aplicación a la validación del blinding](https://github.com/cosmodesi/desi-y1-kp45/tree/main/blinding) (Uendert Andrade & Edmond Chaussidon for fnl)
 
[Aplicación a las pruebas de las colisiones de fibras](https://github.com/mathildepinon/desi_fiber_collisions) (Mathilde Pinon)

# Acknowledgments

[Contributions (direct or indirect) from many collaborators](https://github.com/cosmodesi/desilike/tree/main#acknowledgments)