# Monte Carlo Markov Chains para Galaxy Clustering

Agora que vimos os conceitos básicos de MCMC e análise estatística, é a sua vez. A Gabriela gerou dados observacionais da temperatura da CMB, enquanto o Guilherme explicou como fornecer previsões teóricas. O objetivo é obter **intervalos de confiança** e gerar um ***corner plot*** para dois parâmetros cosmológicos:
- $\Omega_m$: fração que matéria não-relativística ("baryons" + dark matter + neutrinos massivos) representam da energia total no Universo;
- $\sigma_8$: variância do campo de densidade de matéria $\delta_m(\mathbf{x}, z = 0)$ dentro de esferas de raio $R = 8h/\mathrm{Mpc}$.

Vou deixar vocês com um código base, copiado da Gabriela e do Guilherme.

Me chamem se tiverem qualquer dúvida ou problema!

Dicas:
- O notebook `MCMC_supernovas.ipynb` já tem uma implementação de Metropolis-Hastings pronta. Você pode copiar e colar, mas tem que refatorar o código para esse problema:
  - É necessário mudar os parâmetros que são sampleados
  - Repensar priors e proposal (proposal Gaussiano funciona melhor, mas precisa de uma covariância)
- Os $C_\ell$ teóricos são dados em $\ell$ inteiro, enquanto os dados são binados, e portanto tem $\ell$ fracionário. Talvez você queira aplicar uma interpolação
- Você pode explorar alguns valores de $\Omega_m$ e $\sigma_8$ na mão usando a célula acima: isso pode te dar uma informação valiosa sobre o ponto inicial da MCMC, uma vez que começar de um ponto com alta *likelihood* melhora a velocidade de convergência

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from classy import Class

In [None]:
def get_cmb_cl(Omega_m, sigma_8):
    params = {
        # -------------------- SAÍDAS --------------------
        'modes'  : 's',
        'output' : 'tCl, lCl',
        'lensing': 'yes',
        'l_max_scalars': 2200,

        # ----------------- COSMOLOGIA -------------------
        # DE como fld (Ω_Λ=0 e w0/wa dados)
        'Omega_Lambda': 0,
        'w0_fld'      : '-1.',
        'wa_fld'      : '0.0',

        # Primordial
        'sigma8': sigma_8,
        'n_s'   : 0.96,

        # Verbosidade/Gauge
        'background_verbose'   : 0,
        'perturbations_verbose': 0,
        'gauge'                : 'Synchronous',

        # Fundo
        'h'        : 0.673,
        'Omega_b'  : 0.05,
        'Omega_cdm': Omega_m - 0.05,  # valor fiducial
        'Omega_k'  : 0.0,
    }
    M = Class(); M.set(params); M.compute()
    lensed = M.lensed_cl(2200)   
    ell   = np.asarray(lensed['ell'])
    clTT  = np.asarray(lensed['tt'])
    return ell, clTT

In [None]:
# Solução:
from random import uniform
from time import time
from scipy.interpolate import interp1d

# Troque pelo seu arquivo
ell_data, cl_tt_data, sigma_cl_tt = np.load("teste_ell_Cl_errobar_CMB_TT.npy")

# Alguns pontos são zero, vamos retirá-los nos dados
# Talvez precisemos fazer outros cortes
mask = cl_tt_data > 0
ell_data = ell_data[mask]
cl_tt_data = cl_tt_data[mask]
sigma_cl_tt = sigma_cl_tt[mask]

# Exemplo de cosmologia vs teoria
ell_theory, cl_tt_theory = get_cmb_cl(Omega_m=0.3, sigma_8=0.840)
fac_data = ell_data*(ell_data+1)/(2*np.pi)
fac_theory = ell_theory*(ell_theory+1)/(2*np.pi)
plt.semilogx(ell_theory, fac_theory*cl_tt_theory)
plt.errorbar(ell_data, fac_data*cl_tt_data, yerr=fac_data*sigma_cl_tt, color="black", markersize=10, ls="none")

In [None]:
ell_theory, cl_tt_theory = get_cmb_cl(Omega_m=0.3, sigma_8=0.840)
cl_theory_interpolator = interp1d(ell_theory, cl_tt_theory)
cl_tt_theory = cl_theory_interpolator(ell_data)
plt.errorbar(ell_data, (cl_tt_data-cl_tt_theory)/cl_tt_theory, yerr=sigma_cl_tt/cl_tt_theory, color="black", markersize=20)

In [None]:
# Solução:
def chi2(Omega_m, sigma_8):
    ell_theory, cl_tt_theory = get_cmb_cl(Omega_m, sigma_8)
    cl_theory_interpolator = interp1d(ell_theory, cl_tt_theory)
    cl_tt_theory = cl_theory_interpolator(ell_data)
    delta = cl_tt_theory - cl_tt_data
    return np.sum(delta**2/sigma_cl_tt**2)

chi2(0.2, 0.880)

In [None]:
class MCMCWalker:
    """
        Helper class for managing MCMCs. The class contains methods for performing Monte Carlo steps and saves the state.
    """
    def __init__(self):
        # Hard-coding an initial point based on the exploration
        initial_om = ...
        initial_sigma8 = ...
        initial_params = [initial_om, initial_sigma8]
        initial_chi2 = chi2(*initial_params)
        initial_sample = {
            'params': initial_params,
            'chi2': initial_chi2,
            'weight': 1,
        }
        self.samples = [initial_sample]

    def accept_sample(self, params, chi2):
        sample = {
            'params': params,
            'chi2': chi2,
            'weight': 1
        }
        self.samples.append(sample)

    def step(self):
        while True:
            current_chi2 = self.samples[-1]['chi2']
            step = np.random.multivariate_normal(np.zeros(2), cov)
            new_om = self.samples[-1]['params'][0] + step[0]
            new_s8 = self.samples[-1]['params'][1] + step[1]
            
            new_params = [new_om, new_s8]
            if new_om < 0 or new_om > 1 or new_s8 > 1.5 or new_s8 < 0.4:
                # Reject point outside the prior
                self.samples[-1]['weight'] += 1
                continue
            new_chi2 = chi2(*new_params)
            if new_chi2 == np.nan:
                # Reject points that have problematic chi2
                self.samples[-1]['weight'] += 1
                continue
            if new_chi2 < current_chi2:
                self.accept_sample(new_params, new_chi2)
                break
            else:
                r = uniform(0, 1)
                if r < np.exp(-(new_chi2 - current_chi2)/2):
                    self.accept_sample(new_params, new_chi2)
                    break
                else:
                    self.samples[-1]['weight'] += 1 # Increment weight
                    continue
            
    
    def gelman_rubin(self, n_split):
        all_params = np.array(
            [sample['params'] for sample in self.samples]
        )[:-(len(self.samples)%n_split)]
        np.random.shuffle(all_params)
        split_params = np.split(all_params, n_split)
        avg = np.mean(split_params, axis=1)
        std = np.std(split_params, axis=1)
        avg_of_std = np.mean(std, axis=0)
        std_of_avg = np.std(avg, axis=0)
        R_minus_one = std_of_avg/avg_of_std
        return np.max(R_minus_one)

def run_mcmc(w):
    print("Starting MCMC")
    start = time()
    while True:
        for _ in range(10): w.step()
        R_minus_one = w.gelman_rubin(4)
        print(f"At {len(w.samples)} samples, R-1 = {R_minus_one}")
        if R_minus_one < 0.025: break 
    print(f"MCMC Converged! Took {time() - start:.2f} seconds")
    return w

In [None]:
w = MCMCWalker()

In [None]:
run_mcmc(w)

In [None]:
import getdist
from getdist import plots

def getdist_chain(w):
    """
        Função auxiliar que transforma as amostras cruas em um objeto `getdist.MCSamples`
        A função também define o parâmetro derivado `S8`
    """
    mcmc = getdist.MCSamples(
        samples=np.array([sample['params'] + [sample['chi2']] for sample in w.samples]),
        weights=np.array([sample['weight'] for sample in w.samples]),
        names=["Omega_m", "sigma_8", "chi2"],
        labels=["\\Omega_m", "\\sigma_8", "\\chi^2"],
        ranges={"Omega_m": (0, None)}
    )
    mcmc.removeBurn(0.15)
    mcmc.addDerived(mcmc["sigma_8"]*np.sqrt(mcmc["Omega_m"]/0.3), name="S8", label="S_8")
    return mcmc

chain = getdist_chain(w)

In [None]:
# Obter intervalos de confiança 1D
params = ["Omega_m", "sigma_8", "S8"]
print("1D confidence intervals (68%):")
for param in params:
  print(chain.getInlineLatex(param, limit=1))

In [None]:
# Obtendo contornos de confiança 2D, o corner plot
p = getdist.plots.get_subplot_plotter()
p.settings.axes_fontsize=22
p.settings.axes_labelsize=22
p.triangle_plot(
    chain,
    params=params,
    filled=True,
    contour_colors=["#406421"]
)
p.export("mcmc_cmb.pdf")