### Exercício – Amostragem da distribuição Beta via Metropolis–Hastings (versão paralela)

Implemente o algoritmo de **Metropolis–Hastings** para gerar amostras da distribuição alvo

$$f(x) \propto x^{a-1}(1-x)^{b-1}, \quad 0 < x < 1,$$

com parâmetros $a = 4.1$ e $b = 5.2$.

Use como cadeia de propostas variáveis $U \sim \mathrm{Unif}(0,1)$ independentes — isto é, cada proposta é escolhida uniformemente no intervalo $(0,1)$, independentemente do estado atual.  
Essa versão do algoritmo é conhecida como **independence sampler**.

A cada iteração:
1. Gere uma proposta $u \sim \mathrm{Unif}(0,1)$;
2. Calcule a probabilidade de aceitação

   $$
   a(x,u) = \min\!\left( \frac{u^{a-1}(1-u)^{b-1}}{x^{a-1}(1-x)^{b-1}},\, 1 \right);
   $$
3. Aceite a proposta com probabilidade $a(x,u)$; caso contrário, mantenha o estado atual.

---

Agora, **rode várias cadeias independentes em paralelo**, cada uma com um ponto inicial diferente (por exemplo, 5 cadeias iniciadas em valores aleatórios de $(0,1)$).  
Cada cadeia deve gerar $10^5$ amostras e descartar as primeiras $10^3$ (período de *burn-in*).

Ao final:
- Plote o histograma das amostras combinadas, sobrepondo a densidade teórica da distribuição $\mathrm{Beta}(a,b)$;
- Compare visualmente se as diferentes cadeias atingiram o mesmo regime estacionário;
- Discuta se o uso de várias cadeias melhora a confiança na convergência do algoritmo.


### Exercício – Amostragem da distribuição Normal via Metropolis–Hastings

Implemente o algoritmo de **Metropolis–Hastings** para gerar amostras da distribuição alvo

$s(x) \propto \exp\!\left(-\frac{x^2}{2}\right), \quad x \in \mathbb{R},$

correspondente a uma normal padrão $N(0,1)$.

Use como **cadeia de propostas** uma distribuição uniforme centrada no estado atual:

$u \sim \mathrm{Unif}(x - \delta,\, x + \delta),$

onde $\delta > 0$ é um parâmetro que controla o tamanho dos passos da cadeia (por exemplo, $\delta = 1$).

A cada iteração:
1. Gere uma proposta $u \sim \mathrm{Unif}(x - \delta,\, x + \delta)$;
2. Calcule a probabilidade de aceitação

   $$
   a(x,u) = \min\!\left( \frac{s(u)}{s(x)},\, 1 \right)
   = \min\!\left( \exp\!\left[-\frac{1}{2}(u^2 - x^2)\right],\, 1 \right);
   $$
3. Aceite a proposta com probabilidade $a(x,u)$; caso contrário, mantenha o estado atual.

---

Gere $50{,}000$ amostras, descarte as primeiras $2{,}000$ (período de *burn-in*),  
e plote o histograma das amostras restantes, sobrepondo a densidade teórica da normal padrão.

Analise:
- O histograma se aproxima da densidade da normal?
- O valor de $\delta$ afeta a taxa de aceitação?  
  Teste diferentes valores (por exemplo, $\delta = 0.2, 1, 3$) e observe a diferença na convergência e na mistura da cadeia.
- **Questão conceitual:**  
  a fórmula geral do Metropolis–Hastings envolve o termo $\frac{p(x\mid u)}{p(u\mid x)}$.  
  Por que ele desaparece neste caso?  
  Compare com o caso da distribuição Beta e discuta em que situações esse termo é necessário.


### Exercício – Maximização estocástica via Metropolis–Hastings

O algoritmo de **Metropolis–Hastings** gera uma cadeia de Markov cuja distribuição estacionária é proporcional a uma função $s(x)$.  
Se escolhermos $s(x) \propto f(x)$ para alguma função positiva $f$,  
a cadeia passará mais tempo em regiões onde $f(x)$ é grande.  

Assim, após um número suficiente de iterações, os estados mais visitados tendem a se concentrar próximos dos **máximos de $f$**.  
Essa é a base dos métodos de **maximização estocástica**, e, em particular, do **simulated annealing**.

Para controlar o quanto a cadeia explora o espaço, pode-se introduzir um parâmetro de temperatura $T > 0$ e definir
$$
s_T(x) \propto \exp\!\left(\frac{f(x)}{T}\right).
$$
Quando $T$ é grande, a cadeia explora amplamente o espaço;  
à medida que $T$ diminui, a distribuição se concentra cada vez mais nos máximos de $f$.  
No limite $T \to 0$, a cadeia “congela” nos pontos de maior valor.

---

Considere a função
$$
f(x) = \sin(3x)\, e^{-x^2}, \quad x \in [-3,3].
$$

Implemente o algoritmo de **Metropolis–Hastings** para gerar amostras de uma distribuição proporcional a $f(x)$, usando:

- uma proposta simétrica $u \sim \mathrm{Unif}(x - \delta,\, x + \delta)$, com $\delta = 0.5$;
- a regra de aceitação
  $$
  a(x,u) = \min\!\left(1, \frac{f(u)}{f(x)}\right);
  $$
- um total de $20{,}000$ iterações, descartando as primeiras $2{,}000$ como *burn-in*.

---

**Tarefas:**
1. Plote a função $f(x)$ no intervalo $[-3,3]$.
2. Execute o algoritmo e plote o histograma dos estados visitados após o *burn-in*.
3. Verifique se as regiões mais visitadas pela cadeia correspondem aos máximos de $f$.
4. (Opcional) Introduza a versão com temperatura, definindo $s_T(x) \propto \exp(f(x)/T)$,  
   e observe como o comportamento da cadeia muda conforme $T$ diminui.
5. Reflita sobre a ligação entre a **distribuição estacionária** e a **busca de máximos**:  
   por que as regiões mais prováveis na distribuição estacionária correspondem aos máximos de $f(x)$?
