# Exercício 1: Bernoulli e Uniforme

1. Implemente uma função que gere uma realização de uma variável de Bernoulli com parâmetro $p$.

2. Usando $p = 0.5$, implemente um gerador de variáveis **Uniformes(0,1)** a partir da expansão binária:

   $$
   U = \sum_{k=1}^m \frac{B_k}{2^k}, \quad B_k \sim \text{Bernoulli}(0.5).
   $$

   Gere uma amostra de tamanho $1000$ para $U$, utilizando $m$ bits de precisão (por exemplo, $m = 20$).


# Exercício 2: Binomial

Implemente um gerador de variáveis aleatórias com distribuição Binomial($n,p$) utilizando **dois métodos diferentes**:

1. **Método via Bernoullis**: some $n$ variáveis independentes $B_i \sim \text{Bernoulli}(p)$.

2. **Método via inversão recursiva**: utilize a função de distribuição acumulada da Binomial e um gerador uniforme para determinar o valor da variável.

3. Compare o **tempo de execução** dos dois métodos ao gerar uma amostra de tamanho grande (por exemplo, $10^5$ observações).  
   - Fixe $n$ (por exemplo, $n=20$) e varie o valor de $p$ (por exemplo, $p=0.1, 0.3, 0.5, 0.7, 0.9$).  
   - Observe como o desempenho dos dois métodos se altera de acordo com $p$.

4. Compare as **densidades empíricas** obtidas pelos dois métodos com a densidade de referência gerada pela função pronta `numpy.random.binomial`.  
   - Faça histogramas normalizados ou gráficos de barras lado a lado.  
   - Discuta se as distribuições coincidem e se há diferenças relevantes.

5. No caso do **método de inversão recursiva**, calcule o **número médio de passos** que o algoritmo dá até parar.  
   - Mostre empiricamente esse valor para diferentes $p$.  
   - Compare com a expectativa teórica $$\mathbb{E}[\text{nº de passos}] = np + 1.$$


# Exercício 3: Poisson

Implemente um gerador de variáveis aleatórias com distribuição Poisson($\lambda$) utilizando **dois métodos**:

1. **Versão recursiva do algoritmo de inversão** (vista em aula).  
2. **Versão melhorada** (já apresentada nas notas).  

3. Compare os **tempos de execução** dos dois métodos para diferentes valores de $\lambda$ (por exemplo, $\lambda = 1, 5, 10, 50, 100$) e discuta em quais situações cada método é mais eficiente.

4. Considere agora $\lambda = 500$.  
   - Simule uma amostra de variáveis Poisson($\lambda$).  
   - Compare o histograma obtido com a densidade de uma Normal $N(\lambda, \lambda)$, plotando a curva normal com a função `scipy.stats.norm.pdf` ou `numpy` equivalente.  

5. No algoritmo melhorado, o número de passos necessários para encontrar o valor sorteado é dado por
   $$
   T = 1 + |X - \lambda|, \quad X \sim \text{Poisson}(\lambda).
   $$
   (a) Usando a aproximação $X \approx N(\lambda, \lambda)$, mostre que
   $$
   \mathbb{E}[T] \;\approx\; 1 + \sqrt{\lambda}\,\mathbb{E}[|N|],
   $$
   onde $N \sim N(0,1)$.  
   (b) Calcule $\mathbb{E}[|N|]$ e conclua que
   $$
   \mathbb{E}[T] \;\approx\; 1 + \sqrt{\tfrac{2\lambda}{\pi}}.
   $$
   (c) Para $\lambda = 500$, estime empiricamente o valor médio de $T$ a partir de simulações e compare com a fórmula aproximada.


# Exercício 4: Geométrica

1. Implemente um gerador de variáveis aleatórias com distribuição Geométrica($p$) utilizando **dois métodos**:

   - **Versão ingênua (naive):** gerar sucessivamente variáveis Bernoulli($p$) até obter o primeiro sucesso;
   - **Versão via inversão:** usando $U \sim \text{Uniforme}(0,1)$, calcule
     $$
     X = \left\lfloor \frac{\log(1-U)}{\log(1-p)} \right\rfloor + 1.
     $$

2. Para um valor fixo de $p$ (por exemplo, $p = 0.3$), gere uma amostra de tamanho $10^5$ utilizando ambos os métodos.

3. Compare o **tempo de execução** dos dois métodos e discuta qual é mais eficiente.

4. Compare também as **densidades empíricas** obtidas com a distribuição gerada pela função `numpy.random.geometric` (ajustada para contar o número de falhas antes do sucesso).  

# Exercício 5: Binomial Negativa

1. Implemente um gerador de variáveis aleatórias com distribuição $\mathrm{NegBin}(r,p)$ (número de **ensaios até o $r$-ésimo sucesso**) utilizando **três métodos**:

   - **Versão soma de Bernoullis:** simule sucessivos ensaios $B_i \sim \mathrm{Bernoulli}(p)$ até acumular $r$ sucessos.  
     O número total de ensaios realizados corresponde ao valor de $X$.

   - **Versão soma de geométricas:** gere $r$ variáveis $X_i \sim \text{Geom}(p)$ via inversão,
     $$
     X_i = \left\lfloor \frac{\log(1-U_i)}{\log(1-p)} \right\rfloor + 1, 
     \quad U_i \sim \text{Uniforme}(0,1),
     $$
     e defina
     $$
     X = X_1 + \cdots + X_r.
     $$

   - **Versão via inversão recursiva:** use $U \sim \text{Uniforme}(0,1)$, inicialize $n=r$, $p_r = p^r$, $F = p_r$, e atualize
     $$
     p_{n+1} = p_n \cdot \frac{n}{\,n-r+1\,}(1-p), 
     \qquad F \leftarrow F + p_{n+1},
     $$
     até encontrar o menor $n$ tal que $F \ge U$.

2. Para valores fixos de $r$ e $p$ (por exemplo, $r=5$, $p=0.3$), gere uma amostra de tamanho $10^5$ utilizando os três métodos.

3. Compare os resultados com a função `numpy.random.negative_binomial(r, p)` **corrigida para ensaios**:
   $$
   X_{\text{NumPy}} = Y_{\text{NumPy}} + r,
   $$
   onde `numpy.random.negative_binomial(r, p)` retorna $Y$ = número de falhas antes do $r$-ésimo sucesso.

4. Faça gráficos das distribuições empíricas dos quatro métodos e compare com a **PMF teórica**.

5. Compare também o **tempo de execução** dos três métodos de simulação (soma de Bernoullis, soma de geométricas, inversão recursiva) para diferentes valores de $r$ (ex.: $r=5,20$) e $p$ (ex.: $0.1, 0.3, 0.5, 0.7, 0.9$). Discuta como $r$ e $p$ afetam a eficiência de cada método.


# Exercício 4: Hipergeométrica

Implemente um gerador de variáveis aleatórias $X \sim \text{Hipergeom}(N,K,n)$ utilizando o **algoritmo de Fisher–Yates parcial** para realizar a amostragem sem reposição.  
Compare o histograma da amostra simulada com a distribuição teórica dada por `scipy.stats.hypergeom.pmf`.
