# Distribuição Geométrica

Uma variável aleatória discreta $X$ segue uma _Distribuição Geométrica_ com parâmetro $p$, se:

$$
P(X=k) = p(1-p)^{k-1}
$$

Em outras palavras, a _Distribuição Geométrica_, nos auxilia na estimativa do número $k$ de tentativas necessárias para se obter um primeiro sucesso.

## Média e Variância

$$\mu=\frac{1}{p}$$
$$\sigma^2=\frac{1-p}{p^2}$$

## Geração de Dados com Distribuição Geométrica

A biblioteca _numpy_ possui um método que auxilia na produção de dados aleatórios modelados com Distribuição Geométrica.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

p = 0.2
n_pontos = 1000

pontos = np.random.geometric(p, n_pontos)

plt.hist(pontos, bins=np.arange(np.max(pontos)), density=True, rwidth=0.9)
plt.xlabel('k')
plt.ylabel('P(X=k)')
plt.show(True)

print("Valor Esperado Teórico:", 1 / p)
print("Valor Esperado Simulado:", np.sum(pontos) / len(pontos))

## Simulação

Na simulação abaixo, é considerado um número de tentativas até que um sucesso ocorra. Nesse sentido,  $X=k$ indica $k$ experimentos para que ocorram $k-1$ falhas seguidas de um sucesso.

In [None]:
import numpy as np
from matplotlib import pyplot as plt

p = 0.2
total_simulacoes = 10000

tentativas_registradas = []  # lista do número de tentativas p/ o primeiro sucesso

for _ in range(total_simulacoes):
    contagem_tentativas = 0
    houve_sucesso = False
    while not houve_sucesso:
        if np.random.uniform() <= p:
            houve_sucesso = True
        contagem_tentativas += 1
    tentativas_registradas.append(contagem_tentativas)

plt.hist(tentativas_registradas, bins=np.arange(np.max(tentativas_registradas)), density=True, rwidth=0.9)
plt.xlabel('k')
plt.ylabel('P(X=k)')
plt.show(True)