# Distribuições Discretas

Distribuições de probabilidade discretas descrevem situações onde:
* O resultado é uma contagem.
* Os valores possíveis são inteiros (0, 1, 2, 3, ...)

## Exemplos
* Número de defeitos em um produto
* Número de clientes que chegam por hora
* Número de sucessos em uma sequência de tentativas.

## Distribuição Binomial

Modela o número de sucessos em um número fixo de tentativas, onde cada tentativa:
* Tem apenas 2 resultados (sucesso/falha)
* possui probabilidade fixa de sucesso

Geralmente utilizamos esse tipo de distribuição quando:
* Temos um número fixo de tentativas
* Cada tentativa é independente uma da outra
* O resultado é um sucesso ou fracasso

Por exemplo: "Quantos clientes compram após ver um anúncio? (sim/não)"

In [None]:
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

# Definindo uma seed para o gerador de números aleatórios
np.random.seed(42)

# Simulação de uma distribuição binomial
# Exemplo: 10 tentativas, probabilidade de sucesso de 30% (0.3)

n = 10              # Número de tentativas
p = 0.3             # Probabilidade de sucesso de cada tentativa
size = 1000         # Quantidade de experimentos simulados

# Abaixo o numpy simula 1000 experimentos binomiais. Cada valor gerado representa quantos sucessos ocorreram em um experimento.
# Por exemplo: 4 -> em 10 tentativas, houve 4 sucessos
dados_binomial = np.random.binomial(n=n, p=p, size=size)

# Visualização
plt.figure(figsize=(10, 5))

# O parâmetro discrete indica que os dados são discretos, ou seja, de uma distribuição desse tipo
sns.histplot(dados_binomial, bins=range(0, n + 2), discrete=True)

media_dados = dados_binomial.mean()

plt.axvline(media_dados, color='red', linestyle='--', label="Média")
plt.title("Distribuição Binomial (n=10, p=0.3)")
plt.xlabel("Número de sucessos")
plt.ylabel("Frequência")
plt.legend()
plt.show()

# Quantas vezes ocorreu 0, 1, 2, 3, ...
# Valores próximos da média aparecem mais
# Valores mais distantes da média aparecem menos
print(f"Média: {media_dados}")

## Distribuição de Poisson

Modela o número de eventos que ocorrem em um intervalo fixo, quando:
* Os eventos são raros individualmente
* Ocorrem de forma aleatório
* Existe uma faixa média conhecida.

Geralmente, utilizada para casos como:
* Número de chamadas por dia
* Número de falhas por dia
* Número de clientes que chegam em um determinado intervalo.

In [None]:
# Distribuição de Poisson

import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

# Exemplo: média de 4 eventos por intervalo

# O símbolo lambda é utilizado para representar essa distribuição
lambda_poisson = 4  # Média de eventos por intervalo
size = 1000         # Número de intervalos simulados

dados_poisson = np.random.poisson(lam=lambda_poisson, size=size)

# Cada valor gerado indica quantos eventos ocorreram em um intervalo. Ou seja, 3 -> ocorreram 3 eventos naquele intervalo

# Visualização
plt.figure(figsize=(10, 5))

sns.histplot(
    dados_poisson,
    bins=range(0, max(dados_poisson) + 2),
    discrete=True
)

plt.title("Distribuição de Poisson (lambda = 4)")
plt.xlabel("Número de eventos")
plt.ylabel("Frequência")
plt.show()

* Valores próximos a lambda (4) são mais frequentes
* Eventos muito acima da média são raros