---
# Distribuições de  Probabilidade Discretas
Sumarizam as probabilidades de uma variável aleatória discreta.\
Através de uma função matemática, atribui uma probabilidade de 
saída a cada valor específico (Função massa de probabilidade)


---



## Bernoulli vs. Binomial

* **Distribuição de Bernoulli**: Descreve um **único experimento** (ou tentativa) que tem apenas dois resultados possíveis: sucesso (geralmente codificado como 1) ou fracasso (codificado como 0). A probabilidade de sucesso é denotada por $p$.
    * Nos seus exercícios, quando você simulou **um único** lançamento de moeda, **uma única** verificação de e-mail ou **um único** teste de peça, e o resultado era cara/coroa, spam/não spam, aprovada/reprovada, você estava trabalhando com a **Distribuição de Bernoulli**.
    * O código `np.random.binomial(1, p, 1)` é, na prática, uma simulação de uma variável aleatória de Bernoulli, pois o `n` (número de tentativas na Binomial) está definido como 1.

* **Distribuição Binomial**: Descreve o **número de sucessos** em uma **série de $n$ experimentos de Bernoulli independentes e identicamente distribuídos** (ou seja, a probabilidade de sucesso $p$ é a mesma para cada experimento).
    * Quando você realizou o "bônus" nos exercícios, simulando, por exemplo, 500 lançamentos de moeda e depois contando quantos resultaram em "cara" (`num_simulacoes = 500`, `cara = np.sum(lancamentos)`), você estava, de fato, trabalhando com a **Distribuição Binomial**. O resultado de interesse aqui não é o sucesso/fracasso de uma única tentativa, mas sim o **número total de sucessos** em $n$ tentativas.
    * A variável `cara` no seu código do bônus (que conta o número de sucessos em `num_simulacoes` tentativas) segue uma distribuição Binomial com parâmetros $n = \text{num\_simulacoes}$ e $p = \text{p\_cara}$.

**Em resumo:**

* A **Bernoulli** é o bloco de construção: um único evento com dois resultados.
* A **Binomial** é a soma de vários eventos de Bernoulli independentes: o número de sucessos em $n$ tentativas.

Você pode pensar na Distribuição de Bernoulli como um caso especial da Distribuição Binomial onde $n=1$.

Ótima observação! Isso mostra que você está compreendendo bem a relação entre essas duas distribuições fundamentais.


- Exemplo

In [9]:
import numpy as np

# Probabilidade de sucesso (acertar a questão)
p_sucesso = 0.25

# Realizar um único experimento de Bernoulli (chutar uma questão)
# 1 representa sucesso (acertar), 0 representa fracasso (errar)
# O parâmetro 'p' é a probabilidade de sucesso.
# O parâmetro 'size' é o número de experimentos.
chute = np.random.binomial(1, p_sucesso, 1)

if chute[0] == 1:
  print("🎉 Você acertou a questão no chute!")
else:
  print("🙁 Você errou a questão no chute.")

# Para visualizar a distribuição, podemos simular várias vezes
num_simulacoes = 1000
chutes = np.random.binomial(1, p_sucesso, num_simulacoes)

# Contar o número de sucessos e fracassos
sucessos = np.sum(chutes)
fracassos = num_simulacoes - sucessos

print(f"\n--- Simulação de {num_simulacoes} chutes ---")
print(f"Número de acertos (sucessos): {sucessos}")
print(f"Número de erros (fracassos): {fracassos}")
print(f"Probabilidade estimada de acerto: {sucessos/num_simulacoes:.2f}")

🙁 Você errou a questão no chute.

--- Simulação de 1000 chutes ---
Número de acertos (sucessos): 242
Número de erros (fracassos): 758
Probabilidade estimada de acerto: 0.24


---
- ### Exercicio

---

**Exercício 1: Lançamento de Moeda**

Uma moeda honesta é lançada.

Sucesso: Obter "Cara".
Fracasso: Obter "Coroa".
Tarefa:

- Defina a probabilidade de sucesso (obter "Cara").
- Simule um único lançamento da moeda usando a distribuição de Bernoulli.
- Imprima se o resultado foi "Cara" ou "Coroa".
- Bônus: Simule 500 lançamentos e conte quantas vezes deu "Cara" e quantas deu "Coroa".\
 Verifique se a proporção de "Caras" se aproxima da probabilidade definida.

In [10]:
import numpy as np

p_cara = 0.5

lancamento = np.random.binomial(1, p_cara, 1)

if lancamento[0] == 1:
    print('Resultado: cara')
else:
    print('Resultado: coroa')

num_simulacoes = 500

lancamentos = np.random.binomial(1, p_cara, num_simulacoes)

cara = np.sum(lancamentos)
coroa = num_simulacoes - cara

print(f'Lancamentos {num_simulacoes}')
print(f'numero de caras {cara}')
print(f'numero de coroa {coroa}')
print(f'Probabilidade estimada de cara {cara/num_simulacoes}')

Resultado: cara
Lancamentos 500
numero de caras 249
numero de coroa 251
Probabilidade estimada de cara 0.498


---

** Exercício 2: Verificação de E-mail Spam **

Um sistema de detecção de spam analisa um e-mail.

Sucesso: O e-mail é classificado como spam.\
Fracasso: O e-mail é classificado como não spam (ham).\
Considere que a probabilidade de um e-mail aleatório ser spam é de 65% (0.65).

Tarefa:

Defina a probabilidade de sucesso (e-mail ser spam).\
Simule a classificação de um único e-mail.\
Imprima se o e-mail foi classificado como "Spam" ou "Não Spam".\
Bônus: Simule a classificação de 1000 e-mails e veja quantos são classificados como spam.

In [11]:
p_spam = 0.65

evento_spam = np.random.binomial(1, p_spam, 1)

if evento_spam[0] == 1:
    print('SPAM')
else:
    print('NAO SPAM')

num_simulacoes_spam = 1000

eventos_spam = np.random.binomial(1, p_spam, num_simulacoes_spam)

spam = np.sum(eventos_spam)
n_spam = num_simulacoes_spam - spam

print(f'e-mails classificados: {num_simulacoes_spam}')
print(f'numero de spam: {spam}')
print(f'numero de nao spam: {n_spam}')
print(f'Probabilidade estimada de spam: {spam/num_simulacoes_spam}')

SPAM
e-mails classificados: 1000
numero de spam: 651
numero de nao spam: 349
Probabilidade estimada de spam: 0.651


---

** Exercício 3: Teste de Qualidade de Peça **

Uma peça é produzida em uma fábrica e passa por um teste de qualidade.

Sucesso: A peça é aprovada no teste (não tem defeito).\
Fracasso: A peça é reprovada no teste (tem defeito).\
Suponha que a probabilidade de uma peça ser produzida sem defeitos e ser aprovada é de 98% (0.98).

Tarefa:

Defina a probabilidade de sucesso (peça aprovada).\
Simule o teste de qualidade de uma única peça.\
Imprima se a peça foi "Aprovada" ou "Reprovada".\
Bônus: Simule o teste de 200 peças e conte quantas foram aprovadas.

In [12]:
p_boa = 0.98


evento_peca_produzida = np.random.binomial(1, p_boa, 1)

if evento_peca_produzida[0] == 1:
    print('Peca BOA')
else:
    print('Peca DEFEITUOSA')


num_pecas = 200

evento_pecas = np.random.binomial(1, p_boa, num_pecas)

boa = np.sum(evento_pecas)
defeituosa = num_pecas - boa

print(f'Numero de pecas analisadas: {num_pecas}')
print(f'Numero de pecas boas {boa}')
print(f'Numero de pecas defeituosas: {defeituosa}')
print(f'Probabilidade estimada de pecas boas {boa/num_pecas}')



Peca BOA
Numero de pecas analisadas: 200
Numero de pecas boas 194
Numero de pecas defeituosas: 6
Probabilidade estimada de pecas boas 0.97


---

## **Distribuição de Poisson**
A Distribuição de Poisson é uma distribuição de probabilidade discreta que expressa a probabilidade de um determinado número de eventos ocorrer em um intervalo fixo de tempo ou espaço, se esses eventos ocorrem com uma taxa média conhecida e independentemente do tempo desde o último evento.

Pense nela quando você está contando a ocorrência de algo raro em um período de tempo ou em uma área. Por exemplo:

O número de clientes que chegam a uma loja em uma hora.
O número de chamadas que um call center recebe em um minuto.
O número de defeitos em um metro quadrado de tecido.
O número de acidentes em uma rodovia por mês.
O principal parâmetro da distribuição de Poisson é λ (lambda), que representa a taxa média de ocorrência de eventos no intervalo em questão. A função massa de probabilidade (FMP) para a distribuição de Poisson é:

$$P(X=k) = \frac{e^{-\lambda} \lambda^k}{k!}$$
 
​
 

Onde:

P(X=k) é a probabilidade de ocorrerem exatamente k eventos.
e é a base do logaritmo natural (aproximadamente 2.71828).
λ (lambda) é a taxa média de ocorrências por intervalo.
k é o número de ocorrências desejado (0, 1, 2, ...).
k! é o fatorial de k.
É importante que os eventos sejam independentes e que a taxa média λ seja constante ao longo do intervalo.

**Exemplo: Chamadas para um Call Center**

Imagine que um call center recebe, em média, 7 chamadas por hora. Queremos saber a probabilidade de receber um certo número de chamadas em uma hora.

Neste caso, λ=7.

In [13]:
import numpy as np
from scipy.stats import poisson

# Taxa média de chamadas por hora (lambda)
lambda_chamadas = 7

# Qual a probabilidade de receber exatamente 5 chamadas em uma hora?
prob_5_chamadas = poisson.pmf(5, lambda_chamadas)
print(f"Probabilidade de receber exatamente 5 chamadas: {prob_5_chamadas:.4f}")

# Qual a probabilidade de receber 10 ou mais chamadas em uma hora?
# É 1 - a probabilidade de receber 0 a 9 chamadas (CDF acumulada)
prob_10_ou_mais_chamadas = 1 - poisson.cdf(9, lambda_chamadas)
print(f"Probabilidade de receber 10 ou mais chamadas: {prob_10_ou_mais_chamadas:.4f}")

# Simulação de 1000 horas para ver o número de chamadas
# O numpy.random.poisson gera amostras de uma distribuição de Poisson
num_simulacoes = 1000
chamadas_por_hora_simuladas = np.random.poisson(lambda_chamadas, num_simulacoes)

print(f"\n--- Simulação de {num_simulacoes} horas ---")
print(f"Média de chamadas simuladas: {np.mean(chamadas_por_hora_simuladas):.2f}")
print(f"Número mínimo de chamadas em uma hora simulada: {np.min(chamadas_por_hora_simuladas)}")
print(f"Número máximo de chamadas em uma hora simulada: {np.max(chamadas_por_hora_simuladas)}")

# Contar a frequência de alguns números de chamadas
from collections import Counter
frequencias = Counter(chamadas_por_hora_simuladas)
print("\nFrequência de chamadas observadas (ex.: 5, 6, 7, 8):")
for k in sorted([5, 6, 7, 8]):
    print(f"  {k} chamadas: {frequencias[k]} vezes")

Probabilidade de receber exatamente 5 chamadas: 0.1277
Probabilidade de receber 10 ou mais chamadas: 0.1695

--- Simulação de 1000 horas ---
Média de chamadas simuladas: 6.84
Número mínimo de chamadas em uma hora simulada: 0
Número máximo de chamadas em uma hora simulada: 17

Frequência de chamadas observadas (ex.: 5, 6, 7, 8):
  5 chamadas: 132 vezes
  6 chamadas: 169 vezes
  7 chamadas: 165 vezes
  8 chamadas: 117 vezes


---

- ### Exercicios

---

**Exercício 1: Chegadas em um Restaurante**
Um pequeno restaurante recebe, em média, 3 clientes a cada 15 minutos.


Tarefa:

Defina o valor de λ para o intervalo de 15 minutos.\
Usando a distribuição de Poisson, calcule a probabilidade de o restaurante receber exatamente 2 clientes nos próximos 15 minutos.\
Calcule a probabilidade de o restaurante receber mais de 5 clientes nos próximos 15 minutos.\
Bônus: Simule as chegadas de clientes em 500 intervalos de 15 minutos. Qual a média de clientes que você observou?


In [14]:
import numpy as np
from scipy.stats import poisson

lambda_clientes = 3

#probabilidade de receber exatamente 2 clientes
prob_2_clientes = poisson.pmf(2, lambda_clientes)
print(f'A probabilidade de receber exatamente 2 clientes nos proximos 15 minutos: {prob_2_clientes:.4f}')

#probabilidade de recever maid de 5 clientes
prob_5_ou_mais_clientes = 1 - poisson.pmf(4,lambda_clientes)
print(f'A probabilidade de receber  5 ou mais clientes nos proximos 15 minutos: {prob_5_ou_mais_clientes:.4f}')

#simulacao da chegada de clientes em 500 intervalos de 15 minutos
num_simulacoes_clientes = 500
clientes_por_15minutos_simulacao = np.random.poisson(lambda_clientes, num_simulacoes_clientes)

print(f'Media de clientes simulado: {np.mean(clientes_por_15minutos_simulacao)}')
print(f'Numero minimo de clientes em 15 minutos simulados: {np.min(clientes_por_15minutos_simulacao)}')
print(f'Numero maximo de clientes em 15 minutos simulados: {np.max(clientes_por_15minutos_simulacao)}')

# Frenquencia de alguns numeros de clientes
from collections import Counter

frequencia_clientes = Counter(chamadas_por_hora_simuladas)
print('\nfrequencias observadas:')
for c in sorted([0,1,2,3,4,5,6,7,8,9]):
    print(f'{c} clientes: {frequencia_clientes[c]} vezes')

A probabilidade de receber exatamente 2 clientes nos proximos 15 minutos: 0.2240
A probabilidade de receber  5 ou mais clientes nos proximos 15 minutos: 0.8320
Media de clientes simulado: 3.0
Numero minimo de clientes em 15 minutos simulados: 0
Numero maximo de clientes em 15 minutos simulados: 9

frequencias observadas:
0 clientes: 2 vezes
1 clientes: 5 vezes
2 clientes: 29 vezes
3 clientes: 56 vezes
4 clientes: 84 vezes
5 clientes: 132 vezes
6 clientes: 169 vezes
7 clientes: 165 vezes
8 clientes: 117 vezes
9 clientes: 90 vezes


---

**Exercício 2: Defeitos em um Rolo de Fio**
Uma fábrica produz rolos de fio, e sabe-se que há, em média, 0.5 defeitos por metro de fio.


Tarefa:

Defina o valor de λ para um metro de fio.\
Usando a distribuição de Poisson, calcule a probabilidade de um metro de fio ter exatamente 0 defeitos.\
Calcule a probabilidade de um metro de fio ter 2 ou mais defeitos.\
Bônus: Simule a ocorrência de defeitos em 1000 metros de fio. Conte quantos metros tiveram 0, 1 e 2 defeitos.

In [15]:
lambda_defeito_fio = 0.5

#probabilidade de ter 0 defeito
prob_0_defeito = poisson.pmf(0, lambda_defeito_fio)
print(f'A probabilidade do fio ter 0 defeito: {prob_0_defeito:.4f}')

#probabilidade de ter 2 ou mais defeitos
prob_2_ou_mais_defeitos = 1 - poisson.pmf(1, lambda_defeito_fio)
print(f'A probabilidade do fio ter 2 ou mais defeitos: {prob_2_ou_mais_defeitos:.4f}')

#simulacao para 1000 metros de fio
num_simulacoes_fio = 1000
defeitos_100m_fio_simulado = np.random.poisson(lambda_defeito_fio, num_simulacoes_fio)

print(f'\nNumero de simulacoes: {num_simulacoes_fio}')
print(f'Media de defeitos em 1000 m de fio: {np.mean(defeitos_100m_fio_simulado)}')
print(f'Numero minimo de defeitos em 1000 m de fio: {np.min(defeitos_100m_fio_simulado)}')
print(f'Numero maximo de defeitos em 1000 m de fio: {np.max(defeitos_100m_fio_simulado)}')

#frequencia de defeitos em 1000 m de fio
frequencia_defeitos_fio = Counter(defeitos_100m_fio_simulado)
print('\nFrequencia de defeitos (0,1,2):')
for d in sorted([0,1,2]):
    print(f'{d} defeitos: {frequencia_defeitos_fio[d]}')
    


A probabilidade do fio ter 0 defeito: 0.6065
A probabilidade do fio ter 2 ou mais defeitos: 0.6967

Numero de simulacoes: 1000
Media de defeitos em 1000 m de fio: 0.541
Numero minimo de defeitos em 1000 m de fio: 0
Numero maximo de defeitos em 1000 m de fio: 4

Frequencia de defeitos (0,1,2):
0 defeitos: 583
1 defeitos: 320
2 defeitos: 73


---

**Exercício 3: Ocorrências de Eventos Raros em um Site**\
Um site de notícias registra, em média, 0.1 bugs críticos por dia.

Tarefa:

Defina o valor de λ para um dia.\
Usando a distribuição de Poisson, calcule a probabilidade de não ocorrer nenhum bug crítico em um dia.\
Calcule a probabilidade de ocorrer pelo menos um bug crítico em um dia.\
Bônus: Simule a ocorrência de bugs críticos por 365 dias (um ano). Quantos dias tiveram 0 bugs, 1 bug, 2 bugs ou mais?

In [16]:
lambda_bugs = 0.1

#probabilidade de que nao ocorrra nunhum bug em um dia
prob_0_bug = poisson.pmf(0, lambda_bugs)
print(f'A probabilidade de que nao ocorra nunhum bug: {prob_0_bug:.4f}')

#probabilidade de que ocorra pelo menos um bug em um dia
prob_ao_menos_1_bug = 1 - prob_0_bug
print(f'A probabilidade de que ocorra ao menos um bug: {prob_ao_menos_1_bug:.4f}')

#simulacao para ocorrencia de bugs criticos por 365 (0,1,2 ou mais bugs)
num_simulacoes_bugs = 365
bugs_ano_simulacoes = np.random.poisson(lambda_bugs, num_simulacoes_bugs)

print(f'Numero de simulacoes: {num_simulacoes_bugs}')
print(f'Media de bugs em 1 ano: {np.mean(bugs_ano_simulacoes):.4f}')
print(f'Numero minimo de bugs em 1 ano: {np.min(bugs_ano_simulacoes)}')
print(f'Numero maximo de bugs em 1 ano: {np.max(bugs_ano_simulacoes)}')

#Frenquencia de bugs em 1 ano
frequencia_bugs = Counter(bugs_ano_simulacoes)
print('\nFrenquencia:')
for b in sorted([0,1,2,3]):
    print(f'{b} bugs {frequencia_bugs[b]} vezes')

A probabilidade de que nao ocorra nunhum bug: 0.9048
A probabilidade de que ocorra ao menos um bug: 0.0952
Numero de simulacoes: 365
Media de bugs em 1 ano: 0.1123
Numero minimo de bugs em 1 ano: 0
Numero maximo de bugs em 1 ano: 2

Frenquencia:
0 bugs 328 vezes
1 bugs 33 vezes
2 bugs 4 vezes
3 bugs 0 vezes
