In [2]:
import pandas as pd

## <font color=white>Distribuição Binomial</font>
***

# $$P(k)=\binom{n}{k} p^k q^{n-k}$$

Onde:

$p$ = probabilidade de sucesso

$q = (1 - p)$ = probabilidade de fracasso

$n$ = número de eventos estudados

$k$ = número de eventos desejados que tenham sucesso

### Experimento Binomial

### Combinações

Número de combinações de $n$ objetos, tomados $k$ a cada vez, é:

# $$C_{k}^{n} = \binom{n}{k} = \frac{n!}{k!(n - k)!}$$

Onde

## $$n! = n\times(n-1)\times(n-2)\times...\times(2)\times(1)$$
## $$k! = k\times(k-1)\times(k-2)\times...\times(2)\times(1)$$

Por definição

## $$0! = 1$$

In [3]:
pip install scipy

Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip available: 22.3.1 -> 23.0.1
[notice] To update, run: C:\Users\User\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\python.exe -m pip install --upgrade pip


In [4]:
from scipy.special import comb

## Exemplo: Mega Sena

Em um volante de loteria da Mega Sena temos um total de **60 números** para escolher onde a aposta mínima é de **seis números**. Você que é curiosa(o) resolve calcular a probabilidade de se acertar na Mega Sena com apenas **um jogo**. Para isso precisamos saber quantas **combinações de seis números podem ser formadas com os 60 números disponíveis**.

### $$C_{6}^{60} = \binom{60}{6} = \frac{60!}{6!(60 - 6)!}$$

In [5]:
combinacoes = comb(60,6)
combinacoes

50063860.0

In [6]:
probabilidade = 1 / combinacoes
probabilidade

1.997448858318156e-08

In [7]:
probabilidade = 1 / combinacoes
## aqui quer dizer que vai colocar 15 casas decimais
print('%0.15f' % probabilidade)

0.000000019974489


In [8]:
combi = comb(25,20)
prob = 1 / combi
print(f'{prob:0.15f} | {combi}')
print('Combinações = %d e Probabilidade = %0.15f' % (combi, prob))

0.000018821757952 | 53130.0
Combinações = 53130 e Probabilidade = 0.000018821757952


Em um concurso para preencher uma vaga de cientista de dados temos um total de **10 questões** de múltipla escolha com **3 alternativas possíveis** em cada questão. **Cada questão tem o mesmo valor.** Suponha que um candidato resolva se aventurar sem ter estudado absolutamente nada. Ele resolve fazer a prova de olhos vendados e chutar todas as resposta. Assumindo que a prova **vale 10 pontos e a nota de corte seja 5**, obtenha a probabilidade deste candidato **acertar 5 questões** e também a probabilidade deste candidato **passar para a próxima etapa do processo seletivo**.

### Qual o número de ensaios ($n$)?

In [9]:
n = 10

### Os ensaios são independentes?

Sim. A opção escolhida em uma questão não influencia em nada a opção escolhida em outra questão.

### Somente dois resultados são possíveis em cada ensaio?


Sim. O candidato tem duas possibilidades, ACERTA ou ERRAR uma questão. 

### Qual a probabilidade de sucesso ($p$)?

In [10]:
numero_de_alternativas_por_questao = 3
p = 1 / numero_de_alternativas_por_questao
p

0.3333333333333333

### Qual a probabilidade de fracasso ($q$)?

In [11]:
q = 1 - p
q

0.6666666666666667

### Qual o total de eventos que se deseja obter sucesso ($k$)?


In [12]:
k = 5
k

5

### Solução 1

In [13]:
probabilidade = (comb(n,k) * (p**k) * (q**(n-k)))
print(f'{probabilidade:0.8f}')

0.13656455


In [14]:
from scipy.stats import binom

### Solução 2

In [15]:
probabilidade = binom.pmf(k,n,p)
print(f'{probabilidade:0.8f}')

0.13656455


### Obter a probabilidade do candidato passar

### $$P(acertar \geq 5) = P(5) + P(6) + P(7) + P(8) + P(9) + P10)$$

In [16]:
binom.pmf(5, n, p) + binom.pmf(6, n, p) + binom.pmf(7, n, p) + binom.pmf(8, n, p) + binom.pmf(9, n, p) + binom.pmf(10, n, p)

0.21312808006909476

In [17]:
binom.pmf([5,6,7,8,9,10],n,p).sum()

0.21312808006909476

In [18]:
1- binom.cdf(4,n,p)

0.21312808006909523

In [20]:
binom.sf(4,n,p)

0.21312808006909525

### Moeda
Uma moeda, perfeitamente equilibrada, é lançada para o alto quatro vezes. Utilizando a distribuição binomial, obtenha a probabilidade de a moeda cair com a face coroa voltada para cima duas vezes.

In [21]:
#BASE BINOM PARA CALCULO DE PROBABILIDADE = binom.pmf(k,n,p)
#Perfeito, note que a expressão "perfeitamente equilibrada" indica que a moeda usada é honesta, ou seja, apresenta a mesma probabilidade de se obter cara ou coroa.
p = 1 / 2  # Probabilidade de sair COROA
n = 4      # Total de lançamentos
k = 2      # Total de sucessos (faces COROA voltada para cima)
binom.pmf(k,n,p)

0.375

### Dado
Um dado, perfeitamente equilibrado, é lançado para o alto dez vezes. Utilizando a distribuição binomial, obtenha a probabilidade de o dado cair com o número cinco voltado para cima pelo menos três vezes.

In [22]:
p = 1 / 6   # Probabilidade
n = 10      # Total de lançamentos
k = 3       # Total de sucessos (5 caindo pelo menos 3x)
#ERRADO
binom.pmf(k,n,p)
#Está é a probabilidade de se obter o número cinco apenas três vezes. Nosso problema pede a probabilidade de obtermos o número cinco pelo menos três vezes (P (x ≥ 3)).
#SE QUEREMOS QUE O RESULTADO FOSSE PELO MENOS 3X UTILIZE O SF

0.1550453595742519

In [23]:
binom.sf(2,n,p)


0.2247732021287407

Porque 2?
Olhando na documentação podemos ver que a Survival Function vai calcular a probabilidade e subtrair de 1.

Então no nosso exercício que queremos a P (x ≥ 3), utilizamos a Survival Function com k=2, já que ela vai calcular a probabilidade de até duas vezes e subtrair, nos dando o resultado de P (x ≥ 3).
***

### Lâmpada
Uma empresa fabricante de lâmpadas sabe que, em média, 10% das lâmpadas produzidas são defeituosas. Se a empresa enviar um lote de 100 lâmpadas para um cliente, qual é a probabilidade de que menos de 5 lâmpadas sejam defeituosas?

In [41]:
p = 0.1      # Probabilidade de sair defeito
n = 100      # Total de lampadas produzidas
k = 4        # Total de sucessos (de vir pelo menos 5 lampadas defeituosas), coloquei 4 pois o 0 também conta
#Aqui utilizamos a função CDF pois ela acumula e soma, total de 0 sucessos + 1 sucesso + 2 até chegar ao 4
binom.cdf(k,n,p)

0.02371108266347688

### Compra de leite
Um estudo mostra que 60% dos clientes de um determinado supermercado compram leite integral. Se uma amostra aleatória de 200 clientes é selecionada, qual é a probabilidade de que mais de 120 comprem leite integral?

In [43]:
p = 0.6      # Probabilidade de compra
n = 200      # Total de pessoas testadas
k = 120      # minimo de 120 de compra, então pode ter 121, 122 e etc.
#Aqui utilizamos o SF pois como o mínimo é 120 logo pode ter compras a mais
binom.sf(k,n,p)

0.4731557256723586

### Futebol

Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A ganhar 4 jogos.

In [52]:
p = 1/3    # A probabilidade é 0,33333. pois o time tem tanta chance de vencer quanto empatar, não é igual a moeda
n = 6      # Total de jogos
k = 4      # Vencer 4 jogos
#Aqui utilizamos o PMF, pois ele nos trás o resultado exato, sem acumular
binom.pmf(k,n,p)

0.08230452674897114

Encontre a probabilidade do time A ganhar dois ou três jogos:

In [53]:
p = 1/3    # A probabilidade é 0,33333. pois o time tem tanta chance de vencer quanto empatar, não é igual a moeda
n = 6      # Total de jogos
k = 2      # Vencer 2 jogos
#Aqui utilizamos o PMF, pois ele nos trás o resultado exato, sem acumular
resul1 = binom.pmf(k,n,p)

In [54]:
p = 1/3    # A probabilidade é 0,33333. pois o time tem tanta chance de vencer quanto empatar, não é igual a moeda
n = 6      # Total de jogos
k = 3      # Vencer 3 jogos
#Aqui utilizamos o PMF, pois ele nos trás o resultado exato, sem acumular
resul2 = binom.pmf(k,n,p)

In [55]:
print(resul1+resul2)

0.5486968449931411


Encontre a probabilidade da equipe A vencer pelo menos um jogo

In [30]:
p = 1/3    # A probabilidade é 0,33333. pois o minimo é ele vencer um jogo, então ele pode perder ou empatar
n = 6      # Total de jogos
k = 0      # Vencer 1 jogos
#Aqui utilizamos o PMF, pois o mínimo é 1 jogo, então ele pode vencer os 6
binom.sf(k,n,p)

0.9122085048010974

### Parafusos

Seis parafusos são escolhidos ao acaso da produção de certa máquina que apresenta 10% de peças defeituosas, qual a probabilidade de serem defeituosos dois deles?

In [31]:
p = 0.1    # A probabilidade de ser defeituoso
n = 6      # Total de parafusos
k = 2      # Qual a chande de 2 serem defeituosos
#Aqui utilizamos o PMF, pois ele mostra o cálculo exato, não acumulado e nem abaixo
binom.pmf(k,n,p)

0.09841500000000003

### Moeda 2

Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de uma moeda

In [57]:
p = 0.5    # A probabilidade de cair de um lado ou de outro igual
n = 6      # Total de lançamento
k = 3      # Qual a chance de cair 3 caras
#Aqui utilizamos o PMF, pois ele mostra o cálculo exato, não acumulado e nem abaixo
binom.pmf(k,n,p)

0.31249999999999994

### Dado 2
Jogando um dado três vezes, determine a probabilidade de se obter um múltiplo de 3 duas vezes.

Obs: a probabilidade de se obter um múltiplo de 3 jogando em um dado é igual a 2/6 em fração, o que quer dizer? Existem 2 múltiplos de 3 dentro de 6 lados: 1,2,  3  ,4,5,  6.
Logo simplificando a fração o resultado é 1/3

In [33]:
p = 1/3    # Chance de cair os múltiplos de 3 simplificado
n = 3      # Total de lançamento
k = 2      # Qual a chance de cair 2
#Aqui utilizamos o PMF, pois ele mostra o cálculo exato, não acumulado e nem abaixo
binom.pmf(k,n,p)

0.2222222222222222

### Alvo
A probabilidade de um atirador acertar o alvo é de 2/3. Se ele atirar 5 vezes, qual a probabilidade de acertar exatamente 2 tiros?

In [34]:
p = 2/3    # Chance de acertar o alvo
n = 5      # Total de lançamento
k = 2      # Qual a chance de acertar 2
#Aqui utilizamos o PMF, pois ele mostra o cálculo exato, não acumulado e nem abaixo
binom.pmf(k,n,p)

0.16460905349794244

## Médias Binomiais

### Média da distribuição binomial
O valor esperado ou a média da distribuição binomial é igual ao número de experimentos realizados multiplicado pela chance de ocorrência do evento.

# $$\mu = n \times p$$

### Gincana
Uma cidade do interior realiza todos os anos uma gincana para arrecadar fundos para o hospital da cidade. Na última gincana se sabe que a **proporção de participantes do sexo feminino foi de 60%**. **O total de equipes, com 12 integrantes, inscritas na gincana deste ano é de 30**. Com as informações acima responda: Quantas equipes deverão ser formadas por **8 mulheres**?

In [35]:
p = 0.6    # Probabilidade de mulheres
n = 12     # Para formar uma equipe precisa de 12 integrantes por isso o total é 12
k = 8      # Qual a chance de ter 8 mulheres?
#Aqui utilizamos o PMF, pois ele mostra o cálculo exato, não acumulado e nem abaixo
probabilidade = binom.pmf(k,n,p)
probabilidade

0.21284093951999997

In [36]:
equipes = 30 * probabilidade
equipes

6.385228185599999

### Olhos azuis
Suponha que a probabilidade de um casal ter filhos com olhos azuis seja de 22%. Em 50 famílias, com 3 crianças cada uma, quantas podemos esperar que tenham dois filhos com olhos azuis?

In [37]:
p = 0.22
n = 3
k = 2
probabilidade = binom.pmf(k, n, p)
probabilidade

0.11325599999999993

In [38]:
familia = 50 * probabilidade
familia

5.662799999999996

### Fontes: 

* https://pt.slideshare.net/DiegoOliveira462/exerccios-resolvidos-distribuio-binomial

* https://cursos.alura.com.br/course/estatistica-probabilidade-e-amostragem