# Distribuição Binomial

In [1]:
import pandas as pd
import numpy as np

In [2]:
dados = pd.read_excel("../Arquivos/dados.xlsx")
dados.head(3)

Unnamed: 0,UF,Sexo,Idade,Cor,Anos de Estudo,Renda,Altura
0,11,0,23,8,12,800,1603807616
1,11,1,23,2,12,1150,1739789827
2,11,1,35,8,15,880,1760443822


## <font color=red>Problema</font>
***

Em um concurso temos um total de **10 questões** com **3 alternativas possíveis**. **Cada questão tem o mesmo valor.** Suponha que um candidato resolva chutar todas as resposta. Assumindo que a prova **vale 10 pontos e a nota de corte seja 5**, obtenha a probabilidade dele **acertar 5 questões** e também a probabilidade dele **passar para a próxima etapa do processo seletivo**.

### Distribuição Binomial

A distribuição binomial é usada para calcular a probabilidade de um número específico de sucessos em um certo número de tentativas, quando cada tentativa tem apenas dois resultados possíveis: sucesso ou fracasso.
***

### $$P(k)=\binom{n}{k} p^k q^{n-k}$$

Onde:

$p$ = probabilidade de sucesso

$q = (1 - p)$ = probabilidade de fracasso

$n$ = número de eventos estudados

$k$ = número de eventos desejados que tenham sucesso

### Experimento Binomial

1. Realização de $n$ ensaios idênticos.

2. Os ensaios são independentes.

3. Somente dois resultados são possíveis, exemplo: Verdadeiro ou falso; Cara ou coroa; Sucesso ou fracasso.

4. A probabilidade de sucesso é representada por $p$ e a de fracasso por $1-p=q$. Estas probabilidades não se modificam de ensaio para ensaio.

### Média da distribuição binomial

O valor esperado ou a média da distribuição binomial é igual ao número de experimentos realizados multiplicado pela chance de ocorrência do evento.

# $$\mu = n \times p$$

### Desvio padrão da distribuição binomial

O desvio padrão é o produto entre o número de experimentos, a probabilidade de sucesso e a probabilidade de fracasso.

# $$\sigma = \sqrt{n \times p \times q}$$

In [6]:
# Importando combinações
from scipy.special import comb

### Combinações

Número de combinações de $n$ objetos, tomados $k$ a cada vez, é:

## $$C_{k}^{n} = \binom{n}{k} = \frac{n!}{k!(n - k)!}$$

Por definição

## $$0! = 1$$

## <font color='blue'>Exemplo: Mega Sena</font>

Em uma Mega Sena temos um total de **60 números** para escolher onde a aposta mínima é de **seis números**. Você resolve calcular a probabilidade de acertar com apenas **um jogo**. Para isso precisamos saber quantas **combinações de seis números podem ser formadas com os 60 números disponíveis**.

### $$C_{6}^{60} = \binom{60}{6} = \frac{60!}{6!(60 - 6)!}$$

#### Resolvendo com o metodo comb

In [7]:
combinacoes = comb(60, 6)
combinacoes

50063860.0

#### Qual a probabilidade de acertar na mega sena??

In [11]:
probabilidade = (1 / combinacoes)
print('%0.15f' % probabilidade)

0.000000019974489


## <font color='blue'>Exemplo: Concurso para cientista de dados</font>

Em um concurso temos um total de **10 questões** com **3 alternativas possíveis**. **Cada questão tem o mesmo valor.** Suponha que um candidato resolva chutar todas as resposta. Assumindo que a prova **vale 10 pontos e a nota de corte seja 5**, obtenha a probabilidade dele **acertar 5 questões** e também a probabilidade dele **passar para a próxima etapa do processo seletivo**.

### Qual o número de ensaios ($n$)?

In [13]:
n = 10

### Os ensaios são independentes?

Sim. A opção escolhida em uma questão não influencia em nada a opção escolhida em outra questão.

### Somente dois resultados são possíveis em cada ensaio?

Sim. O candidato tem duas possibilidades, ACERTA ou ERRAR uma questão. 

### Qual a probabilidade de sucesso ($p$)?

In [15]:
numero_de_alternativas_por_questao = 3
p = 1 / numero_de_alternativas_por_questao
p

0.3333333333333333

### Qual a probabilidade de fracasso ($q$)?

In [16]:
q = 1 - p
q

0.6666666666666667

### Qual o total de eventos que se deseja obter sucesso ($k$)?

In [17]:
k = 5