In [1]:
import pandas as pd
import numpy as np
import scipy
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.read_csv('dados.csv')  

df.head()

## Distribuições de Probabilidade

#### Distribuição Binomial

Um evento binomial é caracterizado pela possibilidade de ocorrência de apenas duas categorias. Estas categorias somadas representam todo o espaço amostral, sendo também mutuamente excludentes, ou seja, a ocorrência de uma implica na não ocorrência da outra.

Em análises estatísticas o uso mais comum da distribuição binomial é na solução de problemas que envolvem situações de sucesso e fracasso.

# $$P(k)=\binom{n}{k} p^k q^{n-k}$$

Onde:

$p$ = probabilidade de sucesso

$q = (1 - p)$ = probabilidade de fracasso

$n$ = número de eventos estudados

$k$ = número de eventos desejados que tenham sucesso

#### Experimento Binomial

1. Realização de $n$ ensaios idênticos.

2. Os ensaios são independentes.

3. Somente dois resultados são possíveis, exemplo: Verdadeiro ou falso; Cara ou coroa; Sucesso ou fracasso.

4. A probabilidade de sucesso é representada por $p$ e a de fracasso por $1-p=q$. Estas probabilidades não se modificam de ensaio para ensaio.

#### Combinações

Número de combinações de $n$ objetos, tomados $k$ a cada vez, é:

# $$C_{k}^{n} = \binom{n}{k} = \frac{n!}{k!(n - k)!}$$

Onde

## $$n! = n\times(n-1)\times(n-2)\times...\times(2)\times(1)$$
## $$k! = k\times(k-1)\times(k-2)\times...\times(2)\times(1)$$

Por definição

## $$0! = 1$$

#### Exemplo combinação: Mega Sena

Em um volante de loteria da Mega Sena temos um total de **60 números** para escolher onde a aposta mínima é de **seis números**. Você que é curiosa(o) resolve calcular a probabilidade de se acertar na Mega Sena com apenas **um jogo**. Para isso precisamos saber quantas **combinações de seis números podem ser formadas com os 60 números disponíveis**.

### $$C_{6}^{60} = \binom{60}{6} = \frac{60!}{6!(60 - 6)!}$$

In [2]:
from scipy.special import comb

combinacoes = comb(60, 6)
combinacoes

50063860.0

In [3]:
probabilidade = 1 / combinacoes

print('%0.15f' % probabilidade)

0.000000019974489


Suponha que acabamos de criar um jogo de loteria, chamado Show de prêmios da Alura. Neste nosso novo jogo, o apostador marca 20 números, dentre os 25 disponíveis no bilhete, e pode ganhar até 1 milhão de reais.

Determine qual o número de combinações possíveis (espaço amostral) e a probabilidade de se ganhar o prêmio jogando apenas um bilhete (considere apenas quinze casas decimais).

In [4]:
combinacoes = comb(25, 20)
combinacoes

53130.0

In [5]:
probabilidade = 1 / combinacoes
print('%0.15f' % probabilidade)

0.000018821757952


Em um concurso para preencher uma vaga de cientista de dados temos um total de **10 questões** de múltipla escolha com **3 alternativas possíveis** em cada questão. **Cada questão tem o mesmo valor.** Suponha que um candidato resolva se aventurar sem ter estudado absolutamente nada. Ele resolve fazer a prova de olhos vendados e chutar todas as resposta. Assumindo que a prova **vale 10 pontos e a nota de corte seja 5**, obtenha a probabilidade deste candidato **acertar 5 questões** e também a probabilidade deste candidato **passar para a próxima etapa do processo seletivo**.

In [6]:
# Número de ensaios

n = 10
n

10

In [7]:
# Probabilidade de sucesso

numeroAlternativasPorQuestao = 3 
p = 1 / numeroAlternativasPorQuestao
p

0.3333333333333333

In [8]:
# Probabilidade de fracasso

q = 1 - p
q

0.6666666666666667

In [9]:
# Total de eventos que se deseja obter sucesso

k = 5

k

5

In [10]:
probabilidade = (comb(n, k ) * (p ** k) * (q ** (n-k)))
print('%0.8f' % probabilidade)

0.13656455


In [11]:
# Automatizado

from scipy.stats import binom

probabilidade = binom.pmf(k, n, p)
print('%0.8f' % probabilidade)

0.13656455


### $$P(acertar \geq 5) = P(5) + P(6) + P(7) + P(8) + P(9) + P10)$$

In [12]:
# Probabilidade do candidato passar

binom.pmf([5,6,7,8,9,10], n, p).sum()

0.21312808006909525

In [13]:
binom.sf(4, n, p)

0.21312808006909517

Uma moeda, perfeitamente equilibrada, é lançada para o alto quatro vezes. Utilizando a distribuição binomial, obtenha a probabilidade de a moeda cair com a face coroa voltada para cima duas vezes.

In [14]:
n = 4
p = 1/2
q = 1 - p
k = 2

probabilidade = binom.pmf(k, n, p)
print('%0.4f' % probabilidade)

0.3750


Uma cidade do interior realiza todos os anos uma gincana para arrecadar fundos para o hospital da cidade. Na última gincana se sabe que a **proporção de participantes do sexo feminino foi de 60%**. **O total de equipes, com 12 integrantes, inscritas na gincana deste ano é de 30**. Com as informações acima responda: Quantas equipes deverão ser formadas por **8 mulheres**?

In [15]:
n = 12
p = 0.6
q = 1 - p
k = 8

probabilidade = binom.pmf(k, n, p)
print('%0.5f' % probabilidade)

0.21284


Porém, queremos saber quantas dessas 30 equipes serão formadas com esta configuração, então n passará a ser 30.
Para isso, usaremos o conceito da Média de Distribuição Binomial, cuja fórmula é μ igual a n vezes esta probabilidade p de termos 8 mulheres na equipe.

In [16]:
equipes = 30 * probabilidade
round(equipes, 3)

6.385

### Média da distribuição binomial

O valor esperado ou a média da distribuição binomial é igual ao número de experimentos realizados multiplicado pela chance de ocorrência do evento.

# $$\mu = n \times p$$

Suponha que a probabilidade de um casal ter filhos com olhos azuis seja de 22%. Em 50 famílias, com 3 crianças cada uma, quantas podemos esperar que tenham dois filhos com olhos azuis?

In [17]:
n = 3
p = 0.22
q = 1 - p
k = 2

probabilidade = binom.pmf(k, n, p)
print('%0.5f' % probabilidade)

0.11326


In [18]:
50 * probabilidade

5.662799999999999

#### Distribuição Poisson

É empregada para descrever o número de ocorrências em um intervalo de tempo ou espaço específico. Os eventos são caracterizados pela possibilidade de contagem dos sucessos, mas a não possibilidade de contagem dos fracassos.

Como exemplos de processos onde podemos aplicar a distribuição de Poisson temos a determinação do número de clientes que entram em uma loja em determinada hora, o número de carros que chegam em um drive-thru de uma lanchonete na hora do almoço, a determinação do número de acidentes registrados em um trecho de estrada etc.

# $$P(k) = \frac{e^{-\mu}(\mu)^k}{k!}$$

Onde:

$e$ = constante cujo valor aproximado é 2,718281828459045

$\mu$ = representa o número médio de ocorrências em um determinado intervalo de tempo ou espaço

$k$ = número de sucessos no intervalo desejado

#### Experimento Poisson

1. A probabilidade de uma ocorrência é a mesma em todo o intervalo observado.

2. O número de ocorrências em determinado intervalo é independente do número de ocorrências em outros intervalos.

3. A probabilidade de uma ocorrência é a mesma em intervalos de igual comprimento.

#### Média da distribuição Poisson

# $$\mu$$

Um restaurante recebe em média **20 pedidos por hora**. Qual a chance de que, em determinada hora escolhida ao acaso, o restaurante receba **15 pedidos**?

In [20]:
# número médio de ocorrências por hora ( 𝜇 )

media = 20
media

20

In [21]:
# número de ocorrências que queremos obter no período ( 𝑘 )

k = 15
k

15

In [26]:
# Solução manual

probabilidade = (np.e ** (-media)) * (media ** k) / (np.math.factorial(k))

round(probabilidade, 8) * 100

5.164885

In [27]:
from scipy.stats import poisson

probabilidade =  poisson.pmf(k, media)
round(probabilidade, 8) * 100

5.164885

O número médio de clientes que entram em uma padaria por hora é igual a 20. Obtenha a probabilidade de, na próxima hora, entrarem exatamente 25 clientes.

In [31]:
media = 20
k = 25

probabilidade =  poisson.pmf(k, media)
round(probabilidade, 8) *100

4.458765