In [1]:
import pandas as pd
import numpy as np
import scipy
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.read_csv('dados.csv')  

df.head()

## Distribui√ß√µes de Probabilidade

#### Distribui√ß√£o Binomial

Um evento binomial √© caracterizado pela possibilidade de ocorr√™ncia de apenas duas categorias. Estas categorias somadas representam todo o espa√ßo amostral, sendo tamb√©m mutuamente excludentes, ou seja, a ocorr√™ncia de uma implica na n√£o ocorr√™ncia da outra.

Em an√°lises estat√≠sticas o uso mais comum da distribui√ß√£o binomial √© na solu√ß√£o de problemas que envolvem situa√ß√µes de sucesso e fracasso.

# $$P(k)=\binom{n}{k} p^k q^{n-k}$$

Onde:

$p$ = probabilidade de sucesso

$q = (1 - p)$ = probabilidade de fracasso

$n$ = n√∫mero de eventos estudados

$k$ = n√∫mero de eventos desejados que tenham sucesso

#### Experimento Binomial

1. Realiza√ß√£o de $n$ ensaios id√™nticos.

2. Os ensaios s√£o independentes.

3. Somente dois resultados s√£o poss√≠veis, exemplo: Verdadeiro ou falso; Cara ou coroa; Sucesso ou fracasso.

4. A probabilidade de sucesso √© representada por $p$ e a de fracasso por $1-p=q$. Estas probabilidades n√£o se modificam de ensaio para ensaio.

#### Combina√ß√µes

N√∫mero de combina√ß√µes de $n$ objetos, tomados $k$ a cada vez, √©:

# $$C_{k}^{n} = \binom{n}{k} = \frac{n!}{k!(n - k)!}$$

Onde

## $$n! = n\times(n-1)\times(n-2)\times...\times(2)\times(1)$$
## $$k! = k\times(k-1)\times(k-2)\times...\times(2)\times(1)$$

Por defini√ß√£o

## $$0! = 1$$

#### Exemplo combina√ß√£o: Mega Sena

Em um volante de loteria da Mega Sena temos um total de **60 n√∫meros** para escolher onde a aposta m√≠nima √© de **seis n√∫meros**. Voc√™ que √© curiosa(o) resolve calcular a probabilidade de se acertar na Mega Sena com apenas **um jogo**. Para isso precisamos saber quantas **combina√ß√µes de seis n√∫meros podem ser formadas com os 60 n√∫meros dispon√≠veis**.

### $$C_{6}^{60} = \binom{60}{6} = \frac{60!}{6!(60 - 6)!}$$

In [2]:
from scipy.special import comb

combinacoes = comb(60, 6)
combinacoes

50063860.0

In [3]:
probabilidade = 1 / combinacoes

print('%0.15f' % probabilidade)

0.000000019974489


Suponha que acabamos de criar um jogo de loteria, chamado Show de pr√™mios da Alura. Neste nosso novo jogo, o apostador marca 20 n√∫meros, dentre os 25 dispon√≠veis no bilhete, e pode ganhar at√© 1 milh√£o de reais.

Determine qual o n√∫mero de combina√ß√µes poss√≠veis (espa√ßo amostral) e a probabilidade de se ganhar o pr√™mio jogando apenas um bilhete (considere apenas quinze casas decimais).

In [4]:
combinacoes = comb(25, 20)
combinacoes

53130.0

In [5]:
probabilidade = 1 / combinacoes
print('%0.15f' % probabilidade)

0.000018821757952


Em um concurso para preencher uma vaga de cientista de dados temos um total de **10 quest√µes** de m√∫ltipla escolha com **3 alternativas poss√≠veis** em cada quest√£o. **Cada quest√£o tem o mesmo valor.** Suponha que um candidato resolva se aventurar sem ter estudado absolutamente nada. Ele resolve fazer a prova de olhos vendados e chutar todas as resposta. Assumindo que a prova **vale 10 pontos e a nota de corte seja 5**, obtenha a probabilidade deste candidato **acertar 5 quest√µes** e tamb√©m a probabilidade deste candidato **passar para a pr√≥xima etapa do processo seletivo**.

In [6]:
# N√∫mero de ensaios

n = 10
n

10

In [7]:
# Probabilidade de sucesso

numeroAlternativasPorQuestao = 3 
p = 1 / numeroAlternativasPorQuestao
p

0.3333333333333333

In [8]:
# Probabilidade de fracasso

q = 1 - p
q

0.6666666666666667

In [9]:
# Total de eventos que se deseja obter sucesso

k = 5

k

5

In [10]:
probabilidade = (comb(n, k ) * (p ** k) * (q ** (n-k)))
print('%0.8f' % probabilidade)

0.13656455


In [11]:
# Automatizado

from scipy.stats import binom

probabilidade = binom.pmf(k, n, p)
print('%0.8f' % probabilidade)

0.13656455


### $$P(acertar \geq 5) = P(5) + P(6) + P(7) + P(8) + P(9) + P10)$$

In [12]:
# Probabilidade do candidato passar

binom.pmf([5,6,7,8,9,10], n, p).sum()

0.21312808006909525

In [13]:
binom.sf(4, n, p)

0.21312808006909517

Uma moeda, perfeitamente equilibrada, √© lan√ßada para o alto quatro vezes. Utilizando a distribui√ß√£o binomial, obtenha a probabilidade de a moeda cair com a face coroa voltada para cima duas vezes.

In [14]:
n = 4
p = 1/2
q = 1 - p
k = 2

probabilidade = binom.pmf(k, n, p)
print('%0.4f' % probabilidade)

0.3750


Uma cidade do interior realiza todos os anos uma gincana para arrecadar fundos para o hospital da cidade. Na √∫ltima gincana se sabe que a **propor√ß√£o de participantes do sexo feminino foi de 60%**. **O total de equipes, com 12 integrantes, inscritas na gincana deste ano √© de 30**. Com as informa√ß√µes acima responda: Quantas equipes dever√£o ser formadas por **8 mulheres**?

In [15]:
n = 12
p = 0.6
q = 1 - p
k = 8

probabilidade = binom.pmf(k, n, p)
print('%0.5f' % probabilidade)

0.21284


Por√©m, queremos saber quantas dessas 30 equipes ser√£o formadas com esta configura√ß√£o, ent√£o n passar√° a ser 30.
Para isso, usaremos o conceito da M√©dia de Distribui√ß√£o Binomial, cuja f√≥rmula √© Œº igual a n vezes esta probabilidade p de termos 8 mulheres na equipe.

In [16]:
equipes = 30 * probabilidade
round(equipes, 3)

6.385

### M√©dia da distribui√ß√£o binomial

O valor esperado ou a m√©dia da distribui√ß√£o binomial √© igual ao n√∫mero de experimentos realizados multiplicado pela chance de ocorr√™ncia do evento.

# $$\mu = n \times p$$

Suponha que a probabilidade de um casal ter filhos com olhos azuis seja de 22%. Em 50 fam√≠lias, com 3 crian√ßas cada uma, quantas podemos esperar que tenham dois filhos com olhos azuis?

In [17]:
n = 3
p = 0.22
q = 1 - p
k = 2

probabilidade = binom.pmf(k, n, p)
print('%0.5f' % probabilidade)

0.11326


In [18]:
50 * probabilidade

5.662799999999999

#### Distribui√ß√£o Poisson

√â empregada para descrever o n√∫mero de ocorr√™ncias em um intervalo de tempo ou espa√ßo espec√≠fico. Os eventos s√£o caracterizados pela possibilidade de contagem dos sucessos, mas a n√£o possibilidade de contagem dos fracassos.

Como exemplos de processos onde podemos aplicar a distribui√ß√£o de Poisson temos a determina√ß√£o do n√∫mero de clientes que entram em uma loja em determinada hora, o n√∫mero de carros que chegam em um drive-thru de uma lanchonete na hora do almo√ßo, a determina√ß√£o do n√∫mero de acidentes registrados em um trecho de estrada etc.

# $$P(k) = \frac{e^{-\mu}(\mu)^k}{k!}$$

Onde:

$e$ = constante cujo valor aproximado √© 2,718281828459045

$\mu$ = representa o n√∫mero m√©dio de ocorr√™ncias em um determinado intervalo de tempo ou espa√ßo

$k$ = n√∫mero de sucessos no intervalo desejado

#### Experimento Poisson

1. A probabilidade de uma ocorr√™ncia √© a mesma em todo o intervalo observado.

2. O n√∫mero de ocorr√™ncias em determinado intervalo √© independente do n√∫mero de ocorr√™ncias em outros intervalos.

3. A probabilidade de uma ocorr√™ncia √© a mesma em intervalos de igual comprimento.

#### M√©dia da distribui√ß√£o Poisson

# $$\mu$$

Um restaurante recebe em m√©dia **20 pedidos por hora**. Qual a chance de que, em determinada hora escolhida ao acaso, o restaurante receba **15 pedidos**?

In [20]:
# n√∫mero m√©dio de ocorr√™ncias por hora ( ùúá )

media = 20
media

20

In [21]:
# n√∫mero de ocorr√™ncias que queremos obter no per√≠odo ( ùëò )

k = 15
k

15

In [26]:
# Solu√ß√£o manual

probabilidade = (np.e ** (-media)) * (media ** k) / (np.math.factorial(k))

round(probabilidade, 8) * 100

5.164885

In [27]:
from scipy.stats import poisson

probabilidade =  poisson.pmf(k, media)
round(probabilidade, 8) * 100

5.164885

O n√∫mero m√©dio de clientes que entram em uma padaria por hora √© igual a 20. Obtenha a probabilidade de, na pr√≥xima hora, entrarem exatamente 25 clientes.

In [31]:
media = 20
k = 25

probabilidade =  poisson.pmf(k, media)
round(probabilidade, 8) *100

4.458765