# Aula 02 - Princípio da Contagem e Probabilidade
---

## Objetivos

O objetivo desta aula é introduzir a ideia de probabilidade, probabilidade condicional e independencia.


## Bibliotecas usadas

- ?


In [1]:
import pandas as pd
import numpy as np 

# Probabilidade: combinação e permutação 

## Princípio Básico da Contagem

É o princípio utilizado para encontrar o número de possibilidades para um evento constituído de $n$ etapas. Para isso, as etapas devem ser sucessivas e independentes. Se a primeira etapa do evento possui $x$ possibilidades e a segunda etapa é constituída de $y$ possibilidades, então existem $x \times y$ possibilidades. Portanto, o princípio fundamental da contagem é **a multiplicação das opções dadas para determinar o total de possibilidades**.

<center><img src="../images/permutacao.png" width="40%" style="background-color: #eee; padding: 30px; border-radius: 20px; margin: 30px 0" /></center>  

### Exemplos

- $Ex_1$.: O grêmio da faculdade é formado por 3 calouros, 4 estudantes do segundo ano, 5 estudantes do terceiro ano e 2 formandos. Quantos subcomitês podemos formar? (supondo temos um representante de cada categoria no subcomitê)

- $Ex_2$.: De quantos modos distintos eu posso ir a uma festa, se tenho: 5 camisas, 3 calças e dois pares de sapatos?

- $Ex_3$.: Quantas diferentes placas de automóvel com  caracteres são possíveis se os 3 primeiros campos forem ocupados por letras e os 4 campos finais por números?

- $Ex_4$.: No exemplo anterior quantas placas de automóvel seriam possíveis se a repetição entre letras ou número fosse proibida?

- $Ex_5$.: Uma sala possui 3 portas. De quantas maneiras a sala pode **estar aberta**?

- $Ex_5$.: A Sra. Jones possui dez livros que pretende colocar em sua prateleira. Destes, quatro são de matemática, três são de química, dois são de história e um é um livro de línguas. A Sra. Jones deseja arranjá-los de forma que todos os livros que tratam do mesmo assunto permaneçam juntos na prateleira. Quantos diferentes arranjos são possíveis?

In [63]:
# Ex1
print('Ex1: ', 3*4*5*2)

# Ex2
print('Ex2: ', 5*3*2)

# Ex3
print('Ex3: ', 26*26*26*10*10*10*10) ## 26**3 * 10**4

Ex1:  120
Ex2:  30
Ex3:  175760000


## Permutação
---

Nesta seção, discutiremos grupos de objetos exclusivos nos quais **a ordem é importante**.

### Definição de permutação

Considerando uma sequência ordenada qualquer com um número "n" de elementos distintos, qualquer outra sequência formada pelos mesmos “n” elementos reordenados é chamada de permutação.
    
### Permutação simples:

**Um arranjo de objetos sem repetição, onde a ordem é importante.**
    
    
Matematicamente, temos:
    
$$ P_n = n\cdot (n-1)\cdot (n-2)\cdot (n-3) ... \, 3 \cdot 2 \cdot 1 = n! $$
    
    
- $Ex_1$.: Uma turma de teoria de probabilidade é formada por 6 homens e 4 mulheres. Aplica-se uma prova e os estudantes são classificados de acordo com seu desempenho. Suponha que nenhum tenha tirado a mesma nota. Se os homens forem classificados apenas entre si e as mulheres apenas entre si, quantas diferentes classificações são possíveis?

- $Ex_2$.: Cinco amigos querem sentar em um sofá para tirar uma foto. De quantas formas diferentes eles podem aparecer na foto, a depender da posição em que eles se acomodem no sofá?





In [64]:
# Ex1

## homens
class_homens = 6*5*4*3*2*1 # 6! = 6*5*4*3*2*1
print(class_homens)

## meninas
class_meninas = 4*3*2*1
print(class_meninas)

class_homens + class_meninas

720
24


744

In [65]:
# Ex2

amigos = 5*4*3*2*1
amigos

120

### Permutação com repetição:

**Vamos agora determinar o número de permutações de um conjunto de n objetos quando não for possível distinguir certos objetos de outros.**
      
**Exemplos**

1. Quantos diferentes arranjos de letras podem ser formados a partir das letras AAB?
2. Quantos diferentes arranjos de letras podem ser formados a partir da palavra MAPA?

*Respostas*

1. $P_{3}^{2} = \frac{3!}{2!} = \frac{6}{2} = 3$
2. $P_{4}^{2} = \frac{4!}{2!} = \frac{24}{2} = 12$

**Outro Exemplo**: Um torneio de xadrez tem 10 competidores, dos quais 4 são russos, 3 estadunidenses, 2 ingleses e 1 brasileiro. Se o resultado listar apenas a nacionalidade são possiveis quantos resultados diferentes?
      
*Fórmula:*
     $$P_{n}^{r,s,\dots} = \frac{n!}{r!s!\dots} $$

In [69]:
## defina as funções 

def fatorial(n):


    
def permutacao_sem_repeticao(n):

    


IndentationError: expected an indented block (<ipython-input-69-4565eab1adb4>, line 7)

In [70]:
def fatorial(n):
    if n == 1:
        return n
    else:
        return n * fatorial(n-1)

In [71]:
fatorial(4)

24

In [72]:
def permutacao_sem_repeticao(n):
    return fatorial(n)

## Arranjo
---

Arranjos são agrupamentos formados com $p$ elementos de um conjunto de $n$ elementos. Arranjos são como permutações, trocas de posição entre os elementos. Mas no caso dos arranjos, são escolhidos $p$ elementos para ocupar as posições ordenadas. Os arranjos são um caso particular de permutações, já que $p \leq n$.

Matematicamente, temos:

$$A_{n}^{p} = \frac{n!}{(n - p)!}$$

- $Ex_1$.: Cinco amigos querem sentar em um sofá para tirar uma foto. De quantas formas diferentes eles podem aparecer na foto, considerando um sofá de 3 lugares, a depender da posição em que eles se acomodem no sofá?

- $Ex_2$.: Você tem um site no qual os usuários podem se registrar. Eles precisam fornecer uma senha que precise ter exatamente 8 caracteres e os caracteres não podem ser repetidos. Determine quantas combinações para senhas são possíveis. Primeiro, precisamos determinar quantos caracteres e dígitos existem no alfabeto português:

    - o número de letras: 26
    - o número de dígitos: 10




In [73]:
def arranjo(n,p):
    return fatorial(n) / fatorial(n-p)


In [74]:
#Ex 1
arranjo(5,3)

60.0

In [75]:
# Ex2
arranjo(36,8)

1220096908800.0

## Combinação 
---

<center><img src="../images/Combination.png" width="30%" style="background-color: #eee; padding: 30px; border-radius: 20px; margin: 30px 0" /></center>  

Na combinação simples, **a ordem dos elementos no agrupamento não interfere**. São arranjos que se diferenciam somente pela natureza de seus elementos. Portanto, se temos um conjunto A formado por n elementos tomados p a p, qualquer subconjunto de A formado por p elementos será uma combinação.

**Exemplo:** Quando temos 5 itens (A, B, C, D, E), quantos grupos de 3 letras conseguimos selecionar? Pense no caso que quando for selecionado ABC, ACB, BAC, BCA, CAB, CBA temos o mesmo grupo sendo contado 6 vezes.
    
Podemos pensar em:
    
$$5 * 4 * 3$$

mas, como a permutação é limitada por r  dividimos pela quantidade de vezes que um elemento se repete:
    
$$\frac{5 * 4 * 3}{3 * 2 * 1 * 2}$$

Matematicamente, temos:

$$C_{n}^{k} = \frac{n!}{k! \cdot (n - k)!}$$

In [76]:
def combinacao(n,k):
    return fatorial(n) / (fatorial(k) * fatorial(n-k))

In [77]:
combinacao(5,3)

10.0

In [78]:
arranjo(5,3)

60.0

# Probabilidade: conceitos introdutórios 

## Espaço amostral

**definição**: Chamamos de espaço amostral ao conjunto de todos os resultados possíveis de um certo fenômeno aleatório. Ele é muitas vezes representado pela letra grega $\Omega$. Os subconjuntos de $\Omega$ são denominados eventos e representados pelas letras latinas maiúsculas $A, B, \dots$ . O conjunto vazio é denotado por $\emptyset$.

A união de dois eventos A e B, denotado por $A \cup B$ representa a ocorrência de pelo menos um dos eventos A ou B. 

A intersecção do evento A com B, denotado por $A \cap B$ é a ocorrência simultanea de A e B 

Dois eventos A e B são disjuntos ou mutualmente exclusivos quando não têm elemento em comum. Isto é, $A \cap B$ =  $\emptyset$.


<center><img src="../images/conjuntos.png" width="300" height="350" /></center>

Caso dois eventos sejam disjuntos, mas a sua união seja igual à todo o Espaço Amostral, significa que eles são complementares. Ou seja, eles são os únicos eventos possíveis de ocorrer. Matematicamente, se $A \cap B = \emptyset$ e $A \cup B = \Omega$, então os eventos são complementares. O complementar de A será representado por $A^{c}$. Nesse caso, então, $A^{c} = B$ e $B^{c} = A$.


**Definição 2.1: Probabilidade**

Podemos definir então uma função `P(.)` denominada probabilidade se satisfaz as seguintes condições:
    
1. A probabilidade de um evento é sempre um número entre 0 e 1. Ou seja, $0 \leq P(A) \leq 1$.


2. A Probabilidade de ocorrer algo dentro do Espaço Amostral é 1. Ou seja, $ P(\Omega) = 1$.

3. A Probabilidade de ocorrer a união de todos os Pontos Amostrais é igual à soma da Probabilidade de ocorrer cada um dos Pontos Amostrais. Ou seja:

$$
    \sum_{w\in \Omega} P{(w)} = P\left(\bigcup_{w\in \Omega} \{w\}\right)
$$


## Como definir a probabilidade dos elementos do espaço amostral?

A primeira parte consiste na atribuição de probabilidades. Por exemplo, baseando-se em características teóricas da realização do fenômeno. Por exemplo, ao lançarmos um dado, temos o espaço amostral $\omega={1,2,3,4,5,6}$.Admitindo que o dado foi construído de forma homogênea e com medidas rigorosamente simétricas , não temos nenhuma razão para privilegiar essa ou aquela face. Assim consideramos $p(1)=p(2)=p(3)\dots$

**Exemplos:** 

1. Lançamos uma moeda duas vezes, se C indicar cara e K indicar coroa, então, temos um espaço amostral:
    
$$\Omega=[CC,CK,KC,KK]$$


> Se designarmos por A o evento que consiste na obtenção de face iguais nos dois lançamentos, então: 

$$ P(A) = P(CC) + P(KK) = \frac{1}{4} + \frac{1}{4} = \frac{2}{4} = 0.5 $$ 

2. Uma Fábrica produz um determinado artigo. Da linha de produção são retirados 3 artigos, e cada um é classificado como bom (B), ou defeituoso (D). Um espaço amostral do experimento é:
    
$$ \Omega = [BBB,BBD,BDB,DBB,DDB,DBD,BDD,DDD] $$


> Se designarmos por A o evento que consiste em obter dois artigos defeituosos:

$$ P(A) = P(DDB) + P(DBD) + P(BDD) = \frac{1}{8} + \frac{1}{8} + \frac{1}{8} = \frac{3}{8} = 0.375 $$ 

3. Considere o experimento que consiste em retirar uma lâmpada de um lote e medir seu tempo de vida antes de queimar. Um espaço amostral conveniente será:
    
$$ \Omega = [t], \quad \textrm{em que}, t \geq 0 $$


### Usando as ferramentas do python

In [1]:
from itertools import permutations, combinations, combinations_with_replacement, product

In [80]:
# espaço amostral para duas moedas: product
espaco = product(['C', 'K'], repeat=2)

for evento in espaco:
    print(evento)

('C', 'C')
('C', 'K')
('K', 'C')
('K', 'K')


In [81]:
# espaço amostral para três produtos bons ou defeituosos: product
espaco = product('BD', repeat=3)

for evento in espaco:
    print(evento)

('B', 'B', 'B')
('B', 'B', 'D')
('B', 'D', 'B')
('B', 'D', 'D')
('D', 'B', 'B')
('D', 'B', 'D')
('D', 'D', 'B')
('D', 'D', 'D')


In [82]:
# espaço amostral para dois dados: product
espaco = product('123456', repeat=2)

for evento in espaco:
    print(evento)

('1', '1')
('1', '2')
('1', '3')
('1', '4')
('1', '5')
('1', '6')
('2', '1')
('2', '2')
('2', '3')
('2', '4')
('2', '5')
('2', '6')
('3', '1')
('3', '2')
('3', '3')
('3', '4')
('3', '5')
('3', '6')
('4', '1')
('4', '2')
('4', '3')
('4', '4')
('4', '5')
('4', '6')
('5', '1')
('5', '2')
('5', '3')
('5', '4')
('5', '5')
('5', '6')
('6', '1')
('6', '2')
('6', '3')
('6', '4')
('6', '5')
('6', '6')


### Espaço amostral com eventos não uniformes

**Ex1:** Qual a probabilidade de cada evento possível no espaço amostral de dois lançamentos de uma moeda justa?
> 1/4

In [2]:
espaco = product(['C', 'K'], repeat=2)

for evento in espaco:
    print(evento)

('C', 'C')
('C', 'K')
('K', 'C')
('K', 'K')


**Ex2:** Qual a probabilidade de cada evento possível no espaço amostral de dois lançamentos de uma moeda que mostra cara 60% das vezes?
> 

In [7]:
espaco = product(['C', 'K'], repeat=2)

eventos = []
probas = []

prob_cara = 0.6
prob_coroa = 1 - prob_cara

for evento in espaco:
    
    n_caras = evento.count('C')
    n_coroas = evento.count('K')
    
    eventos.append(evento)
    
    prob_evento = prob_cara**n_caras * prob_coroa**n_coroas
    
    probas.append(prob_evento)
    
    print(evento, prob_evento)
    


('C', 'C') 0.36
('C', 'K') 0.24
('K', 'C') 0.24
('K', 'K') 0.16000000000000003


**Ex3:** Qual a probabilidade de cada evento possível no espaço amostral de dois lançamentos de uma moeda que mostar coroa 60% das vezes?
 >

In [8]:
espaco = product(['C', 'K'], repeat=2)

eventos = []
probas = []

prob_cara = 0.4
prob_coroa = 1 - prob_cara

for evento in espaco:
    
    n_caras = evento.count('C')
    n_coroas = evento.count('K')
    
    eventos.append(evento)
    
    prob_evento = prob_cara**n_caras * prob_coroa**n_coroas
    
    probas.append(prob_evento)
    
    print(evento, prob_evento)

('C', 'C') 0.16000000000000003
('C', 'K') 0.24
('K', 'C') 0.24
('K', 'K') 0.36


**Desfio:** Como reproduzir os resultados acima usando os conceitos de permutação, arranjo, etc....?
> Uma moeda está viciada: a chance de se obter uma cara usando ela é de 0,6. Qual probabilidade de essa moeda apresentar, em qualquer ordem, 3 caras e 7 coroas.

>

## Propriedades da União e Intersecção
---

Vamos supor a tabela abaixo  para idades

| idade | $n_{i}$ | $F_{i}$ | $f_{ac}$ |
|-------|---------|---------|----------|
| 17    | 9       |         |          |
| 18    | 22      |         |          |
| 19    | 7       |         |          |
| 20    | 4       |         |          |
| 21    | 3       |         |          |
| 22    | 0       |         |          |
| 23    | 2       |         |          |
| 24    | 1       |         |          |
| 25    | 2       |         |          |
|-------|---------|---------|----------|
| total |   n=50  |    1    |          |
|-------|---------|---------|----------|

Qual nosso espaço amostral ? 
> $\Omega = [17, 18, 19, 20, 21, 22, 23, 24, 25]$

Quais são as probabilidades associadas ?
> Probas = [9/50, 22/50, 7/50, 4/50, 3/50, 0, 2/50, 1/50, 2/50]

P(17) = ? 
> 9/50


### Probabilidade de união de eventos

A probabilidade de união de eventos é calculada através da regra da adição de probabilidades apresentada abaixo :

$$ P(A \cup B) = P(A) + P(B) - P ( A \cap B) $$

Temos também a definição de que um evento pode ser definido pela não ocorrência dele, ou seja, $$A^{c}$$ é a não ocorrência de A. Logo,

$$P(A) = 1 - P(A^{c})$$


Se isso é correto, então: $P(A) + P(A^{c}) = 1$.

Podemos visualizar por:

$$P (A \cup A^{c}) = P(A) + P(A^{c}) - P(A\cap A^{c}) $$

$$P (A \cup A^{c}) = 1 $$

**Exemplo:** Qual chance de jogar um dado e obter um número par **OU** um número maior que 3.

> P(n_par) = 1/2  
> P(n>3) = 1/2  
> P(intersecção) = 1 / 3  
> P(n_par ou n > 3) = $P(n_{par} \cup n>3)$ = 1/2 + 1/2 - 1/3 = 2/3  

# Probabilidade condicional e Independência
---

![venn](../images/venn.gif)


## Eventos independentes 

Quanto a ocorrência de um evento não intefere na ocorrência do outro, e vice-versa. Em outras palavras, quando a probabilidade de ocorrência de um evento A, não alterar a probabilidade de ocorrência de um evento B, e vice-versa.

$Ex_1:$ Qual a probabilida de tirar coroa no lançamento de uma moeda e 5 num dado? 

P(coroa) = 1/2  
P(5 no dado) = 1/6  
P(cora e 5) = 1/2 * 1/6 = 1/12

Qual o espaço amostral dos eventos?

    coroa 1
    coroa 2
    .
    .
    .
    coroa 6
    cara 1
    .
    .
    .
    cara 6

## Eventos dependentes
Para eventos dependentes, o cálculo da Probabilidade muda. Vamos estabelecer que:

$P(A|B)$ -> Probabilidade condicional de A dado B, ou seja, probabilidade do evento A ocorrer, dado que ocorreu o evento B

$P(A \cap B)$ -> Como já vimos, é a probabilidade dos dois eventos ocorrerem


Para eventos dependentes, Temos a seguinte função:

$$P(A|B)= \frac{P(A\cap B)}{P(B)}$$



$$ P(A|B) = \frac{\frac{A \cap B}{\omega}}{\frac{B}{\omega}}$$



E algumas vezes, passamos P(B) para o outro lado da igualdade, e a equação fica assim:

$$P(A\cap B) = P(A|B) × P(B)$$

### Exemplos

$Ex_1$.: Uma moeda é lançada duas vezes, sucessivamente. Qual é a probabilidade de tirarmos cara no segundo lançamento, sabendo que foi obtido coroa no primeiro?



In [9]:
espaco = product(['C', 'K'], repeat=2)

for evento in espaco:
    print(evento)

('C', 'C')
('C', 'K')
('K', 'C')
('K', 'K')


Resposta:
> 1/2

$Ex_2$.: De uma urna com 4 bolas brancas e 6 bolas pretas, retiram-se 2 bolas, sucessivamente, e sem reposição. Qual é a probabilidade de:

1. Ambas serem brancas?
2. A segunda ser branca?
3. A 1ª ser branca, sabendo que a 2ª é branca?


Ex2 - 1:

$P(B,B) = \frac{4}{10} x \frac{3}{9} = \frac{12}{90} = \frac{2}{15} $ 

Ex2 - 2:

$P(?,B) = P(B,B) + P(P,B) = \frac{2}{15} + \frac{6}{10}x\frac{4}{9} = \frac{2}{15} + \frac{4}{15} = \frac{2}{5} $



Ex2-3:

$P(B_1 | B_2) = \frac{P(B_1 \cap B_2)}{P(B_2)}$

$P(B_2) = P(?,B) = \frac{2}{5}$

$P(B_1 \cap B_2) = P(B,B) = \frac{2}{15} $

$P(B_1 | B_2) = \frac{2}{15} x \frac{5}{2} = \frac{1}{3}$



## Diferença entre eventos dependentes e independentes

**Abaixo está um código para criar dados falsos sobre a quantidade de coisas que as pessoas compram, de acordo com a faixa etária**.

Ele gera 100.000 "pessoas" aleatórias e as atribui aleatoriamente como tendo entre 20, 30, 40, 50, 60 ou 70 anos.

Em seguida, atribui uma menor probabilidade de os jovens comprarem coisas.

No final, temos dois dicionários Python:

- "totais" contém o número total de pessoas em cada faixa etária. 
- "compras" contém o número total de itens comprados por pessoas em cada faixa etária. 
- O total geral de compras é total de compras. 
- número total de pessoas é 100.000.

Vamos executá-lo e dar uma olhada:

In [10]:
from numpy import random
random.seed(0)

totals = {20:0, 30:0, 40:0, 50:0, 60:0, 70:0}
compras = {20:0, 30:0, 40:0, 50:0, 60:0, 70:0}
total_compras = 0
for _ in range(100000):
    Decada_ano = random.choice([20, 30, 40, 50, 60, 70])
    Probabilidade_compra = float(Decada_ano) / 100.0 ## por exemplo quem nasceu na decada 20/100
    totals[Decada_ano] += 1
    if (random.random() < Probabilidade_compra):
        total_compras += 1
        compras[Decada_ano] += 1

In [11]:
totals

{20: 16576, 30: 16619, 40: 16632, 50: 16805, 60: 16664, 70: 16704}

In [12]:
compras

{20: 3392, 30: 4974, 40: 6670, 50: 8319, 60: 9944, 70: 11713}

In [13]:
total_compras

45012

    Primeiro vamos calcular P (C | I), onde C é "compra" e I é "você está na casa dos 30 anos". A probabilidade de alguém na casa dos 30 anos comprar alguma coisa é apenas a porcentagem de quantas pessoas de 30 anos compraram alguma coisa, dada por P_I.

In [15]:
P_I = compras[30]/totals[30]
print("P(30's): " +  str(P_I))

P(30's): 0.29929598652145134


In [16]:
P_CI = compras[30] / total_compras
print('P(compras | 30s): ' + str(P_CI))

P(compras | 30s): 0.11050386563583045


    Podemos calcular tambem a probabilidade de comprar alguma coisa:

In [24]:
P_C = total_compras / 100_000
print("P(total_compras):" + str(P_C))

P(total_compras):0.45012


    Se C e I fossem independentes, esperaríamos que P (C | I) fosse aproximadamente o mesmo que P (C). Mas eles não são; P_C é 0,45 e P (C | I) é 0,11. Então, isso nos diz que C e I são dependentes (o que sabemos que são neste exemplo).

    O que é P (I) P (C)?

In [25]:
print("P(30's)P(total_compras)" + str(P_I * P_C))

P(30's)P(total_compras)0.1347191094530357


     P (C, I) é diferente de P (C | I). 

     P (C, I) seria a probabilidade de você estar na casa dos 30 anos e comprar algo (comparado com a poluação total).

# Teorema de Bayes
O **Teorema de Bayes** é um conceito importantíssimo da probabilidade e uma das ferramentas mais importantes de serem aprendidas para um Cientista de Dados. Este já foi usado em diversas aplicações reais, como por exemplo a classificação de um email como spam ou não. O Teorema de Bayes é uma forma de calcular probabilidades condicionais de forma reversa.

Vamos considerar o clássico exemplo para explicar o teorema. Temos uma determinada doença A, e um teste T utilizado para detectar esta doença. O teste não é 100% confiável, indicando pessoas que não tem a doença como doentes (falsos positivos) e não detectando a doença em pessoas que a possuem (falsos negativos), como ilustra a figura abaixo: 


<center><img src="../images/bayes_teste.jpg" width="80%" /></center>


Consideremos que 1% das pessoas possui esta doença e, logo, 99% das pessoas não a possui. O teste detecta a doença em pessoas efetivamente doentes 90% das vezes e, consequentemente, não detecta a doença em pessoas doentes em 10% dos casos. Em pessoas não doentes, o teste detecta a doença (erradamente) `em 5% dos casos` e não detecta em 95% dos casos. Podemos resumir desta forma:

|                | Pessoa Doente | Pessoa Não Doente |
|----------------|---------------|-------------------|
| Teste positivo | 90 %          | 5 %               |
| Teste Negativo | 10 %          | 95 %              |

**Agora, vamos supor que você fez o teste e o resultado deu positivo. Como devemos interpretar este resultado?**

Obviamente, existe uma chance de você possuir a doença e uma chance de não possuir. A chance de você ter a doença e o teste detecta-la (verdadeiro positivo) é igual a chance de você ter a doença multiplicado pela chance do teste ter dado positivo corretamente. 

Analogamente, a chance de você não ter a doença e o teste detecta-la mesmo assim (falso positivo) é igual a chance de você não ter a doença multiplicado pela chance do teste ter dado positivo incorretamente, e assim por diante, para todos os resultados. Atualizamos então a tabela, que fica assim:

|                | Pessoa Doente                            | Pessoa Não Doente                               |
|----------------|------------------------------------------|-------------------------------------------------|
| Teste positivo | Prob Doente e teste pos: 1% × 90% = 0,9% | Prob Não Doente e teste pos: 99% × 5% = 4,95%   |
| Teste Negativo | Prob Doente e teste neg: 1% × 10% = 0,1% | Prob Não Doente e teste neg: 99% × 95% = 94,05% |

Estas então são nossas probabilidades para cada evento. Note que, se somadas, o resultado é 1, ou 100%. Mas agora temos uma dúvida. Se nosso teste deu positivo, qual a chance de termos a doença? 

Considerando o cálculo básico de probabilidade, temos que a chance de ter a doença é igual à chance do evento desejado dividido por todas as possibilidades. O evento desejado é um positivo verdadeiro, ou seja, teste positivo e a pessoa com doença. Para este caso, a probabilidade é de 0,9%. 

O total de possibilidades com relação ao teste positivo seria a soma da probabilidade de “Doente e teste pos” (verdadeiro positivo) com “Não Doente e teste pos” (falso positivo), que resultará em 0,9% + 4,95%, igual a 5,85%. 

Fazendo toda a conta então, nossa chance de ter a doença se temos um teste positivo é de 0,9%/5,85% = 0.1538, ou 15,38%. É uma chance bem mais baixa do que imaginamos apenas ao olhar para o problema e para a suposta precisão do teste.

## Formulação matemática

* P(D|A) = Probabilidade de ter a doença dado um teste positivo (este é a probabilidade que desejamos saber)

* P(D) = Probabilidade da pessoa ter a doença = 1%

* P(A|D) = Probabilidade de um teste positivo se a pessoa tem a doença = 0,9% (

* P(A|¬D) = Probabilidade de um teste positivo se a pessoa não tem a doença = 4,95%

    **O Teorema de bayes diz que :**
    
    
$$ P(D|A) = \frac{P(A|D) * P(D)}{P(A|D) * P(D)  + P(A|nao D) * P(nao D)}    $$


Um excelente video ilustrativo pode ser encontrado [aqui](https://www.youtube.com/watch?v=HZGCoVF3YvM&t=0s).

In [None]:
# A probabilidade de uma pessoa ter certa doença A é de 1%
# consequentemente, a probabilidade de não ter a doença é de 99%


# Um teste T para detectar a doença não é 100% confiável, detectando
# a doença em pessoas não doentes e não detectando em pessoas doentes

# O teste detecta a doença em pessoas doentes em 90% dos casos
# e não detecta a doença em pessoas doentes em 10% dos casos


# O teste detecta a doença em pessoas não doentes em 5% dos casos
# e não detecta a doença em pessoas não doentes em 95% dos casos


# Verdadeiro positivo: chance de ter a doença e o teste dar positivo


# Verdadeiro negativo: chance de não ter a doença e o teste dar negativo

# Falso positivo: chance de não ter a doença e o teste dar positivo

# Falso negativo: chance de ter a doença e o teste dar negativo


# Fizemos o teste e o resultado foi positivo. Qual a chance de eu ter a doença?
# Teorema de Bayes: P(D|A) = (P(A|D) * P(D)) / (P(A|D) * P(D) + P(A|¬D) * P(¬D))



## Exemplo

Uma companhia multinacional tem três fábricas que produzem o mesmo tipo de produto. A fábrica I é responsável por 30% do total produzido, a fábrica II produz 45% do total, e o restante vem da fábrica III. Cada uma das fábricas, no entanto, produz uma proporção de produtos que não atendem aos padrões estabelecidos pelas normas internacionais. Tais produtos são considerados "defeituosos" e correspondem a 1%, 2% e 1,5%, respectivamente, dos totais produzidos por fábrica.

No centro de distribuição, é feito o controle de qualidade da produção combinada das fábricas.

1. Qual é a probabilidade de encontrar um produto defeituoso durante a inspeção de qualidade?
2. Se durante a inspeção encontrarmos um produto defeituoso, qual é a probabilidade de que ele tenha sido produzino na Fábrica II?