# Capítulo 2 - Teorema de Bayes
## Leonardo Yves de Souza Melo
### (21)971771433 | prof.leoyves@gmail.com
## Fonte:
### 1) Think Bayes, Bayesian Statistics in Python - Allen B. Downey; Capítulo 2

# Bibliotecas

In [1]:
import pandas as pd
import numpy as np

# Exemplo 1

Supondo que você escolheu uma das tigelas ao acaso e sem olhar, pegou um cookie aleatoriamente. Se o cookie é de baunilha, qual é a probabilidade dele ser proveniente da tigela 1?

Ou seja, qual é o valor de $P(B_1|V)$?

$B_1$: evento associado à escolha ao acaso da tigela 1 na retirada de um biscoito

$B_2$: evento associado à escolha ao acaso da tigela 2 na retirada de um biscoito

$V$: evento associado à escolha ao acaso de um biscoito de baunilha independente da tigela escolhida 

$C$: evento associado à escolha ao acaso de um biscoito de chocolate independente da tigela escolhida 

In [2]:
# DataFrame com a quantidade de biscoitos em cada tigela, e seus sabores
t_ = pd.DataFrame(index=['Bowl 1','Bowl 2'])
t_['Vanilla'] = 30,20
t_['Chocolate'] = 10,20
t_['Total'] = 40,40
t_

Unnamed: 0,Vanilla,Chocolate,Total
Bowl 1,30,10,40
Bowl 2,20,20,40


* Construção do DataFrame com o index referente à cada tigela
* ``table['prior']``: gera a coluna com às probabilidades a priori de cada tigela ser escolhida ao acaso, $P(B_1)$ e $P(B_2)$

In [3]:
table = pd.DataFrame(index=['Bowl 1','Bowl 2'])
table['prior'] = 1/2,1/2
table

Unnamed: 0,prior
Bowl 1,0.5
Bowl 2,0.5


# Interpretação do teorema de Bayes a partir da atualização das probabilidades sob a inclusão de novas hipóteses

## $ P(H|D) = \frac{P(H)P(D|H)}{P(D)} $
### $H$: hipóteses

### $D$: dados

### $P(H)$: a priori 

### $P(H|D)$: a posteriori  

### $P(D|H)$: verossimilhança; probabilidade dos dados no espaço amostral reduzido das hipóteses  

### $P(D)$: probabilidade dos dados no espaço amostral $\Omega$

## Nesse notebook a correspondência entre as fórmulas e as notações dos DataFrames é dada por

* ### $P(H)\leftrightarrow$ ``table['prior']``
* ### $P(D|H)\leftrightarrow$ ``table['likelihood']``
* ### $P(H)P(D|H)\leftrightarrow$ ``table['unnorm']``
* ### $P(D)\leftrightarrow$ ``prob_data = table['unnorm'].sum()``
* ### $P(H|D)\leftrightarrow$ ``table['unnorm']/prob_data``


* ``table['likelihood']``: inclui a coluna com as verossimilhanças $P(V|B_1)$ e $P(V|B_2)$

* $P(V|B_1)$: probablidade de pegar um biscoito de baunilha dado que se está retirando biscoitos da tigela 1

* $P(V|B_2)$: probabilidade de pegar um biscoito de baunilha dado que se está retirando biscoitos da tigela 2

In [4]:
table['likelihood'] = 3/4, 1/2
table

Unnamed: 0,prior,likelihood
Bowl 1,0.5,0.75
Bowl 2,0.5,0.5


Colocando como condição que as hipóteses devem ser mutuamente excludentes e formar uma partição do conjunto de dados, o produto da probabilidade de uma hipótese $H_i$ pela verossimilhança $P(D|H_i)$ representa a probabilidade de $H_i$ interseção $D$ sem ter sido normalizada ainda, no conjunto $D$. Portanto o produto de ``table['prior']`` por ``table['likelihood']`` será chamado de ``table['unnorm']``.

No exemplo em questão teremos os produtos:
* $P(B_1)P(V|B_1)$
* $P(B_2)P(V|B_2)$

In [5]:
table['unnorm'] = table['prior']*table['likelihood']
table

Unnamed: 0,prior,likelihood,unnorm
Bowl 1,0.5,0.75,0.375
Bowl 2,0.5,0.5,0.25


Utilizando a fórmula do Teorema de Bayes, verificamos que os elementos da coluna ``unnorm`` são as interseções entre o evento $V$ e os eventos $B_i$, $i = 1,2$. Sendo essa probabilidade, computada no espaço amostral contendo as duas tigelas. A coluna ``posterior`` que será adicionada, agora, trata da normalização dessas probabilidades oriundas das interseções citadas.

## $P(V|B_i) = \frac{P(V\cap B_i)}{P(B_i)} \rightarrow P(V\cap B_i) = P(V|B_i)P(B_i)$

A probabilidade total $P(D)$ pode ser obtida usando a seguinte fórmula (lei da probabilidade total):
* Dadas as hipóteses $H_1,H_2,...,H_n$
* $P(D) = \sum_{i=1}^{n}P(D|H_i)P(H_i)$

### No exemplo fica da seguinte forma
* $P(V) = P(B_1)P(V|B_1) + P(B_2)P(V|B_2)$

Analisando a fórmula, a constatação é óbvia, se trata apenas da soma da coluna ``unnorm`` do DataFrame

In [6]:
prob_data = table['unnorm'].sum()
prob_data

0.625

Dividindo as probabilidades das hipóteses, não normalizadas pela probabildade total do conjunto de dados, finalizamos o processo com o cálculo das probailidades a posteriori relativa a cada hipótese.

## $P(H_i|D) = \frac{P(D|H_i)P(H_i)}{\sum_{i=1}^{n}P(D|H_i)P(H_i)}$

No nosso exemplo, ficará da seguinte forma
## $P(B_1|V) = \frac{P(V|B_1)P(B_1)}{P(B_1)P(V|B_1) + P(B_2)P(V|B_2)}$
## $P(B_2|V) = \frac{P(V|B_2)P(B_2)}{P(B_1)P(V|B_1) + P(B_2)P(V|B_2)}$

In [7]:
table['posterior'] = table['unnorm']/prob_data
table

Unnamed: 0,prior,likelihood,unnorm,posterior
Bowl 1,0.5,0.75,0.375,0.6
Bowl 2,0.5,0.5,0.25,0.4


Demonstração de que são probabilidades, pois a soma $P(B_1|V) + P(B_2|V)$ está normalizada

In [8]:
table['posterior'].sum()

1.0

# Exemplo 2

Supondo que eu tenha em uma caixa, um dado de 6 faces, um de 8 faces e outro de 12 faces. Escolho um dado ao acaso e o lanço, o resultado observado é igual 1. Qual é a probabilidade do dado de 6 faces ter sido o dado escolhido?

In [9]:
from fractions import Fraction

Construção de um ``DataFrame`` que represente o conjunto dos três dados

In [10]:
table2 = pd.DataFrame(index=[6,8,12])
table2.index.name = 'número de faces'

* ``table2['prior']``: coluna com a probabilidade de escolha de cada um dos dados ao acaso

* ``tabel2['likelihood']``: coluna com as probabilidades de se obter o resultado 1, no lançamento de cada um dos dados

In [11]:
table2['prior'] = Fraction(1,3)
table2['likelihood'] = Fraction(1,6),Fraction(1,8),Fraction(1,12)
table2

Unnamed: 0_level_0,prior,likelihood
número de faces,Unnamed: 1_level_1,Unnamed: 2_level_1
6,1/3,1/6
8,1/3,1/8
12,1/3,1/12


Função que automatiza o processo de cálculo, recebendo apenas um ``DataFrame`` com as probabilidades a priori e as verossimilhanças.

In [12]:
def update(table,show=False):
    """Cálculo das probabilidades a posteriori"""
    # cálculo das probabilidades não normalizadas
    # produto entre a priori e verossimilhança
    table['unnorm'] = table['prior']*table['likelihood']
    # cálculo da probabilidade dos dados independente da observações
    ## com uso da lei da probabilidade total
    prob_data = table['unnorm'].sum()
    # normalização das probabilidades de table['unnorm']
    table['posterior'] = table['unnorm']/prob_data
    if show == True:
        return prob_data, display(table)
    else:
        return prob_data

In [13]:
prob_data = update(table2)
prob_data

Fraction(1, 8)

In [14]:
table2

Unnamed: 0_level_0,prior,likelihood,unnorm,posterior
número de faces,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
6,1/3,1/6,1/18,4/9
8,1/3,1/8,1/24,1/3
12,1/3,1/12,1/36,2/9


### A probabilidade desejada vale $\frac{4}{9}$

# Exemplo 3

## The Monty Hall Problem

### créditos: http://clubes.obmep.org.br/blog/probabilidades-o-problema-de-monty-hal/

Imagine que você está de frente para três portas numeradas – 1, 2 e 3 – e o apresentador diz: <br>

*– Atrás de uma dessas portas tem um carro; mas atrás de cada uma das outras duas tem um bode. Escolha uma porta e leve para casa o que estiver atrás dela.*

``Data Frame`` que representa as três portas, com a coluna ``prior`` contendo as probabilidades do prêmio estar atrás de uma das três portas

In [15]:
table3 = pd.DataFrame(index=['Door 1','Door 2','Door 3'])
table3['prior'] = Fraction(1,3)
table3

Unnamed: 0,prior
Door 1,1/3
Door 2,1/3
Door 3,1/3


Você vai lá e escolhe uma das três portas; mas antes que você possa abri-la, o apresentador (que sabe exatamente onde está o carro) pede para você esperar e ele abre uma das portas não escolhidas, mostrando um dos bodes. Nesse momento ele faz a seguinte pergunta a você:<br>

*– Você quer ficar com a porta que você escolheu ou quer trocá-la pela outra porta fechada?*

Supondo que a porta 1 foi a escolhida, a probabilidade de ganhar o prêmio nesse caso, será igual a $\frac{1}{3}$. Agora, Monty irá abrir uma das portas que não foi escolhida. Supondo que a porta escolhida foi a porta 3. Vamos analisar em termos de eventos.

* $C_1$: o carro está atrás da porta 1
* $C_2$: o carro está atrás da porta 2
* $C_3$: o carro está atrás da porta 3
* $A$: Monty escolheu a porta 3

Sabendo que a porta 1 foi a escolhida. As probabilidades de Monty abrir a porta 3 dadas as três possibilidades de localização do carro, são as seguintes (essa são as probabilidades de abertura das portas, antes da realização do ato):
* $P(A|C_1) = \frac{1}{2}$ (Monty pode escolher ao acaso tanto a porta 2 quanto a porta 3, pois o carro está atrás da porta 1, que também é a porta escolhida por você);
* $P(A|C_2) = 1$ (Monty é obrigado a escolher a porta 3, pois não pode escolher as portas 1 e 2, a porta 1 pelo fato de já ter sido escolhida e a porta 2 por ter um prêmio, nesse caso é bom salientar que você escolheu o bode);
* $P(A|C_3) = 0$ (Se o carro estiver na porta 3, então Monty não poderá abrí-la, sendo assim, a probabilidade de ocorrência desse evento é nula);

In [16]:
table3['likelihood'] = Fraction(1,2),1,0
table3

Unnamed: 0,prior,likelihood
Door 1,1/3,1/2
Door 2,1/3,1
Door 3,1/3,0


Agora, sabendo que a porta 3 foi aberta e a porta 1 foi escolhida. A probabilidade de ganharmos o prêmio trocando da porta 1, para a porta 2, é dada por $P(C_2|A)$<br>Que é o resultado referente a linha ``Door 2`` na coluna ``posterior`` do ``DataFrame`` ``table3`` atualizado.

In [17]:
update(table3,True)

Unnamed: 0,prior,likelihood,unnorm,posterior
Door 1,1/3,1/2,1/6,1/3
Door 2,1/3,1,1/3,2/3
Door 3,1/3,0,0,0


(Fraction(1, 2), None)