# Bibliotecas e Módulos

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot
from empiricaldist import Pmf

In [2]:
from os.path import basename, exists

def download(url):
    filename = basename(url)
    if not exists(filename):
        from urllib.request import urlretrieve
        local, _ = urlretrieve(url, filename)
        print('Downloaded ' + local)
    
download('https://github.com/AllenDowney/ThinkBayes2/raw/master/soln/utils.py')

In [3]:
from utils import set_pyplot_params
set_pyplot_params()

from utils import decorate

def decorate_bowls(title):
    decorate(xlabel='Bowl #',
             ylabel='PMF',
             title=title)

A classe `Pmf` representa uma função massa de probabilidade. No exemplo abaixo, `coin`se trata de uma moeda, e por se tratar de um espaço amostral discreto, podemos determinar todos os seus elementos e as suas probabilidades associadas. E isso é feito através da atribuição de valores às linhas `heads` (cara) e `tails` (coroa).

In [4]:
# construção da pmf sem atribuição de valores
coin = Pmf()
display(coin)

# atualização do DataFrame que representa a pmf
coin['heads']=1/2; coin['tails']=1/2
display(coin)

Unnamed: 0,probs


Unnamed: 0,probs
heads,0.5
tails,0.5


No exemplo abaixo, construímos a pmf associada aos resultados do lançamento de um dado equilibrado de seis faces.

In [5]:
die = Pmf.from_seq([1,2,3,4,5,6])
die

Unnamed: 0,probs
1,0.166667
2,0.166667
3,0.166667
4,0.166667
5,0.166667
6,0.166667


É permitida a computação das probabilidades referentes à valores repetidos na sequência inserida no método `from_seq`

In [6]:
letters = Pmf.from_seq(list('Mississippi'))
letters

Unnamed: 0,probs
M,0.090909
i,0.363636
p,0.181818
s,0.363636


Pode-se utilizar a indexação dos elementos para recuperação de valores, ou também chamar o objeto Pmf, tal qual uma função.

In [7]:
letters['s']

0.36363636363636365

In [8]:
letters('s')

0.36363636363636365

Observe que enquanto função, é permitida a verificação de valores ausentes do espaço amostral, já utilizando os colchetes de indexação, é retornado um aviso de erro.

In [9]:
letters('t')

0

In [10]:
letters['t']

KeyError: 't'

Tal qual um objeto `Series`, é possível verificar diversos valores simultâneamente

In [13]:
die([1,4,7])

array([0.16666667, 0.16666667, 0.        ])

# Nova resolução do exemplo 1 do capítulo 2

Construção das probabilidades a priori por meio do objeto Pmf

In [14]:
prior = Pmf.from_seq(['Bowl 1','Bowl 2'])
prior

Unnamed: 0,probs
Bowl 1,0.5
Bowl 2,0.5


Utilizando o léxico do Teorema de Bayes: acabamos de construir a distribuição a priori do problema, pois se trata da probabilidade das hipóteses sem a verificação dos dados.

Abaixo temos as verossimilhanças e atualização da planilha a partir da observação dos dados, tendo conhecimento das hipóteses.

In [15]:
likelihood_vanilla = [0.75,0.5]
posterior = prior*likelihood_vanilla
posterior

Unnamed: 0,probs
Bowl 1,0.375
Bowl 2,0.25


Finalizamos com a construção da distribuição a posteriori por meio da normalização das probabilidades calculadas anteriormente.<br>
O valor retorno é a probabilidade dos dados observados, sem levar em consideração as hipóteses

In [16]:
posterior.normalize()

0.625

In [17]:
posterior

Unnamed: 0,probs
Bowl 1,0.6
Bowl 2,0.4


# 101 tigelas!