# <font color='blue'>Data Science Academy</font>
# <font color='blue'>Introdução à Inteligência Artificial</font>

## Probabilidade

Este notebook faz uso das implementações no módulo probabilidade.py. Vamos importar tudo do módulo de probabilidade. Poderá ser útil ver a origem de algumas das nossas implementações. 

In [1]:
from probabilidade import *

## Distribuição de probabilidade

Vamos começar especificando distribuições de probabilidade discretas. A classe **ProbDist** define uma distribuição de probabilidade discreta. Nomeamos nossa variável aleatória e então atribuímos probabilidades aos diferentes valores da variável aleatória. Atribuir probabilidades aos valores funciona de forma semelhante à de usar um dicionário com as chaves sendo o Valor e nós atribuímos a ele a probabilidade. Isso é possível por causa dos métodos mágicos **_ _getitem_ _**  e **_ _setitem_ _** que armazenam as probabilidades no prob dict do objeto. Você pode manter a janela de origem aberta ao lado enquanto toca com o resto do código para obter uma melhor compreensão.

In [2]:
%psource ProbDist

In [3]:
p = ProbDist('Flip')
p['H'], p['T'] = 0.25, 0.75
p['T']

O primeiro parâmetro do construtor ** varname ** tem um valor padrão. O argumento de palavra-chave ** freqs ** pode ser um dicionário de valores de variável aleatória: probabilidade. Estes são então normalizados de tal forma que os valores de probabilidade somam 1 usando o método ** normalize **.

In [4]:
p = ProbDist(freqs={'low': 125, 'medium': 375, 'high': 500})
p.varname

'?'

In [5]:
(p['low'], p['medium'], p['high'])

(0.125, 0.375, 0.5)

Além do ** prob ** e ** varname **, o objeto também acompanha separadamente todos os valores da distribuição em uma lista chamada ** valores **. Cada vez que um novo valor é atribuído uma probabilidade que é acrescentado a esta lista, Isto é feito dentro do método ** _ _setitem_ _ **.

In [6]:
p.values

['low', 'medium', 'high']

A distribuição por padrão não é normalizada se os valores são adicionados incrementalmente. Podemos ainda forçar a normalização invocando o método ** normalize **.

In [7]:
p = ProbDist('Y')
p['Cat'] = 50
p['Dog'] = 114
p['Mice'] = 64
(p['Cat'], p['Dog'], p['Mice'])

(50, 114, 64)

In [8]:
p.normalize()
(p['Cat'], p['Dog'], p['Mice'])

(0.21929824561403508, 0.5, 0.2807017543859649)

Também é possível exibir os valores aproximados até decimais usando o método ** show_approx **.

In [9]:
p.show_approx()

'Cat: 0.219, Dog: 0.5, Mice: 0.281'

## Distribuição de Probabilidade Conjunta

A função auxiliar ** event_values ** retorna uma tupla dos valores das variáveis no evento. Um evento é especificado por um dict onde as chaves são os nomes das variáveis e os valores correspondentes são o valor da variável. As variáveis são especificadas com uma lista. A ordenação da tupla retornada é a mesma das variáveis.


Alternativamente, se o evento é especificado por uma lista ou tupla de comprimento igual das variáveis. Em seguida, a tupla de eventos é retornada como está.

In [10]:
event = {'A': 10, 'B': 9, 'C': 8}
variables = ['C', 'A']
event_values (event, variables)

(8, 10)

Um modelo de probabilidade é completamente determinado pela distribuição conjunta para todas as variáveis aleatórias. O módulo de probabilidade implementa estas como a classe ** JointProbDist ** que herda da classe ** ProbDist **. Esta classe especifica uma distribuição de probabilidade discreta sobre um conjunto de variáveis.

In [11]:
%psource JointProbDist

Valores para uma Distribuição Conjunta é uma tupla ordenada em que cada item corresponde ao valor associado a uma determinada variável. Para a Distribuição Conjunta de X, Y onde X, Y tomam valores inteiros isto pode ser algo como (18, 19).

Para especificar uma distribuição conjunta, precisamos primeiro de uma lista ordenada de variáveis.

In [12]:
variables = ['X', 'Y']
j = JointProbDist(variables)
j

P(['X', 'Y'])

Como a classe ** ProbDist ** ** JointProbDist ** também emprega métodos mágicos para atribuir probabilidade a valores diferentes.
A probabilidade pode ser atribuída em qualquer um dos dois formatos para todos os valores possíveis da distribuição. O ** event_values ** chama ** _ _getitem_ _ ** e ** _ _setitem_ _ ** que fazem o processamento necessário para fazer este trabalho.

In [13]:
j[1,1] = 0.2
j[dict(X=0, Y=1)] = 0.5

(j[1,1], j[0,1])

(0.2, 0.5)

Também é possível listar todos os valores de uma determinada variável usando o método ** values **.

In [14]:
j.values('X')

[1, 0]

## Inferência usando distribuições de articulação completa

Nesta seção usamos Distribuições de Articulação Completa para calcular a distribuição posterior dada alguma evidência. Nós representamos a evidência usando um dicionário python com variáveis como chaves dict e valores de dict que representam os valores.

As funções ** enumerate_joint ** e ** enumerate_joint_ask ** implementam esta funcionalidade. 

In [15]:
full_joint = JointProbDist(['Cavity', 'Toothache', 'Catch'])
full_joint[dict(Cavity=True, Toothache=True, Catch=True)] = 0.108
full_joint[dict(Cavity=True, Toothache=True, Catch=False)] = 0.012
full_joint[dict(Cavity=True, Toothache=False, Catch=True)] = 0.016
full_joint[dict(Cavity=True, Toothache=False, Catch=False)] = 0.064
full_joint[dict(Cavity=False, Toothache=True, Catch=True)] = 0.072
full_joint[dict(Cavity=False, Toothache=False, Catch=True)] = 0.144
full_joint[dict(Cavity=False, Toothache=True, Catch=False)] = 0.008
full_joint[dict(Cavity=False, Toothache=False, Catch=False)] = 0.576

Vejamos agora a função ** enumerate_joint ** retorna a soma dessas entradas em P consistente com e, as variáveis fornecidas são as variáveis restantes de P (aquelas não em e). Aqui, P refere-se à distribuição completa da articulação. A função usa uma chamada recursiva em sua implementação. O primeiro parâmetro ** variáveis ** refere-se a variáveis restantes. A função em cada chamada recursiva mantém constante variável enquanto variando outros.

In [16]:
%psource enumerate_joint

Vamos supor que queremos encontrar ** P (Toothache = True) **. Isso pode ser obtido pela marginalização. Podemos usar ** enumerate_joint ** para resolver este problema tomando Toothache = True como nossa evidência. ** enumerate_joint ** retornará a soma de probabilidades consistentes com evidências, isto é, Probabilidade Marginal.

In [17]:
evidence = dict(Toothache=True)
variables = ['Cavity', 'Catch'] 
ans1 = enumerate_joint(variables, evidence, full_joint)
ans1

0.19999999999999998

Você pode verificar o resultado da nossa definição da distribuição conjunta completa. Podemos usar a mesma função para encontrar probabilidades mais complexas como ** P (Cavidade = True e Toothache = True) **

In [18]:
evidence = dict(Cavity=True, Toothache=True)
variables = ['Catch']
ans2 = enumerate_joint(variables, evidence, full_joint)
ans2

0.12

Ser capaz de encontrar a soma das probabilidades que satisfazem provas dadas nos permite calcular probabilidades condicionais como **P(Cavity=True | Toothache=True)** e podemos reescrever assim $$P(Cavity=True | Toothache = True) = \frac{P(Cavity=True \ and \ Toothache=True)}{P(Toothache=True)}$$

Já calculamos o numerador e o denominador.

In [19]:
ans2/ans1

0.6

Podemos estar interessados na distribuição de probabilidade de uma determinada variável condicionada por alguma evidência. Isso pode envolver fazer cálculos como acima para cada possível valor da variável. Isso foi implementado de forma ligeiramente diferente usando a normalização na função ** enumerate_joint_ask ** que retorna uma distribuição de probabilidade sobre os valores da variável ** X **, dadas as observações {var: val} ** e **, no * * JointProbDist P **. 

In [20]:
%psource enumerate_joint_ask

Let us find **P(Cavity | Toothache=True)** using **enumerate_joint_ask**.

In [21]:
query_variable = 'Cavity'
evidence = dict(Toothache=True)
ans = enumerate_joint_ask(query_variable, evidence, full_joint)
(ans[True], ans[False])

(0.6, 0.39999999999999997)

Você pode verificar que o primeiro valor é o mesmo que obtivemos anteriormente por cálculo manual.

In [22]:
%psource likelihood_weighting

**likelihood_weighting** Implementa o algoritmo para resolver nosso problema de inferência. O código é semelhante ao **rejection_sampling** Mas em vez de adicionar um para cada amostra, somamos o peso obtido de **weighted_sampling**.

In [23]:
likelihood_weighting('Cloudy', dict(Rain=True), sprinkler, 200).show_approx()

'False: 0.176, True: 0.824'

## Fim