# Engenharia do Conhecimento 2021/2022
## Projecto 1 - Onde está o fantasma?


   * | *   
-----|-----
<img src="files/imagens/fantasminhae.gif" alt="Drawing" style="width: 160px;"/>|<img src="files/imagens/chuva_dados.gif" alt="Drawing" style="width: 160px;"/>




### Introdução
Um fantasma move-se no espaço com alguma incerteza. Na verdade ele não se move, são os ventos que o empurram:

<img src="files/imagens/ventoinha.gif" alt="Drawing" style="width: 200px;"/>

O espaço em que ele se move pode ser de uma ou duas dimensões, mas é sempre limitado.

<img src="files/imagens/3012_elegant_ddchicken.gif" alt="Drawing" style="width: 200px;"/>

* No caso de ser de uma só dimensão, o espaço é constituído por $N$ células, em que cada célula é representada por um inteiro, sendo $1$ a célula mais à esquerda e $N$ a célula mais à direita.
* No caso de ser de duas dimensões, o espaço é constituído por $M$ linhas e  $N$ colunas. A célula do canto superior esquerdo é representada por $(1,1)$ e a célula do canto inferior direito por $(M,N)$.  

### Modelo do Movimento
Embora haja incerteza associada ao seu movimento, que depende do poder invisível dos ventos, a deslocação do fantasma segue sempre um dado modelo probabilístico. A nova posição do fantasma apenas depende da sua posição actual, sendo assim independente das posições onde esteve antes. 

Um modelo do movimento do fantasma indica a probabilidade associada a cada um dos movimentos que pode efetuar, na sua posição atual.


#### Mundo 1D

<img src="files/imagens/satelite.gif" alt="Drawing" style="width: 200px;"/>

Um modelo de movimento para o fantasma, num mundo a uma dimensão, poderia ser caracterizado, por exemplo, pelas seguintes frases:
    
    * mantem-se no mesmo lugar com probabilidade 0.2; 
    * vai para a célula imediatamente a leste com probabilidade 0.4;
    * vai para a célula imediatamente a oeste, com 40% de probabilidade.

Notem que, quando o fantasma se tenta mover numa direção e já está no extremo do espaço nessa direção (tenta mover-se para oeste e já está na célula $1$, ou tenta mover-se para leste e já está na célula $N$), para caracterizar bem o modelo teremos que dizer o que acontece: 

    * uma das possibilidades é considerar que fica na mesma posição; 
    * outra possibilidade é considerar que "sai e reaparece na última posição no extremo oposto do espaço", isto é, o mundo funciona como uma espécie de "donut", como na imagem animada do satélite, apresentada mais acima.

#### Mundo 2D

<img src="files/imagens/4018.jpg" alt="Drawing" style="width: 200px;"/>

Um modelo possível para um fantasma-2D,  que estando numa determinada célula é empurrado por ventos (vindos do Oeste ou do Norte), pode ser dado em termos das probabilidades seguintes:

    * 20% das vezes mantém-se no mesmo lugar, 
    * 40% das vezes muda para a célula imediatamente a leste;
    * 40% das vezes vai para a célula imediatamente a sul.
    
E, também neste modelo, tal como no mundo unidimensional, o modelo pode determinar que o fantasma não sai dos limites do mundo: quando se move de encontro a um desses limites, fica no mesmo lugar. Ou alternativamente, pode determinar que o espaço funciona como um "donut": se está numa célula $(i,1)$ e vai para leste, passa para a célula no extremo oposto dessa linha, a célula $(i,N)$, e se está numa célula $(M,j)$ e vai para sul, passa para a célula no extremo oposto dessa coluna, a célula $(1,j)$.


### Distribuição Inicial
A distribuição inicial do fantasma, isto é, a probabilidade de estar numa célula do espaço no instante $t_0$,  terá também que ser dada. 

Podemos, por exemplo, saber a sua posição exacta, i.e. o fantasma tem probabilidade 1 de estar numa certa célula e 0 de estar em qualquer das restantes. Ou, noutro exemplo de distribuição inicial, o fantasma pode estar em qualquer das células com igual probabilidade. 
Podemos ter qualquer  distribuição inicial que desejarmos, como por exemplo, poder estar em duas células $x$ e $y$ do domínio com $P(x)=0.2$ e $P(y)=0.8$.

### Distribuição Conjunta Completa

Vamos modelizar este problema de modo a podermos inferir informação acerca da posição do fantasma ao longo do tempo, desde $t_0$: em $t_1$,  $t_2$,..., $t_{Max}$. Só vamos simular o movimento do fantasma até um determinado instante $(t_{Max})$.

Para isso vamos criar $Max+1$ variáveis: $X0$, $X1$, $X2$, ...$X_{Max}$, em que cada uma delas representa a posição do fantasma no respectivo instante. O domínio das variáveis é igual para todas, pois é o conjunto de células que compõem o espaço. 

Precisaremos de conhecer a distribuição inicial, isto é a distribuição de probabilidade apriori de $X_0$, e o modelo do movimento do fantasma, com os quais iremos construir a distribuição conjunta completa. 

Como referimos atrás,  a posição do fantasma num instante qualquer $t_i$, com $(i>0)$, apenas depende da posição no instante imediatamente anterior $t_{i-1}$. Isso é fundamental para podermos construir a distribuição conjunta completa, pois assegura que temos a independência condicional entre a posição do fantasma no tempo $t_i$, e qualquer conjunto de posições  anteriores a $t_{i-1}$, dada a posição em $t_{i-1}$.  A regra da cadeia para a formação da conjunta poderá ser simplificada ao levar em conta essa independência condicional.

### ...e as Inferências
A partir da distribuição conjunta completa poderemos accionar os mecanismos de inferência por enumeração para obter as respostas a perguntas como estas:

* Qual a probabilidade de se encontrar na célula $1$ num determinado instante, por exemplo $t_8$?
* Qual a probabilidade de se encontrar na célula $3$ no instante $t_{10}$ dado que esteve na célula $2$ no instante $t_6$?
* Qual a probabilidade de se encontrar na célula $3$ no instante $t_{6}$ dado que esteve na célula $2$ no instante $t_{10}$ e na célula 2 também no instante $t_9$?
* Qual a probabilidade de se encontrar na posição $2$ no instante $t_4$ e na posição $3$ no instante $t_7$?
* Qual a célula em que é mais provável que se encontre no final da simulação ($t_{Max}$), partindo de qualquer célula com igual probabilidade ou partindo da célula mais à esquerda, no caso do mundo 1D? 

## Objectivos do Mini-Projecto
O objectivo deste projecto é implementar 5 funções principais: 

* `initDist` que irá criar a distribuição inicial $X_0$;

* `go`, que representa o movimento do fantasma num passo, a partir da sua posição corrente e da informação sobre o seu modelo de movimento;

* `fantasmaConj` para construir a distribuição conjunta completa que corresponde à modelização do movimento do fantasma durante um certo número de instantes, a partir de uma distribuição inicial e de um modelo do movimento;

* `probCondFantasma` para obter uma probabilidade condicional a partir da probabilidade conjunta

* `maxProb` para devolver as células mais prováveis para o fantasma num instante.

Notem que, para a resolução do projeto, podem utilizar funções que fazem parte dos ficheiros dados, mas também podem inspirar-se em funções que fazem parte dos exercícios da TP1: por exemplo `prob_cond_calc` e `enumerate_joint_prob`.


### Função `initDist`

A função `initDist(dimensao, celulas)` devolve uma instância da class `ProbDist`, correspondente à distribuição inicial, dados a dimensão do espaço, que pode ser 1D ou 2D, e as células onde pode estar o fantasma inicialmente. O nome da variável aleatória na instância de `ProbDist`retornada pelo método deverá ser 'X0'.

O segundo parâmetro deste método, pode ser uma lista de células ou um dicionário. No caso de ser uma lista, indica as células com probabilidade positiva (omitem-se as células com probabilidade nula), tendo todas elas a mesma probabilidade de conter o fantasma. No caso de ser um dicionário, também só indicamos as células que têm probabilidade positiva, mas o dicionário permite-nos indicar para cada uma delas a respectiva probabilidade.


Vamos apresentar dois exemplos para um mundo 1D e outros dois para um mundo 2D.

1. Um espaço unidimensional com dimensão $N$ = 5, onde o fantasma pode estar na célula 1 ou na 5 com igual probabilidade:

```python
>>ini=initDist(5,[1,5])
>>ini.var_name
X0
>>ini.prob
{1: 0.5, 2: 0, 3: 0, 4: 0, 5: 0.5}
```

2. Um espaço unidimensional com dimensão $N$ = 6, onde o fantasma tem probabilidade 0.6 de estar em 1 e 0.4 de estar em 4:

```python
>>initial=initDist(6, {1 :0.6, 4: 0.4})
>> initial.prob
{1: 0.6, 2: 0, 3: 0, 4: 0.4, 5: 0, 6: 0} 
```


3. Um espaço 2D com 3 linhas e 3 colunas, onde o fantasma está com certeza na célula (1,1): 

```python
>>ini_2D=initDist((3,3),[(1,1)])
>>ini_2D.var_name
'X0'
>>ini_2D.prob
{(1, 1): 1.0, (1, 2): 0, (1, 3): 0, (2, 1): 0, (2, 2): 0, (2, 3): 0, (3, 1): 0, (3, 2): 0, (3, 3): 0}
```

4. Um espaço 2D com 2 linhas e 3 colunas, onde o fantasma pode estar nas células (1,1), (1,2) ou (2,1) com probabilidades dadas:

```python
>>ini2_2D=initDist((2,3),{(1,1):0.9,(1,2):0.05,(2,1):0.05})
>>ini2_2D.prob
{(1, 1): 0.9, (1, 2): 0.05, (1, 3): 0, (2, 1): 0.05, (2, 2): 0, (2, 3): 0 } 
```


### Função `go`

Já referimos atrás que, para poder inferir informação sobre a posição do fantasma nos vários instantes, precisaremos de um modelo probabilístico do seu movimento. 

A função `go(celula, dimensao, movimentos, donut = False)` recebe o identificador de uma célula (onde o fantasma se encontra num instante), a dimensao do espaço, e outros dois argumentos que descrevem o modelo do movimento, e retorna um dicionário que representa de um modo compacto a distribuição de probabilidade no instante seguinte. Nesse dicionário, apenas são indicadas as células possíveis no instante seguinte e as probabilidades respectivas - todas as células para as quais é impossível o fantasma ir, i.e., com probabilidade 0, são omitidas.

Os argumentos `movimentos` e `donut` (este com valor por omissão `False`) representam o modelo do movimento. Os movimentos possíveis são as direções, que vamos codificar da seguinte forma:

- 'E' representa ir para leste e 'O' representa ir para oeste. Estes movimentos podem ser utilizados quer em espaços unidimensionais quer a duas dimensões.
- 'S' representa ir para sul e 'N' representa ir para norte. Estes movimentos só podem ser utilizados em espaços bidimensionais.
- '.' representa ficar na mesma posição.

O argumento `movimentos` pode ser uma lista ou um dicionário. Caso seja uma lista de movimentos, indica que cada um desses movimentos pode ser executado com igual probabilidade (e os não constantes dessa lista têm probabilidade 0). Quando é um dicionário, indica os movimentos que podem ocorrer e as respectivas probabilidades (mais uma vez, omitem-se os movimentos com probabilidade 0).

Note que o dicionário retornado por $go(pos, dim, movimentos, donut)$ indica as probabilidades de $X_t$ = $i$, para cada célula $i$ no espaço com a dimensão $dim$, dada a evidência  $X_{t-1}$ = $pos$  (considerando o modelo de movimento representado em $movimentos$ e $donut$).



Vamos apresentar alguns exemplos, começando por usar em espaço 1D com dimensão 5:

    Note que, para garantir que os pares chave/valor nos dicionários são
    impressos ordenados pela chave,vamos usar um método auxiliar printSorted 
    assim definido:
        def printSorted(dicionario):
            print({k:v for (k,v) in sorted(dicionario.items())})



```python
>>printSorted(go(3, 5, ['E','.']))
>>printSorted(go(5, 5, ['E','.']))
{3: 0.5, 4: 0.5}
{5: 1.0}
```


```python
>>printSorted(go(1, 5, {'O': 0.45, 'E': 0.45, '.': 0.1})))
>>printSorted(go(5, 5, {'O': 0.45, 'E': 0.45, '.': 0.1}))
>>printSorted(go(3, 5, {'O': 0.45, 'E': 0.45, '.': 0.1}))
{1: 0.55, 2: 0.45}
{4: 0.45, 5: 0.55}
{2: 0.45, 3: 0.1, 4: 0.45}
```


```python
>>printSorted(go(1, 5, {'O': 0.45, 'E': 0.45, '.': 0.1}, donut = True))
>>printSorted(go(5, 5, {'O': 0.45, 'E': 0.45, '.': 0.1}, True))
>>printSorted(go(3, 5, {'O': 0.45, 'E': 0.45, '.': 0.1}, True))
{1: 0.1, 2: 0.45, 5: 0.45}
{1: 0.45, 4: 0.45, 5: 0.1}
{2: 0.45, 3: 0.1, 4: 0.45}
```

Mais uns exemplos, usando um espaço 2D com dimensão $5x5$:

```python
>>printSorted(go((2,3), (5, 5) , {'E': 0.5, 'S': 0.3, '.': 0.2}))
>>printSorted(go((2,5), (5, 5) , {'E': 0.5, 'S': 0.3, '.': 0.2}))
>>printSorted(go((5,5), (5, 5) , {'E': 0.5, 'S': 0.3, '.': 0.2}))
{(2, 3): 0.2, (2, 4): 0.5, (3, 3): 0.3}
{(2, 5): 0.7, (3, 5): 0.3}
{(5, 5): 1.0}
```
      

```python
>>printSorted(go((2,3), (5, 5) , {'E': 0.5, 'S': 0.3, '.': 0.2}, True))
>>printSorted(go((2,5), (5, 5) , {'E': 0.5, 'S': 0.3, '.': 0.2}, True))
>>printSorted(go((5,5), (5, 5) , {'E': 0.5, 'S': 0.3, '.': 0.2}, True))
{(2, 3): 0.2, (2, 4): 0.5, (3, 3): 0.3}
{(2, 1): 0.5, (2, 5): 0.2, (3, 5): 0.3}
{(1, 5): 0.3, (5, 1): 0.5, (5, 5): 0.2}
```


### Função `fantasmaConj`
A função `fantasmaConj(distIni, max, movimentos, donut=False)`, que recebe como argumentos a distribuição inicial, o instante máximo da simulação e o modelo de movimento (representado nos dois argumentos `movimentos` e `donut`), devolve a distribuição conjunta (uma instância da classe `JointProbDist` com as variáveis X0, X1,..., Xmax).

Por exemplo, se tivermos um espaço unidimensional apenas com 3 células e considerarmos $t_{Max}$ = 2 e a distribuição inicial definida a seguir

```python
>>ini=initDist(3,{1:0.6, 3: 0.4})
```
ao invocarmos

```python
>>f=fantasmaConj(ini, 2,{'E':0.3, 'O':0.2,'.':0.5})
```
se fizermos `display` de f, obteremos:

```python
>>display(f)
+----+----+----+----------------------+
| X0 | X1 | X2 |         Prob         |
+----+----+----+----------------------+
| 1  | 1  | 1  |        0.294         |
| 1  | 1  | 2  |        0.126         |
| 1  | 1  | 3  |         0.0          |
| 1  | 2  | 1  |        0.036         |
| 1  | 2  | 2  |         0.09         |
| 1  | 2  | 3  |        0.054         |
| 1  | 3  | 1  |         0.0          |
| 1  | 3  | 2  |         0.0          |
| 1  | 3  | 3  |         0.0          |
| 2  | 1  | 1  |         0.0          |
| 2  | 1  | 2  |         0.0          |
| 2  | 1  | 3  |         0.0          |
| 2  | 2  | 1  |         0.0          |
| 2  | 2  | 2  |         0.0          |
| 2  | 2  | 3  |         0.0          |
| 2  | 3  | 1  |         0.0          |
| 2  | 3  | 2  |         0.0          |
| 2  | 3  | 3  |         0.0          |
| 3  | 1  | 1  |         0.0          |
| 3  | 1  | 2  |         0.0          |
| 3  | 1  | 3  |         0.0          |
| 3  | 2  | 1  | 0.016000000000000004 |
| 3  | 2  | 2  | 0.04000000000000001  |
| 3  | 2  | 3  | 0.024000000000000004 |
| 3  | 3  | 1  |         0.0          |
| 3  | 3  | 2  | 0.06400000000000002  |
| 3  | 3  | 3  | 0.25600000000000006  |
+----+----+----+----------------------+
```

### função `probCondFantasma`

A função `probCondFantasma(pergunta, evidencia, conjunta)`, permite obter o valor da probabilidade condicional da `pergunta` dada a `evidencia`, a partir de uma distribuição conjunta anteriormente calculada.

Quer a `pergunta` quer a `evidencia` são dicionários onde as chaves são algumas das variáveis da conjunta. A `evidencia` pode ser um dicionário vazio, caso em que a probabilidade retornada é uma probabilidade incondicional ou à priori.


Vamos ver alguns exemplos de uso, para várias probabilidades conjuntas anteriormente calculadas.

Vamos primeiro considerar uma função conjunta num espaço unidimensional f_1D, calculada por:
```python
>>ini_1D = initDist(5, {1:0.6,3:0.4})
>>f_1D = fantasmaConj(ini_1D, 6, {'E':0.3, 'O':0.2,'.':0.5})
```


* Qual a probabilidade de o fantasma estar na célula 3 no instante 1? Esta pergunta corresponde a chamar esta função com a pergunta X1 = 3 e uma evidencia vazia.
```python
>>probCondFantasma(dict(X1=3), {}, f_1D)
0.2
```

* Qual a probabilidade de estar na posição 2 no instante 1 e na posição 3 no instante 2?
Esta pergunta corresponde a chamar esta função com a pergunta (X1 = 2, X2 = 3) e uma evidencia vazia.
```python
>>probCondFantasma(dict(X1=2,X2=3),{}, f_1D)
0.078
```

* Qual a probabilidade de estar na célula 3 desde o instante 0 até ao instante 3?
```python
>>probCondFantasma(dict(X0=3,X1=3,X2=3,X3=3),{}, f_1D)
0.05
```



* Qual a probabilidade de estar em $3$ no instante $t_3$ dado que esteve em $3$ no instante $t_1$?
```python
>>query = dict(X3=3)
>>evidence = dict(X1=3)
>>print("{:6f}".format(probCondFantasma(query, evidence, f_1D)))
0.370000
```


* Qual a probabilidade de estar em $3$ no instante $t_3$, dado que esteve em $2$ no instante $t_1$?
```python
>>query = dict(X3=3)
>>evidence = dict(X1=2)
>>print("{:6f}".format(probCondFantasma(query, evidence, f_1D)))
0.300000
```

* Qual a probabilidade de  em $t_1$ estar na célula $2$ e em $t_2$ na célula $3$ dado que está na célula $2$ em $t_3$ e na célula $4$ em $t_4$?
Note que neste caso a evidência é impossível, logo espera-se que a probabilidade condicional seja 0.
```python
>>query = dict(X1=2,X2=3)
>>evidence = dict(X3=2, X4 = 4)
>>print("{:6f}".format(probCondFantasma(query, evidence, f_1D)))
0.000000
```

Passemos a um mundo 2D em que temos um espaço $3x3$ e o fantasma está mesmo no topo esquerdo no instante inicial.
```python
>>ini_2D=initDist((3,3),[(1,1)])
>>f_2D=fantasmaConj(ini_2D,3,['E','.', 'O', 'S'])
```
* Qual a probabilidade de se encontrar na célula $(1,2)$ no instante $t_1$, dado que estava em $(2,3)$ no instante $t_3$?
```python
>>query = {'X1':(1,2)}
>>evidence = dict(X3=(2,3))
>>print("{:6f}".format(probCondFantasma(query, evidence, f_2D)))
0.666667
```
* Qual a probabilidade de se encontrar na célula $(2,1)$ no instante $t_1$, dado que estava em $(2,3)$ no instante $t_3$?
```python
>>query = {'X1':(2,1)}
>>evidence = dict(X3=(2,3))
>>print("{:6f}".format(probCondFantasma(query, evidence, f_2D)))
0.333333
```

### Função `maxProb`

A função `maxProb(conjunta, i)`, recebe uma distribuição conjunta e retorna a lista de células com probabilidade máxima no instante $t_i$, e a respetiva probabilidade. Assume-se que $X_i$ é uma das variáveis na distribuição conjunta dada.

```python
>>ini_1D = initDist(5, {1:0.6,3:0.4})
>>f_1D = fantasmaConj(ini_1D, 6, {'E':0.3, 'O':0.2,'.':0.5})
>>print(maxProb(f_1D, 3))
([1], 0.30139999999999995)
```

```python
>>ini_1D = initDist(5, [1,5])
>>f_1D = fantasmaConj(ini_1D, 6, ['O','E', '.'])
>>print(maxProb(f_1D, 4))
([1, 5], 0.22222222222222213)
```




## Como submeter o projeto

O grupo de alunos deve implementar as 5 funções pedidas e testá-las o melhor possível, após o que **um único aluno do grupo** deve responder ao *quiz moodle* **Projeto1** que está na página da cadeira, introduzindo aí o código das funções.

Esse *quiz* é constituído por 5 perguntas, que correspondem a cada uma das 5 funções pedidas. Cada função é avaliada com um conjunto de testes visíveis e mais alguns testes escondidos.

A última submissão é a que será considerada. Se um grupo fizer várias submissões, elas devem ser todas submetidas pelo aluno do grupo que fez a primeira submissão. 

