# Sistemas Inteligentes

## Paradigma do Espaços de Estados: parte 2


## Conteúdos

* O problema dos jarros
* Exercícios

## Revisão

Vamos formular mais um problema através do Paradigma do Espaço de Estados, usando o Python e a ferramanta [aima-python](https://github.com/aimacode/aima-python).

Note que formular neste caso, quer dizer construir uma programa em Python.

Recordando, para formularmos um problema de acordo com esta metododologia, precisamos de:
* **Estados**: Idealizar uma representação para o que vamos considerar um estado. Notem que o estado deve ser mínimo, apenas deve conter a informação que muda com as acções; 
* **Estado Inicial**: Identificar o estado inicial;
* **Objetivo**: Verificar se um estado satisfaz o objetivo, sendo assim, um dos estados finais;
* **Acções**: Para cada estado, caracterizar rigorosamente as acções de mudança de estado, de que modo incrementam os custos dos caminhos, e quais os estados resultantes.

In [2]:
from typing import List

from searchPlus import *

### O problema dos Jarros

Recordemos o enunciado:
Imagine que tem dois jarros com capacidade para 3 e 5 litros. Pretende-se medir 4 litros de vinho, usando as seguintes operações: encher um jarro, esvaziar um jarro, ou verter vinho de um jarro para outro.

<img src="figures/water22.png" alt="Drawing" style="width: 300px;"/>

#### Representação dos estados
Podemos definir um tuplo com o líquido em cada um dos jarros. É essa a informação que muda com as acções. A capacidade dos jarros deve ficar no problema, é informação estática. O tuplo que colocaremos no problema referente às capacidades dos jarros tem de respeitar a mesma ordem do estado.
Não precisaremos de redefinir o método ***eq()*** porque estamos a usar tuplos como estado.
A impressão do estado em modo texto é a da classe **tuple**.

#### Problema
Na verdade, podemos avançar já para a definição da classe do Problema, fazendo notar que podemos ter mais do que 2 jarros. 
Como não sabemos o estado final apenas poderemos indicar no atributo **goal** qual o líquido que desejamos obter num dos jarros.

Precisaremos de indicar as capacidades dos jarros, o que faremos num tuplo que sincroniza com o estado: o primeiro elemento do estado é a quantidade de liquido existente no jarro com capacidade indicada no primeiro elemento do tuplo **capacidade**; a mesma coisa para o segundo elemento, etc. etc.

Vamos ter 2 accões: *enche*, *esvazia*, para cada um dos jarros, em que o enchemos ou esvaziamos, respetivamente, independentemente do líquido nele contido. Vamos ter uma acção *verte* para quaisquer par de jarros distintos, em que vertemos o líquido do primeiro no segundo até esvaziar o primeiro ou encher o segundo.

Notem que é o método ***actions()*** que verifica quais as acções válidas e o método ***result()*** assume que a acção passada por um argumento é válida.

In [3]:
class ProblemaJarros(Problem):
    """Problema transferir água entre jarros com diferentes capacidades para chegar a um certa quantidade.
    Cada estado é um tuplo com os níveis de água dos vários jarros ordenado. 
    O atributo capacidade guarda as capacidades dos jarros (pela mesma ordem)
    ex. ProblemaJarros(initial=(0, 0), goal=4, capacidades=(5, 3)), 
    que quer dizer que temos dois jarros de tamanho 5 e 3, inicialmente vazios e se deseja atingir 4 litros num dos jarros,
    """
    
    def __init__(self,initial=(0,0),goal=4,capacidades=(3,5)):
        super().__init__(initial,goal)
        self.capacidades = capacidades
    
    def actions(self, estado):
        """As acções executáveis neste estado."""
        jarros = range(len(estado))
        return ([('Enche', i+1)    for i in jarros if estado[i] < self.capacidades[i]] +
                [('Esvazia', i+1)    for i in jarros if estado[i]] +
                [('Verte', i+1, j+1) for i in jarros if estado[i] for j in jarros if i != j])

    def result(self, estado, accao):
        """Aplica a acção ao estado"""
        resultado = list(estado)  # converte tuplo em lista
        a, i, *_ = accao
        i = i-1  # O jarro i corresponde à posição i - 1
        if a == 'Enche':   # Enche jarro i até capacidade
            resultado[i] = self.capacidades[i]
        elif a == 'Esvazia': # Esvazia i
            resultado[i] = 0
        elif a == 'Verte': # Verte i em j
            j = accao[2]-1  # o jarro j corresponde à posição j - 1
            quantidade = min(estado[i], self.capacidades[j] - estado[j])
            resultado[i] -= quantidade
            resultado[j] += quantidade
        return tuple(resultado)

    def is_goal(self, estado):
        """Sucede quando algum dos jarros tem goal litros"""
        return self.goal in estado

Vamos criar um problema

In [4]:
p = ProblemaJarros()

Vamos agora criar uma instância deste problema, imprimir o estado inicial e verificar quantos litros desejamos medir.

In [5]:
prob_jarros = ProblemaJarros()
print("Estado Inicial:",prob_jarros.initial)
print('Capacidades dos jarros:',prob_jarros.capacidades)
print("O objectivo é medir ",prob_jarros.goal, "litros")

Estado Inicial: (0, 0)
Capacidades dos jarros: (3, 5)
O objectivo é medir  4 litros


Vamos verificar quais são as acções que podemos aplicar ao estado inicial

In [6]:
prob_jarros.actions(prob_jarros.initial)

[('Enche', 1), ('Enche', 2)]

Vamos encher o jarro 1 (a primeira acção) e obter um novo estado...

In [7]:
e1 = prob_jarros.result(prob_jarros.initial,('Enche', 1))
print(e1)

(3, 0)


Verifiquemos agora quais as acções aplicáveis a esse novo estado

In [8]:
prob_jarros.actions(e1)

[('Enche', 2), ('Esvazia', 1), ('Verte', 1, 2)]

Vamos verter o primeiro jarro no segundo...

In [9]:
e2 = prob_jarros.result(e1,('Verte',1,2))
print(e2)

(0, 3)


Vamos agora reencher o 1º jarro

In [10]:
e3 = prob_jarros.result(e2,('Enche',1))
print(e3)

(3, 3)


Vamos testar a função ***path_cost*** que é herdada de **Problem**. Notem que essa função recebe 4 argumentos: o custo actual, o estado, a acção e o novo estado e devolve o novo custo acumulado: custo actual + o custo da transição entre estados, neste caso 1.
Começamos com 0 no estado inicial.

In [11]:
custo = 0
e0 = prob_jarros.initial
print("Comecemos:",e0,", com custo =",custo)
e1 = prob_jarros.result(e0,('Enche',2))
custo = prob_jarros.path_cost(custo,prob_jarros.initial,('Enche',2),e1)
print("Vamos encher o segundo jarro:",e1, ", com custo =",custo)
e2 = prob_jarros.result(e1,('Verte',2,1))
custo = prob_jarros.path_cost(custo,e1,('Verte',2,1),e2)
print("Vamos verter o jarro 2 em jarro 1:",e2, ", com custo =",custo)

Comecemos: (0, 0) , com custo = 0
Vamos encher o segundo jarro: (0, 5) , com custo = 1
Vamos verter o jarro 2 em jarro 1: (3, 2) , com custo = 2


## Exercício 1
Experimente criar outras instâncias deste problema. Por exemplo:
* Como medir 3 litros com recipientes de 7 e 5
* Como medir 6 litros com recipientes de 7, 8 e 3


In [None]:
ex1_p1 = ProblemaJarros(goal=3, capacidades=(7, 5))
ex1_p2 = ProblemaJarros(initial=(0, 0, 0), goal=6, capacidades=(7, 8, 3))

## Exercício 2
Extenda a classe **ProblemaJarros** com uma função (método) ***exec()*** que pegue num estado e execute uma sequência de acções numa lista, devolvendo o estado resultante.

In [12]:
class ProblemaJarros_Ex2(ProblemaJarros):
    def exec(self, estado, acoes):
        for acao in acoes:
            estado = self.result(estado, acao)
        return estado

## Exercício 3
Reformule o problema dos jarros, a versão verde, de modo a que o custo das acções deixe de ser unitário. Queremos calcular a água gasta da torneira até à medição desejada - enchem-se os jarros da torneira. Assim, apenas tem custo a acção de encher e o custo corresponde à água gasta.

In [15]:
class ProblemaJarros_Ex3(ProblemaJarros):
    def path_cost(self, c, state1, action, state2):
        if action[0] == 'Enche':
            c += self.capacidades[action[1] - 1]
        return c

In [16]:
custo = 0
ex3_p1 = ProblemaJarros_Ex3()

e0 = ex3_p1.initial
print("Comecemos:",e0,", com custo =",custo)
e1 = ex3_p1.result(e0,('Enche',2))
custo = ex3_p1.path_cost(custo,ex3_p1.initial,('Enche',2),e1)
print("Vamos encher o segundo jarro:",e1, ", com custo =",custo)
e2 = ex3_p1.result(e1,('Verte',2,1))
custo = ex3_p1.path_cost(custo,e1,('Verte',2,1),e2)
print("Vamos verter o jarro 2 em jarro 1:",e2, ", com custo =",custo)

Comecemos: (0, 0) , com custo = 0
Vamos encher o segundo jarro: (0, 5) , com custo = 5
Vamos verter o jarro 2 em jarro 1: (3, 2) , com custo = 5


## Exercício 4
Complete a formulação esboçada a seguir do problema do puzzle de 8. 

![](https://ece.uwaterloo.ca/~dwharder/aads/Algorithms/N_puzzles/images/puz3.png)

Estamos perante o problema clássico de um puzzle de peças deslizantes onde se pode deslocar qualquer peça ortogonalmente para a casa vazia. Partimos de uma configuração inicial (por exemplo, o puzzle da esquerda da figura) e queremos atingir a configuração objetivo (números ordenados).

```Python
class PuzzleN(Problem):
    """ O problema das N=dxd-1 peças deslizantes, num tabuleiro quadrado de dimensão dxd
    onde um dos quadrados está vazio, tentando atingir uma configuração particular
    Um estado é representado por um tuplo de dimensão dxd.
    As peças são representadas pelos próprios números e a peça vazia por 0.
    O objectivo por omissão no caso de 3x3:
        1 2 3
        4 5 6 ==> (1, 2, 3, 4, 5, 6, 7, 8, 0)
        7 8 _
    Existe um atributo d que representa a dimensão do quadrado, 3 no caso do puzzle de 8
    """


    def __init__(self, initial, goal=(0, 1, 2, 3, 4, 5, 6, 7, 8)):
        """Construtor:
           - O initial é sempre passado como argumento;
           - O goal tem um estado por omissão;
           - O d corresponde à raiz quadrada da dimensão do estado, i.e. o número de colunas
             e de linhas. Poderia ser calculado quando fosse necessário, mas é calculado 1 vez.
           - O moves é um vector em que a posição indica o índice do estado e o valor um tuplo
             com os índices no estado das casas vizinhas ortogonalmente.
             Por exemplo, o indice 0 (casa de topo esquerdo) tem como vizinhas os índices 1 e 3
             do vector (a casa à sua direita e em baixo, respectivamente).
        """
        self.initial, self.goal = initial, goal
        self.d = int(math.sqrt(len(initial)))
        self.moves = ((1, 3),    (0, 2, 4),    (1, 5),
                     (0, 4, 6), (1, 3, 5, 7), (2, 4, 8),
                     (3, 7),    (4, 6, 8),    (7, 5))


    def display(self, state):
        """ print the state please"""
        output=""
        for i in range(self.d * self.d):
            ch = str(state[i])
            if ch == "0":
                ch = '_'
            output += ch + " "
            i = i+1
            if i % self.d == 0:
                output += "\n"
        print(output)
```

In [32]:
from typing import List
class PuzzleN(Problem):
    """ O problema das N=dxd-1 peças deslizantes, num tabuleiro quadrado de dimensão dxd
    onde um dos quadrados está vazio, tentando atingir uma configuração particular
    Um estado é representado por um tuplo de dimensão dxd.
    As peças são representadas pelos próprios números e a peça vazia por 0.
    O objectivo por omissão no caso de 3x3:
        1 2 3
        4 5 6 ==> (1, 2, 3, 4, 5, 6, 7, 8, 0)
        7 8 _
    Existe um atributo d que representa a dimensão do quadrado, 3 no caso do puzzle de 8
    """


    def __init__(self, initial, goal=(0, 1, 2, 3, 4, 5, 6, 7, 8)):
        """Construtor:
           - O initial é sempre passado como argumento;
           - O goal tem um estado por omissão;
           - O d corresponde à raiz quadrada da dimensão do estado, i.e. o número de colunas
             e de linhas. Poderia ser calculado quando fosse necessário, mas é calculado 1 vez.
           - O moves é um vector em que a posição indica o índice do estado e o valor um tuplo
             com os índices no estado das casas vizinhas ortogonalmente.
             Por exemplo, o indice 0 (casa de topo esquerdo) tem como vizinhas os índices 1 e 3
             do vector (a casa à sua direita e em baixo, respectivamente).
             0 1 2
             3 4 5
             6 7 8
        """
        self.initial, self.goal = initial, goal
        self.d = int(math.sqrt(len(initial)))
        self.moves = ((1, 3),    (0, 2, 4),    (1, 5),
                     (0, 4, 6), (1, 3, 5, 7), (2, 4, 8),
                     (3, 7),    (4, 6, 8),    (5, 7))


    def display(self, state):
        """ print the state please"""
        output=""
        for i in range(self.d * self.d):
            ch = str(state[i])
            if ch == "0":
                ch = '_'
            output += ch + " "
            i = i+1
            if i % self.d == 0:
                output += "\n"
        print(output)

    def actions(self, state: List[int]):
        livre = state.index(0)
        return [ (move[0] + 1, livre + 1)  for move in enumerate(self.moves) if livre in move[1] ]

    def result(self, state, action):
        de, para = action

        state_cpy = list(state)
        state_cpy[de - 1], state_cpy[para - 1] = state[para - 1], state[de - 1]
        return state_cpy

In [33]:
ex4 = PuzzleN((5, 2, 7, 8, 4, 0, 1, 3, 6))

print('Estado inicial')
ex4.display(ex4.initial)

print('Acoes:', ex4.actions(ex4.initial))

e1 = ex4.result(ex4.initial, (3, 6))
print('Novo estado (aplicar (3, 6))')
ex4.display(e1)

Estado inicial
5 2 7 
8 4 _ 
1 3 6 

Acoes: [(3, 6), (5, 6), (9, 6)]
Novo estado (aplicar (3, 6))
5 2 _ 
8 4 7 
1 3 6 



## Exercício 5
Formule o problema do encontro das duas joaninhas invisíveis:
Supõe que controlas um par de insectos há muito desencontrados. Conheces o labirinto, mas não tens qualquer informação sobre o paradeiro inicial dos insectos, i.e. onde eles começam, mas queres ajudá-los a reencontrarem-se. Para isso, vais formular este problema como uma pesquisa num espaço de estados em que a solução é uma sequência de acções tais que, se os dois insectos a executarem simultaneamente, irão fatalmente parar à mesma célula, independentemente de onde começarem.
Qualquer célula serve para o encontro final, eles querem apenas voltarem a ver-se mais uma vez.  
Cada insecto pode ser movido para uma casa vizinha a norte, sul, este ou oeste, ficando na mesma célula se a acção norte, sul, este ou oeste, respetivamente, estiver bloqueada por uma parede (preto). Qualquer movimento tem o mesmo custo: 1. Nota que o plano [oeste,oeste,oeste,oeste] não é uma solução para o problema, porque só força as joaninhas a encontrarem-se quando ambas estão na mesma linha e não para qualquer situação inicial. A situação da figura abaixo é um contra-exemplo desse plano, porque uma das joaninhas acaba na célula de topo à direita e a outra na célula de fundo à esquerda, não se encontrando.
<img src="figures/joaninhas-invisiveis.PNG" alt="Drawing" style="width: 170px;"/>


## Exercício 6
Supõe agora um puzzle semelhante ao puzzle anterior mas em que conheces as posições das duas joaninhas e queres ajudá-las de novo a reencontrarem-se. Para isso, vais formular este problema como uma procura num espaço de estados em que a solução é uma sequência de acções tais que, se os dois insectos a executarem simultaneamente, irão fatalmente parar à mesma célula. Pode usar as posições da figura no exercício 5 como exemplo das posições iniciais das joaninhas.

## Exercício 7
Modelize o problema da Inversão de um Triângulo de Moedas. 
Dado um triângulo formado por 10 moedas, (ver figuras seguintes), o objetivo do problema consiste em inverter este triângulo através de um número mínimo de operações. A única operação válida corresponde ao deslocamento de uma das moedas de uma fila para uma outra qualquer.
<img src="figures/inv-triangulo-moedas.PNG" alt="Drawing" style="width: 400px;"/>

In [88]:
class TrianguloMoedas(Problem):
    def __init__(self, initial=(1, 2, 3, 4), goal=(4, 3, 2, 1)):
        super().__init__(initial, goal)
        self.initial = initial
        self.goal = goal

    def actions(self, state):
        moedas = range(len(state))
        return (
            [ ('Move', i+1, j+1) for i in moedas for j in moedas if i != j and state[i] > 1 and state[j] < 4 ] +
            [ ('Topo', i+1) for i in moedas if state[i] == 1] + # if i != 0?
            [ ('Base', i+1) for i in moedas if state[i] == 1 ] # if i != len(moedas) - 1?
        )

    def result(self, state, action):
        a, i, *j = action

        res = list(state)
        if a == 'Move':
            res[i - 1] -= 1
            res[j[0] - 1] += 1
        elif a == 'Topo':
            del res[i - 1]
            res.insert(0, 1)
        elif a == 'Base':
            del res[i - 1]
            res.insert(len(state), 1)
        return tuple(res)

In [89]:
ex7 = TrianguloMoedas()

print('Acoes', ex7.actions(ex7.initial))

e1 = ex7.result(ex7.initial, ('Base', 1))
print('Aplicar (Base, 1)', e1)

e2 = ex7.result(e1, ('Move', 3, 1))
print('Aplicar (Move, 3, 1)', e2)

e3 = ex7.result(e2, ('Move', 3, 1))
print('Aplicar (Move, 3, 1)', e3)

print('goal_test', ex7.goal_test(e3))

Acoes [('Move', 2, 1), ('Move', 2, 3), ('Move', 3, 1), ('Move', 3, 2), ('Move', 4, 1), ('Move', 4, 2), ('Move', 4, 3), ('Topo', 1), ('Base', 1)]
Aplicar (Base, 1) (2, 3, 4, 1)
Aplicar (Move, 3, 1) (3, 3, 3, 1)
Aplicar (Move, 3, 1) (4, 3, 2, 1)
goal_test True


## Exercício 8
Formule o problema das latas

Temos uma colecção de N objetos de tamanhos S1, … , SN. Queremos colocar estes objetos em latas de capacidade B e queremos usar o menor número de latas possível.
Por exemplo, suponha que temos:  
   – B=100  
   – 4 objectos com os tamanhos seguintes:  
         S1=45, S2=80, S3=30 e S4=15.  
Então é possível colocar estes 4 objetos em duas latas, colocando por exemplo os objetos 1, 3 e 4 numa das latas e o objeto 2 noutra. Uma solução alternativa consiste em empacotar os objetos 1 e 3 numa das latas e os objetos 2 e 4 noutra.