## Quiz 2: Funciones heurísticas para el 8-puzzle

Adaptado de Russell and Norvig (2016), cap. 3.

### 8-puzzle

El siguiente problema se conoce como el 8-puzzle. En un tablero $3\times 3$ se ponen ocho fichas, cada una con un número del 1 al 8, dejando un espacio vacío. Partiendo de una configuración aleatoria, el objetivo es encontrar una secuencia de desplazamientos de fichas al espacio vacío, una a la vez, hasta llegar a un tablero ordenado, como se muestra en la siguiente figura:


<img src="./imagenes/8-puzzle.png" width="300">

**Ejercicio 1:**

Proporcione la descripción formal del problema:

* **Estado inicial**: 

* **Posibles acciones**: 

* **Función de transiciones**: 

* **Prueba de satisfacción del objetivo**: 

* **Función de costo**: 

----


**Implementación del problema**

Implementaremos el problema del 8-puzzle.

In [51]:
import numpy as np
from random import choice
import copy

%matplotlib inline

In [52]:
class ocho_puzzle:
    
    def estado_inicial(self):
        estado = list(np.random.choice(9, 9, replace=False))
        estado = np.reshape(estado, (3,3))
        return estado
    
    def acciones_aplicables(self, estado):
        # Devuelve una lista de fichas que es posible mover
        # y en qué dirección
        # Input: estado, que es una np.matrix(8x8)
        # Output: lista de parejas ((x1,y1), (x2,y2))
        # Es decir, la ficha en la posición (x1,y1) puede moverse a (x2,y2)
        y, x = np.where(estado == 0)
        y = y[0]
        x = x[0]
        if x == 0:
            if y == 0:
                return [((x + 1, y), (x, y)), 
                        ((x, y + 1), (x, y))
                       ]
            elif y == 2:
                return [((x + 1, y), (x, y)), 
                        ((x, y - 1), (x, y))
                       ]
            else:
                return [((x + 1, y), (x, y)), 
                        ((x, y + 1), (x, y)),
                        ((x, y - 1), (x, y))
                       ]
        if x == 2:
            if y == 0:
                return [((x - 1, y), (x, y)), 
                        ((x, y + 1), (x, y))
                       ]
            elif y == 2:
                return [((x - 1, y), (x, y)), 
                        ((x, y - 1), (x, y))
                       ]
            else:
                return [((x - 1, y), (x, y)), 
                        ((x, y + 1), (x, y)),
                        ((x, y - 1), (x, y))
                       ]
        else:
            if y == 0:
                return [((x - 1, y), (x, y)),
                        ((x + 1, y), (x, y)),
                        ((x, y + 1), (x, y))
                       ]
            elif y == 2:
                return [((x - 1, y), (x, y)),
                        ((x + 1, y), (x, y)),
                        ((x, y - 1), (x, y))
                       ]
            else:
                return [((x - 1, y), (x, y)), 
                        ((x + 1, y), (x, y)),
                        ((x, y + 1), (x, y)),
                        ((x, y - 1), (x, y))
                       ]

    def transicion(self, estado, indices):
        # Devuelve el tablero moviendo la ficha en indice
        # Input: estado, que es una np.matrix(8x8)
        #        indice, de la forma ((x1,y1), (x2,y2))
        # Output: estado, que es una np.matrix(8x8)
        
        s = copy.deepcopy(estado)
        x1, y1 = indices[0]
        x2, y2 = indices[1]
        s[y2, x2] = estado[y1, x1]
        s[y1, x1] = 0
        return s
    
    def test_objetivo(self, estado):
        # Devuelve True/False dependiendo si el estado
        # resuelve el problema
        # Input: estado, que es una np.matrix(8x8)
        # Output: True/False
        k = list(np.reshape(estado, (9,1)))
        k = [x[0] for x in k]
        return (k == range(9))
        
    def costo(self, estado, accion):
        return 1

### Funciones heurísticas

Heurística es una palabra que viene del griego εὑρίσκειν, y que significa "hallar" o "inventar". Una función heurística es una manera de usar conocimiento sobre el problema (*domain knowledge*) para buscar una solución de manera más eficiente que las estrategias no informadas.

Para el 8-puzzle se han encontrado dos funciones con muy buenos resultados:

- $h_1 = $ número de fichas que no corresponden al orden del estado objetivo.

- $h_2 = $ suma de la distancia de cada ficha a su lugar en el estado objetivo, usando la distancia Manhattan, también conocida como la [distancia del taxista](https://es.wikipedia.org/wiki/Geometr%C3%ADa_del_taxista). 

**Ejercicio 2:**

Implemente las dos funciones heurísticas, $h_1$ y $h_2$, para el 8-puzzle. 

---

**Ejercicio 3:**

Lea la sección 3.5.1 del texto guía e implemente el algoritmo *greedy best-first search*. Use este algoritmo para encontrar una solución al 8-puzzle.

---

### En este notebook usted aprendió

* El concepto de función heurística en la búsqueda de soluciones para implementar *domain knowledge*.

* Implementar el método de búsqueda *greedy best-first search*.