## Quiz 2: Funciones heurísticas para el 8-puzzle

Adaptado de Russell and Norvig (2016), sec. 3.6.

### 8-puzzle

El siguiente problema se conoce como el 8-puzzle. En un tablero $3\times 3$ se ponen ocho fichas, cada una con un número del 1 al 8, dejando un espacio vacío. Partiendo de una configuración aleatoria, el objetivo es encontrar una secuencia de desplazamientos de fichas al espacio vacío, una a la vez, hasta llegar a un tablero ordenado, como se muestra en la siguiente figura:


<img src="./imagenes/8-puzzle.png" width="300">

**Ejercicio 1:**

Proporcione la descripción formal del problema:

* **Estado inicial**: 

* **Posibles acciones**: 

* **Función de transiciones**: 

* **Prueba de satisfacción del objetivo**: 

* **Función de costo**: 

----


**Implementación del problema**

Implementaremos el problema del 8-puzzle.

In [1]:
import numpy as np
from random import choice
import copy

%matplotlib inline

In [2]:
class ocho_puzzle:
    
    def estado_inicial(self):
        estado = list(np.random.choice(9, 9, replace=False))
        estado = np.reshape(estado, (3,3))
        return estado
    
    def acciones_aplicables(self, estado):
        # Devuelve una lista de fichas que es posible mover
        # y en qué dirección
        # Input: estado, que es una np.matrix(8x8)
        # Output: lista de parejas ((x1,y1), (x2,y2))
        # Es decir, la ficha en la posición (x1,y1) puede moverse a (x2,y2)
        y, x = np.where(estado == 0)
        y = y[0]
        x = x[0]
        if x == 0:
            if y == 0:
                return [((x + 1, y), (x, y)), 
                        ((x, y + 1), (x, y))
                       ]
            elif y == 2:
                return [((x + 1, y), (x, y)), 
                        ((x, y - 1), (x, y))
                       ]
            else:
                return [((x + 1, y), (x, y)), 
                        ((x, y + 1), (x, y)),
                        ((x, y - 1), (x, y))
                       ]
        if x == 2:
            if y == 0:
                return [((x - 1, y), (x, y)), 
                        ((x, y + 1), (x, y))
                       ]
            elif y == 2:
                return [((x - 1, y), (x, y)), 
                        ((x, y - 1), (x, y))
                       ]
            else:
                return [((x - 1, y), (x, y)), 
                        ((x, y + 1), (x, y)),
                        ((x, y - 1), (x, y))
                       ]
        else:
            if y == 0:
                return [((x - 1, y), (x, y)),
                        ((x + 1, y), (x, y)),
                        ((x, y + 1), (x, y))
                       ]
            elif y == 2:
                return [((x - 1, y), (x, y)),
                        ((x + 1, y), (x, y)),
                        ((x, y - 1), (x, y))
                       ]
            else:
                return [((x - 1, y), (x, y)), 
                        ((x + 1, y), (x, y)),
                        ((x, y + 1), (x, y)),
                        ((x, y - 1), (x, y))
                       ]

    def transicion(self, estado, indices):
        # Devuelve el tablero moviendo la ficha en indice
        # Input: estado, que es una np.matrix(8x8)
        #        indice, de la forma ((x1,y1), (x2,y2))
        # Output: estado, que es una np.matrix(8x8)
        
        s = copy.deepcopy(estado)
        x1, y1 = indices[0]
        x2, y2 = indices[1]
        s[y2, x2] = estado[y1, x1]
        s[y1, x1] = 0
        return s
    
    def test_objetivo(self, estado):
        # Devuelve True/False dependiendo si el estado
        # resuelve el problema
        # Input: estado, que es una np.matrix(8x8)
        # Output: True/False
        k = list(np.reshape(estado, (9,1)))
        k = [x[0] for x in k]
        return (k == range(9))
        
    def costo(self, estado, accion):
        return 1

### Funciones heurísticas

Heurística es una palabra que viene del griego εὑρίσκειν, y que significa "hallar" o "inventar". Una función heurística es una manera de usar conocimiento sobre el problema (*domain knowledge*) para buscar una solución de manera más eficiente que las estrategias no informadas.

Para el 8-puzzle se han encontrado dos funciones con muy buenos resultados:

- $h_1 = $ número de fichas que no corresponden al orden del estado objetivo.

- $h_2 = $ suma de la distancia de cada ficha a su lugar en el estado objetivo, usando la distancia Manhattan, también conocida como la [distancia del taxista](https://es.wikipedia.org/wiki/Geometr%C3%ADa_del_taxista). 

**Ejercicio 2:**

Implemente las dos funciones heurísticas, $h_1$ y $h_2$, para el 8-puzzle. 

**Respuesta:**

Una posible implementación es la siguiente:

In [74]:
def h1(estado):
    distancia = 0
    for i in range(1, 3 * 3):
        x = i % 3
        y = int(i / 3)
        if estado[y, x] != i:
            distancia += 1

    return distancia

def h2(estado):
    distancia = 0
    final = np.reshape(range(9), (3,3))
    for i in range(1, 9):
        y1, x1 = np.where(estado == i)
        y2, x2 = np.where(final == i)
        distancia += np.abs(x1 - x2) + np.abs(y1 - y2)

    return distancia[0]

In [51]:
P = ocho_puzzle()
s = P.estado_inicial()
print("s\n", s)
print("h1(s) =", h1(s))
print("h2(s) =", h2(s))

s
 [[7 6 5]
 [1 4 3]
 [0 8 2]]
h1(s) = 8
h2(s) = 16


---

**Ejercicio 3:**

Lea la sección 3.5.1 del texto guía e implemente el algoritmo *greedy best-first search*. Use este algoritmo para encontrar una solución al 8-puzzle.

**Respuesta:**

Una posible implementación es la siguiente:

In [72]:
class nodo:
    
    # Clase para crear los nodos
    
    def __init__(self, estado, madre, accion, costo):
        self.estado = estado
        self.madre = madre
        self.accion = accion
        self.costo = costo
        
def nodo_hijo(problema, madre, accion):
    
    # Función para crear un nuevo nodo
    # Input: problema, que es un objeto de clase ocho_reinas
    #        madre, que es un nodo,
    #        accion, que es una acción que da lugar al estado del nuevo nodo
    # Output: nodo

    return nodo(problema.transicion(madre.estado, accion),
                madre,
                accion,
                costo = madre.costo + problema.costo(madre.estado, accion)
               )

def obtiene_acciones(n):
    if n.madre == None:
        return []
    else:
        return [n.accion] + obtiene_acciones(n.madre)
    
def solucion(n):
    acciones_invertidas = obtiene_acciones(n)
    N = len(acciones_invertidas)
    return [acciones_invertidas[N - i] for i in range(1, N + 1)]

def tree_search(problema, distancia):
    
    # Función de búsqueda mediante la construcción
    # del arbol de búsqueda de manera aleatoria
    
    raiz = nodo(problema.estado_inicial(), None, None, 0)
    print("Estado inicial:\n", raiz.estado)
    
    if problema.test_objetivo(raiz.estado):
            return raiz
    else:
        frontera = {distancia(raiz.estado):[raiz]}
        explored = []
        print("Frontera:", frontera)
        print("Explored:", explored)

    while len(frontera) > 0:
        n = frontera[min(frontera.keys())][0] # Seleccionamos un nodo aleatorio
        print("Estado seleccionado:\n", n.estado)
        frontera[distancia(n.estado)].remove(n)
        explored.append(n)
        print("Frontera:", frontera)
        print("Explored:", explored)
        if len(frontera[distancia(n.estado)]) == 0:
            del frontera[distancia(n.estado)]
        explored.append(n)
        acciones = problema.acciones_aplicables(n.estado)
        for a in acciones:
            N = nodo_hijo(problema, n, a)
            print("Nuevo estado:\n", N.estado)
            if problema.test_objetivo(N.estado):
                return N
            elif N not in explored:                
                try:
                    frontera[distancia(N.estado)].append(N)
                except:
                    frontera[distancia(N.estado)] = [N]
    
    return None

In [73]:
r = tree_search(P, h1)

Estado inicial:
 [[0 8 2]
 [5 3 1]
 [6 7 4]]
Frontera: {5: [<__main__.nodo object at 0x117355af0>]}
Explored: []
Estado seleccionado:
 [[0 8 2]
 [5 3 1]
 [6 7 4]]
Frontera: {5: []}
Explored: [<__main__.nodo object at 0x117355af0>]
Nuevo estado:
 [[8 0 2]
 [5 3 1]
 [6 7 4]]
Nuevo estado:
 [[5 8 2]
 [0 3 1]
 [6 7 4]]
Estado seleccionado:
 [[8 0 2]
 [5 3 1]
 [6 7 4]]
Frontera: {6: [<__main__.nodo object at 0x117336a90>]}
Explored: [<__main__.nodo object at 0x117355af0>, <__main__.nodo object at 0x117355af0>, <__main__.nodo object at 0x117336c10>]
Nuevo estado:
 [[0 8 2]
 [5 3 1]
 [6 7 4]]
Nuevo estado:
 [[8 2 0]
 [5 3 1]
 [6 7 4]]
Nuevo estado:
 [[8 3 2]
 [5 0 1]
 [6 7 4]]
Estado seleccionado:
 [[0 8 2]
 [5 3 1]
 [6 7 4]]
Frontera: {6: [<__main__.nodo object at 0x117336a90>, <__main__.nodo object at 0x11735be20>], 5: [], 7: [<__main__.nodo object at 0x11735b2e0>]}
Explored: [<__main__.nodo object at 0x117355af0>, <__main__.nodo object at 0x117355af0>, <__main__.nodo object at 0x117336c10>

 [6 7 0]]
Nuevo estado:
 [[5 8 0]
 [3 1 2]
 [6 7 4]]
Estado seleccionado:
 [[5 0 2]
 [3 8 1]
 [6 7 4]]
Frontera: {6: [<__main__.nodo object at 0x11735be20>, <__main__.nodo object at 0x11735c070>, <__main__.nodo object at 0x11735c910>, <__main__.nodo object at 0x10807c430>, <__main__.nodo object at 0x117355940>, <__main__.nodo object at 0x117355a90>, <__main__.nodo object at 0x117355190>, <__main__.nodo object at 0x117355790>, <__main__.nodo object at 0x117355e80>, <__main__.nodo object at 0x117336ee0>, <__main__.nodo object at 0x1173554c0>, <__main__.nodo object at 0x11735bd00>, <__main__.nodo object at 0x11735b0a0>, <__main__.nodo object at 0x117355d30>, <__main__.nodo object at 0x1173557f0>, <__main__.nodo object at 0x1173558b0>, <__main__.nodo object at 0x117355610>, <__main__.nodo object at 0x117355730>, <__main__.nodo object at 0x11735bfa0>, <__main__.nodo object at 0x11735bb20>, <__main__.nodo object at 0x11735bd30>, <__main__.nodo object at 0x11735b100>, <__main__.nodo object at

Nuevo estado:
 [[5 8 2]
 [3 0 1]
 [6 7 4]]
Estado seleccionado:
 [[0 5 2]
 [3 8 1]
 [6 7 4]]
Frontera: {6: [<__main__.nodo object at 0x11735be20>, <__main__.nodo object at 0x11735c070>, <__main__.nodo object at 0x11735c910>, <__main__.nodo object at 0x10807c430>, <__main__.nodo object at 0x117355940>, <__main__.nodo object at 0x117355a90>, <__main__.nodo object at 0x117355190>, <__main__.nodo object at 0x117355790>, <__main__.nodo object at 0x117355e80>, <__main__.nodo object at 0x117336ee0>, <__main__.nodo object at 0x1173554c0>, <__main__.nodo object at 0x11735bd00>, <__main__.nodo object at 0x11735b0a0>, <__main__.nodo object at 0x117355d30>, <__main__.nodo object at 0x1173557f0>, <__main__.nodo object at 0x1173558b0>, <__main__.nodo object at 0x117355610>, <__main__.nodo object at 0x117355730>, <__main__.nodo object at 0x11735bfa0>, <__main__.nodo object at 0x11735bb20>, <__main__.nodo object at 0x11735bd30>, <__main__.nodo object at 0x11735b100>, <__main__.nodo object at 0x11735b4

IOPub data rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_data_rate_limit`.

Current values:
NotebookApp.iopub_data_rate_limit=1000000.0 (bytes/sec)
NotebookApp.rate_limit_window=3.0 (secs)



[<__main__.nodo object at 0x117355af0>, <__main__.nodo object at 0x117355af0>, <__main__.nodo object at 0x117336c10>, <__main__.nodo object at 0x117336c10>, <__main__.nodo object at 0x11735bb50>, <__main__.nodo object at 0x11735bb50>, <__main__.nodo object at 0x117336a90>, <__main__.nodo object at 0x117336a90>, <__main__.nodo object at 0x117355e50>, <__main__.nodo object at 0x117355e50>, <__main__.nodo object at 0x117336f10>, <__main__.nodo object at 0x117336f10>, <__main__.nodo object at 0x117336df0>, <__main__.nodo object at 0x117336df0>, <__main__.nodo object at 0x117336e80>, <__main__.nodo object at 0x117336e80>, <__main__.nodo object at 0x117355250>, <__main__.nodo object at 0x117355250>, <__main__.nodo object at 0x11735be50>, <__main__.nodo object at 0x11735be50>, <__main__.nodo object at 0x11735bfd0>, <__main__.nodo object at 0x11735bfd0>, <__main__.nodo object at 0x117355ee0>, <__main__.nodo object at 0x117355ee0>, <__main__.nodo object at 0x117336e20>, <__main__.nodo object at

KeyboardInterrupt: 

---

### En este notebook usted aprendió

* El concepto de función heurística en la búsqueda de soluciones para implementar *domain knowledge*.

* Implementar el método de búsqueda *greedy best-first search*.