In [1]:
# Resolviendo el 8-puzzle con un algoritmo con informacion (A*)
import numpy as np
from abc import ABC, abstractmethod

In [42]:
# ======== UTILIS ========
# Para saber donde esta el espacio vacio cada iteracion
class Coord_Empty:    
    def __init__(self, state):
        for i in range(state.shape[0]):
            for j in range(state.shape[1]):
                if state[i, j] == np.empty:
                    self.i = i
                    self.j = j
                    return

# Clases responsables de generar un nuevo estado dependiendo de la accion (modificar puzzle)
class Action(ABC):
    @abstractmethod
    def move(self, state):
        pass

class ActionUp(Action):
    name = "up"
    def move(self, state):
        # Revisar que sí se pueda mover hacia arriba
        coord_empty = Coord_Empty(state)
        if coord_empty.i == 0:
            return None
        else:  
            next_state = np.copy(state)
            buffer = next_state[coord_empty.i - 1, coord_empty.j]
            next_state[coord_empty.i, coord_empty.j] = buffer
            next_state[coord_empty.i - 1, coord_empty.j] = np.empty
            return next_state

class ActionDown(Action):
    name = "down"
    def move(self, state):
        # Revisar que sí se pueda mover hacia arriba
        coord_empty = Coord_Empty(state)
        if coord_empty.i == state.shape[0] - 1:
            return None
        else:  
            next_state = np.copy(state)
            buffer = next_state[coord_empty.i + 1, coord_empty.j]
            next_state[coord_empty.i, coord_empty.j] = buffer
            next_state[coord_empty.i + 1, coord_empty.j] = np.empty
            return next_state
        
class ActionLeft(Action):
    name = "left"
    def move(self, state):
        # Revisar que sí se pueda mover a la izquierda
        coord_empty = Coord_Empty(state)
        if coord_empty.j == 0:
            return None
        else:
            next_state = np.copy(state)
            buffer = next_state[coord_empty.i, coord_empty.j - 1]
            next_state[coord_empty.i, coord_empty.j] = buffer
            next_state[coord_empty.i, coord_empty.j - 1] = np.empty
            return next_state

class ActionRight(Action):
    name = "right"
    def move(self, state):
        # Revisar que sí se pueda mover a la derecha
        coord_empty = Coord_Empty(state)
        if coord_empty.j == state.shape[1] - 1:
            return None
        else:  
            next_state = np.copy(state)
            buffer = next_state[coord_empty.i, coord_empty.j + 1]
            next_state[coord_empty.i, coord_empty.j] = buffer
            next_state[coord_empty.i, coord_empty.j + 1] = np.empty
            return next_state

# Como se usa un grafo, cada nodo debe construir sobre las secuencias de movimientos necesarias para resolver el puzzle
class Node:
    def __init__(self, id, depth, state, parent, parentAction):
        self.id = id
        self.depth = depth
        self.state = state
        self.parent = parent
        self.parentAction = parentAction
        self.f = 0
    
    # f(x) = h(x) + g(x)
    def calcF(self, h):
        self.f = h + self.depth
        
# El algoritmo de AStar
class AStar:
    def __init__(self):
        self.actions = np.array([ActionUp(), ActionDown(), ActionLeft(), ActionRight()])
        self.goal = np.mat([[1, 2, 3], [4, 5, 6], [7, 8, np.empty]])
    
#   Para revisar si el estado generado es igual a nuestra meta
    def goalAchieved(self, state):
        return np.array_equal(state, self.goal)
    
# Para el calculo de la heuristica.
# La heuristica es el acumulado de la diferencia entre cada celda de ambos tableros.
    def calcHeuristic(self, state):
        sum = 0
        for i in range(state.shape[0]):
            for j in range(state.shape[1]):
                if state[i, j] != self.goal[i, j] and state[i, j] != np.empty and self.goal[i, j] != np.empty:
                    sum += 1            
        return sum
        
    
#   La busqueda con informacion
    def search(self, node):
        open_nodes = [node]
#       Para solo evaluar estados que no se hayan evaluado previamente
        closed_nodes = []
        curr_id = 0
        
        while open_nodes:
            curr_node = open_nodes.pop(0)
            curr_node.calcF(self.calcHeuristic(curr_node.state))
            print(curr_node.f)
            
            if self.goalAchieved(curr_node.state):
                print("Puzzle ya estaba completado.")
                return curr_node
            
            for action in self.actions:
                next_state = action.move(curr_node.state)
#                 Considerar que el movimiento podria ser invalido
                if next_state is not None:
                    curr_id += 1
                    child = Node(curr_id, curr_node.depth + 1, next_state, curr_node, action)
                    child.calcF(self.calcHeuristic(child.state))
                    
#                   Checar que no se haya revisado esta combinacion previamente
                    if child.state.tolist() not in closed_nodes:
                        open_nodes.append(child)
                        closed_nodes.append(child.state.tolist())
#                       Revisar si se encontro la solucion
                        if self.goalAchieved(child.state):
                            print("Puzzle completado.")
                            return child
            open_nodes.sort(key = lambda x:x.f,reverse=False)
        return None
        
    # Para imprimir la secuencia de movimientos de la respuesta final
    def print_solution(self, final_node):
    #   Reconstruir secuencia de movimientos usando la referencia a parent
        solution = [final_node]
        buffer = final_node.parent

        while buffer is not None:
            solution = np.insert(solution, 0, buffer)
            buffer = buffer.parent 

        for node in solution:
    #       Si llegamos a la raiz de la busqueda
            if(node.parent is None):
                print("INICIO")
                print("Estado")
                print(str(node.state) + "\n")
            else:
                print("Movimiento : " + str(node.parentAction.name))
                print("Profundidad : " + str(node.depth))
                print("Id: " + str(node.id))
                print("Parent: " + str(node.parent.id))
                print("Estado")
                print(str(node.state) + "\n")

In [43]:
# Creando 8-puzzle ejemplo

# 1 2 3
#   8 7
# 6 5 4
# puzzle = np.mat([[1, 2, 3], [np.empty, 8, 7], [6, 5, 4]])

puzzle = np.mat([[1, 2, 3], [np.empty, 4, 6], [7, 5, 8]])

puzzle

# La respuesta debe ser
# 1 2 3
# 4 5 6
# 7 8 

matrix([[1, 2, 3],
        [<built-in function empty>, 4, 6],
        [7, 5, 8]], dtype=object)

In [44]:
# Necesitamos comenzar a construir el grafo, usando el puzzle declarado previamente como su estado inicial
root = Node(0, 0, puzzle, None, None)
a_star = AStar()

# Buscando solucion
solution = a_star.search(root)

if solution is None:
    print("No hay solucion para este 8-puzzle.")
else:
    a_star.print_solution(solution)

2
2
2
Puzzle completado.
INICIO
Estado
[[1 2 3]
 [<built-in function empty> 4 6]
 [7 5 8]]

Movimiento : right
Profundidad : 1
Id: 3
Parent: 0
Estado
[[1 2 3]
 [4 <built-in function empty> 6]
 [7 5 8]]

Movimiento : down
Profundidad : 2
Id: 5
Parent: 3
Estado
[[1 2 3]
 [4 5 6]
 [7 <built-in function empty> 8]]

Movimiento : right
Profundidad : 3
Id: 10
Parent: 5
Estado
[[1 2 3]
 [4 5 6]
 [7 8 <built-in function empty>]]

