# Algoritmo $A^*$

El algoritmo $A^*$ es un algoritmo estándar para búsqueda informada, aquí aplicamos el algoritmo a un problema de puzzle o juego del 8, que consiste en ordenar una tabla de números.

#### Funciones iniciales

In [1]:
import numpy as np
from copy import deepcopy

Definimos una función que nos dará las coordenadas en que se encuentra el elemento vacío 'e' en la tabla. La posición se puede pensar como las coordenadas de una cuadrícula de $3 \times 3$.

In [2]:
def get_location(state, input_element):
    """
    Función para localizar la posición de un elemento del puzzle
    dentro del cuadrado o tabla.

    Arguments
    --------
    state : array
        Tabla que representa el estado del puzzle
    input_element : str
        Elemento del que se quiere obtener su localización

    Returns
    -------
        Posición en la tabla del elemento.
    """
    #Renglones
    for i, row in enumerate(state):
        #Columnas
        for j, item in enumerate(row):
            #Revisa las entradas de la tabla
            #hasta encontrar el elemento
            if item == input_element:
                #Regresa el lugar del elemento
                return i, j

## Juego del 8

Ahora definimos el problema del puzzle. Se trata de una casilla de $3\times 3$ ocupada por números de 1 a 8. Existe un hueco, que denotamos como 'e', y los números se pueden mover hacia esta casilla.

El objetivo es, a partir de una configuración inicial de las casillas, llegar a ordenarlas. En este caso, la configuración final a la que queremos llegar es:

$$[1,2,3] \\ [4,5,6] \\ [7,8,e]$$

Dentro de esta clase, definimos una función para las <b>acciones</b>; estas acciones corresponde a los números que se pueden mover hacia el espacio vacío.

La función de <b>resultado de una acción</b> regresa el resultado de aplicar esa acción (mover ese número) dado el estado actual del puzzle.

In [3]:
#Estado final del puzzle
goal = [['1', '2', '3'],
        ['4','5','6'], 
        ['7', '8', 'e']]

class Puzzle(object):
    def __init__(self, initial):
        #Estado inicial
        self.initial = initial
        #Estado actual
        self.state = initial
        #Estado meta
        self.goal = goal

    def actions(self):
        """
        Función que regresa las posibles acciones que se pueden hacer,
        según el estado actual. Por cada estado regresa tres posibles acciones.

        Returns
        -------
        actions : list
            Lista de posibles acciones/movimientos del puzzle a partir del estado actual del puzzle.
        """
        #Localiza el espacio vacío 'e' en la tabla
        row_empty, col_empty = get_location(self.state, 'e')
        #Guarda las acciones
        actions = []
        #Si no está en la primera entrada del renglón
        #Se desplaza a la izquierda
        if row_empty > 0:
            actions.append(self.state[row_empty-1][col_empty])
        #Si no está en la última entrada del renglón
        #se desplaza a la derecha
        if row_empty < 2:
            actions.append(self.state[row_empty+1][col_empty])
        #Si no está en la primera entrada de la columna
        #Se desplaza hacia arriba
        if col_empty > 0:
            actions.append(self.state[row_empty][col_empty-1])
        #Si no está en la última entrada de la columna
        #Se desplaza hacia abajo
        if col_empty < 2:
            actions.append(self.state[row_empty][col_empty+1])

        return actions

    # Return the resulting state after moving a piece to the empty space
    def result(self, action):
        """
        Obtiene el resultado a partir a partir del estado actual del puzzle y de una acción a realizar.

        Arguments
        ---------
        action : str
            Elemento que se va a deslizar en la tabla (o hacia donde el elmento 'e' se desliza)

        Returns
        -------
        rows : array
            Tabla que representa el nuevo estado del puzzle al realizar la acción.
        """
        #Nuevo estado con acción
        state = deepcopy(self.state)
        #Posición del elemento 'e'
        row_empty, col_empty = get_location(self.state, 'e')
        #Posición nueva ante la acción
        row_new, col_new = get_location(self.state, action)
        #Creación del nuevo estado del puzzle
        state[row_empty][col_empty], state[row_new][col_new] = state[row_new][col_new], state[row_empty][col_empty]

        return state

Podemos ver algunos ejemplos de cómo funciona el puzzle y como es que las acciones afectan al estado del problema de búsqueda.

In [4]:
estado = [['1','e','2'],
           ['6','3','4'],
           ['7','5','8']]

ex_puzzle = Puzzle(estado)
for a in ex_puzzle.actions():
    print(a, ex_puzzle.result(a))

3 [['1', '3', '2'], ['6', 'e', '4'], ['7', '5', '8']]
1 [['e', '1', '2'], ['6', '3', '4'], ['7', '5', '8']]
2 [['1', '2', 'e'], ['6', '3', '4'], ['7', '5', '8']]


## Definición de una heurística

Tomaremos una heurística consistente y por tanto admisibles. Esta heurística es la distancia Manhattan (o $L_1$) que se define como:

$$h(n) = \sum_{x \in n} |x_i-goal_i| + |x_j - goal_j|$$

Es decir tomamos la distancia $L_i$ de la posición actual de un número o casilla hasta la posición que tendría en el estado meta. Aquí $i,j$ son las coordenadas, el renglón y la columna, respectivamente. 

In [5]:
#Guarda posiciones del estado meta
goal_positions = {}
for number in ['1','2','3','4','5','6','7','8','e']:
    goal_positions[number] = get_location(goal, number)

def heuristic(state):
    """
    Define la heurística a partir dela distancia Manhattan (L1) en el puzzle.
    
    Arguments
    ---------
    state : array
        Tabla (arreglo) que representa el estado actual del puzzle.
        
    Returns
    -------
    distance : int
        Función heurística basada en distancia Manhattan.
    """
    #Acumula las distancias
    distance = 0
    #Computa la distancia sum(|x-y|)
    for number in ['1','2','3','4','5','6','7','8','e']:
        row_new, col_new = get_location(state, number)
        row_new_goal, col_new_goal = goal_positions[number]
        distance += abs(row_new - row_new_goal) + abs(col_new - col_new_goal)
        #Distancia de linea recta (euclideana)
        #distance += np.sqrt(abs(row_new - row_new_goal)**2 + abs(col_new - col_new_goal)**2)
        
    return distance

## Algoritmo de búsqueda $A^*$

El algoritmo $A^*$ es un algoritmo de búsqueda informada que se basa en una función definida como:

$$f(n) = g(n) + h(n)$$

Donde $g(n)$ es la función de costo del camino, que tomaremos como la profundidad del estado en el árbol de búsqueda. 

La heurística $h(n)$ será la distancia Manhattan que hemos definido más arriba.

#### Cola de prioridad

Definirmeos una cola de prioridad que tome como tope al elemento que minimiza la función $f(n)$:

In [6]:
class PriorityQueue(object):
    """
    Clase de una cola de prioridad en los problemas de búsqueda.
    """
    def __init__(self,h=lambda x: 1):
        self.queue = []
        self.h = h
  
    def __str__(self):
        return ' '.join([str(q) for q in self.queue])
  
    def isEmpty(self):
        """
        Returns
        -------
        empty : bool
            Devuelve el valor True si el queue está vacío
        """
        return self.queue == []
  
    def push(self, element):
        """
        Arguments
        ---------
        element : 
            El elemento que se va agregar al queue
        """
        self.queue.append(element)
  
    def pop(self):
        """
        Elimina el elemento con más valor según un peso f
        y regresa el elemento correspondiente a este valor.
        """
        #Encuentra el elemento máximo en base al costo
        min_element = np.argmin([element.f for element in self.queue])
        #Guarda el elemento máximo
        item = self.queue[min_element]
        #Borra este elemento de la cola
        del self.queue[min_element]
    
        return item
    
    def top(self):
        """
        Devuelve el elemento con la función de costo más alta.
        A diferencia de pop, no elimina el elemento de la pila.
        """
        #Encuentra el elemento máximo en base al costo
        min_element = np.argmin([element.f for element in self.queue])
        #Guarda el elemento máximo
        item = self.queue[min_element]
        
        return item

#### Nodos

Los nodos del árbol de búsqueda guardarán:

* Los estados del problema del puzzle.
* El padre o nodo generador.
* La acción que llevó a este nodo.
* El costo del camino (profundidad en este caso).
* La función $f(n)$

In [7]:
class Node(object):
    """
    Clase para crear nodos con sus atributos.
    """
    def __init__(self):
        self.state = None
        self.parent = None 
        self.action = None
        self.path_cost = 0
        self.f = 0
        
    def __str__(self):
        return str(self.state)

#### Función de expansión de nodo

El nodo se expande según los estados que puedan resultar de las acciones posibles. En la expansión se genera los nodos hijos y en cada uno de estos se guarda el costo de ese nodoa $f(n)$.

In [8]:
def expand(problem, node):
    """
    Función para expandir los nodos dado el problema.
    
    Argumentos
    ---------
    problem : objeto
        Problema de búsqueda.
    node : objeto
        Nodo que se va a expandir.
        
    Salida
    ------
    childs :generator
        Generador con los hijos del nodo.
    """
    #Nodo en el que se inicia
    s = node.state
    for action in problem.actions():
        #Ejecuta la acción
        new_s = problem.result(action)
        
        #Genera un nuevo nodo
        new_node = Node()
        new_node.state = new_s
        new_node.parent = node 
        new_node.action = action 
        
        #El costo del camino g(n) será la profundidad
        new_node.path_cost = node.path_cost + 1
        #La función f(n) es el costo del caminoa más la heurística
        new_node.f = new_node.path_cost + heuristic(new_s)

        yield new_node

## Implementación del algoritmo

El algoritmo de $A^*$ es similar al de Best-First (Mejor primero), donde toma como función de costo a la función $f(n)$ que se basa en la heurística $h(n)$.

In [9]:
def AStar(problem):
    """
    Algoritmo A* para generar el camino más apto
    en el árbol de búsqueda de un problema basado en la heurística h.
    
    Argumentos
    ----------
    problem : objeto
        Problema de búsquda.
        
    Salida
    ------
    nodes : list
        Lista de los nodos que llevan a la solución.
    """
    #Almacenamiento de nodos
    nodes = []
    #Nodo inicial
    node = Node()
    node.state = problem.initial
    #Frontera con cola de prioridad
    frontier = PriorityQueue()
    frontier.push(node)
    #Nodos alcanzados
    reached = {str(problem.initial):node}

    #Mientras la frontera no esté vacía
    while frontier.isEmpty() == False:
        #Pop en frontera
        node = frontier.pop()
        #Guarda el nodo en la lista
        nodes.append(node)
        #Actualiza el estado del problema
        problem.state = node.state

        #Si llega a un estado final se detiene 
        #y regresa el camino de nodos
        if problem.state == problem.goal:
            return nodes

        #Expande el nodo actual
        expantion = expand(problem, node)
        for child in expantion:
            #print(child.f)
            #Guarda estado de los hijos
            state = str(child.state)
            #Guarda los hijos no alcanzados o que tengan menor costo
            if state not in reached.keys() or child.f < reached[state].f:
                reached[state] = child
                frontier.push(child)

    #Si no logra llegar a un nodo final
    #El algoritmo regresa mensaje de error
    return "No se ha logrado llegar a un estado final."

##### Prueba del método

Ahora podemos probar $A^*$ en el problema de puzzle que hemos definido. Le daremos un estado inicial y dejaremos que $A^*$ encuentre las acciones necesarias para poder obtener la solución al puzzle, es decir, llegar al estado meta.

In [10]:
"""
#Estado más simple
initial = [['1', '2', '3'], 
           ['4', 'e', '5'], 
           ['7', '8', '6']]
"""
#"""
#Estado dicicultad intermedia
initial = [['1','e','2'],
           ['6','3','4'],
           ['7','5','8']]
#"""
"""
#Este inicial requiere más iteraciones
initial = [['5', '4', '2'], 
           ['3', '1', '7'], 
           ['e', '6', '8']]
           
"""

#Creamos el modelo del puzzle
puzzle = Puzzle(initial)

Aplicando $A^*$ podemos ver cuáles son las acciones para llegar al estado final.

In [11]:
#Aplicación de A*
result = AStar(puzzle)

#Cuenta cuántos pasos para llegar a la solución
total_nodos = 0
for node in result:
    #Imprime acciones y estados
    #print("{}------>\n{}".format(node.action, np.asarray(node.state)))
    total_nodos += 1
    
print('Total de nodo en árbol: ', total_nodos)

Total de nodo en árbol:  187


### Visualización del camino hacia la meta

El camino que obtenemos a partir del árbol lo podemos obtener regresando en el árbol a partir de la hoja meta hasta la raíz del estado inicial. Recorriendo este camino obtenemos las acciones que llevan a la solución.

In [12]:
def get_path(search_tree, root):
    """
    Recorre el árbol de búsqueda de atrás hacia el inicio para obtener el camino de acciones
    que llevaron a la meta.
    """
    #Meta
    leaf = search_tree[-1]
    #Padre de la meta
    parent = leaf.parent
    #Adjunta la meta y su padre al camino
    path = [leaf, parent]
    #Recorre el árbol de búsqueda hasta el inicial
    while parent.state != root:
        parent = parent.parent
        #Adjunta los padres en el camino
        path.append(parent)
        
    return path[::-1]

pasos = 0
for n in get_path(result, initial):
    print("{} ----->\n{}".format(n.action, np.asarray(n.state)))
    pasos += 1
    
print('Total de acciones: ', pasos)

None ----->
[['1' 'e' '2']
 ['6' '3' '4']
 ['7' '5' '8']]
2 ----->
[['1' '2' 'e']
 ['6' '3' '4']
 ['7' '5' '8']]
4 ----->
[['1' '2' '4']
 ['6' '3' 'e']
 ['7' '5' '8']]
3 ----->
[['1' '2' '4']
 ['6' 'e' '3']
 ['7' '5' '8']]
6 ----->
[['1' '2' '4']
 ['e' '6' '3']
 ['7' '5' '8']]
1 ----->
[['e' '2' '4']
 ['1' '6' '3']
 ['7' '5' '8']]
2 ----->
[['2' 'e' '4']
 ['1' '6' '3']
 ['7' '5' '8']]
4 ----->
[['2' '4' 'e']
 ['1' '6' '3']
 ['7' '5' '8']]
3 ----->
[['2' '4' '3']
 ['1' '6' 'e']
 ['7' '5' '8']]
6 ----->
[['2' '4' '3']
 ['1' 'e' '6']
 ['7' '5' '8']]
4 ----->
[['2' 'e' '3']
 ['1' '4' '6']
 ['7' '5' '8']]
2 ----->
[['e' '2' '3']
 ['1' '4' '6']
 ['7' '5' '8']]
1 ----->
[['1' '2' '3']
 ['e' '4' '6']
 ['7' '5' '8']]
4 ----->
[['1' '2' '3']
 ['4' 'e' '6']
 ['7' '5' '8']]
5 ----->
[['1' '2' '3']
 ['4' '5' '6']
 ['7' 'e' '8']]
8 ----->
[['1' '2' '3']
 ['4' '5' '6']
 ['7' '8' 'e']]
Total de acciones:  16


Para probar el algoritmo, también podemos hacer que el estado inicial se genere de manera aleatoria. Así, podemos representar las acciones en cada estado del puzzle.

In [13]:
%%time
from random import shuffle

#Creamos una configuración aleatoria del puzzle
shuffle_list = deepcopy(['1','2','3','4','5','6','7','8','e'])
shuffle(shuffle_list)
initial_state = [shuffle_list[:3], shuffle_list[3:6], shuffle_list[6:]]

#Creamos el modelo de este puzzle
random_init_puzzle = Puzzle(initial_state)
#Aplicamos A*
result = AStar(random_init_puzzle)

#Cuenta cuántos pasos para llegar a la solución
total_nodos = 0
for node in result:
    #Imprime acciones y estados
    #print("{}------>\n{}".format(node.action, np.asarray(node.state)))
    total_nodos += 1
    
print('Total de nodo en árbol: ', total_nodos)

Total de nodo en árbol:  8585
CPU times: user 3.42 s, sys: 12.2 ms, total: 3.43 s
Wall time: 3.4 s


In [14]:
pasos = 0
for n in get_path(result, initial_state):
    #print("{} ----->\n{}".format(n.action, np.asarray(n.state)))
    pasos += 1
    
print('Total de acciones: ', pasos)

Total de acciones:  29
