# APLICACIONES EN CIENCIAS DE COMPUTACION

## Laboratorio 3:  Busqueda con Informacion (Busqueda codiciosa, A* y heurísticas)

Indicaciones previas:
- Se recomienda utilizar Jupyter Notebook para la resolución del presente cuadernillo.
- Las respuestas deben tener un buen fundamento teórico, se realizarán descuentos en el puntaje a respuestas que no contesten a lo solicitado
- Cualquier indicio de plagio resultará en la anulación de la prueba.

La tarea de este laboratorio consiste en comparar métodos de busqueda a ciegas y busqueda con información A* para buscar caminos en un laberinto.<br>La clase MazeSearchProblem necesita ser completada (metodos actions y result).<br>Deberá implementarse 4 heurísticas para A* (euclidean_dist:distancia en linea recta, manhattan_dist:distancia Manhattan, chebyshev_dist:distancia Chebyshev, lab03_dist: distancia implementada para el laboratorio 3).<br>Después de implementar lo anteriormente mencionado, realice las pruebas con el laberinto the_maze.txt.<br>Al final de este notebook se encuentran las preguntas que serán evaluadas en este laboratorio. 

**Usted deberá completar el código en las celdas respectivas**


### Clase <b>Maze</b>
La clase Maze es representada por una matriz (grid) de espacios, los cuales pueden estar libres o bloqueados. Cada celda del grid puede tener uno de los siguientes carateres:

    '#': Indica una celda con obstaculo  (impasable) 
    '~': Indica una celda con agua (pasable, con costo 6)
    '=': Indica una celda con arena (pasable, con costo 3)
    ' ': Indica una celda vacia (pasable con costo 1)
    'S': Indica la celda de inicio (Start)
    'E': Indica la celda de salida ( End )

In [26]:
class Maze:

    def __init__(self, grid):
        """ Construye el maze a partir del grid ingresado
            grid: debe ser una matriz (lista de listas), ejemplo [['#','S',' '],['#',' ','E']]  """
        self.grid = grid
        self.numRows = len(grid)
        self.numCols = len(grid[0])
        for i in range(self.numRows):
            for j in range(self.numCols):
                if len(grid[i]) != self.numCols:
                    raise "Grid no es Rectangular"
                if grid[i][j] == 'S':
                    self.startCell = (i,j)
                if grid[i][j] == 'E':
                    self.exitCell= (i,j)
        if self.exitCell == None:
            raise "No hay celda de Inicio"
        if self.startCell == None:
            raise "No hay celda de salida"
   
    def isPassable(self, row, col):
        """ Retorna true si la celda (row,col) es pasable  (' ' o '~' o '=') """
        return self.isWater(row, col) or isSAnd(row,col) or self.isClear(row, col)    
    
    def isBlocked(self, row,col):
        """ Retorna true si la celda (row,col) tiene obstaculo ('#') """
        return self.grid[row][col] == '#'   
    
    def isClear(self,row,col):
        return self.grid[row][col] == ' '
    
    def isSand(self, row,col):
        """ Retorna true si la celda (row,col) tiene obstaculo ('#') """
        return self.grid[row][col] == '='  
    
    def isWater(self, row, col):
        return self.grid[row][col] == '~' 
        
    def getNumRows(self):
        """ Retorna el numero de filas en el maze """
        return self.numRows
  
    def getNumCols(self):
        """ Retorna el numero de columnas en el maze """
        return self.numCols  
   
    def getStartCell(self):
        """ Retorna la posicion (row,col) de la celda de inicio """
        return self.startCell
  
    def getExitCell(self):
        """ Retorna la posicion (row,col) de la celda de salida """
        return self.exitCell

    def __getAsciiString(self):
        """ Retorna el string de vizualizacion del maze """
        lines = []
        headerLine = ' ' + ('-' * (self.numCols)) + ' '
        lines.append(headerLine)
        for row in self.grid:
            rowLine = '|' + ''.join(row) + '|'
            lines.append(rowLine)
        lines.append(headerLine)
        return '\n'.join(lines)

    def __str__(self):
        return self.__getAsciiString()

### Funcion para cargar una laberinto de archivo de disco

In [27]:
def readMazeFromFile(file):
    """ Lee un archivo que contiene un laberinto y retorna una instancia de Maze con dicho laberinto"""
    fin = open(file)
    lines = fin.read().splitlines()
    grid = []
    for line in lines: 
        grid.append(list(line))
    return Maze(grid)

### Clase <b>SearchProblem</b>

Esta es una clase abstracta para definir problemas de busqueda. Se debe hacer subclases que implementen los metodos de las acciones, resultados, test de objetivo y el costo de camino. Entonces se puede instanciar las subclases y resolverlos con varias funciones de busqueda.

In [28]:
class SearchProblem(object):
    def __init__(self, initial, goal=None):
        """Este constructor especifica el estado inicial y posiblemente el estado(s) objetivo(s),
        La subclase puede añadir mas argumentos."""
        self.initial = initial
        self.goal = goal

    def actions(self, state):
        """Retorna las acciones que pueden ser ejecutadas en el estado dado.
        El resultado es tipicamente una lista."""
        raise NotImplementedError

    def result(self, state, action):
        """Retorna el estado que resulta de ejecutar la accion dada en el estado state.
        La accion debe ser alguna de self.actions(state)."""
        raise NotImplementedError

    def goal_test(self, state):
        """Retorna True si el estado pasado satisface el objetivo."""
        raise NotImplementedError

    def path_cost(self, c, state1, action, state2):
        """Retorna el costo del camino de state2 viniendo de state1 con 
        la accion action, asumiendo un costo c para llegar hasta state1. 
        El metodo por defecto cuesta 1 para cada paso en el camino."""
        return c + 1

###  <b> Clase MazeSearchProblem </b>  
Esta es una subclase de SearchProblem que implementa concretamente el problema de busqueda en laberinto. El constructor recibe el laberinto en un objeto maze. Cada estado es codificado como una tupla (row,col) representando la posicion de una celda del grid. El estado inicial es la celda de inicio y el único estado objetivo es la celda de salida.
Se necesita completar Actions (acciones legales para un estado dado) y result (que hacen las acciones).

In [29]:
class MazeSearchProblem(SearchProblem):
    def __init__(self, maze):
        """El constructor recibe el maze"""
        self.maze = maze
        self.initial = maze.getStartCell()
        self.goal = maze.getExitCell()
        self.numNodesExpanded = 0        
        self.expandedNodeSet = {}   
        
    def __isValidState(self,state):
        """ Retorna true si el estado dado corresponde a una celda no bloqueada valida """
        row,col = state
        if row < 0 or row >= self.maze.getNumRows():
            return False
        if col < 0 or col >= self.maze.getNumCols():
            return False
        return not self.maze.isBlocked(row,col)        

    def actions(self, state):
        """Retorna las acciones legales desde la celda actual """
        row,col = state
        acciones = []
        if self.__isValidState((row-1, col)):
            acciones.append('N')
        if self.__isValidState((row+1, col)):
            acciones.append('S')
        if self.__isValidState((row, col-1)):
            acciones.append('W')
        if self.__isValidState((row, col+1)):
            acciones.append('E')
        return acciones
    
    def result(self, state, action):
        """Retorna el estado que resulta de ejecutar la accion dada desde la celda actual.
        La accion debe ser alguna de self.actions(state)"""  
        row,col = state
        newState = ()
        if action == 'N':
            newState = (row-1, col)
        elif action == 'S':
            newState = (row+1, col)
        elif action == 'W':
            newState = (row, col-1)
        elif action == 'E':
            newState = (row, col+1)
        return newState
    
        
    def goal_test(self, state):
        """Retorna True si state es self.goal"""
        return (self.goal == state) 

    def path_cost(self, c, state1, action, state2):
        """Retorna el costo del camino de state2 viniendo de state1 con la accion action 
        El costo del camino para llegar a state1 es c. El costo de la accion sale de self.maze """
        row, col = state2
        
        if self.maze.isClear(row, col):
            actionCost = 1
        elif self.maze.isWater(row, col):    
            actionCost = 6
        elif self.maze.isSand(row, col):    
            actionCost =  3
        elif state2 == self.maze.getStartCell() or state2 == self.maze.getExitCell():
            actionCost = 1
        else:
            raise "El costo de una celda bloqueada no esta definido" 
        return c + actionCost


### Clase <b>Node</b>

Estructura de datos para almacenar la información de un nodo en un <b>arbol de busqueda</b>. Contiene información del nodo padre y el estado que representa el nodo. Tambien incluye la acción que nos llevo al presente nodo y el costo total del camino desde el nodo raíz hasta este nodo.

In [30]:
class Node:
    def __init__(self, state, parent=None, action=None, path_cost=0):
        "Crea un nodo de arbol de busqueda, derivado del nodo parent y accion action"
        self.state = state
        self.parent = parent
        self.action = action
        self.path_cost = path_cost
        self.depth = 0
        if parent:
            self.depth = parent.depth + 1

    def expand(self, problem):
        "Devuelve los nodos alcanzables en un paso a partir de este nodo."
        return [self.child_node(problem, action)
                for action in problem.actions(self.state)]

    def child_node(self, problem, action):
        next = problem.result(self.state, action)
        return Node(next, self, action,
                    problem.path_cost(self.path_cost, self.state, action, next))

    def solution(self):
        "Retorna la secuencia de acciones para ir de la raiz a este nodo."
        return [node.action for node in self.path()[1:]]

    def path(self):
        "Retorna una lista de nodos formando un camino de la raiz a este nodo."
        node, path_back = self, []
        while node:
            path_back.append(node)
            node = node.parent
        return list(reversed(path_back))
    
    def __lt__(self, node):
        return self.state < node.state
    
    def __eq__(self, other): 
        "Este metodo se ejecuta cuando se compara nodos. Devuelve True cuando los estados son iguales"
        return isinstance(other, Node) and self.state == other.state
    
    def __repr__(self):
        return "<Node {}>".format(self.state)
    
    def __hash__(self):
        return hash(self.state)

### <b> Frontera tipo cola FIFO (first-in first out) para BFS</b> 

In [31]:
from collections import deque

class FIFOQueue(deque):
    """Una cola First-In-First-Out"""
    def pop(self):
        return self.popleft()

### <b> Frontera tipo cola de prioridad ordenada por una funcion de costo (para best_first_graph_search y A*)</b> 

In [32]:
import heapq
class FrontierPQ:
    "Una Frontera ordenada por una funcion de costo (Priority Queue)"
    
    def __init__(self, initial, costfn=lambda node: node.path_cost):
        "Inicializa la Frontera con un nodo inicial y una funcion de costo especificada (por defecto es el costo de camino)."
        self.heap   = []
        self.states = {}
        self.costfn = costfn
        self.add(initial)
    
    def add(self, node):
        "Agrega un nodo a la frontera."
        cost = self.costfn(node)
        heapq.heappush(self.heap, (cost, node))
        self.states[node.state] = node
        
    def pop(self):
        "Remueve y retorna el nodo con minimo costo."
        (cost, node) = heapq.heappop(self.heap)
        self.states.pop(node.state, None) # remove state
        return node
    
    def replace(self, node):
        "node reemplaza al nodo de la Fontera que tiene el mismo estado que node."
        if node.state not in self:
            raise ValueError('{} no tiene nada que reemplazar'.format(node.state))
        for (i, (cost, old_node)) in enumerate(self.heap):
            if old_node.state == node.state:
                self.heap[i] = (self.costfn(node), node)
                heapq._siftdown(self.heap, 0, i)
                return

    def __contains__(self, state): return state in self.states
    
    def __len__(self): return len(self.heap)

### <b>Algoritmo general de búsqueda con memoria de nodos expandidos (Graph Search)</b>

Algoritmo de general de busqueda ciega con memoria de estados visitados. El argumento frontier debe ser una cola vacia. Si la frontera es tipo FIFO hace busqueda en amplitud (BFS), si la frontera es una pila hará busqueda en profundidad (DFS)

In [33]:
def graph_search(problem, frontier):
    frontier.append(Node(problem.initial))
    explored = set()     # memoria de estados visitados
    visited_nodes = []   # almacena nodos visitados durante la busqueda
    while frontier:
        node = frontier.pop()
        visited_nodes.append(node)
        if problem.goal_test(node.state):
            return node, visited_nodes
        explored.add(node.state)
        
        frontier.extend(child for child in node.expand(problem)
                        if child.state not in explored and
                        child not in frontier)
    return None

### <b> Algoritmo Best-First-Graph-Search </b> 
Algoritmo general de busqueda con información. La frontera es una cola de prioridad ordenada por la funcion de evaluacion f 

In [34]:
def best_first_graph_search(problem, f):
    """Busca el objetivo expandiendo el nodo de la frontera con el menor valor de la funcion f. Memoriza estados visitados
    Antes de llamar a este algoritmo hay que especificar La funcion f(node). Si f es node.depth tenemos Busqueda en Amplitud; 
    si f es node.path_cost tenemos Busqueda  de Costo Uniforme. Si f es una heurística tenemos Busqueda Voraz;
    Si f es node.path_cost + heuristica(node) tenemos A* """

    frontier = FrontierPQ( Node(problem.initial), f )  # frontera tipo cola de prioridad ordenada por f
    explored = set()     # memoria de estados visitados
    visited_nodes = []   # almacena nodos visitados durante la busqueda
    while frontier:
        node = frontier.pop()
        visited_nodes.append(node)        
        if problem.goal_test(node.state):
            return node, visited_nodes
        explored.add(node.state)
        for action in problem.actions(node.state):
            child = node.child_node(problem, action)
            if child.state not in explored and child.state not in frontier:
                frontier.add(child)
            elif child.state in frontier:
                incumbent = frontier.states[child.state] 
                if f(child) < f(incumbent):
                    frontier.replace(child)

### <b> Algoritmo A* </b> 
A* es un caso especial de best_first_graph_search con f = path_cost + heuristic

In [35]:
def astar_search(problem, heuristic):
    f = lambda node: node.path_cost + heuristic(node, problem)
    return best_first_graph_search(problem, f)

def nullheuristic(node, problem):   # heurística nula (A* se convierte en busqueda de costo uniforme)
    return 0

### <b> Heurísticas para A* </b> 
Se debe implementar las heurísticas abajo para A* 

In [36]:
import math

def euclidean_dist(node, problem):
    "Distancia en linea recta desde la celda de node hasta la celda Objetivo (problem.goal)"
    (sx , sy) = node.state     #estado actual (posicion de fila y columna)
    (gx , gy) = problem.goal   #estado objetivo (fila y columna)
    dx = abs(sx - gx)
    dy = abs(sy - gy)
    square = dx * dx + dy * dy
    return math.sqrt(square)
    
     
def manhattan_dist(node, problem):
    "Distancia Manhattan (o city block) desde la celda de node hasta la celda Objetivo (problem.goal)"
    (sx , sy) = node.state     #estado actual (posicion de fila y columna)
    (gx , gy) = problem.goal   #estado objetivo (fila y columna)
    dx = abs(sx - gx)
    dy = abs(sy - gy)
    return dx + dy
    
    
def chebyshev_dist(node, problem):
    "Distancia de chebyshev (https://chris3606.github.io/GoRogue/articles/grid_components/measuring-distance.html#chebyshev-distance) desde la celda de node hasta la celda Objetivo (problem.goal)"
    (sx , sy) = node.state     #estado actual (posicion de fila y columna)
    (gx , gy) = problem.goal   #estado objetivo (fila y columna)
    dx = abs(sx - gx)
    dy = abs(sy - gy)
    return max(dx, dy)

    
def lab03_dist(node, problem):
    "Es el valor máximo de evaluar la distancia Euclidiana, Manhattan y Chebyshev"
    ## COMPLETAR
    return max(euclidean_dist(node, problem), manhattan_dist(node, problem), chebyshev_dist(node, problem))
  
    

### <b> Función para mostrar los resultados </b> 

In [37]:
def displayResults(maze, visitedNodes, solutionNodes):
    """ Muestra los resultados de busqueda en el maze.   """
    grid_copy = []
    for row in maze.grid:
        grid_copy.append([x for x in row]) 
    for node in visitedNodes:
        row,col = node.state
        ch = maze.grid[row][col]
        if ch != 'S' and ch != 'E': grid_copy[row][col] = 'o' 
    for node in solutionNodes:  
        row,col = node.state
        ch = maze.grid[row][col]
        if ch != 'S' and ch != 'E': grid_copy[row][col] = 'x'    
    maze_copy = Maze(grid_copy)
    print (maze_copy)
    print ("x - celdas en la solucion")
    print ("o - celdas visitadas durante la busqueda")
    print ("-------------------------------")

## <b> Experimentación con los algoritmos de Busqueda</b> 


In [38]:
""" Carga un laberinto de archivo en disco e instancia el problema de busqueda.   """
maze = readMazeFromFile('maze3.txt') 
p = MazeSearchProblem(maze)
print(maze)

 --------------------------- 
|#################~~~~~~~~~~|
|#################    =~   #|
|~~  S~~~~    ==   =~==~   #|
| ~~~~~ ~~~  ====  ==~=~~  #|
| ~   ===~~   #==   =~=~~  #|
|~~   ===~~  ###    =~     #|
|~~~  ===~~  ##   ###~     #|
|~=~    ~~        ## ~   ###|
| =~   ~  ##  == =~ =~   ###|
|~~    ==###  == =~      ###|
|##########   ==        ~###|
|~~~~~~~~         ~~~~##~   |
| ### # # ### ### ====##=   |
| # # # # #   # #   ==~~~=  |
| ### # # #   ###   =~~~==  |
| #   # # #   #     =##~E   |
| #   ### ### #     =##     |
|~~~~~~~~~~~~~~~~~~~~~~~~~~~|
 --------------------------- 


### Búsqueda en amplitud (BFS)

In [39]:
nsol, visited_nodes = graph_search(p, FIFOQueue())
print('Solucion BFS: {}. Nodos visitados={}. Costo Solucion = {}'.format(nsol.solution(), len(visited_nodes),nsol.path_cost))
displayResults(maze, visited_nodes, nsol.path())

Solucion BFS: ['S', 'S', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'E']. Nodos visitados=339. Costo Solucion = 69
 --------------------------- 
|#################oooooooooo|
|#################ooooooooo#|
|ooooSooooooooooooooooooooo#|
|ooooxooooooooooooooooooooo#|
|ooooxoooooooo#oooooooooooo#|
|ooooxooooooo###ooooooooooo#|
|ooooxooooooo##ooo###oooooo#|
|ooooxxxxxxxxooooo##ooooo###|
|ooooooooo##xoooooooooooo###|
|oooooooo###xoooooooooooo###|
|##########oxoooooooooooo###|
|oooooooooooxxxxxxoooo##oooo|
|o###o#o#o###o###xoooo##ooo |
|o# #o#o#o#ooo# #xoooooooo  |
|o###o#o#o#ooo###xxxxxxxo=  |
|o#ooo#o#o#ooo#oooooo##xE   |
|o#ooo###o###o#oooooo##o    |
|~ooooooooooooooooooooo~~~~~|
 --------------------------- 
x - celdas en la solucion
o - celdas visitadas durante la busqueda
-------------------------------


### Búsqueda en profundidad (DFS)

In [40]:
nsol, visited_nodes = graph_search(p, [])
print('Solucion DFS: {}. Nodos visitados={}. Costo Solucion = {}'.format(nsol.solution(), len(visited_nodes),nsol.path_cost))
displayResults(maze, visited_nodes, nsol.path())

Solucion DFS: ['E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'S', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'S', 'S', 'E', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'S', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'S', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'W', 'S', 'S', 'S', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'N', 'N', 'W', 'W', 'W']. Nodos visitados=110. Costo Solucion = 367
 --------------------------- 
|#################~~~~~~~~~~|
|#################    =~   #|
|~~  Sxxxxxxxxxxxxxxxxxxxxx#|
| ~~~~~ ~~~  ====  ==~=~~ x#|
| ~   ===~~   #oxxxxxxxxxxx#|
|~~   ===~~  ###x   =~     #|
|~~~  ===~~  ## xx###~     #|
|~=~    ~~       x## ~   ###|
| =~   ~  ##  == xxxxxxxx###|
|~~    ==###  == =~     x###|
|##########xxxxxxxxxxxxxx###|
|xxxxxxxxxxx      ~~~~##~   |
|x### # # ##

### Búsqueda A* con heurística nula (UCS)

In [41]:
nsol, visited_nodes = astar_search(p, nullheuristic)
print('Solucion A* y heuristica nula (UCS): {}. Nodos visitados={}. Costo Solucion = {}'.format(nsol.solution(), len(visited_nodes),nsol.path_cost))
displayResults(maze, visited_nodes, nsol.path())

Solucion A* y heuristica nula (UCS): ['S', 'S', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'E', 'E', 'S', 'S', 'S', 'S', 'W', 'W']. Nodos visitados=322. Costo Solucion = 61
 --------------------------- 
|#################ooooooooo~|
|#################ooooooooo#|
|ooooSooooooooooooooooooooo#|
|ooooxooooooooooooooooooooo#|
|ooooxoooooooo#oooooooooooo#|
|ooooxooooooo###ooooooooooo#|
|ooooxooooooo##ooo###oooooo#|
|ooooxxxxxxxxxxxxo##ooooo###|
|ooooooooo##ooooxoooooooo###|
|oooooooo###ooooxoooooooo###|
|##########oooooxxxxxxxxx###|
|~~~~ooooooooooooooooo##xxxo|
| ###o#o#o###o###ooooo##ooxo|
| # #o#o#o#ooo# #ooooooo~oxo|
| ###o#o#o#ooo###oooooo~=oxo|
| #   #o#o#ooo#oooooo##~Exxo|
| #   ###o###o#oooooo##   o |
|~~~~~~ooooooooooooooo~~~~~~|
 --------------------------- 
x - celdas en la solucion
o - celdas visitadas durante la busqueda
-------------------------------


### Búsqueda A* con heurística euclidean_dist (Completar el código para mostrar los resultados de la búsqueda con heurística euclidean_dist)

In [42]:
nsol, visited_nodes = astar_search(p, euclidean_dist)
print('Solucion A* y distancia euclideana: {}. Nodos visitados={}. Costo Solucion = {}'.format(nsol.solution(), len(visited_nodes),nsol.path_cost))
displayResults(maze, visited_nodes, nsol.path())

Solucion A* y distancia euclideana: ['S', 'S', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'E', 'S', 'E', 'S', 'S', 'S', 'W', 'W']. Nodos visitados=276. Costo Solucion = 61
 --------------------------- 
|#################oo~~~~~~~~|
|#################ooooo~   #|
|ooooSooooooooooooooooo~   #|
|ooooxooooooooooooooo~=~~  #|
|ooooxoooooooo#oooooooo~~o #|
|ooooxooooooo###ooooooooooo#|
|ooooxooooooo##ooo###oooooo#|
|ooooxxxxxxxxxxxxo##ooooo###|
|ooooooooo##ooooxoooooooo###|
|oooooooo###ooooxoooooooo###|
|##########oooooxxxxxxxxx###|
|~~~~~~~oooooooooooooo##xxoo|
| ### # #o###o###ooooo##oxx |
| # # # #o#ooo# #ooooooo~ox |
| ### # #o#ooo###oooooo~==x |
| #   # #o#ooo#oooooo##~Exx |
| #   ###o###o#oooooo##     |
|~~~~~~~~o~~~oooooooo~~~~~~~|
 --------------------------- 
x - celdas en la solucion
o - celdas visitadas durante la busqueda
-------------------------------


### Búsqueda A* con heurística manhattan_dist (Completar el código para mostrar los resultados de la búsqueda con heurística manhattan_dist)

In [43]:
nsol, visited_nodes = astar_search(p, manhattan_dist)
print('Solucion A* y distancia Manhattan: {}. Nodos visitados={}. Costo Solucion = {}'.format(nsol.solution(), len(visited_nodes),nsol.path_cost))
displayResults(maze, visited_nodes, nsol.path())

Solucion A* y distancia Manhattan: ['S', 'S', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'E', 'S', 'E', 'S', 'S', 'S', 'W', 'W']. Nodos visitados=268. Costo Solucion = 61
 --------------------------- 
|#################~~~~~~~~~~|
|#################ooooo~   #|
|ooooSoooooooooooooo~o=~   #|
|ooooxooooooooooooooo~=~~  #|
|ooooxoooooooo#oooooooo~~o #|
|ooooxooooooo###ooooooooooo#|
|ooooxooooooo##ooo###~ooooo#|
|ooooxxxxxxxxxxxxo##ooooo###|
|ooooooooo##ooooxoooooooo###|
|oooooooo###ooooxoooooooo###|
|##########oooooxxxxxxxxx###|
|~~~~~~~oooooooooooooo##xxo |
| ### # #o###o###ooooo##oxx |
| # # # #o#ooo# #ooooooo~ox |
| ### # #o#ooo###oooooo~==x |
| #   # #o#ooo#oooooo##~Exx |
| #   ###o###o#oooooo##     |
|~~~~~~~~~~~~o~oooooo~~~~~~~|
 --------------------------- 
x - celdas en la solucion
o - celdas visitadas durante la busqueda
-------------------------------


### Búsqueda A* con heurística chebyshev_dist (Completar el código para mostrar los resultados de la búsqueda con heurística chebyshev_dist)

In [44]:
nsol, visited_nodes = astar_search(p, chebyshev_dist)
print('Solucion A* y distancia Chebyshev: {}. Nodos visitados={}. Costo Solucion = {}'.format(nsol.solution(), len(visited_nodes),nsol.path_cost))
displayResults(maze, visited_nodes, nsol.path())

Solucion A* y distancia Chebyshev: ['S', 'S', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'E', 'S', 'E', 'S', 'S', 'S', 'W', 'W']. Nodos visitados=281. Costo Solucion = 61
 --------------------------- 
|#################ooo~~~~~~~|
|#################ooooo~   #|
|ooooSooooooooooooooooo~   #|
|ooooxoooooooooooooooo=~~  #|
|ooooxoooooooo#oooooooo~~oo#|
|ooooxooooooo###ooooooooooo#|
|ooooxooooooo##ooo###oooooo#|
|ooooxxxxxxxxxxxxo##ooooo###|
|ooooooooo##ooooxoooooooo###|
|oooooooo###ooooxoooooooo###|
|##########oooooxxxxxxxxx###|
|~~~~~~~oooooooooooooo##xxoo|
| ### # #o###o###ooooo##oxxo|
| # # # #o#ooo# #ooooooo~oxo|
| ### # #o#ooo###oooooo~==x |
| #   # #o#ooo#oooooo##~Exx |
| #   ###o###o#oooooo##     |
|~~~~~~~~o~~~oooooooo~~~~~~~|
 --------------------------- 
x - celdas en la solucion
o - celdas visitadas durante la busqueda
-------------------------------


### Búsqueda A* con heurística lab03_dist (Completar el código para mostrar los resultados de la búsqueda con heurística lab03_dist)

In [45]:
nsol, visited_nodes = astar_search(p, lab03_dist)
print('Solucion A* y distancia Laboratorio 03: {}. Nodos visitados={}. Costo Solucion = {}'.format(nsol.solution(), len(visited_nodes),nsol.path_cost))
displayResults(maze, visited_nodes, nsol.path())

Solucion A* y distancia Laboratorio 03: ['S', 'S', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'S', 'S', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'S', 'E', 'S', 'E', 'S', 'S', 'S', 'W', 'W']. Nodos visitados=268. Costo Solucion = 61
 --------------------------- 
|#################~~~~~~~~~~|
|#################ooooo~   #|
|ooooSoooooooooooooo~o=~   #|
|ooooxooooooooooooooo~=~~  #|
|ooooxoooooooo#oooooooo~~o #|
|ooooxooooooo###ooooooooooo#|
|ooooxooooooo##ooo###~ooooo#|
|ooooxxxxxxxxxxxxo##ooooo###|
|ooooooooo##ooooxoooooooo###|
|oooooooo###ooooxoooooooo###|
|##########oooooxxxxxxxxx###|
|~~~~~~~oooooooooooooo##xxo |
| ### # #o###o###ooooo##oxx |
| # # # #o#ooo# #ooooooo~ox |
| ### # #o#ooo###oooooo~==x |
| #   # #o#ooo#oooooo##~Exx |
| #   ###o###o#oooooo##     |
|~~~~~~~~~~~~o~oooooo~~~~~~~|
 --------------------------- 
x - celdas en la solucion
o - celdas visitadas durante la busqueda
-------------------------------


## Preguntas

<b>1) Completar el código faltante (Clases y Heurísticas). (3 ptos)<br>   

Completado.

<b>2) En cuanto a los resultados obtenidos, ¿los algoritmos BFS o DFS encuentran soluciones óptimas?.<br> &nbsp; ¿Qué requisito necesita el problema para que alguno de estos algoritmos encuentre soluciones óptimas? (3 ptos) </b><br>  

En este caso en particular, la ssoluciones BFS y DFS no encontraron la solución óptima; además, en un caso genérico no deberían por qué coincidir ya que tanto BFS como DFS no están tratando de optimizar algo, simplemente realizan un recorrido de una determinada manera (expandiendo utilizando una pila o una cola).
Solo en el caso de BFS, cuando todos los costos son iguales, es decir, dado un grafo $G = (V, E)$, si existe una constante $c \geq 0$ tal que $\text{peso}(e) = c$, para toda arista $e \in E$, tenemos que BFS computa la distancia mínima desde el nodo en el cual se lanzó este algoritmo hasta todos los alcanzables.
Por otro lado, establecer algún requisito para que DFS encuentre una solución óptima es mucho más difícil puesto que este algoritmo se basa en un backtracking. La única manera que podemos garantizar que el DFS encuentra una solución óptima es que exista un único camino desde el nodo origen hacia el nodo destino e igualmente para cada uno de los nodos que pertenecen a dicho camino, en otro caso, al poder existir múltiples maneras de llegar a cualquiera de esos nodos, no podemos garantizar de que el costo sea el óptimo.

<b>3) En cuanto a las soluciones encontradas por A*, ¿ellas serán siempre óptimas?.<br> &nbsp; ¿Qué necesita la heurística para garantizar soluciones óptimas?.<br> &nbsp; ¿Las heurísticas planteadas para el laboratorio cumplen con estos requisitos?. Explique. (4 ptos)</b><br>


Debido a la naturaleza de las heurísticas proporcionadas en este laboratorio, afirmo que nuestras soluciones serán óptimas.
Para que una heurística garantice optimalidad, esta tiene que ser admisible y consistente.
Probemos que cada una de las heurísticas proporcionadas son óptimas.
<ul>
    <li>
        Euclideana:
        Esta heurística es admisible, puesto que transicionar de un nodo a otro nos costará 1, 3 o 6, lo cual es siempre mayor o igual a 1. Así, el costo con la menor cantidad de movimientos en caso no haya obstáculos (de haberlo, se harían más movimientos) sería mayor o igual a la distancia manhattan, la cual la podemos interpretar como la suma de los catetos del triángulo rectángulo que conecta nuestro nodo actual con el abjetivo. Como la distancia euclideana es equivalente a la medida de la hipotenusa, por la desigualdad triangular en $\mathbb{R}^2$ tenemos que $euclideana(n) \leq h^*(n)$. La consistencia también se desprende de manera inmediata de lo anterior. pues dados $n, n', a \in V$ tenemos por la desigualdad triangular en $\mathbb{R}^2$
        $$h(n) = euclideana(n, t) \leq euclideana(n, n') + euclideana(n', t) \leq c(n, a, n') + h(n'),$$
        donde $t$ es el nodo objetivo.
    </li>
    <li>
        Manhattan:
        Esta heurística es admisible trivialmente, por el argumento dado en uno ya que el manhattan entre nodos adyacentes es igual a 1 y nuestros costos de acciones son mayores o iguales a 1, por lo que nuestra heurística siempre será menos que el costo real.
        Asimismo, es consistente utilizando el mismo argumento similar puesto que la desigualdad triangular la podemos probar sencillamente analizando dos casos, dados dos puntos, chequeamos lo que ocurre cuando el punto intermedio se encuentra dentro de la región que encierra rectangularmente al origen y el destino, y si está fuera, es sencillo ver que es estrictamente mayor. Así, como cumple con la desigualdad triangular en $\mathbb{R}^2$, de la misma manera cumple con la desigualdad triangular heurística.
    </li>
    <li>
        Chebyshev:
    </li>
    Esta heurística es óptima trivialmente, por el mismo hecho que el máximo entre las distancias de los catetos es menor o igual a la suma de estos, y por transitividad, va a ser siempre menor o igual a la distancia manhattan, por lo que heredaría inmediatamente la admisibilidad y consistencia.
    <li>
        Laboratorio:
        Al igual que la de Chebyshev, esta heurística es óptima trivialmente, y principalmente porque la función máximo es una función continua en $\mathbb{R}^n$, en particular, en $\mathbb{R}^2$ y estamos componiendo una función continua con funciones óptimas, por lo que las propiedades de admisibilidad y consistencia trivialmente se desprenden de esta al analizar las diferentes situaciones.
    </li>
</ul>

<b>4) En cuanto al costo temporal, ¿qué método visita menos nodos?.<br> &nbsp; ¿Cómo podría esto beneficiar a casos reales en los que se emplee algoritmos A*? (3 ptos) </b><br>

El método que visita menos nodos es laboratorio.
Dadas las heurísticas euclideana: $V \times V \to \mathbb{R}$, manhattan: $V \times V \to \mathbb{R}$, chebyshev: $V \times V \to \mathbb{R}$ y laboratorio: $V \times V \to \mathbb{R}$ cuyas reglas de correspondencia fueron definidas previamente.
Afirmo que la heurística laboratorio domina a cualquiera de las otras tres. Concluir esto es trivial, pues dado un nodo $n \in V$ fijo pero arbitrario y cualquier heurística $h$ en {euclideana, manhattan, chebyshev} tenemos que
$$
h(n) \leq \max(euclideana(n), manhattan(n), chebyshev(n)) = laboratorio(n).
$$
Por lo tanto, laboratorio domina a las demás heurísticas.
De esta manera, al estar expandiendo nodos más cercanos a nuestro objetivo, expandimos menos nodos.
Como consecuencia inmediata, el beneficio es que necesitamos menos memoria para poder realizar el análisis en el grafo. Asimismo, como expandemos menos nodos, tenemos menos complejidad en tiempo.

<b>5) ¿Existe relación de dominancia entre algún par de heurísticas implementadas (No considerar heurística nula)?. &nbsp; <br>¿Guarda alguna relación la solución de menor costo temporal y la heurística dominante? Explique. (3 ptos) </b><br>

Como se ha desarrollado ampliamente en la pregunta 2, existen muchas relaciones de dominancia en las heurísticas proporcionados.
La más fácil es la de Chebyshev, la cual es dominada por todas las demás, puesto que el máximo de las diferencias, es el tamaño del mayor cateto, lo cual es menor o igual a la suma de ambos, el cual es menor o igual a la hipotenusa, y el cual trivialmente es menor o igual que le máximo de las tres que obtengamos.
Asimismo, euclideana es dominada por Manhattan puesto que la medida de la hipotenusa es menor estricto que la suma de los catetos, y también es dominada por laboratorio puesto que es el máximo entre cualquiera.
Luego, Manhattan es fácilmente dominada por laboratorio debido a que siempre cogerá el máximo de las otras mediciones o esa misma.
En la pregunta 4 hemos probado que laboratorio domina a las demás heurísticas.
Respecto a si guarda alguna relación la solución de menor costo temporal con la heurística dominante, esto ya fue justificado en la pregunta 4.

<b>6) ¿Explique cómo expande nodos cada método (UCS y las 4 heurísticas)?.<br>¿Coinciden las propiedades de una heurística con las zonas exploradas por cada una en las pruebas? Explique. (4 ptos)</b><br>

El método UCS expande sus nodos de manera greedy utilizando el costo menor de llegar desde el origen hacia el nodo actual sin alguna heurística.
Por este motivo, este induce un árbol de expansión que va ramificándose de manera regular.
Por otro lado, nuestras otras 4 heurísticas tienen maneras distintas de ir expandiendo por su naturaleza, las cuales son fáciles de analizar con nuestro conocimiento básico de topología en $\mathbb{R}^n$ utilizando el teorema de equivalencia de normas. Debido a esto, cuatro tendrán una manera suave de expansión, pero con una distinta forma. Por ejemplo, la norma de la suma trata de expandirse como en un rombo debido a las ecuaciones que implican mantener las sumas. La norma del chevyshev, al ser la norma del máximo, se va expandiendo como un cuadrado, la normal euclideana trata de ir expandiéndose como una circunferencia (y normalmente se suele deformar de manera elíptica) mientras que la de laboratorio se expande fusionando un poco los previos, por lo que tendría una forma un poco amorfa pero limpia en el sentido de crecimiento.
Efectivamente, estas propiedades coinciden con las zonas exploradas por lo mencionado arriba, sin embargo, no podemos apreciarlo tanto en el output obtenido porque es el estado final del mapa, pero si lo viésemos ir creciendo, obtendríamos una visualización muy similar de acuerdo a la teoría de Análisis Real.