# Sokoban (Modo Automático)

**Lee este notebook con atención**

En este notebook se carga código de notebooks anteriores, por lo que las funciones de los notebooks anteriores deberían haber sido realizadas y probadas antes de empezar con este.

Este notebook constituye la segunda parte de la práctica.

### ¿Que se va a hacer?

Se va a usar el algoritmo A\* para resolver el juego del sokoban.

### ¿Como se va a hacer?

- Se va a utilizar la implementación del A\* realizada en el notebook "Busqueda 2". Si es necesario habrá que corregir la implementación del A\* de Búsqueda 2 para que funcione.

- Se van a implementar funciones para:
    - obtener cuando un estado es meta.
    - obtener cual es el valor heurístico de un estado.
    - obtener los sucesores de un nodo. Para obtener los sucesores se va a utilizar la función mueve realizada en la primera parte de la práctica. 
    
A continuación se puede ver como usando la clase **DynamicCodeLoader** se puede cargar el código de los notebooks anteriores. Este ejemplo es solo para hacer pruebas, dado que la interfaz gráfica ya integra todo.

Todo el código del Notebook de la primera parte de la práctica se guarda en el módulo *model* y todo el código del Notebook de 'Búsqueda 2' se guarda en el módulo *search*

In [1]:
# Cargar Celda
from DynamicCodeLoader import cargaCodigoDinamico

# atento a los nombres que tengan tus notebook en tu PC
model = cargaCodigoDinamico('P1_1_Sokoban_manual.ipynb',"Model")
search = cargaCodigoDinamico('Búsqueda 2.ipynb',"Search")

### Ejemplo 1: Crear un estado y un nivel y manipularlo

Se crea un estado y un nivel usando la clase **Loader**, el método **carga_nivel**

In [2]:
# ejemplo de como se carga un nivel
from Sokoban import Level, State
from LoaderSokoban import Loader
    
l = Loader()
l.get_all_levels()
level_txt = open("./levels/"+'level0.txt','r').read()
level, state = l.carga_nivel(level_txt)

A continuación el estado se manipula usando el método mueve que se definió en la primera parte de la práctica.

In [3]:
# Ejemplos de Model
print(state)
print(model.es_meta(state.get_cajas(),level.get_destinos()))

nuevoEstado = model.mueve(level,state,[1,0])
print(nuevoEstado)





[3, 3]{(3, 1)}
False
[4, 3]{(3, 1)}


In [4]:
# creao un estado donde la caja está junto al jugador

estado = State([3,3],set([(3,2)]))

estadoNuevo = model.mueve(level,estado,[0,-1])

print(estadoNuevo)

[3, 2]{(3, 1)}


In [5]:
estado

[3, 3]{(3, 2)}

In [6]:
#Prueba con set
a = set([1,2])

In [7]:
b = a

In [8]:
c = set(a)

In [9]:
b.add(5)
a

{1, 2, 5}

In [10]:
#Fin de pruebas con set
c.add(6)
a,c


({1, 2, 5}, {1, 2, 6})

Se puede si se quiere visualizar el estado original y el estado manipulado de forma gráfica.

In [11]:
# ejemplo de como se visualiza un nivel
from UI import pinta_juegoHTML
from ipywidgets import HTML

htmlStr = pinta_juegoHTML(level, state)
HTML(value = htmlStr)

A Jupyter Widget

In [12]:
htmlStr = pinta_juegoHTML(level, nuevoEstado)
HTML(value = htmlStr)

A Jupyter Widget

### Ejemplo 2: Usar el algoritmo A\* para hacer pathfinding

En el módulo *search* tenemos una implementación de A\* y funciones y variables para hacer pathfinding.

En el ejemplo de abajo, se crea un tablero, un estado inicial y un estado final.

La función *creaNodoInicialPF* crea un nodo para el problema del PathFinding y además inicializa los valores de las variables globales search.estadoFinalPF y search.tablero, que se usan dentro de las funciones de heurística y sucesores.

Una vez creado el nodo, se invoca a la función *search.AStar* pasandole dicho nodo y las funciones de meta, heurística y sucesores.

In [13]:
tablero = [[1,1,1,1,1,1,1,1],
           [1,0,0,0,0,0,0,1],
           [1,0,1,1,0,0,0,1],
           [1,0,1,0,0,1,1,1],
           [1,1,1,0,1,0,0,1],
           [1,0,1,0,0,0,0,1],
           [1,1,1,1,1,1,1,1]]

estadoInicialPF = (1,1) #y,x
estadoFinalPF = (5,6)


def creaNodoInicialPF(ei,ef, tab, hPF):
    """ Crea un nodo
    Devuelve un nodo
    Parámetros:
    Estado inicial
    Estado final, necesario para calcular la heurística
    Tablero: necesario en la función de sucesores
    Heurística, necesaria para calcular la F.
    """    
    search.estadoFinalPF = ef 
    search.tablero = tab
    
    return search.Nodo(ei,None,0,hPF(ei))
    
""""    

nodoInicialPF = creaNodoInicialPF(estadoInicialPF,
                                  estadoFinalPF, 
                                  tablero, 
                                  search.heuristicaPF)

solucion = search.AStar(nodoInicialPF,
                        search.sucesoresPF, 
                        search.es_metaPF, 
                        search.heuristicaPF)
solucion
"""

'"    \n\nnodoInicialPF = creaNodoInicialPF(estadoInicialPF,\n                                  estadoFinalPF, \n                                  tablero, \n                                  search.heuristicaPF)\n\nsolucion = search.AStar(nodoInicialPF,\n                        search.sucesoresPF, \n                        search.es_metaPF, \n                        search.heuristicaPF)\nsolucion\n'

## Que se necesita para resolver el Sokoban usando A\*

Se necesita:
- Crear un nodo (proporcionado por el profesor)
- Saber cuando un estado es meta (proporcionado por el profesor)
- Función heurística (**Implementado por el alumno**)
- Función de sucesores (**Implementado por el alumno**)


#### Crear un nodo

La función *nodo_inicial_Sokoban* crea un nodo inicial se Sokoban con el estado y el nivel especificado. Usa fH para calcular el valor heurístico.

Además inicializa:
- nivel_global. Una variable global que puede ser usada por las funciones de meta, de hurística y de sucesores
- num_evaluados. Una variable que lleva la cuenta del número de nodos evaluados.

In [14]:
# Cargar Celda
num_evaluados = 0
coste_total = 0


def nodo_inicial_Sokoban(nivel,estado,fH):
    """ Crea un nodo de sokoban
    Devuelve un nodo
    Parámetros:
    nivel que contiene el tablero y los destinos
    estado inicial que contiene el jugador y las cajas
    fH heurística usada para calcular la F.
    """ 
    
    
    global nivel_global 
    global num_evaluados
    nivel_global= nivel
    num_evaluados = 0 # reinicio el número de evaluados
    
    nodoInicial = search.Nodo(estado,None,0,fH(estado))
    
    return nodoInicial




#### Saber cuando es meta

La función *meta_Sokoban* toma un nodo y va a devolver True si dicho nodo contiene un estado meta (todas las cajas están sobre los destinos, reutiliza es_meta de la primera parte).

Además si es meta recupera el valor de G (el coste), para saber el coste de la solución.


In [15]:
# Cargar Celda



def meta_Sokoban(nodo):
    """ Consulta si un nodo contiene un estado meta
    Devuelve True si es meta
    Parámetros:
    nodo a evaluar
    """ 
    
    global nivel_global
    global coste_total
    
    estado = nodo.getEstado()
    
    es_meta = model.es_meta(estado.get_cajas(),nivel_global.get_destinos())
    if es_meta:
        coste_total = nodo.getG()
        

    return es_meta

#### Calcular valor heurístico

**(A implementar por los alumnos)**

Esta función tiene que devolver un valor númerico que estime los movimientos que faltan para llegar a la meta.

Ejemplos:
- $f_0$ Devuelve siempre 0. Es minorate, así que encontraría el camino más corto.
- $f_1$ Devuelve el número de cajas. Es minorante, supone que se puede llevar una caja a su destino con solo un movimiento
- $f_2$ Devuelve número de cajas multiplicado por la distancia mínima entre una caja y un destino. Es minorante, supone que vamos a poder empujar las cajas en cualquier dirección.
- $f_3$ Devuelve la suma de distancias de manhatan desde cada caja a su destino más cercano. Es minorante, supone que vamos a poder empujar las cajas en cualquier dirección.

$f_0 < f_1 < f_2 < f_3$

Cuanto mayor sea el valor heurístico menos nodos se explorarán y encontrará el camino mínimo siempre que sea minorante.


In [16]:
# Cargar Celda
def heuristica_Sokoban(estado):
    """ Evalua el coste estimado desde un estado hasta la meta
    Devuelve un número positivo mayor que 0
    Parámetros:
    estado a evaluar
    """ 
    
    global nivel_global
    # cada vez que se invoca la heurística se incrementa en 1 el número de nodos evaluados
    global num_evaluados
    num_evaluados+=1
    
    # implementación de la heurística abajo
    # descomenta la heuristica que quieras usar
    return heuristica_Sokoban3(estado)
    #return heuristica_Sokoban0(estado)
    #return heuristica_Sokoban1(estado)
    #return heuristica_Sokoban2(estado)

In [17]:
# Cargar Celda
def heuristica_Sokoban3(estado):
    """ Evalua el coste estimado desde un estado hasta la meta
    Devuelve un número positivo mayor que 0
    Parámetros:
    estado a evaluar
    """
    
    # implementación de la heurística abajo
    cajas = estado.get_cajas()
    destinos = nivel_global.get_destinos()
    manhattan = 0
    for caja in cajas:
        x,y = caja
        manhattanp=999
        for destino in destinos:
            xd,yd=destino
            if manhattanp > abs(x-xd)+abs(y-yd):
                manhattanp = abs(x-xd)+abs(y-yd)
        manhattan+=manhattanp
    return manhattan

In [18]:
# Cargar Celda
def heuristica_Sokoban2(estado):
    """ Evalua el coste estimado desde un estado hasta la meta
    Devuelve un número positivo mayor que 0
    Parámetros:
    estado a evaluar
    """
    
    # implementación de la heurística abajo
    cajas = estado.get_cajas()
    destinos = nivel_global.get_destinos()
    distanciamin = 999
    distanciaact = 0
    for caja in cajas:
        x,y=caja
        for destino in destinos:
            xd,yd=destino
            distanciaact=abs(x-xd)+abs(y-yd)
            if distanciaact < distanciamin:
                distanciamin = distanciaact
                
    return len(cajas-destinos)*distanciamin

In [19]:
# Cargar Celda
def heuristica_Sokoban1(estado):
    """ Evalua el coste estimado desde un estado hasta la meta
    Devuelve un número positivo mayor que 0
    Parámetros:
    estado a evaluar
    """ 
    
    # implementación de la heurística abajo
    cajas = estado.get_cajas()
    destinos = nivel_global.get_destinos()
    return len(cajas-destinos)

In [20]:
# Cargar Celda
def heuristica_Sokoban0(estado):
    """ Evalua el coste estimado desde un estado hasta la meta
    Devuelve un número positivo mayor que 0
    Parámetros:
    estado a evaluar
    """ 
    
    return 0

#### Crear sucesores

Esta función debería de crear nodos sucesores. Siguiendo una de estas dos estrategías:

Opción sencilla:
- Habría un máximo de 4 sucesores, el resultado de ejecutar los movimientos arriba, abajo, derecha o izquierda, si alguno de los movimientos no se puede ejecutar habría menos de 4 sucesores.

Opción avanzada (ver pdf)
- Habría 2 tipos de sucesores:
    - Sucesores empujar
    - Sucesores colocarse
Si se puede empujar se empuja y sino se mueve a alguna casilla adyacente a una caja para la que exista un camino (pathfinding). De esta manera no se exploran estados intermedios en los que no existe ni la posibilidad de empujar una caja.

In [21]:
# Cargar Celda

def sucesores_Sokoban(nodo,hSoc):
    global nivel_global
    estado = nodo.getEstado()
    g = nodo.getG()
    hijos = []
    coordenadas =([1,0],[-1,0],[0,1],[0,-1])
    for coord in coordenadas:
        estadoNuevo=model.mueve(nivel_global,estado,coord)
        if not estadoNuevo == estado:
            hijos.append(search.Nodo(estadoNuevo,nodo,g+1,hSoc(estadoNuevo)+g)) 
    
    
    return hijos




In [22]:
# Cargar Celda

# Crea tantas celdas como necesites, si son funciones necesarias
# para el juego deberán empezar por Cargar Celda


### Probando las funciones

La manera de probar las funciones es igual que en la primera parte de la práctica.

Se carga un nivel donde tengamos la partida que queremos probar.

In [23]:
level_txt = open("./levels/"+'level1.txt','r').read()
level1, state1 = l.carga_nivel(level_txt)


Se usa el estado y el nivel para para crear un Nodo.

In [24]:
nodoInicial = nodo_inicial_Sokoban(level1,state1,heuristica_Sokoban)    
nodoInicial



Nodo [3, 3]{(1, 2), (3, 2)}(4)

Después de crear el nodo inicial se pueden probar las funciones.
**Siempre hay que crear un nodo inicial**

In [25]:
sucesores = sucesores_Sokoban(nodoInicial,heuristica_Sokoban)
sucesores

[Nodo [4, 3]{(1, 2), (3, 2)}(4),
 Nodo [2, 3]{(1, 2), (3, 2)}(4),
 Nodo [3, 4]{(1, 2), (3, 2)}(4),
 Nodo [3, 2]{(1, 2), (3, 1)}(3)]

In [26]:
meta = meta_Sokoban(nodoInicial)
meta

False

In [27]:
heuristica = heuristica_Sokoban(state1)
heuristica

4

Podemos probar el A\* en su conjunto de la siguiente forma:

In [28]:
solucion = search.AStar(nodoInicial,sucesores_Sokoban, meta_Sokoban, heuristica_Sokoban)
print("Solución ")
for estad in solucion:
    print(estad)
print("Nodos evaluados ",num_evaluados)
print("Coste de la solución ",coste_total)

Solución 
[3, 3]{(1, 2), (3, 2)}
[4, 3]{(1, 2), (3, 2)}
[4, 2]{(1, 2), (3, 2)}
[4, 1]{(1, 2), (3, 2)}
[3, 1]{(1, 2), (3, 2)}
[3, 2]{(1, 2), (3, 3)}
[3, 3]{(1, 2), (3, 4)}
[4, 3]{(1, 2), (3, 4)}
[4, 4]{(1, 2), (3, 4)}
[3, 4]{(1, 2), (2, 4)}
[2, 4]{(1, 2), (1, 4)}
[2, 3]{(1, 2), (1, 4)}
[1, 3]{(1, 2), (1, 4)}
[1, 2]{(1, 1), (1, 4)}
Nodos evaluados  507
Coste de la solución  13


Podriamos visualizar la solución de manera gráfica así:

In [29]:
# mejor en chrome
from ipywidgets import VBox, Label

htmls = []
for est in solucion:
    htmlStr = pinta_juegoHTML(level1, est) # estoy cargando el mapa1
    htmls.append(HTML(value = htmlStr))


from ipywidgets import Layout, Button, Box

box_layout = Layout(overflow_x='scroll',width='310px',height='',flex_direction='row',display='flex')
carousel = Box(children=htmls, layout=box_layout)
VBox([carousel])

A Jupyter Widget

Una vez hayas implementado y probado las funciones, trata de ejecutar el juego.

El Mediador que es la clase que sirve de enganche entre las clases de interfaz y la funcionalidad, leerá las celdas que empiezan por "# Cargar Celda", cargará esas funciones dinámicamente y las usará para mover y comprobar si la partida finaliza.

In [30]:
from IPython.display import display
from Mediador import Mediator
from UI import gui

import warnings
warnings.filterwarnings("ignore")
ui = gui(manual = False)
ui_elements = ui.get_ui_elements()

# atento a los nombres que tengan tus notebook
med = Mediator.get_instance(modelPath = 'P1_1_Sokoban_manual.ipynb',aStarPath = 'Búsqueda 2.ipynb',nodesPath = "P1_2_Sokoban_Automatico.ipynb")   
med.register_ui(ui_elements)



display(ui_elements)

A Jupyter Widget