# Kwirk (Modo Automático)

**Lee este notebook con atención**

En este notebook se carga código de notebooks anteriores, por lo que las funciones de los notebooks anteriores deberían haber sido realizadas y **probadas exhaustivamente** antes de empezar con este.

Dado que este notebook carga código de notebooks anteriores, cada vez que se cambie o corrija uno de los notebooks anteriores **es necesario** recargar este notebook al completo.

Este notebook constituye la segunda parte de la primera y más importante práctica obligatoria.

### ¿Que se va a hacer?

Se va a usar el algoritmo A\* para resolver el juego del Kwirk.

### ¿Como se va a hacer?

- Se va a utilizar la implementación del A\* realizada en el notebook "Busqueda 2". Si es necesario habrá que corregir la implementación del A\* de Búsqueda 2 para que funcione este notebook correctamente. 

- Se van a implementar funciones para:
    - obtener cuando un estado es meta.
    - obtener cual es el valor heurístico de un estado.
    - obtener los sucesores de un nodo. Para obtener los sucesores se va a utilizar la función **move** realizada en la primera parte de la práctica. 

Dado que la implementación de A\* es genérica debe de funcionar con cualquier problema solo cambiando las funciones anteriores.

---------------------------
    
A continuación se puede ver como usando la clase **DynamicCodeLoader** se puede cargar el código de los notebooks anteriores. Este ejemplo es solo para hacer pruebas, dado que la interfaz gráfica ya integra todo.

Todo el código del Notebook de la primera parte de la práctica se guarda en el módulo *model* y todo el código del Notebook de 'Búsqueda 2' se guarda en el módulo *search*

# Autores:
- **Rodrigo Díaz García**
- **Miguel Barriuso García**

In [1]:
# Cargar Celda
from DynamicCodeLoader import cargaCodigoDinamico

# atento a los nombres que tengan tus notebook en tu PC
model = cargaCodigoDinamico('Kwirk_2.ipynb', "Model")
search = cargaCodigoDinamico('Busqueda_2.ipynb',"Search")

### Ejemplo 1: Crear un estado y un nivel y manipularlo

Se crea un estado y un nivel usando la clase **Loader**, el método **carga_nivel**

In [2]:
# ejemplo de como se carga un nivel
import os
from Kwirk import Level, State
from LoaderKwirk import Loader
    
l = Loader()
l.get_all_levels()
# os.sep es el separador de ficheros ("/" en linux "\" en windows)
level_txt = open("."+os.sep+"levels"+os.sep+"level_medio.txt",'r').read()
level, state = l.load_level(level_txt)

A continuación el estado se manipula usando el método **move** que se definió en la primera parte de la práctica.

Esta parte solo funcionará si esta terminado y corregido el notebook **P1_1_Kwirk_manual**

In [3]:
# Ejemplos de Model
print(state)
print(model.is_goal(state))

print("model.move(\n{}, \n{}, \n{})".format(level,state,[0,1]))
new_state = model.move(level,model.change_turn(state),[0,1])
print(new_state)

[[3, 4], [2, 1]]{(2, 2)}{(2, 4)}True
False
model.move(
[(1, 1, 1, 1, 1, 1), (1, 0, 0, 1, 0, 1), (1, 0, 0, 0, 0, 1), (1, 0, 1, 0, 0, 1), (1, 1, 1, 1, 1, 1)](1, 4), 
[[3, 4], [2, 1]]{(2, 2)}{(2, 4)}True, 
[0, 1])
[[3, 4], [2, 2]]{(2, 3)}{(2, 4)}False


Se puede si se quiere visualizar el estado original y el estado manipulado de forma gráfica.

In [4]:
# ejemplo de como se visualiza un nivel
from UI import gui
from ipywidgets import HTML
ui = gui()
htmlStr = ui.get_html(level, state)
HTML(value = htmlStr)

HTML(value='<style> img.game {width: 50px !important; height: 50px !important;}</style><table><tr><td><img cla…

In [5]:
htmlStr = ui.get_html(level, new_state)
HTML(value = htmlStr)

HTML(value='<style> img.game {width: 50px !important; height: 50px !important;}</style><table><tr><td><img cla…

### Ejemplo 2: Usar el algoritmo A\* para hacer pathfinding

En el módulo *search* tenemos una implementación de A\* y funciones y variables para hacer *pathfinding* (El problema de ir de la coordenada A a la coordenada B en un espacio de estados de coordenadas sin cajas, agua ni nada).

En el ejemplo de abajo, se crea un tablero, un estado inicial y un estado final.

La función *creaNodoInicialPF* crea un nodo para el problema del PathFinding y además inicializa los valores de las variables globales search.estadoFinalPF y search.tablero, que se usan dentro de las funciones de heurística y sucesores.

Una vez creado el nodo, se invoca a la función *search.AStar* pasandole dicho nodo y las funciones de meta, heurística y sucesores.

Esta celda solo funcionará si está implementado y corregido el notebook **Busqueda 2**.

In [6]:
tablero = [[1,1,1,1,1,1,1,1],
           [1,0,0,0,0,0,0,1],
           [1,0,1,1,0,0,0,1],
           [1,0,1,0,0,1,1,1],
           [1,1,1,0,1,0,0,1],
           [1,0,1,0,0,0,0,1],
           [1,1,1,1,1,1,1,1]]

estadoInicialPF = (1,1) #y,x
estadoFinalPF = (5,6)


def creaNodoInicialPF(ei,ef, tab, hPF):
    """ Crea un nodo
    Devuelve un nodo
    Parámetros:
    Estado inicial
    Estado final, necesario para calcular la heurística
    Tablero: necesario en la función de sucesores
    Heurística, necesaria para calcular la F.
    """    
    search.estadoFinalPF = ef 
    search.tablero = tab
    
    return search.Nodo(ei,None,0,hPF(ei))
    
    

nodoInicialPF = creaNodoInicialPF(estadoInicialPF,
                                  estadoFinalPF, 
                                  tablero, 
                                  search.heuristicaPF)

solucion = search.AStar(nodoInicialPF,
                        search.sucesoresPF, 
                        search.es_metaPF, 
                        search.heuristicaPF)
print(solucion)

[(1, 1), (1, 2), (1, 3), (1, 4), (2, 4), (3, 4), (3, 3), (4, 3), (5, 3), (5, 4), (5, 5), (5, 6)]


## Que se necesita para resolver el Kwirk usando A\*

Se necesita:
- Crear un nodo (proporcionado por el profesor)
- Saber cuando un estado es meta (proporcionado por el profesor)
- Función heurística (**Implementado por el alumno**)
- Función de sucesores (**Implementado por el alumno**)


Todas estas funciones estarán en celdas que comienzan por #Cargar Celda.
Así el código del profesor podrá cargar las funciones desarrolladas por el alumno y usarlas en la interfaz gráfica.

#### Crear un nodo

La función **nodo_inicial_Kwirk** crea un nodo inicial se Kwirk con el estado y el nivel especificado. Usa la función fH para calcular el valor heurístico.

Además inicializa:
- nivel_global. Una variable global que puede ser usada por las funciones de meta, de hurística y de sucesores
- num_evaluados. Una variable que lleva la cuenta del número de nodos evaluados. Y saber posteriormente que implementación de heurística es mejor.

In [7]:
# Cargar Celda
num_evaluados = 0
coste_total = 0


def nodo_inicial_Kwirk(nivel,estado,fH):
    """ Crea un nodo de sokoban
    Devuelve un nodo
    Parámetros:
    nivel que contiene el tablero y los destinos
    estado inicial que contiene el jugador y las cajas
    fH heurística usada para calcular la F.
    """ 
    global nivel_global 
    global num_evaluados
    nivel_global= nivel
    
    nodoInicial = search.Nodo(estado,
                              None,
                              0,
                              fH(estado))

    num_evaluados = 0 # reinicio el número de evaluados
    
    return nodoInicial




#### Saber cuando es meta

La función *meta_Sokoban* toma un nodo y va a devolver True si dicho nodo contiene un estado meta (todas las cajas están sobre los destinos, reutiliza es_meta de la primera parte).

Además si es meta recupera el valor de G (el coste), para saber el coste de la solución.


In [8]:
# Cargar Celda


# goal
def meta_Kwirk(nodo):
    """ Consulta si un nodo contiene un estado meta
    Devuelve True si es meta
    Parámetros:
    nodo a evaluar
    """ 
    
    global nivel_global
    global coste_total
    
    estado = nodo.getEstado()
    
    es_meta = model.is_goal(estado)
    if es_meta:
        coste_total = nodo.getG()
        

    return es_meta

#### Calcular valor heurístico

**(A implementar por los alumnos)**

Esta función tiene que devolver un valor númerico que estime los movimientos que faltan para llegar a la meta.

Ejemplos:
- $f_0$ Devuelve siempre 0. Es minorate, así que encontraría el camino más corto.
- $f_1$ Devuelve la suma de distancias de manhatan entre la meta y los jugadores. Es minorante.
- $f_2$ y $f_3$ Inventadas por el alumno para que tengan en cuenta el agua y las cajas

$f_0 < f_1$ 

Cuanto mayor sea el valor heurístico menos nodos se explorarán y encontrará el camino mínimo siempre que sea minorante.


In [1]:
# Cargar Celda
def heuristica_Kwirk(estado):
    """ Evalua el coste estimado desde un estado hasta la meta
    Devuelve un número positivo mayor que 0
    Parámetros:
    estado a evaluar
    """ 
    
    global nivel_global
    # cada vez que se invoca la heurística se incrementa en 1 el número de nodos evaluados
    global num_evaluados
    num_evaluados+=1
    
    if model.is_goal(estado):
        return 0
    cost = 0
    for player in estado.get_players():
        if player is not None:
            cost += abs(player[0] - nivel_global.get_destination()[0]) + abs(player[1] - nivel_global.get_destination()[1])
    
    cost += len(estado.get_water())*100

    return cost


'\ndef es_validaBox(estado):\n    global nivel_global\n    search.\n    y, x = estado\n    return y < len(tablero) and y >= 0 and x < len(tablero[0]) and x >= 0 and tablero[y][x] == 0\n\ndef sucesoresBox(nodo, heuristicaF):\n    hijos = []\n    for mov in search.posiblesMovs:\n        target = (nodo.estado[0] + mov[0], nodo.estado[1] + mov[1])\n        if search.es_validaPF(target) and es_validaBox(target):\n            hijos.append(Nodo(target, nodo, 1, search.heuristicaPF(target)))    \n    return hijos\n'

#### Crear sucesores

Esta función debería de crear nodos sucesores. Siguiendo una de estas dos estrategías:

Opción sencilla:
- Habría un máximo de 5 sucesores, el resultado de ejecutar los movimientos arriba, abajo, derecha o izquierda y cambiar turno, si alguno de los movimientos no se puede ejecutar habría menos de 4 sucesores.

Opción avanzada (ver pdf)
- Habría 2 tipos de sucesores:
    - Sucesores colocarse: Lleva el jugador actual hasta la meta o a una posición adyacente a una caja.
    - Sucesores empujar: Empuja una caja
    - Sucesores cambiar turno: Cambia el turno.
    
Si se puede ir a la meta se va a la meta. Si no, es que hay una caja o agua bloqueando el camino, así que habrá que ir junto a una caja para empujarla. Los desplazamientos hasta la meta o hasta las coordenadas adyacentes a una caja se harán con pathfinding.

Con esta idea no se exploran estados intermedios en los que no existe ni la posibilidad de empujar una caja.

In [2]:
# Cargar Celda

import copy

def sucesores_Kwirk(nodo,hSoc):
    global nivel_global
    estado = nodo.getEstado()
    g = nodo.getG()
    hijos = []
    player = estado.get_players()[not estado.get_turn()]
    if player is None:
        return hijos
    
    board = copy.deepcopy(nivel_global.get_board())
    for water in estado.get_water():
        board[water[0]] = board[water[0]][0:water[1]] + (1,) + board[water[0]][water[1]+1:]
    for box in estado.get_boxes():
        board[box[0]] = board[box[0]][0:box[1]] + (1,) + board[box[0]][box[1]+1:]
    adversary = estado.get_players()[estado.get_turn()]
    if adversary is not None:
        board[adversary[0]] = board[adversary[0]][0:adversary[1]] + (1,) + board[adversary[0]][adversary[1]+1:]
    
    # Check if player can go directly to destination
    nodoInicial = search.creaNodoInicialPF((player[0], player[1]), nivel_global.get_destination(), board, search.heuristicaPF)
    destination_path = search.AStar(nodoInicial, search.sucesoresPF, search.es_metaPF, search.heuristicaPF)
    if len(destination_path) > 0:
        adversary_can_finish = True
        # The other player must also be able to go to destination or the game would be soft-locked
        if adversary is not None:
            new_board = copy.deepcopy(board)
            new_board[adversary[0]] = new_board[adversary[0]][0:adversary[1]] + (0,) + new_board[adversary[0]][adversary[1]+1:]
            adversary_nodoInicial = search.creaNodoInicialPF((adversary[0], adversary[1]), nivel_global.get_destination(), new_board, search.heuristicaPF)
            adversary_destination_path = search.AStar(adversary_nodoInicial, search.sucesoresPF, search.es_metaPF, search.heuristicaPF)
            adversary_can_finish = len(adversary_destination_path) > 0
        if (adversary_can_finish):
            y_diff = destination_path[-1][0] - player[0]
            x_diff = destination_path[-1][1] - player[1]
            hijo = model.move(nivel_global,estado,[y_diff, x_diff])
            hijos.append(search.Nodo(hijo, nodo, g+1, g+1+heuristica_Kwirk(hijo)))
            return hijos
    
    # Get all avaialable spaces next to boxes
    adjacent = set()
    for box in estado.get_boxes():
        for mov in [[1,0],[-1,0],[0,1],[0,-1]]:
            y = box[0] + mov[0]
            x = box[1] + mov[1]
            if (y < len(nivel_global.get_board()) and y >= 0 and x < len(nivel_global.get_board()[0])
                    and x >= 0 and nivel_global.get_board()[y][x] == 0
                    and not any(water[0] == y and water[1] == x for water in estado.get_water())
                    and not any(box[0] == y and box[1] == x for box in estado.get_boxes())
                    and not any(player is not None and player[0] == y and player[1] == x for player in estado.get_players())):
                adjacent.add((y,x))
    
    # Go to the available adjacent spaces next to the boxes if reachable
    if len(adjacent) > 0:
        for target in adjacent:
            nodoInicial = search.creaNodoInicialPF((player[0], player[1]), target, board, search.heuristicaPF)
            result = search.AStar(nodoInicial, search.sucesoresPF, search.es_metaPF, search.heuristicaPF)
            if len(result) > 0:
                y_diff = result[-1][0] - player[0]
                x_diff = result[-1][1] - player[1]
                hijo = model.move(nivel_global,estado,[y_diff, x_diff])
                hijos.append(search.Nodo(hijo, nodo, g+1, g+1+heuristica_Kwirk(hijo)))
    
    # Check if it can push a box
    for mov in [[1,0],[-1,0],[0,1],[0,-1]]:
        y = player[0] + mov[0]
        x = player[1] + mov[1]
        if (y < len(nivel_global.get_board()) and y >= 0 and x < len(nivel_global.get_board()[0])
                and x >= 0 and nivel_global.get_board()[y][x] == 0
                and any(box[0] == y and box[1] == x for box in estado.get_boxes())):
            hijo = model.move(nivel_global,estado,mov)
            hijos.append(search.Nodo(hijo, nodo, g+1, g+1+heuristica_Kwirk(hijo)))

    # Change turn if there's still another player
    if adversary is not None:
        hijo = model.change_turn(estado)
        hijos.append(search.Nodo(hijo, nodo, g, g+heuristica_Kwirk(hijo)))

    return hijos

In [11]:
# Cargar Celda

# Crea tantas celdas como necesites, si son funciones necesarias
# para el juego deberán empezar por Cargar Celda


# Probando las funciones

La manera de probar las funciones es igual que en la primera parte de la práctica.

Se carga un nivel donde tengamos la partida que queremos probar.

In [12]:
# Si tienes problemas empieza cargando los niveles más fáciles el 0, el 1
# Aumenta la dificultad a medida que arregles los fallos.

level_txt = open("."+os.sep+"levels"+os.sep+"level_medio.txt",'r').read()
level1, state1 = l.load_level(level_txt)


Se usa el estado y el nivel para para crear un Nodo. **Siempre hay que crear un nodo inicial**. Las funciones de heurística y sucesores funcionan sobre nodos.
La función de crear nodo es una de las funciones proporcionadas por el profesor.

In [13]:
nodoInicial = nodo_inicial_Kwirk(level1,state1,heuristica_Kwirk)    
nodoInicial



Nodo [[3, 4], [2, 1]]{(2, 2)}{(2, 4)}True(6)

Después de crear el nodo inicial se pueden probar las funciones.


In [14]:
sucesores = sucesores_Kwirk(nodoInicial,heuristica_Kwirk)
sucesores

[Nodo [[3, 4], [2, 1]]{(2, 2)}{(2, 4)}True(7),
 Nodo [[3, 4], [2, 1]]{(2, 2)}{(2, 4)}True(7),
 Nodo [[3, 4], [2, 1]]{(2, 2)}{(2, 4)}True(7),
 Nodo [[3, 3], [2, 1]]{(2, 2)}{(2, 4)}True(8),
 Nodo [[3, 4], [2, 1]]{(2, 2)}{(2, 4)}False(6)]

Podemos probar el A\* en su conjunto de la siguiente forma:

In [15]:
solucion = search.AStar(nodoInicial,
                        sucesores_Kwirk, 
                        meta_Kwirk, 
                        heuristica_Kwirk)
print("Solución ")
for estado in solucion:
    print(estado)
print("Nodos evaluados ",num_evaluados)
print("Coste de la solución ",coste_total)

Solución 
[[3, 4], [2, 1]]{(2, 2)}{(2, 4)}True
[[3, 4], [2, 1]]{(2, 2)}{(2, 4)}False
[[3, 4], [2, 2]]{(2, 3)}{(2, 4)}False
[[3, 4], [2, 3]]set()set()False
[[3, 4], [2, 4]]set()set()False
[[3, 4], None]set()set()True
[[2, 4], None]set()set()True
[None, None]set()set()True
Nodos evaluados  115
Coste de la solución  6


Podriamos visualizar la solución de manera gráfica así:

In [16]:
# mejor en chrome
from ipywidgets import VBox, Label

htmls = []
for est in solucion:
    htmlStr = ui.get_html(level1, est) # estoy cargando el mapa1
    htmls.append(HTML(value = htmlStr))
    


from ipywidgets import Layout, Button, VBox

box_layout = Layout(overflow_x='scroll',
                    width='310px',
                    height='',
                    flex_direction='row',
                    display='flex')
carousel = VBox(children=htmls, layout=box_layout)
VBox([carousel])

VBox(children=(VBox(children=(HTML(value='<style> img.game {width: 50px !important; height: 50px !important;}<…

Una vez hayas implementado y probado las funciones, trata de ejecutar el juego.

El Mediador que es la clase que sirve de enganche entre las clases de interfaz y la funcionalidad, leerá las celdas que empiezan por "# Cargar Celda", cargará esas funciones dinámicamente y las usará para mover y comprobar si la partida finaliza.

In [2]:
from IPython.display import display
from Mediador import Mediator
from UI import gui

import warnings
warnings.filterwarnings("ignore")
ui = gui(manual = False)

med = Mediator.get_instance(modelPath = "Kwirk_2.ipynb",
                           aStarPath = 'Busqueda_2.ipynb',
                           nodesPath = "Kwirk_3.ipynb")

med.register_ui(ui)


# Cuando llamo a la función se crean
display(ui.get_ui_elements())

VBox(children=(Dropdown(description='Elija nivel:', options=('level_1.txt', 'level_2.txt', 'level_3.txt', 'lev…