# A. Enunciado de la práctica

## 1. Objetivos de la práctica
El desarrollo de esta práctica pretende que el alumnado analice, diseñe e implemente soluciones a un problema usando las técnicas de exploración en espacios de estados impartidas en la asignatura Inteligencia Artificial (IA). Para ello, el alumnado desarrollará de forma grupal (por cuartetos) un proyecto de programación en lenguaje Python mediante el uso del entorno de programación Google Colab y cuadernos de Python.

## 2. Caso de estudio
Se pretende resolver una variante del problema de las reinas de ajedrez, utilizando caballos en su lugar para descubrir cuántos caballos pueden estar presentes en un tablero de ajedrez sin amenazarse mutuamente. Cualquier configuración de caballos en el tablero es válida siempre y cuando no se amenacen mutuamente, pero se desea encontrar el máximo número de caballos. A continuación se ven varios ejemplos sobre un tablero de tamaño 3x3:

```
Optimal and Valid   Valid   Not valid
K·K                 K·K     K··
·K·                 ···     ··K
K·K                 K··     ·K·
```

* Se proporciona un tablero de tamaño MxN (M=Alto, N=Ancho).
* El objetivo del algoritmo es encontrar una configuración válida con el máximo número de caballos posible.
* El movimiento del caballo forma una L en 8 direcciones posibles, consulta la figura para tener una referencia visual:

<img src="https://culturacientifica.com/app/uploads/2022/10/imagen-2-560x553.jpg" alt="drawing" style="width:200px;"/>

## 3. Desarrollo
El desarrollo de esta práctica supone completar este cuaderno de python para resolver el problema para varias configuraciones diferentes usando técnicas de Búsqueda. Además, usando este cuaderno de python, se quieren mostrar resultados de la ejecución de los algoritmos para extraer conclusiones sobre las configuraciones del problema. También se desea hacer una comparativa entre los algoritmos de búsqueda seleccionados.

Es posible que la configuración del problema sea demasiado grande para alguno de los algoritmos. Como regla general, si el algoritmo tarda más de 5 minutos en completar su ejecución se puede declarar que el algoritmo no ha encontrado solución en un tiempo razonable (y lo indicamos en el análisis de resultados)

* Se proporcionan varias configuraciones:
    * Un tablero de **2x2**,
    * Un tablero de **3x3**,
    * Un tablero de **3x5**,
    * Un tablero de **5x5**,
    * Un tablero de **8x8**.
* Se desea aplicar dos algoritmos:
    * **Branch & Bound**: Se quiere obtener una solución óptima, (máximo número de caballos)
    * **A-Star**: Se debe proporcionar (al menos) una heurística admisible para encontrar una solución óptima. En esta memoria se debe justificar que la heurística sea admisible, haciendo la demostración correspondiente.

Para cada configuración y algoritmo se debe proporcionar una tabla de estas características (Puede usarse un generador de tablas https://www.tablesgenerator.com/markdown_tables o pandas https://pandas.pydata.org/docs/user_guide/index.html):

| Tablero | Algoritmo | Tiempo | Caballos |
|---------|-----------|--------|----------|
| 3x3     |  A*       | 3s     | 4        |
| 3x3     |  B&B      | 5s     | 4        |
| 3x5     |  A*       | 10s    | 6        |

## 4. Normativa de la práctica
Para el desarrollo del proyecto de programación se proporciona este cuaderno que sirve a modo de proyecto de programación. Se han propuesto varias configuraciones de tablero para utilizar en las distintas pruebas. Se permiten crear todas las funciones adicionales que sea necesario siempre y cuando se respete la estructura general de este cuaderno. Este cuaderno es el único entregable, por tanto desarrollar código fuera de él no es recomendable.

Además de explicar las decisiones tomadas, será necesario realizar una comparativa de resultados en una o varias tablas, así como incluir una comparativa  final.

La práctica debe realizarse teniendo en cuenta la siguiente normativa:
* NO está permitido alterar los nombres, parámetros ni tipo de retorno de ninguno de los métodos proporcionados. El método modificado se evaluará como 0 así como todos los métodos que dependan de él.
* No está permitido el uso de librerías externas excepto numpy y pandas. El uso de librerías externas hará que se evalúe la práctica como 0.
* La práctica se realizará de forma grupal (grupos de 4 alumnos). Cada grupo deberá desarrollar de manera independiente su propia práctica y realizar su propia entrega.
* El plagio de la práctica queda estrictamente prohibido. La detección de plagio supondrá una calificación de 0 en la convocatoria de la asignatura para todos los alumnos implicados, así como la posibilidad de apertura de expediente académico disciplinar.
* Para ser evaluado de la práctica es obligatorio entregarla en plazo, habiendo realizado correctamente al menos una funcionalidad de las pedidas. Una entrega fuera de plazo será evaluada como 0.
* Usa este cuaderno a modo de memoria, justificando las decisiones que tomes a lo largo del proceso de desarrollo. El desarrollo en texto puntúa de cara a la nota de la práctica.
* De cara a la entrega es estrictamente necesario entregar el cuaderno ejecutado al completo. Una entrega que no haya sido ejecutada con éxito hasta la última celda será evaluada como 0. (Entregad el archivo .ipynb)
* Se debe comentar el código adecuadamente. Este apartado es puntuable.

# Cuerpo de la práctica
Usa las siguientes celdas para desarrollar todo el código pedido. Recuerda respetar esta estructura general y añadir celdas siempre dentro de cada apartado.

## Gestión de estados

### Estado inicial

In [None]:
import numpy as np
def initial_state(M, N):
    # Crea un tablero vacío usando 0s
    return np.zeros((M,N), dtype=int)

In [None]:
# Ejemplo de uso de la función estado inicial
board = initial_state(3, 3)
print(board)

### Expansion de estados

In [None]:
from enum import Enum
# Representación de las celdas del tablero
class BoardCell(int, Enum):
    KNIGHT = 1
    EMPTY = 0
    THREATED = -1
    

def expand(board):
    boards = [] # Crea una lista vacía de tableros

    # Crea una lista de tableros con todas las posibles jugadas validas
    rows, cols = board.shape
    for i in range(rows):
        for j in range(cols):
            # Check if can insert knight in i/j
            if board[i][j] == BoardCell.EMPTY and not knight_in_threat(board, i, j):
                board_copy = copy_board(board)
                add_knight(board_copy, i, j)
                boards.append(board_copy)

    return boards # Devolvemos una lista de tableros


def knight_in_threat(board, i, j):
    """
        Returns True if a Knight at i/j index is not in range of others knights
        Args:
            board (np.ndarray): Our chess board
            i (int): row index
            j (int): col index
        Returns:
            bool
    """
    threated = False
    for move in KnightMove:
        move_i, move_j = move.value
        next_i, next_j = (i + move_i, j + move_j)
        if index_in_range(board, next_i, next_j):
            if board[next_i][next_j] == BoardCell.KNIGHT:
                threated = True
                break
    return threated

def index_in_range(board, i, j):
    """
        Returns True if i, j are in range of given board / matrix
        Args:
            board (np.ndarray): Our chess board
            i (int): row index
            j (int): col index
        Returns:
            bool
    """
    rows, cols = board.shape
    return 0 <= i < rows and 0 <= j < cols


# Pistas:
# - Una función que copie un tablero completo
def copy_board(board):
    """
        Returns a copy of given board / matrix
        Args:
            board (np.ndarray): Our chess board
        Returns:
            np.ndarray
    """
    return board.copy()

# - Una función que coloque un caballo en una posición dada en i, j
def add_knight(board, i, j):
    """
        Add a Knight (1) in the board index given
        Args:
            board (np.ndarray): Our chess board
            i (int): row index
            j (int): col index
        Returns:
            None
    """
    # Add Knight
    board[i][j] = BoardCell.KNIGHT

    # Add also threated cells
    for move in KnightMove:
        move_i, move_j = move.value
        next_i, next_j = (i + move_i, j + move_j)
        if index_in_range(board, next_i, next_j):
            board[next_i][next_j] = BoardCell.THREATED

# - Una estructura de datos con los movimientos posibles para un caballo
class KnightMove(Enum):
    UP_LEFT    = (-2, -1)
    UP_RIGHT   = (-2,  1)
    LEFT_UP    = (-1, -2)
    LEFT_DOWN  = ( 1, -2)
    RIGHT_UP   = (-1,  2)
    RIGHT_DOWN = ( 1,  2)
    DOWN_LEFT  = ( 2, -1)
    DOWN_RIGHT = ( 2,  1)

In [None]:
expand(board) # Debe devolver una lista de tableros

### Solucion alcanzada

In [None]:
def is_solution(board):
    # Verifica si un tablero es solución
    sol = True

    # Haz todas las comprobaciones necesarias para determinar
    # si el tablero es solución

    # Se entiende que un tablero es solución, cuando no quedan espacios vacíos (BoardCell.EMPTY) 
    # y todos los huecos están ocupados por caballos (BoardCell.KNIGHT) o están amenazados por estos (BoardCell.THREATED)

    # NOTA: aunque sea solución, puede no ser la optima. 

    sol = np.count_nonzero(board==BoardCell.EMPTY) == 0

    return sol # Devuelve True si es solución, False en caso contrario



## Métricas

### Funcion de coste

In [None]:
def cost(path): # path debe contener VARIOS tableros
    # Calcula el coste de un camino
    # Esto debería ser posible: board = path[-1]
    cost = 0

    # Calcula el coste de un camino completo

    # Vamos hacer que el coste sea el número de caballos amenazados que serán los casos no validos
    # de esta forma los casos validos tendrán coste 0 y estará minimizado

    # Como son sucesiones, podemos utilizar el ultimo board del path, dado que este contiene los caballos de los anteriores
    board = path[-1]

    # Aumentamos el coste segun haya mas casillas amenazadas, las cuales no podemos usar para poner caballos
    # cost += np.count_nonzero(board==BoardCell.THREATED) * 1

    # Disminuimos el coste si el caballo NO está amenazado, dado que este camino SI nos interesa\n",
    cost -= np.count_nonzero(board==BoardCell.KNIGHT) * 0.5

                    
    # Para poder podar por el camino más corto, añadimos el numero de pasos hasta alcazar el tablero final
    cost += len(path)

    return cost

# Pista:
# - Recuerda que A* y B&B funcionan minimizando el coste.
# - ¿Podemos afrontar este problema de otra manera? Maximizar las casillas ocupadas NO funciona...

### Test Cost

In [None]:
# For debug purpose

# Cost 6
path_1 = [
    np.array([
        [1,0,0], 
        [0,0,0], 
        [0,0,0]], dtype=int),
    np.array([
        [1,0,0], 
        [0,0,1], 
        [0,0,0]], dtype=int),
    np.array([
        [1,0,0], 
        [0,0,1], 
        [1,0,0]], dtype=int)
]
# Cost 2
path_2 = [
    np.array([
        [0,0,0], 
        [0,0,0], 
        [0,0,0]], dtype=int),
    np.array([
        [1,0,0], 
        [0,0,0], 
        [0,0,0]], dtype=int),
    np.array([
        [1,0,0], 
        [0,0,0], 
        [0,0,1]], dtype=int)
]
# Cost 4
path_3 = [
    np.array([
        [1,0,0], 
        [0,0,0], 
        [0,0,0]], dtype=int),
    np.array([
        [1,0,0], 
        [0,0,1], 
        [0,0,0]], dtype=int)
]

expected_cost_for_path_1 = 6
expected_cost_for_path_2 = 2
expected_cost_for_path_3 = 4

print(cost(path_1) == expected_cost_for_path_1)
print(cost(path_2) == expected_cost_for_path_2)
print(cost(path_3) == expected_cost_for_path_3)

### Heurística(s)

In [None]:
def heuristic_1(board):
    # Calcula una heurística para un tablero
    heuristic = 0

    # Calcula la heurística de un tablero aquí

    return heuristic

# Pista:
# - Al igual que con el coste cuanto menor sea el valor de la heurística mejor, ya que se pretende minimizar.
# - Puedes probar con heuristicas no admisibles, pero al menos una de ellas debe ser admisible para puntuar.

#### Admisibilidad de la heurística

**Usa este espacio para explicar la motivación para usar la heurística, así como demostrar que es admisible.**

## Algoritmo de búsqueda

### Poda

In [None]:
from hashlib import md5
def prune(path_list):
    # Si detecta que dos caminos llevan al mismo estado,
    # solo nos interesa aquel camino de menor coste
    # Más adelante usamos la poda despues de ordenar

    path_dict={}
    for i, path in enumerate(path_list):
        # Get hash for last board
        board_hash = md5(path[-1]).hexdigest()

        # Get / Init if not exists
        path_dict[board_hash] = path_dict.get(board_hash, [])

        # Store index for same boards
        path_dict[board_hash].append(i)
    
    # Check duplicated boards
    for key, value in path_dict.items():
        if len(value) > 1:
            min_cost = float("inf")
            min_index = 0

            # Get min cost for this board
            for index in value:
                current_cost = cost(path_list[index])
                if current_cost < min_cost:
                    min_cost = current_cost
                    min_index = index

            # Remove others
            for index in value:
                if index != min_index:
                    # Add None instead of remove, because removing items the index changes
                    path_list[index] = None

    # Remove None values
    path_list = [x for x in path_list if x is not None]

    # Use the same path_list object to keep the order

    return path_list # Devuelve una lista de caminos

### Test Prune

In [None]:
# For debug purpose

path_1 = [
    np.array([
        [0,0], 
        [0,0]], dtype=int), 
    np.array([
        [0,0], 
        [0,1]], dtype=int)
]
path_2 = [
    np.array([
        [0,0], 
        [0,1]], dtype=int), 
    np.array([
        [0,0], 
        [1,1]], dtype=int)
]
path_3 = [
    np.array([
        [0,0], 
        [1,0]], dtype=int), 
    np.array([
        [0,1], 
        [0,0]], dtype=int)
]
path_4 = [
    np.array([
        [0,1], 
        [0,0]], dtype=int), 
    np.array([
        [0,1], 
        [0,1]], dtype=int), 
    np.array([
        [0,0], 
        [0,1]], dtype=int)
] # Mismo final que el primero

path_list = [path_1, path_2, path_3, path_4]
expected_path_list = [path_1, path_2, path_3]

print(prune(path_list) == expected_path_list)

### Ordenacion

In [None]:
# *args y **kwargs son argumentos variables, si el argumento no es reconocido es almacenado en estas variables.
# Aquí se utilizan para ignorar argumentos innecesarios.
def order_astar(old_paths, new_paths, c, h, *args, **kwargs):
    # Ordena la lista de caminos segun la heuristica y el coste
    return prune([]) # Devuelve la lista de caminos ordenada y podada segun A*

def order_byb(old_paths, new_paths, c, *args, **kwargs):
    # Ordena la lista de caminos segun el coste
    all_paths = old_paths + new_paths

    # order paths by c (cost)
    all_paths = sorted(all_paths, key=lambda x: c(x))

    return prune(all_paths) # Devuelve la lista de caminos ordenada y podada segun B&B

### Test order B&B

In [None]:
# For debug purpose

# Cost 6
path_1 = [
    np.array([
        [1,0,0], 
        [0,0,0], 
        [0,0,0]], dtype=int),
    np.array([
        [1,0,0], 
        [0,0,1], 
        [0,0,0]], dtype=int),
    np.array([
        [1,0,0], 
        [0,0,1], 
        [1,0,0]], dtype=int)
]
# Cost 2
path_2 = [
    np.array([
        [0,0,0], 
        [0,0,0], 
        [0,0,0]], dtype=int),
    np.array([
        [1,0,0], 
        [0,0,0], 
        [0,0,0]], dtype=int),
    np.array([
        [1,0,0], 
        [0,0,0], 
        [0,0,1]], dtype=int)
]
# Cost 4
path_3 = [
    np.array([
        [1,0,0], 
        [0,0,0], 
        [0,0,0]], dtype=int),
    np.array([
        [1,0,0], 
        [0,0,1], 
        [0,0,0]], dtype=int)
]
# Cost 5 (Podar igual que Coste 4)
path_4 = [
    np.array([
        [0,0,0], 
        [0,0,0], 
        [0,0,0]], dtype=int),
    np.array([
        [1,0,0], 
        [0,0,0], 
        [0,0,0]], dtype=int),
    np.array([
        [1,0,0], 
        [0,0,1], 
        [0,0,0]], dtype=int)
]

old_paths = [path_1, path_2]
new_paths = [path_3, path_4]

expected_paths = [path_2, path_3, path_1]

print(order_byb(old_paths, new_paths, cost) == expected_paths)

### Algoritmo de búsqueda

In [None]:
import itertools
import logging
current_level = logging.DEBUG
logging.basicConfig(level=current_level, format='%(message)s')

def search(initial_board, expansion, cost, heuristic, ordering, solution):
    # Realiza una búsqueda en el espacio de estados
    paths = None # Crea la lista de caminos
    sol = None # Este es el estado solución

    # La lista de caminos inicial debe ser el initial_board, con el formato de lista de listas
    # dado que un camino es una lista de boards
    paths = [
        [initial_board]
    ]


    # 1 - Mientras haya caminos y no se haya encontrado solución
    count = 1
    while(len(paths) > 0 and sol is None):
        # 2 - Extraer el primer camino
        path = paths.pop(0)
        logging.debug(f"Paso: {count}")

        # 3 - Comprobar si estamos ante un estado solución
        es_solucion = solution(path[-1])
        logging.debug(f"{es_solucion=}")
        if not es_solucion:
            # 4 - Si no es solución, expandir el camino/ Si es solución, detenemos y vamos al paso 7.
            expanded_boards = expansion(path[-1])
            logging.debug("Sucesores:")
            if current_level <= logging.DEBUG:
                for item in expanded_boards:
                    logging.debug(np.array2string(item, separator=', '))

            # 5 - Para cada estado expandido nuevo, añadirlo al camino lo que genera una lista de nuevos caminos
            new_paths = [path + [matrix] for matrix in expanded_boards]            
            
            if current_level <= logging.DEBUG:
                for item1 in new_paths:
                    for item2 in item1:
                        logging.debug(np.array2string(item2, separator=', '))

            # 6 - Ordenar los nuevos caminos y viejos caminos, y realizar poda. Volver al paso 1.
            paths = ordering(paths, new_paths, cost, h=heuristic)
            
            if current_level <= logging.DEBUG:
                for item1 in paths:
                    for item2 in item1:
                        logging.debug(np.array2string(item2, separator=', '))
        else:
            # 7 - Devolver el camino si es solución, si no devolver None
            sol = path[-1]

    return sol # Devuelve solo la solución, no el camino solución

### Test Search

In [None]:
# For debug purpose
search(board, expand, cost, None, order_byb, is_solution)

# Experimentos
Usa las funciones `search_horse_byb` y `search_horse_astar` para extraer resultados.

## Utilidades
Usa estas funciones pre-programadas para ejecutar los experimentos y resumir el código.

### Temporizador

In [None]:
################################# NO TOCAR #################################
#                                                                          #
import time

def timer(func):
    def wrapper(*args, **kwargs):
        start = time.time()
        res = func(*args, **kwargs)
        end = time.time()
        print("Executime time: ", end - start, " seconds")
        return res
    return wrapper
#                                                                          #
################################# NO TOCAR #################################

# Este codigo temporiza la ejecución de una función cualquiera

### Envoltorios

In [None]:
################################# NO TOCAR #################################
#                                                                          #
@timer
def search_horse_byb(initial_board):
    return search(initial_board, expand, cost, None, order_byb, is_solution)

@timer
def search_horse_astar(initial_board, heuristic):
    return search(initial_board, expand, cost, heuristic, order_astar, is_solution)
#                                                                          #
################################# NO TOCAR #################################


### Lanzador de experimentos

In [None]:
CONF = {'2x2': (2, 2),
        '3x3': (3, 3),
        '3x5': (3, 5),
        '5x5': (5, 5),
        '8x8': (8, 8),
        }

def measure_solution(board):
    # Devuelve el número de caballos en la solución
    # Es necesario programarla para poder medir la calidad de la solución
    return np.count_nonzero(board==BoardCell.KNIGHT)

def launch_experiment(configuration, heuristic=None):
    conf = CONF[configuration]
    print(f"Running {'A*' if heuristic else 'B&B'} with {configuration} board")
    if heuristic:
        sol = search_horse_astar(initial_state(*conf), heuristic)
    else:
        sol = search_horse_byb(initial_state(*conf))
    n_c = measure_solution(sol)
    print(f"Solution found: \n{sol}")
    print(f"Number of horses in solution: {n_c}")

    return sol, n_c

## Ejecuciones
Este espacio de la práctica está reservado a las ejecuciones de los algoritmos. Se recomienda el uso del método launch_experiment.

In [None]:
launch_experiment('2x2') # Ejemplo de uso para B&B
print()
launch_experiment('3x5', heuristic=heuristic_1) # Ejemplo de uso para A*
print("Execution finished")

### Branch & Bound

In [None]:
### Coloca aquí tus experimentos ###
launch_experiment('2x2')

In [None]:
launch_experiment('3x3')

In [None]:
launch_experiment('3x5')

In [None]:
launch_experiment('5x5')

In [None]:
launch_experiment('8x8')

**Resultados de Branch & Bound**

#### Tabla
| Tablero | Algoritmo | Tiempo | Caballos |
|---------|-----------|--------|----------|
| 2x2     |  B&B      | 0.000s | 4        |
| 3x3     |  B&B      | 0.008s | 4        |
| 3x5     |  B&B      | 0.040s | 5        |
| 5x5     |  B&B      | 0.315s | 10       |
| 8x8     |  B&B      | 7.134s | 24       |

#### Gráfico
<img src="https://raw.githubusercontent.com/ggilperez/ia_practica_1/main/ia_practica_1/imgs/grafico_tiempo_caballos_byb.png" alt="drawing" style="width:500px;"/>

<em>Los tiempos de ejecución pueden variar respecto a la ejecución actual.</em>


#### Análisis
Como se puede ver en la tabla y de mejor forma en el gráfico, estamos ante un algoritmo que si bien hace lo que promete, que es encontrar un camino óptimo a una posible solución, la cual no tiene porque ser óptima, gracias a su sistema de costes, no lo hace de la mejor forma posible, dado que para tableros muy pequeños, como el de 5x5 o menos, los tiempos son razonables, pero a medida que escala en tamaño los tiempos escalan de forma exponencial.

### A*

In [None]:
### Coloca aquí tus experimentos ###

**Resultados de A-Star**

**--> Incluye aquí <--**

La tabla de A* y una valoración crítica de los resultados.

## Conclusiones

**--> Incluye aquí <--**

La tabla comparativa entre A* y B&B, añade una valoración crítica de los resultados, especificando las diferencias que encuentras entre ambos algoritmos de búsqueda, ventajas de usar uno sobre otro, el efecto de la configuración del problema, etc.


#### Tabla
| Tablero | Algoritmo | Tiempo | Caballos |
|---------|-----------|--------|----------|
| 2x2     |  B&B      | 0.000s | 4        |
| 2x2     |  A*       |||
| 3x3     |  B&B      | 0.008s | 4        |
| 3x3     |  A*       |||
| 3x5     |  B&B      | 0.040s | 5        |
| 3x5     |  A*       |||
| 5x5     |  B&B      | 0.315s | 10       |
| 5x5     |  A*       |||
| 8x8     |  B&B      | 7.134s | 24       |
| 8x8     |  A*       |||