# NO PRESENTAR - TP1: Algoritmos de búsqueda en Torre de Hanoi

## Integrantes

- Nicolás Rodriguez da Cruz
- Francisco Cofré
- Gaspar Acevedo Zain
- Juan Chunga
- Rodrigo Nicolás Lauro

## Resolución

### 1. ¿Cuáles son los PEAS de este problema? (Performance, Environment, Actuators, Sensors)

- **Performance**
  - Para el problema de Torre de Hanoi, la medida de performance son la cantidad de movimientos mínimos necesarios para transicionar entre el estado de inicial (discos ubicados en la primer varilla) al estado objetivo (todos los discos ubicados en la tercer varilla).
- **Environment**
  - Consiste en un total de tres varillas y cinco discos. Inicialmente, los cinco discos están ubicados en la primer varilla (estado inicial).
- **Actuators**
  - Son el conjunto de libraries de `aima_libs` (estructura de datos, funciones, clases, etc.) que permiten realizar los pasos necesarios para transicionar entre estados del problema.
- **Sensors**
  - Son el conjunto de libraries de `aima_libs` (estructura de datos, funciones, clases, etc.) que permiten leer el estado actual del problema, es decir, la ubicación de los cinco discos en las tres varillas en un momento dado.

### 2. ¿Cuáles son las propiedades del entorno de trabajo?
- **Totalmente observable**: ya que los sensores del agente le permiten conocer el estado de manera completa en cualquier momento, es decir, como se distribuyen los cinco discos entre las tres varillas.
- **Determinista**: ya que ante un estado *origen* determinado, usando un mismo algoritmo determinado, siempre se ejecutará la misma acción para transicionar a un mismo estado *destino*.
- **Secuencial**: ya que cada movimiento que realiza el agente afecta a futuros movimientos.
- **Estático**: ya que el ambiente/entorno solo es afectado por las acciones del agente.
- **Discreto**: ya que los estados del problema y movimientos que realiza el agente para llegar a ellos son finitos.
- **Agente individual**: ya que hay un solo agente que interactúa con el ambiente/entorno.

### 3. En el contexto de este problema, defina los siguientes conceptos:
- **Estado**: corresponde a la ubicación de cada disco en función de las varillas, en un momento dado.
- **Espacio de estados**: corresponde a las distintas combinaciones de estados.
- **Árbol de búsqueda**: estructura en la que cada nodo representa un estado y las aristas, acciones.  
- **Nodo de búsqueda**: elemento del árbol que contiene estado, padre, acción y costo acumulado.  
- **Objetivo**: consiste en el estado final que soluciona al problema de Torres de Hanoi, siendo este el que contiene los cinco discos en la última varilla.
- **Acción**: consiste en las operaciones que realiza el agente para pasar de un estado a otro.
- **Frontera**: consiste en los nodos que genera el algoritmo para explorar, pero que no fueron expandidos.

### 4. Implementación del algoritmo A*

- Heurística
  - Utilizamos la heurística provista en clase, la cual consta de, para un estado de un nodo dado, restar un punto por cada disco en la última varilla.
  - `H(nodo) = (nodo.estado.cant_discos_en_última_varilla)*(-1)`
- Función Costo
  - Dado que el costo de mover un disco es *ínfimo*, lo consideramos como costo `1`, idéntico para todos los discos
  - `G(nodo) = 1`

In [2]:
from metrics_calculator import MetricsCalculator
from search_algorithms import SearchAlgorithms

In [3]:
cantidad_de_discos = 5
cantidad_de_ejecuciones = 10
# Lambda para calcular el costo. Para Hanoi, el costo de ejecutar una acción para pasar de estado siempre será de 1.
costo = lambda nodo : 1

searchAlgorithms = SearchAlgorithms(cantidad_de_discos=cantidad_de_discos)

In [4]:
# Heurísticas

# Heurística 1 (dada en clase): suma "-1" por cada disco posicionado en la última varilla.
# NOTA: hacemos uso de una lambda, para poder "pasarla" a la función de A*, y ejecutarla fácilmente dentro de la misma
heuristica_posicion_correcta = lambda nodo : -len(nodo.state.get_state_dict()["peg_3"])

# Heurística 2 (dada en clase): Consiste en 5 más el resultado de "Heurística 1" para un estado dado.
# NOTA: hacemos uso de una lambda, para poder "pasarla" a la función de A*, y ejecutarla fácilmente dentro de la misma
lambda_heuristica_posicion_correcta_inversa = lambda cant_discos, fn : (lambda arg : cant_discos + fn(arg))
heuristica_posicion_correcta_inversa = lambda_heuristica_posicion_correcta_inversa(cantidad_de_discos, heuristica_posicion_correcta)

In [None]:
# Resolvemos el problema de Torres de Hanoi utilizando el algoritmo A*
solution, metrics = searchAlgorithms.a_star_search(costo=costo, heuristica=heuristica_posicion_correcta)

solution.generate_solution_for_simulator()

### 5. ¿Cuál es la complejidad teórica en tiempo y memoria del algoritmo elegido?

La complejidad del Algoritmo `A*` es $O(b^d)$ tanto en tiempo y memoria, siendo:
- `b` o **branching factor**: el número máximo de sucesores para un estado
- `d` o **profundidad de solución**: es decir, la longitud del camino más corto del árbol de búsqueda

### 6. A nivel de implementación, ¿cuánto tiempo y memoria utiliza el algoritmo?

**Consumo de Memoria**
En un total de diez ejecuciones, el algoritmo `A*` consume, en MB:
- En **promedio**, `0.256 MB`, con un **Desvío estandar** de `0.067 MB`
- El pico **máximo** consumo de memoria fue de `0.399 MB`
- El pico **mínimo** de consumo de memoria fue de `0.2188 MB`

**Tiempo de ejecución**
En un total de diez ejecuciones, el algoritmo `A*` tardó, en segundos:
- En **promedio** `0.2955 segundos`, con un **Desvío estandar** de `0.0933 segundos`
- Como máximo tardó `0.5247 segundos` en resolver el problema
- Como mínimo tardó `0.1972 segundos` en resolver el problema

In [6]:
# Lambdas necesarias para Calcular Métricas
lambda_funcion_a_ejecutar = lambda function, costo, heuristica : (lambda x=None: function(costo, heuristica))
funcion_a_ejecutar = lambda_funcion_a_ejecutar(searchAlgorithms.a_star_search, costo, heuristica_posicion_correcta)

In [7]:
# Memoria
metricsCalculator = MetricsCalculator(cantidad_de_ejecuciones=cantidad_de_ejecuciones, funcion_a_ejecutar=funcion_a_ejecutar)
result = metricsCalculator.calcular_memoria()

In [8]:
print("Promedio de memoria ocupada [MB]", result["promedio"])
print("Desvío estandar de memoria ocupada [MB]", result["desvio"])
print("Máxima memoria ocupada [MB]", result["maximo"])
print("Mínimo memoria ocupada [MB]", result["minimo"])

Promedio de memoria ocupada [MB] 0.25302724838256835
Desvío estandar de memoria ocupada [MB] 0.058008557711681376
Máxima memoria ocupada [MB] 0.3604907989501953
Mínimo memoria ocupada [MB] 0.21906471252441406


In [9]:
# Tiempo
metricsCalculator = MetricsCalculator(cantidad_de_ejecuciones=cantidad_de_ejecuciones, funcion_a_ejecutar=funcion_a_ejecutar)
result = metricsCalculator.calcular_tiempo()

In [10]:
print("Promedio de tiempo [sec]", result["promedio"])
print("Desvío estandar de tiempo de ejecución [sec]", result["desvio"])
print("Máximo tiempo de ejecución [sec]", result["maximo"])
print("Mínimo tiempo de ejecución [sec]", result["minimo"])

Promedio de tiempo [sec] 0.21080552998464555
Desvío estandar de tiempo de ejecución [sec] 0.11230271462150145
Máximo tiempo de ejecución [sec] 0.38587470003403723
Mínimo tiempo de ejecución [sec] 0.11444810009561479


### 7. Si la solución óptima es de $2^k - 1$ movimientos...

**Pregunta**: 7. Si la solución óptima es de $2^k - 1$ movimientos (siendo *k* el número de discos), ¿qué tan lejos está la solución encontrada por el algoritmo implementado de esa solución óptima? (Se recomienda ejecutar al menos 10 veces y usar el promedio de los trayectos obtenidos).

Para el problema de Torres de Hanoi con las siguientes características:
- Cantidad de discos: cinco (5)
- Cantidad de varillas: tres (3)
- Algoritmo: `A*`
- Función de costo: `G(nodo) = 1`
- Heurística: `H(nodo) = (nodo.estado.cant_discos_en_última_varilla)*(-1)`

la cantidad de movimientos necesarias para resolverlo es de **38 movimientos**.
La solución óptima de $2^k -1$, con un `k=5` es de **31 movimientos**, lo cual indica que nuestra solución está lejos de este valor óptimo.

A priori, podemos decir que esto se debe a la combinación que usamos de *función de costos* y la *heurística*:
- `Función de costo`: ya que la misma es uniforme para todos los discos. En nuestro caso, no tiene sentido cambiarla, pero para otros problemas, permitiría al algoritmo hace un mejor uso de su *cola de prioridad*.
- `Heurística`: si bien es una buena heurística "para comenzar", capaz que convenga explorar heurísticas más complejas, y analizar como afectan las mismas los tiempos de ejecución, la memoria requerida y, principalmente, la cantidad de movimientos necesaria.

In [11]:
# Promedio de trayectos
metricsCalculator = MetricsCalculator(cantidad_de_ejecuciones=cantidad_de_ejecuciones, funcion_a_ejecutar=funcion_a_ejecutar)
result = metricsCalculator.ejecutar_y_analizar_trayectos()

In [13]:
print("Promedio de cantidad de movimientos", result["promedio"])
print("Desvío estandar de cantidad de movimientos", result["desvio"])
print("Máxima cantidad de movimientos", result["maximo"])
print("Mínima cantidad de movimientos", result["minimo"])

Promedio de cantidad de movimientos 38
Desvío estandar de cantidad de movimientos 0.0
Máxima cantidad de movimientos 38
Mínima cantidad de movimientos 38
