# TP1: Algoritmos de búsqueda en Torre de Hanoi (17Co2024)

## Tareas a resolver

### 1. ¿Cuáles son los PEAS de este problema? (Performance, Environment, Actuators, Sensors)

#### Performance

La medida de desempeño para un agente resolviendo el problema de las Torres de Hanói puede incluir varios factores:

> - Minimización del número de movimientos -> El objetivo principal es mover todos los discos desde la torre inicial a la torre final utilizando el menor número de movimientos posible.    
> - Corrección de la solución -> Asegurarse de que todos los movimientos son legales, es decir, no se coloca un disco más grande sobre uno más pequeño.
> - Tiempo de ejecución -> El tiempo que tarda el agente en encontrar la solución también puede ser un factor si se está optimizando para eficiencia.

#### Environment

El entorno para el problema de las Torres de Hanói incluye:

> - Torres y discos: Tres torres (A, B, C) y un conjunto de discos de diferentes tamaños.    
> - Estado inicial: Todos los discos están apilados en la torre A en orden decreciente de tamaño, con el disco más grande en la base y el más pequeño en la parte superior.    
> - Estado objetivo: Todos los discos están apilados en la torre C en el mismo orden decreciente.

#### Actuators

Los actuadores del agente en el problema de las Torres de Hanói son las acciones que el agente puede realizar:

> - Mover un disco: El agente puede mover el disco superior de una torre a otra torre siempre que el movimiento sea legal (un disco más grande no puede ser colocado sobre uno más pequeño).

#### Sensors

Los sensores del agente en el problema de las Torres de Hanói son las percepciones del estado del entorno que el agente puede observar:

> - Percepción del estado de las torres: El agente puede observar la posición actual de todos los discos en las tres torres. Esto incluye saber qué discos están en cada torre y en qué orden.


#### En resumen :
- **Performance**: Minimizar el número de movimientos, realizar movimientos legales, minimizar el tiempo de ejecución.
- **Environment**: Tres torres (A, B, C) y n discos de diferentes tamaños, estado inicial con todos los discos en la torre A, estado objetivo con todos los discos en la torre C.
- **Actuators**: Mover el disco superior de una torre a otra.
- **Sensors**: Observar la disposición actual de los discos en las tres torres.


### 2. ¿Cuáles son las propiedades del entorno de trabajo?

**Totalmente observable vs. parcialmente observable**:
- Totalmente observable: El entorno es completamente observable ya que el agente puede ver el estado completo de las tres torres en cualquier momento. Esto incluye la posición de todos los discos en las torres.

**Determinista vs. Estocástico**:
- Determinista: El entorno es determinista. Cada acción del agente tiene un resultado predecible y no hay incertidumbre en los efectos de las acciones. Cada movimiento de disco se realiza con certeza según las reglas del problema.

**Episódico vs. Secuencial**:
- Secuencial: El entorno es secuencial porque cada acción afecta el estado futuro del entorno. Las decisiones deben considerarse en una secuencia que lleva desde el estado inicial al estado objetivo.

**Estático vs. Dinámico**:
- Estático: El entorno es estático, ya que no cambia mientras el agente está decidiendo qué acción tomar. Los únicos cambios en el entorno son resultado de las acciones del agente.

**Discreto vs. Continuo**:
- Discreto: El entorno es discreto. Los estados (configuraciones de las torres) y las acciones (mover un disco de una torre a otra) son finitos y claramente definidos.

**Agente individual vs. Multiagente (competitivo o cooperativo)**:
- Agente individual: El entorno involucra un solo agente. No hay otros agentes con los cuales competir o cooperar. El agente trabaja solo para resolver el problema de las Torres de Hanói.


### 3. En el contexto de este problema, establezca cuáles son los: estado, espacio de estados, árbol de búsqueda, nodo de búsqueda, objetivo, acción y frontera.

**Estado**:
Un estado en el problema de las Torres de Hanói con 5 discos se define por la posición de los 5 discos en las tres torres. Especifica qué discos están en cada torre y en qué orden. Por ejemplo, el estado inicial puede ser:

- Torre A: [5, 4, 3, 2, 1] (todos los discos en orden decreciente)
- Torre B: []
- Torre C: []
- En python podriamos definir un estado_inicial = [[5, 4, 3, 2, 1], [], []]
 
**Espacio de Estados**:
El espacio de estados es el conjunto de todas las posibles configuraciones de los 5 discos en las tres torres. Dado que cada disco puede estar en cualquiera de las tres torres, el número de estados posibles es \(3^5\), que es 243.

**Árbol de Búsqueda**:
El árbol de búsqueda es un camino de estados que pueden alcanzarse desde el estado inicial mediante una secuencia de movimientos legales al estado objetivo. Cada nodo en el árbol representa un estado, y las ramas representan las acciones (movimientos de discos) que llevan de un estado a otro. El estado inicial es la raíz del árbol, y cada nivel del árbol corresponde a un movimiento de disco.

**Nodo de Búsqueda**:
Un nodo de búsqueda en el árbol de búsqueda representa un estado del problema de las Torres de Hanói con 5 discos. Además del estado, un nodo de búsqueda incluye:
- El nodo padre (el estado previo)
- La acción que llevó a este estado (qué disco se movió de qué torre a qué torre)
- El costo del camino desde el estado inicial hasta este nodo (número de movimientos realizados)

**Objetivo**:
El estado objetivo es la configuración de los discos donde todos los discos están apilados en la torre C en orden decreciente de tamaño:
- Torre A: []
- Torre B: []
- Torre C: [5, 4, 3, 2, 1]
- En python, estado_objetivo =  [[], [], [5, 4, 3, 2, 1]]

**Acción**:
Una acción en el problema de las Torres de Hanói con 5 discos es mover el disco superior de una torre a otra torre, siempre que el movimiento sea legal (un disco más grande no puede ser colocado sobre uno más pequeño). Por ejemplo:
- Mover el disco 1 de la torre A a la torre B

**Frontera**:
La frontera es el conjunto de nodos de búsqueda que han sido generados pero no han sido explorados todavía. En un algoritmo de búsqueda como BFS (Breadth-First Search) o DFS (Depth-First Search), la frontera se utiliza para determinar cuál nodo explorar a continuación. Inicialmente, la frontera contiene solo el estado inicial.

### 4. Implemente algún método de búsqueda. Puedes elegir cualquiera menos búsqueda en anchura primero (el desarrollado en clase). Sos libre de elegir cualquiera de los vistos en clases, o inclusive buscar nuevos.


#### Estado Inicial y Objetivo

Definimos el estado inicial y el estado objetivo del problema de las Torres de Hanói con 5 discos. 
- `initial_state`: Representa la configuración inicial con todos los discos en la Torre A.
- `goal_state`: Representa la configuración final deseada con todos los discos en la Torre C.


In [2]:
# Estado inicial
initial_state = [
    [5, 4, 3, 2, 1],  # Torre A
    [],               # Torre B
    []                # Torre C
]

# Estado objetivo
goal_state = [
    [],               # Torre A
    [],               # Torre B
    [5, 4, 3, 2, 1]   # Torre C
]


#### Clase del Nodo de Búsqueda

La clase `SearchNode` representa un nodo en el árbol de búsqueda. 
Cada nodo incluye:
- `state`: El estado actual de las torres.
- `parent`: El nodo padre desde el cual se generó este nodo.
- `action`: La acción que llevó a este estado.
- `cost`: El costo acumulado desde el estado inicial hasta este nodo.
- `heuristic`: La estimación del costo restante para alcanzar el estado objetivo.
- `total`: La suma del costo y la heurística, utilizada para priorizar nodos en la búsqueda A*.


In [3]:
# Nodo de búsqueda
class SearchNode:
    def __init__(self, state, parent=None, action=None, cost=0, heuristic=0,peg_start = 0,peg_end = 0, disk = 0):
        self.state = state
        self.parent = parent
        self.action = action
        self.cost = cost
        self.heuristic = heuristic
        self.total = cost + heuristic
        self.peg_start = peg_start
        self.peg_end = peg_end
        self.disk = disk

    def __lt__(self, other):
        return self.total < other.total


#### Función Heurística

##### Basada en la Distancia de Manhattan

Esta heurística suma las "distancias" de cada disco desde su posición actual hasta su posición objetivo. En el contexto de las Torres de Hanói, la distancia de un disco puede ser considerada como el número de movimientos necesarios para llevar el disco desde su torre actual hasta la torre objetivo, asumiendo que no hay otros discos que obstaculicen el movimiento.

Definición
Para cada disco, la distancia puede ser:

> - 0 si el disco ya está en la torre objetivo
> - 1 si el disco necesita ser movido una vez (por ejemplo, de la torre A a la torre C, o de la torre B a la torre C)
> - 2 si el disco necesita ser movido dos veces (por ejemplo, de la torre A a la torre B y luego a la torre C)

##### Referencias

https://es.wikipedia.org/wiki/Geometr%C3%ADa_del_taxista



In [4]:
# Función heurística
def heuristic(state):    
    # Heurística basada en la distancia de Manhattan.
    # Calcula la suma de las distancias de cada disco desde su posición actual hasta su posición objetivo.
    distance = 0
    for i, tower in enumerate(state):
        for disk in tower:
            # Si el disco no está en la torre objetivo (torre C, índice 2)
            if i != 2:
                distance += 1  # Se necesita al menos un movimiento para cada disco
                if i == 0 and state[1] and min(state[1]) < disk:
                    distance += 1  # Disco en la torre A pero torre B tiene discos menores
                if i == 1 and state[0] and min(state[0]) < disk:
                    distance += 1  # Disco en la torre B pero torre A tiene discos menores
    return distance


#### Generación de Estados Sucesores

La función `generate_states` crea nuevos estados posibles moviendo el disco superior de una torre a otra. 
Cada movimiento debe ser legal, es decir, no se puede colocar un disco más grande sobre uno más pequeño.


In [5]:
# Generar estados sucesores
def generate_states(state):
    states = []
    for i in range(3):
        if state[i]:
            disk = state[i][-1]
            for j in range(3):
                if i != j and (not state[j] or state[j][-1] > disk):
                    new_state = [tower[:] for tower in state]
                    new_state[i].pop()
                    new_state[j].append(disk)
                    states.append((new_state, f"Mover disco {disk} de {chr(65+i)} a {chr(65+j)}",i+1,j+1,disk))
    return states


#### Reconstrucción del Camino

La función `reconstruct_path` reconstruye el camino desde el nodo inicial hasta el nodo objetivo, 
almacenando las acciones que llevaron a la solución.


In [6]:
# Reconstruir el camino desde el nodo inicial hasta el nodo objetivo
def reconstruct_path(node):
    path = []
    while node.parent is not None:
        path.append(node.action)
        node = node.parent
    return path[::-1]


#### Algoritmo A*

La función `a_star` implementa el algoritmo A*, utilizando una cola de prioridad (`heapq`) para explorar los nodos de manera eficiente.
- Inicializa el nodo inicial y la frontera.
- Utiliza un conjunto (`set`) para almacenar los estados explorados.
- En cada iteración, extrae el nodo con el menor costo total de la frontera y lo expande.
- Si alcanza el estado objetivo, reconstruye y retorna el camino.
- Si no se encuentra una solución, retorna `None`.


In [7]:
from heapq import heappop, heappush

# Algoritmo A*
def a_star(initial_state, goal_state):
    initial_node = SearchNode(initial_state, heuristic=heuristic(initial_state))
    frontier = []
    heappush(frontier, initial_node)
    explored = set()

    while frontier:
        current_node = heappop(frontier)
        
        # Verificar si hemos alcanzado el objetivo
        if current_node.state == goal_state:
            print("¡Objetivo alcanzado!")
            return current_node,reconstruct_path(current_node)

        # Marcar el estado actual como explorado
        explored.add(tuple(map(tuple, current_node.state)))

        # Generar y evaluar estados sucesores
        for successor_state, action,peg_start,peg_end,disk in generate_states(current_node.state):
            if tuple(map(tuple, successor_state)) not in explored:
                cost = current_node.cost + 1
                heur = heuristic(successor_state)
                successor_node = SearchNode(successor_state, parent=current_node, action=action, cost=cost, heuristic=heur,peg_start=peg_start,peg_end=peg_end,disk=disk)
                heappush(frontier, successor_node)
    
    return None  # Si no se encuentra solución


#### Ejecución del Algoritmo A*

En esta celda, ejecutamos el algoritmo A* para resolver el problema de las Torres de Hanói con 5 discos. 
Los pasos necesarios para alcanzar el objetivo se imprimen si se encuentra una solución. 
Si no se encuentra una solución, se indica que no se encontró.


In [8]:

# Ejecutar el algoritmo A* con resultados detallados
last_node,path = a_star(initial_state, goal_state)

if path:
    print("Estado inicial:")
    print(initial_state)
    print("\nEstado objetivo:")
    print(goal_state)
    print("\nNúmero total de movimientos necesarios:", len(path))
    print("\nMovimientos paso a paso:")
    for step_number, step in enumerate(path, start=1):
        print(f"Paso {step_number}: {step}")
else:
    print("No se encontró solución")



¡Objetivo alcanzado!
Estado inicial:
[[5, 4, 3, 2, 1], [], []]

Estado objetivo:
[[], [], [5, 4, 3, 2, 1]]

Número total de movimientos necesarios: 31

Movimientos paso a paso:
Paso 1: Mover disco 1 de A a C
Paso 2: Mover disco 2 de A a B
Paso 3: Mover disco 1 de C a B
Paso 4: Mover disco 3 de A a C
Paso 5: Mover disco 1 de B a A
Paso 6: Mover disco 2 de B a C
Paso 7: Mover disco 1 de A a C
Paso 8: Mover disco 4 de A a B
Paso 9: Mover disco 1 de C a B
Paso 10: Mover disco 2 de C a A
Paso 11: Mover disco 1 de B a A
Paso 12: Mover disco 3 de C a B
Paso 13: Mover disco 1 de A a C
Paso 14: Mover disco 2 de A a B
Paso 15: Mover disco 1 de C a B
Paso 16: Mover disco 5 de A a C
Paso 17: Mover disco 1 de B a A
Paso 18: Mover disco 2 de B a C
Paso 19: Mover disco 1 de A a C
Paso 20: Mover disco 3 de B a A
Paso 21: Mover disco 1 de C a B
Paso 22: Mover disco 2 de C a A
Paso 23: Mover disco 1 de B a A
Paso 24: Mover disco 4 de B a C
Paso 25: Mover disco 1 de A a C
Paso 26: Mover disco 2 de A a B


# Creación de archivos .json para simulator_hanoi.py

En esta celda realizamos la creación del archivo "sequence.json" a partir de la secuencia encontrada en la celda anterior. A su vez, se crea el archivo "initial_state.json" que establece el punto de partida (estado inicial de los discos), tambien necesario para ejecutar el script "simulator_hanoi.py"

In [11]:
# Crear el archivo sequence.json para usar el script de pygame

import json

node = last_node
movements = []

while node.parent is not None:
    
    #path.append(node.action)
    print(node.action,node.disk,node.peg_start,node.peg_end)
    movement = {
        "type": "movement",
        "disk": node.disk,
        "peg_start": node.peg_start,
        "peg_end": node.peg_end
    }
    movements.insert(0,movement)
    node = node.parent

filename = "sequence.json"
with open(filename, 'w') as f:
    json.dump(movements, f, indent=2)

# Crear el archivo initial_state.json para usar el script de pygame
initial_state = {
  "peg_1": [5,4,3,2,1],
  "peg_2": [],
  "peg_3": []
}
filename = "initial_state.json"
with open(filename, 'w') as f:
    json.dump(initial_state, f, indent=2)

Mover disco 1 de A a C 1 1 3
Mover disco 2 de B a C 2 2 3
Mover disco 1 de B a A 1 2 1
Mover disco 3 de A a C 3 1 3
Mover disco 1 de C a B 1 3 2
Mover disco 2 de A a B 2 1 2
Mover disco 1 de A a C 1 1 3
Mover disco 4 de B a C 4 2 3
Mover disco 1 de B a A 1 2 1
Mover disco 2 de C a A 2 3 1
Mover disco 1 de C a B 1 3 2
Mover disco 3 de B a A 3 2 1
Mover disco 1 de A a C 1 1 3
Mover disco 2 de B a C 2 2 3
Mover disco 1 de B a A 1 2 1
Mover disco 5 de A a C 5 1 3
Mover disco 1 de C a B 1 3 2
Mover disco 2 de A a B 2 1 2
Mover disco 1 de A a C 1 1 3
Mover disco 3 de C a B 3 3 2
Mover disco 1 de B a A 1 2 1
Mover disco 2 de C a A 2 3 1
Mover disco 1 de C a B 1 3 2
Mover disco 4 de A a B 4 1 2
Mover disco 1 de A a C 1 1 3
Mover disco 2 de B a C 2 2 3
Mover disco 1 de B a A 1 2 1
Mover disco 3 de A a C 3 1 3
Mover disco 1 de C a B 1 3 2
Mover disco 2 de A a B 2 1 2
Mover disco 1 de A a C 1 1 3


### 5. ¿Qué complejidad en tiempo y memoria tiene el algoritmo elegido?

#### Complejidad Temporal
La complejidad temporal del algoritmo A* depende del factor de ramificación y de la profundidad de la solución en el árbol de búsqueda. En términos generales, se puede expresar como \(O(b^d)\), donde:
- \(b\) es el factor de ramificación (número promedio de sucesores por estado).
- \(d\) es la profundidad del nodo objetivo en el árbol de búsqueda.

Para el problema de las Torres de Hanói:
- **Factor de ramificación \(b\)**: El factor de ramificación máximo es 3, ya que en cada estado un disco puede moverse a una de las otras dos torres.
- **Profundidad \(d\)**: La profundidad del nodo objetivo es \(2^k - 1\), donde \(k\) es el número de discos. Esto se debe a que la solución óptima del problema de las Torres de Hanói requiere \(2^k - 1\) movimientos.

#### Complejidad Espacial
La complejidad espacial del algoritmo A* es también exponencial en el peor de los casos, porque A* debe almacenar todos los nodos generados en la memoria. Esto se puede expresar como \(O(b^d)\), donde \(b\) y \(d\) son el factor de ramificación y la profundidad del nodo objetivo, respectivamente.

En resumen, tanto la complejidad temporal como la espacial del algoritmo A* para el problema de las Torres de Hanói son exponenciales en el peor de los casos, debido a la naturaleza combinatoria del problema.

#### Factores que Influyen en la Complejidad
- **Heurística**: La eficiencia del algoritmo A* depende en gran medida de la heurística utilizada. Una heurística más informada y precisa puede reducir significativamente el número de nodos explorados.
- **Factor de Ramificación**: Aunque el factor de ramificación es pequeño (máximo 3), la profundidad del árbol de búsqueda es grande, lo que resulta en una complejidad exponencial.
- **Número de Discos \(k\)**: La complejidad aumenta exponencialmente con el número de discos, ya que la profundidad del árbol de búsqueda es \(2^k - 1\).

#### Conclusión
El algoritmo A* es una potente técnica de búsqueda que encuentra la solución óptima si se utiliza una heurística admisible y consistente. Sin embargo, su complejidad temporal y espacial exponencial puede ser una limitación para problemas con un gran número de estados posibles, como es el caso de las Torres de Hanói con un número elevado de discos.

### 6. A nivel implementación, ¿qué tiempo y memoria ocupa el algoritmo? (Se recomienda correr 10 veces y calcular promedio y desvío estándar de las métricas).

Utilizamos la librería time para medir el tiempo de ejecución y tracemalloc para medir el uso de memoria.

In [10]:
import time
import tracemalloc
import statistics

# Función para medir tiempo y memoria
def measure_performance(num_runs=10):
    times = []
    memories = []
    path_lengths = []

    for run in range(num_runs):
        tracemalloc.start()
        start_time = time.time()
        
        # Ejecutar el algoritmo A*
        path = a_star(initial_state, goal_state)
        
        end_time = time.time()
        current, peak = tracemalloc.get_traced_memory()
        tracemalloc.stop()
        
        if path:
            print(f"Ejecución {run + 1}")
            times.append(end_time - start_time)
            memories.append(peak / 1024)  # Convertir a KB
            path_lengths.append(len(path))
        else:
            print(f"Ejecución {run + 1}: No se encontró solución")
    
    avg_time = statistics.mean(times)
    std_time = statistics.stdev(times)
    avg_memory = statistics.mean(memories)
    std_memory = statistics.stdev(memories)
    avg_path_length = statistics.mean(path_lengths)
    std_path_length = statistics.stdev(path_lengths)
    
    return avg_time, std_time, avg_memory, std_memory, avg_path_length, std_path_length

# Ejecutar la medición
avg_time, std_time, avg_memory, std_memory, avg_path_length, std_path_length = measure_performance()

print()
print(f"Tiempo promedio: {avg_time:.4f} segundos (desviación estándar: {std_time:.4f})")
print(f"Memoria promedio: {avg_memory:.2f} KB (desviación estándar: {std_memory:.2f})")
print(f"Longitud promedio del trayecto: {avg_path_length:.2f} movimientos (desviación estándar: {std_path_length:.2f})")


KeyError: 1

### 7. Si la solución óptima es 2k -1 movimientos con k igual al número de discos. Qué tan lejos está la solución del algoritmo implementado de esta solución óptima (se recomienda correr al menos 10 veces y usar el promedio de trayecto usado).

Para el problema de las Torres de Hanói con 5 discos, la solución óptima requiere \(2^5 - 1 = 31\) movimientos.
Vamos a comparar la longitud promedio del trayecto encontrado por el algoritmo con esta solución óptima.

In [None]:
optimal_solution_length = 2**5 - 1
avg_time, std_time, avg_memory, std_memory, avg_path_length, std_path_length = measure_performance()

print()
print(f"Tiempo promedio: {avg_time:.4f} segundos (desviación estándar: {std_time:.4f})")
print(f"Memoria promedio: {avg_memory:.2f} KB (desviación estándar: {std_memory:.2f})")
print(f"Longitud promedio del trayecto: {avg_path_length:.2f} movimientos (desviación estándar: {std_path_length:.2f})")
print(f"Solución óptima: {optimal_solution_length} movimientos")
print(f"Diferencia promedio respecto a la solución óptima: {avg_path_length - optimal_solution_length:.2f} movimientos")
