# Ejercicio Módulo 2
**Inteligencia Artificial - CEIA - FIUBA**

**Agustín Jesús Vazquez (e2301)**

En este ejercicio deben implementar un algoritmo de búsqueda que no sea **Búsqueda Primero en Anchura (BFS)** para resolver el problema de la Torre de Hanoi. La nota máxima dependerá del algoritmo implementado:

- **Búsqueda Primero en Profundidad**: nota máxima 6.
- **Búsqueda de Costo Uniforme**: nota máxima 6.
- **Búsqueda de Profundidad Limitada con Profundidad Iterativa**: nota máxima 7.
- **Búsqueda Voraz usando la heurística dada en el aula virtual**: nota máxima 8.
- **Búsqueda Voraz usando una heurística desarrollada por vos**: nota máxima 9.
- **Búsqueda A\* usando la heurística dada en el aula virtual**: nota máxima 9.
- **Búsqueda A\* usando una heurística desarrollada por vos**: nota máxima 10.

La función debe devolver la salida correspondiente a la solución encontrada o `None si no se encontró una solución.

Además, debe calcular métricas de rendimiento que, como mínimo, incluyan:

- `solution_found`: `True` si se encontró la solución, `False` en caso contrario.
- `nodes_explored`: cantidad de nodos explorados (entero).
- `states_visited`: cantidad de estados distintos visitados (entero).
- `nodes_in_frontier`: cantidad de nodos que quedaron en la frontera al finalizar la ejecución (entero).
- `max_depth`: máxima profundidad explorada (entero).
- `cost_total`: costo total para encontrar la solución (float).

In [1]:
import heapq
from aima_libs.hanoi_states import ProblemHanoi, StatesHanoi
from aima_libs.tree_hanoi import NodeHanoi
from heapq import heappush, heappop
from aima_libs import aima  # opcional
from collections import defaultdict
import os

In [2]:
def search_algorithm(number_disks=5) -> (NodeHanoi, dict):

    list_disks = [i for i in range(5, 0, -1)]
    initial_state = StatesHanoi(list_disks, [], [], max_disks=number_disks)
    goal_state = StatesHanoi([], [], list_disks, max_disks=number_disks)
    problem = ProblemHanoi(initial=initial_state, goal=goal_state)

    ##############################################################################################

    def search_algorithm(number_disks=5) -> (NodeHanoi, dict):
        # ----- construir estados inicial y objetivo
        list_disks = [i for i in range(number_disks, 0, -1)]  # discos: grande->chico
        initial_state = StatesHanoi(list_disks, [], [], max_disks=number_disks)
        goal_state    = StatesHanoi([], [], list_disks, max_disks=number_disks)
        problem = ProblemHanoi(initial=initial_state, goal=goal_state)

    # ----- helpers: hashing de estado y heurística admisible
    def state_key(st: StatesHanoi):
        # ajustá esto si tu clase expone otro nombre que no sea 'rods'
        return tuple(tuple(rod) for rod in st.rods)

    def goal_peg_index(st: StatesHanoi):
        # detecta cuál es la estaca objetivo (la que tiene los discos [n..1] en el goal_state)
        rods = goal_state.rods
        for i in range(3):
            if tuple(rods[i]) == tuple([*range(number_disks, 0, -1)]):
                return i
        # por defecto 2 (tercera estaca)
        return 2

    GOAL_PEG = goal_peg_index(goal_state)

    def heuristic(st: StatesHanoi) -> int:
        """h(n) = 2^(remaining) - 1, donde remaining = n - k;
        k = cantidad de discos más grandes ya ubicados correctamente en la estaca objetivo.
        """
        rods = st.rods
        goal_stack = rods[GOAL_PEG]
        # contamos cuántos discos desde el más grande hacia abajo ya están correctamente al fondo
        k = 0
        expect = number_disks
        # goal_stack está ordenada de abajo->arriba? normalmente sí: fondo=índice 0.
        # Recorremos desde el fondo hacia arriba mientras coincidan number_disks, number_disks-1, ...
        for d in goal_stack:
            if d == expect:
                k += 1
                expect -= 1
            else:
                break
        remaining = number_disks - k
        if remaining <= 0:
            return 0
        return (1 << remaining) - 1  # 2^(remaining) - 1

    # ----- estructura para A*
    # cada entrada del heap: (f, tie, g, node)
    # 'tie' evita problemas de comparación entre nodos (contador incremental)
    frontier = []
    tie = 0

    start = NodeHanoi(initial_state)
    g0 = 0
    f0 = g0 + heuristic(initial_state)
    heapq.heappush(frontier, (f0, tie, g0, start))
    tie += 1

    # mejores g conocidos por estado
    best_g = {state_key(initial_state): 0}
    # set de visitados (para métrica states_visited); usamos keys para evitar objetos duplicados
    visited_states = set()

    # métricas
    metrics = {
        "solution_found": False,
        "nodes_explored": 0,    # nodos extraídos de la frontera (expandidos)
        "states_visited": 0,    # cantidad de estados únicos que efectivamente visitamos
        "nodes_in_frontier": 0, # quedarán al final
        "max_depth": 0,         # mayor profundidad alcanzada al expandir
        "cost_total": 0.0,      # costo g de la solución
    }

    goal_key = state_key(goal_state)

    # ----- bucle principal de A*
    while frontier:
        f, _, g, node = heapq.heappop(frontier)
        metrics["nodes_explored"] += 1
        metrics["max_depth"] = max(metrics["max_depth"], getattr(node, "depth", 0))

        k = state_key(node.state)

        if k not in visited_states:
            visited_states.add(k)
            metrics["states_visited"] = len(visited_states)
        
        # ✅ comprobar objetivo por clave de estado (robusto)
        if k == goal_key:
            metrics["solution_found"] = True
            metrics["cost_total"] = float(g)
            metrics["nodes_in_frontier"] = len(frontier)
            return node, metrics

        # expandir sucesores
        for child in node.expand(problem):
            g_child = g + 1  # cada movimiento cuesta 1
            sk = state_key(child.state)

            # dominio de A*: solo re-encolar si encontramos mejor g
            prev = best_g.get(sk)
            if prev is None or g_child < prev:
                best_g[sk] = g_child
                h = heuristic(child.state)
                f_child = g_child + h
                heapq.heappush(frontier, (f_child, tie, g_child, child))
                tie += 1

    # si no se encontró solución
    metrics["nodes_in_frontier"] = 0
    return NodeHanoi(initial_state), metrics

Se prueba la función:

In [3]:
solution, metrics = search_algorithm(number_disks=5)

Veamos las métricas:

In [4]:
for key, value in metrics.items():
    print(f"{key}: {value}")

solution_found: True
nodes_explored: 116
states_visited: 116
nodes_in_frontier: 9
max_depth: 31
cost_total: 31.0


Veamos el camino de estados desde el principio a la solución:

In [5]:
for nodos in solution.path():
    print(nodos)

<Node HanoiState: 5 4 3 2 1 |  | >
<Node HanoiState: 5 4 3 2 |  | 1>
<Node HanoiState: 5 4 3 | 2 | 1>
<Node HanoiState: 5 4 3 | 2 1 | >
<Node HanoiState: 5 4 | 2 1 | 3>
<Node HanoiState: 5 4 1 | 2 | 3>
<Node HanoiState: 5 4 1 |  | 3 2>
<Node HanoiState: 5 4 |  | 3 2 1>
<Node HanoiState: 5 | 4 | 3 2 1>
<Node HanoiState: 5 | 4 1 | 3 2>
<Node HanoiState: 5 2 | 4 1 | 3>
<Node HanoiState: 5 2 1 | 4 | 3>
<Node HanoiState: 5 2 1 | 4 3 | >
<Node HanoiState: 5 2 | 4 3 | 1>
<Node HanoiState: 5 | 4 3 2 | 1>
<Node HanoiState: 5 | 4 3 2 1 | >
<Node HanoiState:  | 4 3 2 1 | 5>
<Node HanoiState: 1 | 4 3 2 | 5>
<Node HanoiState: 1 | 4 3 | 5 2>
<Node HanoiState:  | 4 3 | 5 2 1>
<Node HanoiState: 3 | 4 | 5 2 1>
<Node HanoiState: 3 | 4 1 | 5 2>
<Node HanoiState: 3 2 | 4 1 | 5>
<Node HanoiState: 3 2 1 | 4 | 5>
<Node HanoiState: 3 2 1 |  | 5 4>
<Node HanoiState: 3 2 |  | 5 4 1>
<Node HanoiState: 3 | 2 | 5 4 1>
<Node HanoiState: 3 | 2 1 | 5 4>
<Node HanoiState:  | 2 1 | 5 4 3>
<Node HanoiState: 1 | 2 | 5 4 

Y las acciones que el agente debería aplicar para llegar al objetivo:

In [6]:
for act in solution.solution():
    print(act)

Move disk 1 from 1 to 3
Move disk 2 from 1 to 2
Move disk 1 from 3 to 2
Move disk 3 from 1 to 3
Move disk 1 from 2 to 1
Move disk 2 from 2 to 3
Move disk 1 from 1 to 3
Move disk 4 from 1 to 2
Move disk 1 from 3 to 2
Move disk 2 from 3 to 1
Move disk 1 from 2 to 1
Move disk 3 from 3 to 2
Move disk 1 from 1 to 3
Move disk 2 from 1 to 2
Move disk 1 from 3 to 2
Move disk 5 from 1 to 3
Move disk 1 from 2 to 1
Move disk 2 from 2 to 3
Move disk 1 from 1 to 3
Move disk 3 from 2 to 1
Move disk 1 from 3 to 2
Move disk 2 from 3 to 1
Move disk 1 from 2 to 1
Move disk 4 from 2 to 3
Move disk 1 from 1 to 3
Move disk 2 from 1 to 2
Move disk 1 from 3 to 2
Move disk 3 from 1 to 3
Move disk 1 from 2 to 1
Move disk 2 from 2 to 3
Move disk 1 from 1 to 3
