In [8]:
import numpy as np

# Definir el estado inicial para los postes
def initial_state(num_discs):
    A = list(range(num_discs, 0, -1))
    B = []
    C = []
    return A, B, C

# Función heurística que calcula cuántos discos están en el poste "C" en el orden correcto
def heuristic(state):
    _, _, C = state
    count = 0
    for i in range(1, len(C) + 1):
        if C[-i] == i:
            count += 1
        else:
            break
    return count

# Genera vecinos del estado actual al mover un disco entre los postes
def get_neighbors(state):
    A, B, C = state
    neighbors = []
    
    # Lista de movimientos posibles entre postes con sus nombres
    possible_moves = [(A, B, "A", "B"), (A, C, "A", "C"), 
                      (B, A, "B", "A"), (B, C, "B", "C"), 
                      (C, A, "C", "A"), (C, B, "C", "B")]
    
    # Genera los estados vecinos aplicando cada movimiento posible
    for source, target, source_name, target_name in possible_moves:
        if source and (not target or source[-1] < target[-1]):  # Regla de discos
            # Copiar el estado actual
            new_A, new_B, new_C = A[:], B[:], C[:]
            new_state = (new_A, new_B, new_C)
            
            # Ejecutar el movimiento en la copia
            disk = source.pop()
            target.append(disk)
            neighbors.append((new_A[:], new_B[:], new_C[:], disk, source_name, target_name))
            
            # Revertir el movimiento en el estado original
            target.pop()
            source.append(disk)
    
    return neighbors

# Implementa el algoritmo Hill Climbing para mover todos los discos a "C"
def hill_climbing_hanoi(num_discs):
    # Estado inicial
    current_state = initial_state(num_discs)
    current_heuristic = heuristic(current_state)
    steps = [current_state]
    visited_states = set()
    visited_states.add(tuple(tuple(peg) for peg in current_state))  # Guardar el estado como una tupla inmutable
    
    # Continuar hasta que todos los discos estén en el poste "C"
    while current_heuristic < num_discs:
        # Obtener todos los vecinos del estado actual
        neighbors = get_neighbors(current_state)
        
        # Seleccionar el vecino con el mayor valor de la heurística que no haya sido visitado
        best_neighbor = None
        best_neighbor_heuristic = -1
        
        for neighbor in neighbors:
            state_only = neighbor[:3]
            if tuple(tuple(peg) for peg in state_only) not in visited_states:
                heuristic_value = heuristic(state_only)
                if heuristic_value > best_neighbor_heuristic:
                    best_neighbor = neighbor
                    best_neighbor_heuristic = heuristic_value
        
        # Si no se encontró un vecino mejor no visitado, romper el ciclo para evitar bucles
        if best_neighbor is None or best_neighbor_heuristic <= current_heuristic:
            print("No se puede mejorar más el estado actual. Hill Climbing se detiene.")
            break
        
        # Imprimir el movimiento realizado
        disk, origen, destino = best_neighbor[3], best_neighbor[4], best_neighbor[5]
        print(f"Mueve el disco {disk} de {origen} a {destino}")
        
        # Actualizar el estado actual y la heurística
        current_state = best_neighbor[:3]
        current_heuristic = best_neighbor_heuristic
        steps.append(current_state)
        
        # Añadir el nuevo estado a los estados visitados
        visited_states.add(tuple(tuple(peg) for peg in current_state))
    
    return steps

# Número de discos
num_discs = 4

# Ejecutar el algoritmo
hill_climbing_hanoi(num_discs)


No se puede mejorar más el estado actual. Hill Climbing se detiene.


[([4, 3, 2, 1], [], [])]