In [1]:
# Definición del estado inicial y el estado objetivo
estado_inicial = [['A'],
                  ['B'],
                  ['C']] # A, B, C en una pila

estado_objetivo = [[],
                   [],
                   ['C', 'B', 'A']]  # El objetivo es moverlos todos a la tercera pila en orden inverso
# ['A'], []
# ['B'], []
# ['C'], ['C', 'B', 'A']

In [2]:
def evaluar_estado(estado_actual, estado_objetivo):
    """
    Función de evaluación mejorada que considera tanto la posición correcta de los bloques
    como la altura correcta de las pilas para comparar el estado actual con el estado objetivo.
    """
    puntuacion = 0
    for pila_actual, pila_objetivo in zip(estado_actual, estado_objetivo):
        # Comparar las alturas de las pilas para dar prioridad a los movimientos que igualen estas alturas
        if len(pila_actual) == len(pila_objetivo):
            puntuacion += len(pila_objetivo) * 2  # Multiplicador para priorizar la altura correcta de la pila
        # Sumar puntos por cada bloque en la posición correcta
        for bloque_actual, bloque_objetivo in zip(pila_actual, pila_objetivo):
            if bloque_actual == bloque_objetivo:
                puntuacion += 1
    return puntuacion

In [3]:
def obtener_vecinos(estado):
    """
    Genera todos los estados vecinos posibles a partir del estado actual.
    Un vecino se genera moviendo el bloque superior de una pila a otra.
    """
    vecinos = []
    for i, pila_origen in enumerate(estado):
        if pila_origen:  # Si la pila no está vacía
            for j in range(len(estado)):
                if i != j:  # Evitar mover un bloque dentro de la misma pila
                    estado_copia = [pila.copy() for pila in estado]
                    bloque = estado_copia[i].pop()  # Remover el bloque superior
                    estado_copia[j].append(bloque)  # Mover el bloque a otra pila
                    vecinos.append(estado_copia)
    return vecinos

In [6]:
def hill_climbing(estado_inicial, estado_objetivo):
    estado_actual = estado_inicial
    puntuacion_actual = evaluar_estado(estado_actual, estado_objetivo)
    
    print("Objetivo:")
    for eo in estado_objetivo:
        print(eo)
    
    while True:
        vecinos = obtener_vecinos(estado_actual)
        mejor_vecino = None
        mejor_puntuacion = puntuacion_actual

        print("____________")
        print("Actual:")
        for ea in estado_actual:
            print(ea)
        print("Puntos:", mejor_puntuacion)
        print("")
        
        for vecino in vecinos:
            puntuacion_vecino = evaluar_estado(vecino, estado_objetivo)
            if puntuacion_vecino > mejor_puntuacion:
                mejor_vecino = vecino
                mejor_puntuacion = puntuacion_vecino
        
        if mejor_puntuacion == puntuacion_actual:
            # No se encontraron vecinos con mejor puntuación, retornar el estado actual
            return estado_actual
        
        # Actualizar el estado actual al mejor vecino encontrado
        estado_actual = mejor_vecino
        puntuacion_actual = mejor_puntuacion

In [8]:
solucion = hill_climbing(estado_inicial, estado_objetivo)
print("Estado final alcanzado:")
for pila in solucion:
    print(pila)

Objetivo:
[]
[]
['C', 'B', 'A']
____________
Actual:
['A']
['B']
['C']
Puntos: 1

____________
Actual:
['A']
[]
['C', 'B']
Puntos: 2

____________
Actual:
[]
[]
['C', 'B', 'A']
Puntos: 9

Estado final alcanzado:
[]
[]
['C', 'B', 'A']
