In [None]:
## Полезная библиотека для решения
# %pip install HeapDict
# import heapdict

# Задание на программирование [50 баллов]

**Постановка**

В этой задаче вам предстоит реализовать алгоритм поиска на графе 𝐴*, для нахождения оптимальной последовательности ходов в игре пятнашки (3 × 3). Например, пусть дано следующее начальное расположение:

|   |   |   |
|---|---|---|
| 1 | 2 | 3 |
| 4 |   | 6 |
| 7 | 5 | 8 |

Ваша программа должна найти самую короткую последовательность ходов, чтобы перевести игру в целевое расположение:

|   |   |   |
|---|---|---|
| 1 | 2 | 3 |
| 4 | 5 | 6 |
| 7 | 8 |   |

Выход вашей программы должен выглядеть примерно так: ["down", "right"], то есть для решения этой головоломки нужно сначала сдвинуть пустую клетку внизу (поменять ее местами с костяшкой снизу), а затем сдвинуть ее вправо (поменять ее местами с костяшкой справа).

**Техническию детали**

*   Текущее состояние игры будет представлено в виде Python tuple, где пустая клетка обозачается нулем. Пример выше будет выглядеть следующим образом (1, 2, 3, 4, 0, 6, 7, 5, 8).
*   Не каждая начальная позиция может быть переведена в целевое состояние. Чтобы протестировать ваше решение, может быть полезно написать функцию, которая генерирует валидные изначальные расположения. Для этого можно начать из целевой позиции и многогратно переместить пустую клетку в случайном допустимом направлении.

## Часть 1. Реализация эвристик [20 баллов]

Вам нужно реализовать две эвристики в предоставленных шаблонах функций `heuristic_misplaced` и `heuristic_manhattan`.

**Задача 1. Количество неправильно расположенных костяшек [10 баллов]**

Реализуйте эвристику, которая возвращает количество костяшек, расположенных не на своих местах. Пустое пространство не является костяшкой и не должно учитываться при подсчете неправильно расположенных костяшек.

In [None]:
import numpy as np

In [None]:
def heuristic_misplaced(state):
    """
    Количество неправильно расположенных костяшек.
    Пустое пространство не является костяшкой и не должно
    не учитывается при подсчете неправильно размещенных костяшек.

    :param state: Tuple, представляющий текущее состояние игры.
    :return: Количество неправильно расположенных костяшек.
    """

    # [TODO: Ваш код здесь!]
    mask = np.array([1, 2, 3, 4, 5, 6, 7, 8, 0])
    curr = np.array(state)
    res = len(mask[mask != curr]) - int(curr[-1] != 0)
    return res

In [None]:
# В этом блоке вы можете протестировать свое решение для самопроверки.
# После сдачи мы протестируем ваше решение на дополнительных тестах и проверим
# корректность вручную

def test_heuristic_misplaced():
    res = []
    test_cases = [
    ((1, 2, 3, 4, 0, 6, 7, 5, 8), 2),
    ((1, 2, 3, 4, 5, 6, 7, 8, 0), 0),
    ((1, 2, 3, 4, 5, 6, 7, 0, 8), 1),
    ((1, 2, 3, 4, 5, 6, 0, 7, 8), 2),
    ((1, 2, 3, 4, 0, 5, 7, 8, 6), 2),
    ((1, 2, 3, 5, 4, 6, 7, 8, 0), 2)
]



    for i, (state, expected_value) in enumerate(test_cases):
        actual_value = heuristic_misplaced(state)
        assert actual_value == expected_value, f"Тест для расположения {state} завершился ошибкой: " \
                                               f"функия heuristic_misplaced вернула значение {actual_value}, " \
                                               f"ожидаемое значение: {expected_value}"

    print("Все тесты для heuristic_misplaced завершились успешно!")

test_heuristic_misplaced()

Все тесты для heuristic_misplaced завершились успешно!


**Задача 2. Сумма манхэттенских расстояний до правильных позиций [10 баллов]**

Реализуйте эвристику, которая для каждой костяшки подсчитывает манхэттэнское расстояние до правильной позиции и возвращает сумму этих расстояний. Пустое пространство не является костяшкой и не должно учитываться при подсчете.

*Пример: В приведенном выше примере расстояния от неправильно расположенных костяшек 5 и 8 до их правильных позиций равны 1, поэтому сумма манхэттенских расстояний равна 2.*

In [None]:
def heuristic_manhattan(state):
    """
    Сумма манхэттенских расстояний от неправильно
    расположенных костяшек до их правильного положения.

    :param state: Tuple, представляющий текущее состояние игры.
    :return: Сумма манхэттенских расстояний.
    """

    # [TODO: Ваш код здесь!]
    aim = [1, 2, 3, 4, 5, 6, 7, 8, 0]
    res = 0
    for i in range(1, 9):
        res += abs(aim.index(i) % 3 - list(state).index(i) % 3) + abs(aim.index(i) // 3 - list(state).index(i) // 3)

    return res # TODO: Замените на ваше значение.

In [None]:
# В этом блоке вы можете протестировать свое решение для самопроверки.
# После сдачи мы протестируем ваше решение на дополнительных тестах и проверим
# корректность вручную

def test_heuristic_manhattan():
    res = []
    test_cases = [
        ((1, 2, 3, 4, 0, 6, 7, 5, 8), 2),
        ((1, 2, 3, 4, 5, 6, 7, 8, 0), 0),
        ((1, 2, 3, 4, 5, 6, 0, 7, 8), 2),
        ((1, 2, 3, 4, 6, 0, 7, 5, 8), 3),
        ((1, 3, 0, 4, 2, 5, 7, 8, 6), 4),
        ((1, 2, 3, 4, 0, 8, 7, 6, 5), 6)
    ]

    for state, expected_value in test_cases:
        actual_value = heuristic_manhattan(state)
        assert actual_value == expected_value, f"Тест для расположения {state} завершился ошибкой: " \
                                               f"функия heuristic_manhattan вернула значение {actual_value}, " \
                                               f"ожидаемое значение: {expected_value}"

    print("Все тесты для heuristic_manhattan завершились успешно!")

test_heuristic_manhattan()

Все тесты для heuristic_manhattan завершились успешно!


## Часть 2. Реализация A* [20 баллов]

Теперь вам предстоит реализовать алгоритм поиска на графе A* в предоставленном шаблоне функции astar, чтобы найти решение пятнашек с помощью эвристик, описанных выше. Ваша функция должна возвращать два объекта:

*   строку, представляющую ходы, необходимые для достижения цели
*   список состояний в том порядке, в котором они были исследованы алгоритмом (expanded)

Используйте символы «r», «l», «u» и «d» для обозначения направлений «вправо», «влево», «вверх» и «вниз» соответственно. В приведенном выше примере ваша функция должна вернуть строку `dr`. Если изначальное расположение не имеет решений, верните None для оптимального пути и список посещенных (Expanded) состояний.

**Детерминированность**

Строго говоря, A* не является детерминированым алгоритмом. Если при выборе следующей вершины для исследования несколько вершин имеют одинаковое значение cost-функции (текущее количество ходов + значение эвристики), то алгоритм выбирает из этих вершин произвольно.

Чтобы мы могли проверить ваше решение, мы требуем, чтобы ваша реализация алгоритма выбирала из нескольких вершин с одинаковой cost-функцией в лексикографическом порядке. Например, состояние (1, 2, 3, 4, 0, 6, 7, 5, 8) лексикографически меньше, чем (1, 2, 3, 4, 0, 6, 7, 8, 5).

**Реализация**

В реализации алгоритма вам потребуется очередь с приоритетом для выбора следующей вершины для исследования. Мы рекомендуем использовать heapdict. В первом блоке этого ноутбука показано как установить эту библиотеку в Google Colab и импортировать ее. Подробности можно найти по адресу https://github.com/DanielStutzbach/heapdict.

Чтобы выполнить требование детерминированности, в качестве value в очереди с приоритетами следует использовать tuple (зачение cost-функции, state). Тогда выбор из нескольких вершин с одинаковыми значениями cost-функции будет осуществляться в лексикографическом порядке.

**Тестирование**

В блоке ниже реализован простой тест для первичной проверки алгоритма. Однако, мы рекомендуем вам протестировать решение на дополнительных примерах, которые вы должны сгенерировать самостоятельно.

In [312]:
def step(state, heuristic, states_visited):
    miss = heuristic
    zero_index = state.index(0)

    state_list = np.array(list(state))
    left = -1
    right = -1
    up = -1
    down = -1

    a_1, a_2, a_3, a_4 = 100, 100, 100, 100

    dct = dict()

    if zero_index - 1 >= 0:
        left = zero_index - 1
        state_list[zero_index], state_list[left] = state_list[left], state_list[zero_index]
        a_1 = miss(state_list)
        if tuple(state_list) not in states_visited:
            dct[a_1] = [tuple(state_list), 'l']
        else:
            a_1 = 100
        state_list[zero_index], state_list[left] = state_list[left], state_list[zero_index]


    if zero_index + 1 < len(state):
        right = zero_index + 1
        state_list[zero_index], state_list[right] = state_list[right], state_list[zero_index]
        a_2 = miss(state_list)
        if tuple(state_list) not in states_visited:
            dct[a_2] = [tuple(state_list), 'r']
        else:
            a_2 = 100
        state_list[zero_index], state_list[right] = state_list[right], state_list[zero_index]

    if zero_index - 3 >= 0:
        up = zero_index - 3
        state_list[zero_index], state_list[up] = state_list[up], state_list[zero_index]
        a_3 = miss(state_list)
        if tuple(state_list) not in states_visited:
            dct[a_3] = [tuple(state_list), 'u']
        else:
            a_3 = 100
        state_list[zero_index], state_list[up] = state_list[up], state_list[zero_index]

    if zero_index + 3 < len(state):
        down = zero_index + 3
        state_list[zero_index], state_list[down] = state_list[down], state_list[zero_index]
        a_4 = miss(state_list)
        if tuple(state_list) not in states_visited:
            dct[a_4] = [tuple(state_list), 'd']
        else:
            a_4 = 100
        state_list[zero_index], state_list[down] = state_list[down], state_list[zero_index]

    return dct[np.min([a_1, a_2, a_3, a_4])]


def astar(init_state, heuristic):
    """
    A^* implementation.

    :param init_state: Tuple, представляющий текущее состояние игры.
    :param heuristic: Функция эвристики
    :return: Tuple, в котором:
        Первый элемент - это строка, представляющая оптимальный путь.
            Используйте символы 'r', 'l', 'u' и 'd' для обозначения
            'right', 'left', 'up' и 'down' соответственно.
        Второй элемент - это список, содержащий исследованные (expanded)
        алгоритмом состояния в порядке их прохождения.
    """
    states_visited = set()
    states_visited.add(init_state)

    aim = (1, 2, 3, 4, 5, 6, 7, 8, 0)
    curr_state = init_state
    k = 0
    ans_str = ''
    ans_lst = [curr_state]

    while curr_state != aim:
        curr = step(curr_state, heuristic, states_visited)
        ans_lst.append(curr[0])
        ans_str += curr[1]
        curr_state = curr[0]
        states_visited.add(tuple(curr_state))
        k += 1

    # [TODO: Ваш код здесь!]


    return ans_str, ans_lst # TODO: Замените на свое значение

In [313]:
# В этом блоке вы можете протестировать свое решение для самопроверки.
# После сдачи мы протестируем ваше решение на дополнительных тестах и проверим
# корректность вручную

def test_astar(heuristic):
    test_cases = [
            ((1, 2, 3, 4, 5, 6, 7, 8, 0), "", [(1, 2, 3, 4, 5, 6, 7, 8, 0)]),
            ((1, 2, 3, 4, 5, 6, 0, 7, 8), "rr", [(1, 2, 3, 4, 5, 6, 0, 7, 8),
                                                (1, 2, 3, 4, 5, 6, 7, 0, 8),
                                                (1, 2, 3, 4, 5, 6, 7, 8, 0)]),
            ((1, 2, 3, 4, 6, 0, 7, 5, 8), "ldr", [(1, 2, 3, 4, 6, 0, 7, 5, 8),
                                                (1, 2, 3, 4, 0, 6, 7, 5, 8),
                                                (1, 2, 3, 4, 5, 6, 7, 0, 8),
                                                (1, 2, 3, 4, 5, 6, 7, 8, 0)]),
            ((1, 3, 0, 4, 2, 5, 7, 8, 6), "ldrd", [(1, 3, 0, 4, 2, 5, 7, 8, 6),
                                                (1, 0, 3, 4, 2, 5, 7, 8, 6),
                                                (1, 2, 3, 4, 0, 5, 7, 8, 6),
                                                (1, 2, 3, 4, 5, 0, 7, 8, 6),
                                                (1, 2, 3, 4, 5, 6, 7, 8, 0)]),
        ]

    for test in test_cases:
        state, actual_path, actual_states = test[0], test[1], test[2]
        path, states = astar(test[0], heuristic)
        assert path == actual_path and states == actual_states, f"Тест для расположения {state} завершился ошибкой: " \
                                                                f"astar вернула {path}, {states}, " \
                                                                    f"ожидаемые значения {actual_path, actual_states}"
    print("Все тесты для test_astar завершились успешно!")

test_astar(heuristic_manhattan)
test_astar(heuristic_misplaced)

Все тесты для test_astar завершились успешно!
Все тесты для test_astar завершились успешно!


## Часть 3. Сравнение эвристик [10 баллов]

Теперь сравниие эффективность различных эвристик. Выберите несколько допустимых начальных позиций и сравните количество исследованных (expanded) алгоритмом состояний для двух эвристик. Прокомментируйте наблюдаемый результат.

In [333]:
def check_heuristics_difference():

    # [TODO: Ваш код здесь!]
    samples = [
        (1, 2, 3, 4, 5, 6, 0, 7, 8),
        (1, 3, 0, 4, 2, 5, 7, 8, 6),
        (0, 6, 1, 2, 5, 3, 8, 7, 4),
        (6, 8, 5, 2, 3, 1, 0, 7, 4),
        (1, 7, 4, 3, 2, 0, 5, 6, 8)
    ]

    for sample in samples:
        res_misplaced = len(astar(sample, heuristic_misplaced)[0])
        res_manhattan = len(astar(sample, heuristic_manhattan)[0])
        print(f'misplaced {res_misplaced}')
        print(f'manhattan {res_manhattan}')
        print()


In [334]:
check_heuristics_difference()

misplaced 2
manhattan 2

misplaced 4
manhattan 4

misplaced 202
manhattan 18

misplaced 326
manhattan 260

misplaced 265
manhattan 43



**Вывод:** Эвристика с числом неверно расположенных костяшек показала себя намного хуже на 'боевых' примерах. Это, скорее всего, объясняется тем, что она часто может совпадать для двух разных состояний. Манххэттенское расстояние всегда почти разное, и благодаря нему у нас по пути к целевому положению меньше решает рандом куда нам идти.