## Задача 5-1. A\* поиск в задаче о кратчайших путях.

В этой задаче Вам предлагается реализовать поиск кратчайших путей в графе с помощью A\*-поиска с использованием эвристической функции («потенциала»), основанном на landmarks. Теоретические основы можно посмотреть [здесь](http://logic.pdmi.ras.ru/midas/sites/default/files/midas-werneck.pdf), слайды 20—36.

Вам предлагается скачать [отсюда](http://www.diag.uniroma1.it/challenge9/download.shtml) файлы “Travel time graph” и “Coordinates” для штата Флорида. Для Вашего удобства они также размещены в архиве `florida.7z` в настоящем репозитории на GitHub.

Функции `read_node_coords` и `read_arcs` возвращают соответственно координаты вершин графа (отнормированные; координаты нужны только для обеспечения возможности выбора landmarks “по периметру графа”) и структура дуг графа.

In [13]:
import math
from typing import List, Dict, Tuple
from collections import namedtuple, defaultdict
Coords = namedtuple('Coords', ['x', 'y'])

def read_node_coords(filename='coding-hometask-5-1-files/USA-road-d.FLA.co') -> List[int]:
    node_coords = []
    
    with open(filename, 'r') as coord_file:
        for line in coord_file:
            if line.startswith('v '):
                node_number, x, y = map(int, line.split()[1:])
                node_coords.append(Coords(x, y))
    
    minx = min(c.x for c in node_coords)
    miny = min(c.y for c in node_coords)
    for i, c in enumerate(node_coords):
        node_coords[i] = Coords(c.x-minx, c.y-miny)
    
    return node_coords


def read_arcs(filename='coding-hometask-5-1-files/USA-road-t.FLA.gr') -> Dict[int, Dict[int, float]]:
    adjacency_lists = defaultdict(dict)
    
    with open(filename, 'r') as coord_file:
        for line in coord_file:
            if line.startswith('a '):
                node_from, node_to, weight = map(int, line.split()[1:])
                adjacency_lists[node_from-1][node_to-1] = weight
                
    return adjacency_lists

Реализуйте процедуру `good_old_dijkstra`, которая для пары номеров вершин графа ищет кратчайший путь между ними и возвращает список номеров вершин, образующих оптимальный путь и его длину.

In [3]:
import heapq

# В случае node_to=None ищет расстояния до всех вершин графа.
def good_old_dijkstra(adjacency_lists, node_from, node_to=None):
    parent = {}
    dist = {}
    visited = {}
    
    for u in adjacency_lists:
        dist[u] = math.inf
        parent[u] = -1
        visited[u] = False
    
    dist[node_from] = 0
    parent[node_from] = -1
    
    Q = []
    heapq.heappush(Q, (0, node_from))
    
    while not len(Q) == 0:
        u = heapq.heappop(Q)[1]
        if u == node_to:
            break
        if visited[u] == True:
            continue
            
        for v in adjacency_lists[u]:
            weight = adjacency_lists[u][v]
            if dist[v] > dist[u] + weight:
                dist[v] = dist[u] + weight
                parent[v] = u
                heapq.heappush(Q, (dist[v], v))
        visited[u] = True
    
    if node_to is None:
        return dist
    
    # Восстановим путь.
    path = []
    if dist[node_to] != math.inf:
        node = node_to
        path.append(node)
        while parent[node] != -1:
            node = parent[node]
            path.append(node)
    path.reverse()
    
    return (path, dist[node_to])

Реализуйте тройку процедур `choose_landmarks`, `precalculate_landmark_distances` и `a_star_with_landmarks`. Процедура `choose_landmarks` выбирает нужное количество специальных вершин графа — этот выбор делается равномерным выбором по периметру графа (см. слайд 30 в [презентации](http://logic.pdmi.ras.ru/midas/sites/default/files/midas-werneck.pdf)). Процедура `precalculate_landmark_distances` для каждой вершины из заданного набора с помощью обычного алгоритма Дейкстры вычисляет расстояния до всех вершин графа. Эта информация затем используется в `a_star_with_landmarks` для ускорения поиска кратчайшего пути.

In [4]:
from numpy import arctan2

def choose_landmarks(node_coords, num_landmarks=15) -> List[int]:
    def vector_props(u, v):
        x = v[0] - u[0]
        y = v[1] - u[1]
        phi = arctan2(x, y)
        if phi < 0:
            phi += 2 * math.pi
        return math.hypot(x, y), phi
    
    # Обозначим приблизительный центр фигуры.
    get_mean = lambda i: sum([u[i] for u in node_coords]) / len(node_coords)
    center = Coords(get_mean(0), get_mean(1))
    
    angles = [2 * math.pi * i / num_landmarks for i in range(num_landmarks)]
    sects = [(-1, -1)] * num_landmarks
    for i in range(len(node_coords)):
        rho, phi = vector_props(center, node_coords[i])
        num_sect = int(phi * num_landmarks / (2 * math.pi))
        if sects[num_sect][1] < rho:
            sects[num_sect] = (i, rho)
    
    return [sects[i][0] for i in range(num_landmarks)]

In [5]:
def precalculate_landmark_distances(landmarks: List[int],
                                    adjacency_lists: Dict[int, Dict[int, float]]) -> Dict[int, Dict[int, float]]:
    landmark_dists = {}
    for node_from in landmarks:
        landmark_dists[node_from] = good_old_dijkstra(adjacency_lists, node_from)
    return landmark_dists

In [17]:
def a_star_with_landmarks(adjacency_lists: Dict[int, Dict[int, float]],
                          node_from, node_to, landmark_distances: Dict[int, Dict[int, float]]) -> Tuple[List[int], float]:
    
    # Эвристическая функция.
    def heuristic(u):
        distance = 0
        for l in landmark_distances:
            distance = max(distance, abs(landmark_distances[l][node_to] -
                                         landmark_distances[l][u]))
        return distance
    
    dist = {}
    parent = {}
    visited = {}
    
    for u in adjacency_lists:
        dist[u] = math.inf
        parent[u] = -1
        visited[u] = False
    
    dist[node_from] = 0
    
    Q = []
    heapq.heappush(Q, (heuristic(node_from), node_from))
    
    while not len(Q) == 0:
        u = heapq.heappop(Q)[1]
        if u == node_to:
            break
        if visited[u] == True:
            continue
        for v in adjacency_lists[u]:
            weight = adjacency_lists[u][v]
            if dist[v] > dist[u] + weight:
                dist[v] = dist[u] + weight
                parent[v] = u
                heapq.heappush(Q, (dist[v] + heuristic(v), v))
        visited[u] = True
    
    # Восстановим путь.
    path = []
    if dist[node_to] != math.inf:
        node = node_to
        path.append(node)
        while parent[node] != -1:
            node = parent[node]
            path.append(node)
    path.reverse()
    
    return (path, dist[node_to])

In [22]:
import time
from random import randrange

def run_all():
    node_coords = read_node_coords()
    adjacency_lists = read_arcs()
    num_nodes = len(node_coords)
    
    time_start = time.monotonic()
    landmark_distances = precalculate_landmark_distances(choose_landmarks(node_coords), adjacency_lists)
    print('Precalculation done in {:.2} seconds.'.format(time.monotonic() - time_start))
    
    time_dijkstra = 0
    time_a_star = 0
    
    num_tests = 100
    for _ in range(num_tests):
        node_from, node_to = randrange(num_nodes), randrange(num_nodes)
        time_start = time.monotonic()
        p_dijkstra, d_dijkstra = good_old_dijkstra(adjacency_lists, node_from, node_to)
        time_dijkstra += time.monotonic()-time_start
        time_start = time.monotonic()
        p_a_star, d_a_star = a_star_with_landmarks(adjacency_lists, node_from,
                                                   node_to, landmark_distances)
        time_a_star += time.monotonic()-time_start
        assert(d_dijkstra == d_a_star)
    
    print('Time elapsed in {} test: {:.2} second for A* vs. {:.2} seconds for Dijkstra.'.format(num_tests, time_a_star, time_dijkstra))

In [23]:
run_all()

Precalculation done in 5.2e+01 seconds.
Time elapsed in 100 test: 1e+02 second for A* vs. 1.9e+02 seconds for Dijkstra.
