# Графы
Материал взят из:  
- Classic Computer Science Problems in Python
- Introduction to The Design & Analysis of Algorithms (Anany Levitin)

## Терминология

**Граф** - это совокупность точек на плоскости, называемых *вершинами*, часть из которых соединена отрезками (*ребрами*)
![image.png](attachment:image.png)

In [1]:
# граф можно представить как два множества
# V - вершины, E - пары вершин, означающие ребра
V = {'a', 'b', 'c', 'd', 'e', 'f'}
E = {('a', 'c'), ('a', 'd'),
     ('b', 'c'), ('b', 'f'),
     ('e', 'c'), ('e', 'f'), ('e', 'd')}

G = (V, E)

Граф называется **неориентированным**, если ребра не имеют направления, то есть пара `('a', 'b')` означает то же самое, что и пара `('b', 'a')`. В ином случае граф является **ориентированным (directed)**. 

Граф называют **взвешенным (weighted graph)**, если каждое ребро имеет **вес/стоимость (weight/cost)**.

Граф называется **полным (complete)**, если каждая пара вершин соединена ребром. Стандартное обозначение для полного графа, состоящего из $|V|$ вершин: $K_{|V|}$.  
Граф называется **плотным (dense)**, если он *почти полный*. В ином случае граф называют **разреженным (sparse)**.

## Представление графа
В компьютерным программах чаще всего графы представляют двумя способами:
- **Матрица смежности (adjacency matrix)**. Это матрица размера $n*n$, где $n = |V|$. Каждая строка и каждый столбец соответствуют одной из вершин графа. $[i, j]$ - ый элемент этой матрицы равен количеству ребер, проведенных из вершины $i$ в вершину $j$.
![image.png](attachment:image.png)
Для неориентированного графа матрица смежности всегда симметрична  
- **Cвязанные списки смежных вершин (adjancency linked lists)** - это совокупность связанных списков (по одному на каждую вершину), в которых содержится информация обо всех смежных вершинах для текущей вершины. Обычно в начале каждого подобного списка располагается вершина, для которой этот список составлен:
![image-2.png](attachment:image-2.png)


! Связанные списки хороши для *разреженных графов*, поскольку требуется не так много оперативной памяти (если использовать матрицу, то она будет почти вся заполнена нулями). В случае *плотных графов* лучше использовать матрицу смежности.


В случае взвешенного графа матрица смежности преобразуется в **матрицу весов/стоимости (weight/cost matrix)**. Её элементы $A[i, j]$ равны стоимости ребра из $i$ в $j$. В случае, если ребра между вершинами нет, ставится специальный знак (например, бесконечность). Что касается связанных списков, то их, в случае взвешенного графа, необходимо расширить:
![image-3.png](attachment:image-3.png)

## Свойства графа
Для решения огромного количества задач важны некоторые свойства графов. Следует начать с терминологии, которая необходима для пояснения некоторых свойств:  
**Путь (path)** или **маршрут** от вершины $u$ к вершине $v$ - это последовательность смежных (соединенных ребром) вершин, которая начинается в $u$ и заканчивается в $v$. Путь называют **простым (simple)**, если все ребра, входящие в него, различны. Под **длиной (length)** пути подразумевается количество ребер, которые составляют этот путь (*данный термин следует использовать аккуратно, когда речь идет о взвешенных графах*). 

Первое важное свойство - **связность (connectivity)** - свойство графа, означающее, что для любой пары вершин $(u, v)$ этого графа существует путь из $u$ в $v$. *Объяснение:* если представить вершины графа как шары, а совокупность всех ребер как длинную веревку, то связный граф - этот тот граф, который можно *удержать в одной руке*, то есть одной веревки будет достаточно для того, чтобы соединить все шары. Если граф не является связным, то потребуется несколько веревок. *Строго говоря*, граф либо является связным, либо состоит из отдельных участков, называемых **компонентами связности (connected component** - максимальный связный подграф исходного графа).
![image.png](attachment:image.png)
Данный граф состоит из 9 вершин и 8 ребер. Он имеет два компонента связности.  


Второе важное свойство - это **ацикличность (acyclic)** - свойство графа, означающее, что он не содержит **циклов** (**cycle** - простой путь положительной длины, который начинается и заканчивается в одной и той же вершине). В примере выше путь f-h-i-g-f является циклом. Подграф (b,c,a,e,d) является ациклическим.

## Моделирование реальной задачи
Известный предприниматель Илон Маск предложил построить между крупными районами США высокоскоростную транспортную сеть HyperLoop, состоящую из капсул, перемещающихся в герметичных трубах. По его мнению, высокая скорость перемещения капсул позволит создать экономически эффективный междугородный транспорт.

Построим графовую структуру, внесем в неё данные предложенной модели и рассмотрим на этом примере реальные алгоритмы и свойства графов. 

In [2]:
# связь/ребро
class Edge:
    def __init__(self, u, v):
        # ребро
        self.u_index = u # из какой вершины
        self.v_index = v # в какую вершину
        # вершины будут представлены числовыми индексами
    
    def reversed(self):
        # изменение направления обхода ребра
        return Edge(self.v_index, self.u_index)
    
    def __str__(self):
        return f"{self.u_index} --> {self.v_index}"
    
#-------------------------------------------------------------------------------------------------------------------------------
    
# граф - связь ребер и вершин

# вершины будут строкового типа (названия городов), но они будут храниться в списке,
# а значит каждая вершина будет иметь целочисленный индекс
# именно эти индексы будут храниться в экземплярах класса Edge

# для представления графа будут использоваться списки смежности (связанные списки смежных вершин)
class Graph:
    def __init__(self, V):
        self._vertices = V # все вершины 
        self._edges = [[] for _ in V] # для каждой вершины связанный список смежных вершин 
                                      # (по индексу вершины можно найти соответствующий ей список)
    @property
    def vertex_count(self):
        return len(self._vertices) # количество вершин
    
    @property
    def edges_count(self):
        return sum(map(len, self._edges)) # количество ребер (включая повторения)
    
    # ДОБАВЛЕНИЕ ВЕРШИНЫ----------------------------
    def add_vertex(self, vertex):
        # подается вершина в оригинальном типе данных (строка в данном случае)
        self._vertices.append(vertex)
        self._edges.append([])
        # возвращаем индекс добавленной вершины
        return self.vertex_count - 1
    
    # ДОБАВЛЕНИЕ РЕБРА------------------------------
    def add_edge(self, edge):
        # добавление ребра производится в два списка (для вершины "из" и для вершины "в")
        self._edges[edge.u_index].append(edge)
        self._edges[edge.v_index].append(edge.reversed())
    
    # ДОБАВЛЕНИЕ РЕБРА ПО ИНДЕКСАМ ВЕРШИН-----------
    def add_edge_by_indices(self, u_index, v_index):
        edge = Edge(u_index, v_index)
        self.add_edge(edge)
            
    # ДОБАВЛЕНИЕ РЕБРА ПО ВЕРШИНАМ------------------        
    def add_edge_by_vertex(self, u_vertex, v_vertex):
        # на вход две вершины в оригинальном типе
        u_index = self._vertices.index(u_vertex)
        v_index = self._vertices.index(v_vertex)
        # нашли их индексы
        self.add_edge_by_indices(u_index, v_index)
        
    # ПОИСК ВЕРШИНЫ ПО ИНДЕКСУ----------------------
    def search_vertex_by_index(self, index):
        return self._vertices[index]
    
    # ПОИСК ИНДЕКСА ПО ВЕРШИНЕ----------------------
    def search_index_by_vertex(self, vertex):
        return self._vertices.index(vertex)
    
    # ПОИСК СМЕЖНЫХ ВЕРШИН ПО ИНДЕКСУ---------------
    def neighbors_for_vertex_by_index(self, index):
        neighbors = [e.v_index for e in self._edges[index]] # индексы смежных вершин
        return list(map(self.search_vertex_by_index, neighbors)) # возвращаем список вершин, смежных с исходной
    
    # ПОИСК СМЕЖНЫХ ВЕРШИН ПО ВЕРШИНЕ---------------
    def neighbors_for_vertex(self, vertex):
        index = self.search_index_by_vertex(vertex) # найдем индекс вершины, для которой ищем смежные
        return self.neighbors_for_vertex_by_index(index)
    
    # РЕБРА ДЛЯ ВЕРШИНЫ ПО ИНДЕКСУ------------------
    def edges_for_vertex_by_index(self, index):
        return self._edges[index]
    
    # РЕБРА ДЛЯ ВЕРШИНЫ ПО САМОЙ ВЕРШИНЕ------------
    def edges_for_vertex(self, vertex):
        return self._edges[self.search_index_by_vertex(vertex)]
    
    # ВЫВОД ГРАФА
    def __str__(self):
        result = ''
        for i in range(self.vertex_count):
            result += f'{i}: {self._vertices[i]} --> {self.neighbors_for_vertex_by_index(i)}\n'
        return result

Карта (в виде графа) континентальной части США с 15 крупнейшими муниципальными районами (Metropolitan Statistical Area - MSA) страны:
![image.png](attachment:image.png)
Введем эти данные в графовую структуру

In [3]:
cities = ['Сан-Франциско', 'Лос-Анджелес', 'Риверсайд', 'Феникс', 'Даллас', 'Хьюстон', 'Майами',
          'Атланта', 'Вашингтон', 'Филадельфия', 'Нью-Йорк', 'Бостон', 'Чикаго', 'Детройт', 'Сиэтл']
USA_map = Graph(cities)
print(USA_map)

0: Сан-Франциско --> []
1: Лос-Анджелес --> []
2: Риверсайд --> []
3: Феникс --> []
4: Даллас --> []
5: Хьюстон --> []
6: Майами --> []
7: Атланта --> []
8: Вашингтон --> []
9: Филадельфия --> []
10: Нью-Йорк --> []
11: Бостон --> []
12: Чикаго --> []
13: Детройт --> []
14: Сиэтл --> []



In [4]:
USA_map.add_edge_by_vertex('Сан-Франциско', 'Лос-Анджелес')
USA_map.add_edge_by_vertex('Сан-Франциско', 'Риверсайд')
USA_map.add_edge_by_vertex('Сан-Франциско', 'Сиэтл')

USA_map.add_edge_by_vertex('Риверсайд', 'Чикаго')
USA_map.add_edge_by_vertex('Риверсайд', 'Феникс')
USA_map.add_edge_by_vertex('Риверсайд', 'Лос-Анджелес')

USA_map.add_edge_by_vertex('Феникс', 'Даллас')
USA_map.add_edge_by_vertex('Феникс', 'Хьюстон')
USA_map.add_edge_by_vertex('Феникс', 'Лос-Анджелес')

USA_map.add_edge_by_vertex('Даллас', 'Атланта')
USA_map.add_edge_by_vertex('Даллас', 'Хьюстон')

USA_map.add_edge_by_vertex('Хьюстон', 'Майами')
USA_map.add_edge_by_vertex('Хьюстон', 'Атланта')

USA_map.add_edge_by_vertex('Атланта', 'Майами')
USA_map.add_edge_by_vertex('Атланта', 'Чикаго')
USA_map.add_edge_by_vertex('Атланта', 'Вашингтон')

USA_map.add_edge_by_vertex('Майами', 'Вашингтон')

USA_map.add_edge_by_vertex('Вашингтон', 'Филадельфия')
USA_map.add_edge_by_vertex('Вашингтон', 'Детройт')

USA_map.add_edge_by_vertex('Филадельфия', 'Нью-Йорк')

USA_map.add_edge_by_vertex('Нью-Йорк', 'Бостон')
USA_map.add_edge_by_vertex('Нью-Йорк', 'Детройт')

USA_map.add_edge_by_vertex('Детройт', 'Бостон')
USA_map.add_edge_by_vertex('Детройт', 'Чикаго')

USA_map.add_edge_by_vertex('Чикаго', 'Сиэтл')


print(USA_map)

0: Сан-Франциско --> ['Лос-Анджелес', 'Риверсайд', 'Сиэтл']
1: Лос-Анджелес --> ['Сан-Франциско', 'Риверсайд', 'Феникс']
2: Риверсайд --> ['Сан-Франциско', 'Чикаго', 'Феникс', 'Лос-Анджелес']
3: Феникс --> ['Риверсайд', 'Даллас', 'Хьюстон', 'Лос-Анджелес']
4: Даллас --> ['Феникс', 'Атланта', 'Хьюстон']
5: Хьюстон --> ['Феникс', 'Даллас', 'Майами', 'Атланта']
6: Майами --> ['Хьюстон', 'Атланта', 'Вашингтон']
7: Атланта --> ['Даллас', 'Хьюстон', 'Майами', 'Чикаго', 'Вашингтон']
8: Вашингтон --> ['Атланта', 'Майами', 'Филадельфия', 'Детройт']
9: Филадельфия --> ['Вашингтон', 'Нью-Йорк']
10: Нью-Йорк --> ['Филадельфия', 'Бостон', 'Детройт']
11: Бостон --> ['Нью-Йорк', 'Детройт']
12: Чикаго --> ['Риверсайд', 'Атланта', 'Детройт', 'Сиэтл']
13: Детройт --> ['Вашингтон', 'Нью-Йорк', 'Бостон', 'Чикаго']
14: Сиэтл --> ['Сан-Франциско', 'Чикаго']



In [5]:
USA_map.neighbors_for_vertex('Сиэтл')

['Сан-Франциско', 'Чикаго']

## Обход графа: поиск в глубину (DFS)
Обход графа полезен при исследовании свойств графа. Для таких обходов чаще всего используют **depth-first search (DFS)** и **breadth-first search (BFS)**.



**Поиск в глубину**  

1. Выбирается произвольная (стартовая) вершина и помечается, как посещенная.  
2. На каждой итерации алгоритм обрабатывает непосещенные вершины, смежные с текущей (если таких вершин несколько, то они обрабатываются в произвольном порядке)  
3. Если достигнут тупик - вершина, у которой нет непосещенных смежных вершин, то алгоритм возвращается на одно ребро назад (в вершину, из которой он последний раз сделал переход) и переходит к другой непосещенной смежной вершине  
4. Алгоритм заканчивает свою работу, когда возвращается в начальную вершину, которая к этому моменту становится тупиком

Для выполнения поиска в глубину удобно использовать стек. Вершина помещается в стек, когда впервые посещается (начинается обход вершины), и снимается со стека, когда становится тупиком (обход вершин завершается)

**Пример применения:** проверка связности графа. *Когда поиск в глубину заканчивается, посещенными являются все вершины связного компонента, из которого бралась первоначальная вершина*. Таким образом, что проверить граф на связность, можно поступить следующим образом: начать поиск в глубину с произвольной вершины и по окончании проверить, все ли вершины исходного графа оказались посещенными. Если все, то граф связный. В противной случае - нет.  

In [6]:
class Stack:
    def __init__(self):
        self._container = []
    @property
    def empty(self):
        return len(self._container)==0
    def pop(self):
        return self._container.pop()
    def push(self, elem):
        self._container.append(elem)
    def __repr__(self):
        return repr(self._container)

In [7]:
def dfs(graph, start_vertex):
    available_vertices = Stack() # доступные для посещения вершины
    explored_vertices = [start_vertex] # посещенные вершины
    for vertex in graph.neighbors_for_vertex(start_vertex):
        available_vertices.push(vertex)
        explored_vertices.append(vertex)
        # добавили все вершины, смежные со стартовой, в стек доступных
        
        # добавляем также в посещенные с той целью, чтобы в стеке
        # повторно не хранились одни и те же вершины
        # (e.g. 2 разные вершины могут быть связаны через 3-ю,
        # тогда эта 3-я может добавиться в стек дважды)
    
    while not available_vertices.empty:
        # снимаем со стека вершину
        current_vertex = available_vertices.pop()  
        # смотрим на смежные с ней вершины
        for neighbor_vertex in graph.neighbors_for_vertex(current_vertex):
            # если они уже посещены, то пропускаем их
            if neighbor_vertex in explored_vertices:
                continue
            # иначе - добавляем в доступные и в посещенные
            available_vertices.push(neighbor_vertex)
            explored_vertices.append(neighbor_vertex)
    return explored_vertices

In [8]:
# проверим работу поиска в глубину
print('Посещенные вершины при старте в Бостоне: ',
      dfs(USA_map, 'Бостон'))
print('Количество посещенных вершин: ',
      len(dfs(USA_map, 'Бостон')))
print('Всего вершин в графе: ', USA_map.vertex_count)

Посещенные вершины при старте в Бостоне:  ['Бостон', 'Нью-Йорк', 'Детройт', 'Вашингтон', 'Чикаго', 'Риверсайд', 'Атланта', 'Сиэтл', 'Сан-Франциско', 'Лос-Анджелес', 'Феникс', 'Даллас', 'Хьюстон', 'Майами', 'Филадельфия']
Количество посещенных вершин:  15
Всего вершин в графе:  15


Таким образом, можно убедиться, что наш граф является связным. Проверим теперь свойство связности для другого графа.
![image.png](attachment:image.png)

In [9]:
USA_map_not_connected = Graph(['Сиэтл', 'Риверсайд', 'Чикаго',
                               'Детройт', 'Атланта'])

USA_map_not_connected.add_edge_by_vertex('Сиэтл', 'Риверсайд')
USA_map_not_connected.add_edge_by_vertex('Атланта', 'Чикаго')
USA_map_not_connected.add_edge_by_vertex('Атланта', 'Детройт')

new_result = dfs(USA_map_not_connected, 'Чикаго')
print('Посещенные вершины при старте в Чикаго: \n', new_result)
new_result = dfs(USA_map_not_connected, 'Риверсайд')
print('Посещенные вершины при старте в Риверсайде: \n', new_result)

Посещенные вершины при старте в Чикаго: 
 ['Чикаго', 'Атланта', 'Детройт']
Посещенные вершины при старте в Риверсайде: 
 ['Риверсайд', 'Сиэтл']


Время работы поиска в глубину пропорционально размеру испозуемой для представления графа структуры данных. При использовании матрицы смежности временная эффективная обхода в глубину: $\theta(|V|^2)$. При использовании связанных списокв: $\theta(|V|+|E|)$

Поиск в глубину можно использоваться для определения связных компонентов графа. **Лес поиска в глубину** можно использовать для определения ацкиличности графа. Существуют и другие способы применения алгоритма поиска в глубину.

## Поиск кратчайшего пути: поиск в ширину
Hyperloop для перемещения будет использовать высокоскоростной транспорт, поэтому почти любое расстояние (в рамках разумного) будет преодолеваться за приемлемое время. По этой причине **поиск кратчайшего пути между двумя городами** предполагает поиск такого пути (в терминологии теории графов), который имел бы наименьшую длину (в смысле количества проходимых ребер). Иными словами, *чем меньше остановок на пути, тем лучше*.

Алгоритм **breadth-first search** сперва посещает все вершины, смежные со стартовой, затем - все вершины, которые лежат на расстоянии двух ребер от стартовой и т.д. Так до тех пор, пока не будет найдена определенная вершина (или не будут посещены все вершины связного компонента, из которому принадлежит стартовая точка). Для реализации bfs используют очередь.  
Алгоритм:  
1. Очередь инициализируется стартовой вершиной, помеченной как посещенная.
2. На каждой итерации алгоритм находит непосещенные вершины, смежные с вершиной в начале очереди, помечает их как посещенные и вносит в очередь; после этого вершина в начале изымается из неё (строя таким образом путь)
3. Если в какой-то момент в списке смежных вершин оказалась нужная вершина, то поиск окончен. В ином случае продолжаем

In [10]:
from collections import deque

class Queue:
    def __init__(self):
        self._container = deque() ## двусторонняя очередь
    @property
    def empty(self):
        return len(self._container)==0
    def pop(self):
        return self._container.popleft() ## извлечение элемента с начала
    def push(self, elem):
        self._container.append(elem)
    def __repr__(self):
        return repr(self._container)
class state:
    def __init__(self, vertex, parent):
        self.vertex = vertex
        self.parent_state = parent
    
def bfs(graph, start_vertex, finish_vertex):
    start_state = state(start_vertex, None)
    visited = set()
    available = Queue()
    result_path = [finish_vertex]
    
    visited.add(start_vertex)
    available.push(start_state)
    
    while not available.empty:
        # гарантированно снимаем ближайшую со стартовой
        current_state = available.pop()
        
        for vertex in graph.neighbors_for_vertex(current_state.vertex):
            if vertex == finish_vertex:
                result_path = [vertex, current_state.vertex]
                while current_state.parent_state is not None:
                    tmp = current_state.parent_state
                    result_path.append(tmp.vertex)
                    current_state = tmp
                return list(reversed(result_path))
            if vertex in visited:
                continue
            visited.add(vertex)
            available.push(state(vertex, current_state))
    
    # если не найден путь
    return None

In [11]:
bfs(USA_map, 'Сан-Франциско', 'Атланта')

['Сан-Франциско', 'Риверсайд', 'Чикаго', 'Атланта']

Поиск в ширину гарантированно находит кратчайший путь

## Работа со взвешенными графами
Как соединить все MSA, используя минимальное число трасс? Предположим, что для каждой дороги из одного города в другой требуется некоторое количество трасс (т.е. каждое ребро теперь будет взвешено). Итак, вес ребра - это количество трасс, необходимое для для того, чтобы проложить дорогу, соответствующую данному ребру. 

In [18]:
class WeightedEdge(Edge):
    def __init__(self, u, v, w):
        super().__init__(u, v)
        self.weight = w
    
    def reversed(self):
        # изменение направления обхода ребра
        return WeightedEdge(self.v_index, self.u_index, self.weight)
    
    def __lt__(self, other):
        return self.weight < other.weight    
    
    def __str__(self):
        return f"{self.u_index} -({self.weight})-> {self.v_index}"
    
class WeightedGraph(Graph):
    def __init__(self, V):
        super().__init__(V)
    
    def add_edge_by_indices(self, u_ind, v_ind, weight):
        edge = WeightedEdge(u_ind, v_ind, weight)
        self.add_edge(edge) # версия суперкласса
    
    def add_edge_by_vertex(self, u_vertex, v_vertex, weight):
        # на вход две вершины в оригинальном типе
        u_ind = self._vertices.index(u_vertex)
        v_ind = self._vertices.index(v_vertex)
        # нашли их индексы
        self.add_edge_by_indices(u_ind, v_ind, weight)
    
    def neighbors_for_vertex_by_index_with_weight(self, index):
        distance_tuples = []
        for edge in self.edges_for_vertex_by_index(index):
            elem = (self.search_vertex_by_index(edge.v_index), edge.weight)
            distance_tuples.append(elem)
        return distance_tuples
    
    def __str__(self):
        result = ''
        for i in range(self.vertex_count):
            result += f'{self.search_vertex_by_index(i)} --> {self.neighbors_for_vertex_by_index_with_weight(i)}\n'
        return result

In [19]:
USA_map_with_weights = WeightedGraph(cities)
print(USA_map_with_weights)

Сан-Франциско --> []
Лос-Анджелес --> []
Риверсайд --> []
Феникс --> []
Даллас --> []
Хьюстон --> []
Майами --> []
Атланта --> []
Вашингтон --> []
Филадельфия --> []
Нью-Йорк --> []
Бостон --> []
Чикаго --> []
Детройт --> []
Сиэтл --> []



In [20]:
USA_map_with_weights.add_edge_by_vertex('Сан-Франциско', 'Лос-Анджелес', 348)
USA_map_with_weights.add_edge_by_vertex('Сан-Франциско', 'Риверсайд', 386)
USA_map_with_weights.add_edge_by_vertex('Сан-Франциско', 'Сиэтл', 678)

USA_map_with_weights.add_edge_by_vertex('Риверсайд', 'Чикаго', 1704)
USA_map_with_weights.add_edge_by_vertex('Риверсайд', 'Феникс', 307)
USA_map_with_weights.add_edge_by_vertex('Риверсайд', 'Лос-Анджелес', 50)

USA_map_with_weights.add_edge_by_vertex('Феникс', 'Даллас', 887)
USA_map_with_weights.add_edge_by_vertex('Феникс', 'Хьюстон', 1015)
USA_map_with_weights.add_edge_by_vertex('Феникс', 'Лос-Анджелес', 357)

USA_map_with_weights.add_edge_by_vertex('Даллас', 'Атланта', 721)
USA_map_with_weights.add_edge_by_vertex('Даллас', 'Хьюстон', 225)

USA_map_with_weights.add_edge_by_vertex('Хьюстон', 'Майами', 968)
USA_map_with_weights.add_edge_by_vertex('Хьюстон', 'Атланта', 702)

USA_map_with_weights.add_edge_by_vertex('Атланта', 'Майами', 604)
USA_map_with_weights.add_edge_by_vertex('Атланта', 'Чикаго', 588)
USA_map_with_weights.add_edge_by_vertex('Атланта', 'Вашингтон', 543)

USA_map_with_weights.add_edge_by_vertex('Майами', 'Вашингтон', 923)

USA_map_with_weights.add_edge_by_vertex('Вашингтон', 'Филадельфия', 123)
USA_map_with_weights.add_edge_by_vertex('Вашингтон', 'Детройт', 396)

USA_map_with_weights.add_edge_by_vertex('Филадельфия', 'Нью-Йорк', 81)

USA_map_with_weights.add_edge_by_vertex('Нью-Йорк', 'Бостон', 190)
USA_map_with_weights.add_edge_by_vertex('Нью-Йорк', 'Детройт', 482)

USA_map_with_weights.add_edge_by_vertex('Детройт', 'Бостон', 613)
USA_map_with_weights.add_edge_by_vertex('Детройт', 'Чикаго', 238)

USA_map_with_weights.add_edge_by_vertex('Чикаго', 'Сиэтл', 1737)


print(USA_map_with_weights)

Сан-Франциско --> [('Лос-Анджелес', 348), ('Риверсайд', 386), ('Сиэтл', 678)]
Лос-Анджелес --> [('Сан-Франциско', 348), ('Риверсайд', 50), ('Феникс', 357)]
Риверсайд --> [('Сан-Франциско', 386), ('Чикаго', 1704), ('Феникс', 307), ('Лос-Анджелес', 50)]
Феникс --> [('Риверсайд', 307), ('Даллас', 887), ('Хьюстон', 1015), ('Лос-Анджелес', 357)]
Даллас --> [('Феникс', 887), ('Атланта', 721), ('Хьюстон', 225)]
Хьюстон --> [('Феникс', 1015), ('Даллас', 225), ('Майами', 968), ('Атланта', 702)]
Майами --> [('Хьюстон', 968), ('Атланта', 604), ('Вашингтон', 923)]
Атланта --> [('Даллас', 721), ('Хьюстон', 702), ('Майами', 604), ('Чикаго', 588), ('Вашингтон', 543)]
Вашингтон --> [('Атланта', 543), ('Майами', 923), ('Филадельфия', 123), ('Детройт', 396)]
Филадельфия --> [('Вашингтон', 123), ('Нью-Йорк', 81)]
Нью-Йорк --> [('Филадельфия', 81), ('Бостон', 190), ('Детройт', 482)]
Бостон --> [('Нью-Йорк', 190), ('Детройт', 613)]
Чикаго --> [('Риверсайд', 1704), ('Атланта', 588), ('Детройт', 238), ('Сиэт

### Поиск минимального связующего дерева
*Дерево* - это ациклический связный граф. Любой связный граф, не являющийся деревом (то есть содержащий цикл(-ы)) может быть приведен к дереву, если удалить некоторые ребра.

**Минимальное связующее дерево** - это такое дерево, которое соединяет все вершины в связном взвешенном графе и при этом имеет минимальный суммарный вес по сравнению с другими связующими деревьями. Такое дерево можно найти для любого взвешенного графа. Найти такое дерево - это значит решить очень важную задачу. При проектировании любой сети (транспортной, телефонной, компьютерной) встает вопрос: *как соединить все пункты, сделав минимальные затраты?*

In [32]:
from heapq import heappop, heappush

# для реализации алгоритмов потребуется очередь с приоритетом
class PriorityQueue:
    def __init__(self):
        self._container = []
    
    @property
    def empty(self):
        return len(self._container)==0
    
    def push(self, item):
        heappush(self._container, item)
                
    # извлечение элемента с наименьшим приоритетом
    def pop(self):
        return heappop(self._container)
        
    def __repr__(self):
        return repr(self._container)
    

# функция для вычисления суммарного веса связующего дерева
# weighted_path - список WeightedEdge
def total_path(weigthed_path):
    return sum([edge.weight for edge in weigthed_path])

**Алгоритм Ярника (Прима)**:  
1) Выбрать произвольную вершину и включить ее в результирующее минимальное связующее дерево. В очередь с приоритетом добавить все исходящие из нее ребра.  
2) Извлечь из очереди с приоритетом ребро с наименьшим весом, соединяющее минимальное связующее дерево с вершинами, ещё не входящими в дерево (то есть все вершины исходного графа на каждом шаге разбиты на два множества).  
3) В результирующее минимальное дерево добавить ту вершину найденного ребра, которая ещё не принадлежит дереву. Каждый раз, когда новая вершина добавляется в дерево, все исходящие из нее ребра добавляются в очередь с приоритетом.  
4) Шаги 2, 3 повторяются до тех пор, пока очередь с приоритетом не опустеет (т.е. пока все вершины графа не будут включены в минимальное связующее дерево)

In [38]:
def mst(weighted_graph, start_vertex):
    start_index = weighted_graph.search_index_by_vertex(start_vertex)
    if start_index == None:
        return None
    result = [] # weighted_path
    pq = PriorityQueue()
    visited = [False] * weighted_graph.vertex_count
    
    def visit(index):
        visited[index] = True
        for edge in weighted_graph.edges_for_vertex_by_index(index):
            if not visited[edge.v_index]:
                pq.push(edge)
    
    visit(start_index)
    while not pq.empty:
        min_edge = pq.pop()
        if not visited[min_edge.v_index]:
            result.append(min_edge)
            visit(min_edge.v_index)
    
    return result

$\color{red}{!}$ Алгоритм Ярника не работает для орграфов (не всегда правильно) и не подействует для несвязных графов.

In [45]:
# функция для вывода взвешенного пути (и минимально связующего дерева заодно)
def print_weighted_path(weighted_graph, weighted_path):
    for edge in weighted_path:
        print(f'{weighted_graph.search_vertex_by_index(edge.u_index)} -{edge.weight}-> {weighted_graph.search_vertex_by_index(edge.v_index)}')
    print('------------------------------------------------')
    print(f'Суммарные затраты: {total_path(weighted_path)}')

In [46]:
wp = mst(USA_map_with_weights, 'Сиэтл')
print_weighted_path(USA_map_with_weights, wp)

Сиэтл -678-> Сан-Франциско
Сан-Франциско -348-> Лос-Анджелес
Лос-Анджелес -50-> Риверсайд
Риверсайд -307-> Феникс
Феникс -887-> Даллас
Даллас -225-> Хьюстон
Хьюстон -702-> Атланта
Атланта -543-> Вашингтон
Вашингтон -123-> Филадельфия
Филадельфия -81-> Нью-Йорк
Нью-Йорк -190-> Бостон
Вашингтон -396-> Детройт
Детройт -238-> Чикаго
Атланта -604-> Майами
------------------------------------------------
Суммарные затраты: 5372
