# Python Algorithms And Data Structures - Topic 7

- Практическое задание: реализация алгоритма Крускала
- Тест 8. Графовые структуры

---

Примеры написаны на Python 3.11  

# Тестовая часть
---

## Тест 8. Графовые структуры

### Вопрос 1. Какие элементы входят в определения графа:

- Точки
- Рёбра ✅
- Вершины ✅
- Линии
- Пересечение

### Вопрос 2. Что такое списки ребёр?

- Представление, в котором все элементы (вершины и рёбра) хранятся в списке
- Представление, в котором все вершины графа хранятся в списке
- Представление, в котором все рёбра графа хранятся в списке ✅

### Вопрос 3. Что такое списки смежности?

- Представление, в котором вершины графа хранятся в виде ассоциативного массива, где ключ — это вершина, значение — другая вершина
- Представление, в котором вершины и рёбра графа хранятся в списке
- Представление, в котором вершины графа хранятся в виде ассоциативного массива, где ключ — это вершина, значение — список всех вершин, в которые есть ребро ✅

### Вопрос 4. Что такое матрица смежности?

- Матрица, где в столбцах и строках стоят значения, характеризующее связь между вершиной и ребром
- Матрица, где в столбцах и строках стоят значения, характеризующее наличии связи между двумя рёбрами
- Матрица, где в столбцах и строках стоят значения, характеризующее наличии связи между двумя вершинами ✅

### Вопрос 5. Что такое матрица инциндентности?

- Матрица, где в столбцах и строках стоят значения, характеризующее наличии связи между двумя вершинами
- Матрица, где в столбцах и строках стоят значения, характеризующее наличии связи между двумя рёбрами
- Матрица, где в столбцах и строках стоят значения, характеризующее связь между вершиной и ребром ✅

### Вопрос 6. При реализации обхода в ширину используют:

- Очередь ✅
- Стек
- Двоичное дерево
- Ассоциативный массив

### Вопрос 7. При реализации обхода в глубину используют:

- Очередь
- Стек ✅
- Двоичное дерево
- Рекурсивный вызов ✅
- Ассоциативный массив

### Вопрос 8. Для поиска кратчайшего расстояния используют:

- Преобразование графа в двоичное дерево
- Преобразование графа в приоритетную очередь
- Обход в ширину ✅
- Обход в глубину

### Вопрос 9. При топологической сортировке используют:

- Преобразование графа в двоичное дерево
- Обход в ширину
- Преобразование графа в приоритетную очередь
- Обход в глубину ✅

# Практическая часть
---

Алгоритм Крускала — это алгоритм поиска минимального остовного дерева, построенного на графе. Остовным деревом называют ацикличный связный граф минимального веса, другими словами, это алгоритм, который позволяет соединить все вершины графа так, чтобы в новом полученном графе не существовало циклов, а сумма всех взвешенных рёбер была бы минимальной.

Например, для случая, когда в графе существуют 3 ребра: `AB`, `BC` и `AC` с весами: `w(AB)=1`, `w(BC)=2` и `w(AC)=3`, то этот граф может иметь `3` остовных (но пока не минимальных) деревьев:
- AB и BC
- BC и AC
- AB и AC

Сумма весов рёбер для каждого такого дерева будет равна соотвественно `3`, `5` и `4`. Таким образом минимальным остовным деревом может быть только один вариант, а именно 1: `AB` и `BC`.

Алгоритм Крускала позволяет находить минимальное остовное дерево. Для этого в самом начале работы алгоритма полагают, что результат содержит пустое множество рёбер. После чего в исходном графе находят ребро наименьшего веса и добавляют его к результату, после чего это ребро исключают из рассмотрения. При добавлении ребра обязательно проверяется, возникнет ли после добавления ребра в результат цикл или нет. Если цикл возникает, то такое ребро не добавляется в результат.

Рассмотрим на следующем примере. Пусть граф задан через использование списков рёбер, где каждое ребро описывается кортежем (вершина 1, вершина 2, вес ребра):
```py
[('A', 'B', 1), ('B', 'C', 3), ('A', 'C', 2), ('D', 'C', 3)].
```

Построим для него минимальное остовное  дерево. Для этого отсортируем рёбра в порядке возрастания их весов:
```py
[('A', 'B', 1), ('A', 'C', 2), ('B', 'C', 3), ('D', 'C', 3)].
```

И создадим пустой список для хранения результатов:
```py
[].
```

Шаг 1: Добавляем первое ребро из отсортированного списка в результат. Так как он добавляется первым и вершины разные, цикл не может образоваться, таким образом результат = `[('A', 'B', 1)]`

Шаг 2: Проверяем следующее ребро `('A', 'C', 2)`. При добавлении в результат циклов не образуется, т.к. из `'A'` нельзя попасть в `'C'` другим путём. Таким образом результат = `[('A', 'B', 1), ('A', 'C', 2)]`

Шаг 3: Проверяем следующее ребро `('B', 'C', 3)`. При его добавлении образуется цикл, т.к. из `B` можно попасть в `C` через вершину `A`, то есть по рёбра: `('A', 'B')`, `('A', 'C')`, поэтому это ребро не попадает в результат.

Шаг 4: Проверяем следующее ребро `('D', 'C', 3)`. При его добавлении циклов не образуется, т.к. нельзя попасть из вершины `D` в вершину `C` по тем рёбрам, что уже добавлены в результат. Поскольку это последняя пара рёбер, то окончательный ответ состоит из рёбер: `[('A', 'B', 1), ('A', 'C', 2), ('D', 'C', 3)]`.

Для проверки того, что добавляемое ребро может создать цикл можно использовать любой из обходов графа (результата) и проверить, что при посещении всех верши в этом графе не будет встречена соседняя вершина. Этот вариант корректный, но достаточно долгий. Вместо него можно использовать структуру данных под названием система непересекающихся множеств.

Эта структура позволяет хранить информацию о том, к какому множеству относится вершина графа. Изначально полагается, что каждая вершина есть отдельное множество. Для этого можно использовать ассоциативный массив, который назовём `ufs` (сокращение от union-find set). Если для произвольной вершины `"a"` список возвращает `None`, то этот элемент является идентификтором множества. К примеру, пусть существуют 3 вершины `A`, `B` и `C`. Вначале запрос для любой из них будет возвращать `None`, например:
```py
ufs[A] == None
```

Это значит, что `A` является идентификатором множества `A`, `B` — идентификатором множества `B` и `C` — идентификатором множества `C`. Чтобы объединить 2 вершины в одно множество, выберем любую из них и укажем ссылку на неё в ufs:
```py
ufs[A] = B.
```

Теперь B является идентификтором множества их вершин (`A` и `B`), т.к. запрос `ufs[B]` вернёт `None`. Вершина `A` ссылается же на `B`. Вершина `C` составляет отдельное множество. Теперь добавим в множество c идентификтором `B` вершину `С`. Допустим, это сделано через связку с вершиной `A`:
```py
ufs[C] = A.
```

Теперь `C` ссылается на `A`, а `A` ссылаться на `B`. Все три вершины входят в одно множество с идентификатором `B`. Таким образом, чтобы определить в какое множество входит вершина достаточно переходить по `ufs` до тех пор, пока не встретится `None`.

Таким образом, чтобы определить, входят ли 2 различные вершины в одно множество или нет, достаточно найти идентификаторы множеств к которым эти множества относятся. Если это один и тот же идентификатор, то это означает, вершины входят в одно множество, а ребро, которое содержит эти вершины создаст цикл при добавлении.

Таким образом, весь алгоритм Крускала описывается так:
- Отсортировать все рёбра в порядке возрастания веса
- Создать пустой список для хранения результата
- Создать ассоциативный массив ufs для хранения системы непересекающихся множеств
- Для каждого ребра из отсортированного списка:
- Проверить, что идентификторы множества текущих вершин ребра различны. Если это так, то добавляем ребро в результат и объединяем вершины ребра в одно множество
- иначе пропускаем ребро

Когда рёбра закончатся, результат будет содержать только те рёбра, которые составляют минимальное остовное дерево.

Дан список рёбер. Каждое ребро представляет собой кортеж `('Вершина 1', 'Вершина 2', Вес)`. Реализуйте процедуру `sort(x)`, которая отсортирует список по возрастанию из весов:

Например, 
```py
[('A', 'C', 3), ('B', 'C', 2), ('A', 'B', 1)]
```
Вернёт новый список
```py
[('A', 'B', 1), ('B', 'C', 2), ('A', 'C', 3)]
```

In [None]:
def sort(x):
    return sorted(x, key=lambda k: k[2])

# Solution Test

print(sort([('A', 'C', 3), ('B', 'C', 2), ('A', 'B', 1)]))

Дан ассоциативный массив, который хранит систему непересекающихся множеств. Реализуйте процедуру `find(ufs, key)`, которая возвращает идентификатор множества для заданного элемента. Идентификатором считается тот элемент, который возвращает `None` при указании в качестве ключа. Другие элементы могут ссылаться друг на друга, например:
```py
find(1) # вернёт 2
find(2) # вернёт 4
find(3) # вернёт 4
find(4) # вернёт None, таким образом 4 — идентификтор множества, 
# а элементы 1, 2 и 3 входят в этом множество
```

In [None]:
def find(ufs, key):
    if key not in ufs:
        return key
    return find(ufs, ufs[key])

# Solution Test

ufs = {
    1: 2,
    2: 4,
    3: 4,
    10: 9,
    11: 9,
}

print(find(ufs, 1))
print(find(ufs, 2))
print(find(ufs, 3))
print(find(ufs, 4))
print(find(ufs, 4))
print(find(ufs, 10))
print(find(ufs, 11))
print(find(ufs, 9))

Реализуйте процедуру `mst(x)`, которая принимает на вход список рёбер графа с весом и возвращает список только из тех ребёр, которые входят в минимальное остовное дерево в порядке возрастания весов:
```py
mst([('A', 'C', 3), ('B', 'C', 2), ('A', 'B', 1)])
```
Возвращает список
```py
[('A', 'B', 1), ('B', 'C', 2)]
```
Чтобы ответ был принят необходимо добавить процедуры сортировки и поиска в системе непересекающихся множеств.

In [None]:
def sort(x):
    return sorted(x, key=lambda k: k[2])

def find(ufs, key):
    if key not in ufs:
        return key
    return find(ufs, ufs[key])

def mst(x):    
    s = sort(x)
    arr = []
    ufs = {}
    for edge in s:
        a, b = find(ufs, edge[0]), find(ufs, edge[1])
        if a != b:
            arr.append(edge)
            ufs[b] = a
    return arr

# Solution Test

x = mst([('A', 'C', 3), ('B', 'C', 2), ('A', 'B', 1)])
print(x)