## 최소 신장 트리의 이해

### 1. 신장 트리란?
- Spanning Tree, 또는 신장 트리라고 불리움
- 원래는 그래프의 모든 노드가 연결되어 있으면서 트리의 속성을 만족하는 그래프
- 신장 트리의 조건
    - 본래의 그래피의 모든 노드를 포함해야 함
    - 모든 노드가 서로 연결
    - 트리의 속성을 만족시킴(사이클이 존재하지 않음)

### 2. 최소 신장 트리 알고리즘
- 그래프에서 최소 신장 트리를 찾을 수 있는 알고리즘이 존재함
- 대표적인 최소 신장 트리 알고리즘
    - Kruskal's algorithm(크루스칼 알고리즘), Prim's algorithm(프림 알고리즘)

### 3. 크루스칼 알고리즘
1. 모든 정점을 독립적인 집합으로 만든다.
2. 모든 간선의 비용을 기준으로 정렬하고, 비용이 작은 간선부터 양 끝의 두 정점을 비교한다.
3. 두 정점의 최상위 정점을 확인하고, 서로 다를 경우 두 정점을 연결한다. (사이클이 없도록 유지)
> 탐욕 알고리즘을 기초로 하고 있음

### 4. Union-Find 알고리즘
- Disjoint Set을 표현 할 때 사용하는 알고리즘으로 트리 구조를 활용하는 알고리즘
- 간단하게, 노드들 중에 연결된 노드를 찾거나, 노드들을 연결 할 때 사용
- Disjoint Set이란
    - 서로 중복되지 않는 부분 집합들로 나눠진 원소들에 대한 정보를 저장하고 조작하는 자료구조
    - 공통원소가 없는 상호 베타적인 부분 집합들로 나눠진 원소들에 대한 자료구조를 의미함
    - Disjoint Set = 서로소 집합 자료구조

1. 초기화
    - n 개의 원소가 개별 집합으로 여겨지도록 초기화

2. Union
    - 두 개별 집합을 하나의 집합으로 합침, 두 트리를 하나의 트리로 만듦

3. Find
    - 여러 노드가 존재 할 때, 두 개의 노드를 선택해서, 현재 두 노드가 서로 같은 그래프에 속하는지 판별하기 위해, 각 그룹의 최상단 원소를 확인

***Union-Find 알고리즘의 고려할 점***
- Union 순서에 따라서, 최악의 경우 링크드 리스트와 같은 형태가 될 수 있음
- 이 때는 계산량이 O(N)이 될 수 있기 때문에, 해당 문제를 해결하기 위해, union-by-rank, path compression 기법을 사용함

***union-by-rank 기법***
- 각 트리에 대해 높이를 기억해두고, Union 할 때 두 트리의 높이가 다르면, 높이가 작은 트리를 높이가 큰 트리에 붙임
- 높이가 h - 1인 두 개의 트리를 합칠 때는 한 쪽의 트리 높이를 1 증가시켜주고, 다른 쪽의 트리를 해당 트리에 붙여줌
- 초기화시, 모든 원소는 높이가 0인 개별 집합인 상태에서 하나씩 원소를 합칠 때, union-by-rank 기법을 사용한다면
    - 높이가 h인 트리가 만들어지려면, 높이가 h - 1인 두 개의 트리가 합쳐져야 함
    - 높이가 h - 1인 트리를 만들기 위해 최소의 n개의 원소가 필요하다면, 높이가 h인 트리가 만들어지기 위해서는 2n개의 원소가 필요함
    - 따라서 union-by-rank 기법을 사용하면, union/find 연산의 시간 복잡도는 O(logn)으로 낮출 수 있음

***path compression***
- find를 실행한 노드에서 거쳐간 노드를 루트에 다이렉트로 연결하는 기법
- find를 실행한 노드는 이후부터는 루트 노드를 한 번에 알 수 있음

In [1]:
graph = {
    'vertices': ['A', 'B', 'C', 'D', 'E', 'F', 'G'],
    'edges': [
        (7, 'A', 'B'),
        (5, 'A', 'D'),
        (8, 'B', 'C'),
        (9, 'B', 'D'),
        (7, 'B', 'E'),
        (5, 'C', 'E'),
        (7, 'D', 'E'),
        (6, 'D', 'F'),
        (8, 'E', 'F'),
        (9, 'E', 'G'),
        (11, 'F', 'G')
    ]
}

In [2]:
parent = dict()
rank = dict()

def make_set(node):
    parent[node] = node
    rank[node] = 0

def find(node):
    if parent[node] != node:
        parent[node] = find(parent[node])
    return parent[node]


def union(node_v, node_u):

    root1 = find(node_v)
    root2 = find(node_u)

    if rank[root1] > rank[root2]:
        parent[root2] = root1
    elif rank[root2] > rank[root1]:
        parent[root1] = root2
    else:
        rank[root2] += 1
        parent[root1] = root2

def kruskal(graph):
    mst = list()

    # 1. 초기화
    for node in graph['vertices']:
        make_set(node)

    # 2. edge를 sorting
    edges = graph['edges']
    edges.sort()

    # 3. 사이클이 생기지 않도록 연결
    for edge in edges:
        weight, node_v, node_u = edge

        if find(node_v) != find(node_u):
            union(node_v, node_u)
            mst.append(edge)
    
    return mst

In [3]:
kruskal(graph)

[(5, 'A', 'D'),
 (5, 'C', 'E'),
 (6, 'D', 'F'),
 (7, 'A', 'B'),
 (7, 'B', 'E'),
 (9, 'E', 'G')]