## 신장 트리(Spanning Tree)
- 원래의 그래프의 모든 노드가 연결되어 있으면서 트리의 속성을 만족하는 그래프
- 신장 트리의 조건
    - 본래의 그래프의 모든 노드를 포함해야 한다
    - 모든 노드가 서로 연결되어야 한다
    - 트리의 속성을 만족시켜야 한다(사이클X)

### 최소 신장 트리(Minimum Spaning Tree, MST)
- 가능한 신장 트리 중 간선의 가중치 합이 최소인 신장 트리
- 대표적인 최소 신장 트리 알고리즘
    - 크루스칼 알고리즘(Kruskal's algorithm)
    - 프림 알고리즘(Prim's algorithm)

### 크루스칼 알고리즘(Kruskal's algorithm)
- 모든 정점을 독립적인 집합으로 만든다
- 모든 간선을 비용 기준으로 정렬 후 비용이 작은 간선부터 양 끝의 두 정점을 비교한다
- 두 정점의 최상위 정점을 확인 후 서로 다를 경우 두 정점을 연결한다(사이클이 생기지 않도록)
> 탐욕 알고리즘을 기초로 한다(당장 눈앞의 최소 비용을 선택하여 최적의 솔루션을 찾음)

### Union-Find 알고리즘
- Disjoint Set을 표현할 때 사용하는 알고리즘으로 트리 구조를 활용하는 알고리즘
- Disjoint Set
    - 서로 중복되지 않는 부분 집합들로 나누어진 원소들에 대한 정보를 저장하고 조작하는 자료구조
    - 공통 원소가 없는 상호 배타적인 부분 집합들로 나누어진 원소들에 대한 자료구조
    - 서로소 집합 자료구조라고도 한다

1. 초기화
    - n개의 원소가 개별 집합으로 이루어지도록 초기화
2. Union
    - 두 개별 집합을 하나의 집합으로 합친다(두 트리를 하나의 트리로 만든다)
3. Find
    - 여러 노드가 존재할 때 두개의 노드를 선택하여 현재 두 노드가 서로 같은 그래프에 속하는지 판별하기 위해 각 그룹의 최상단 원소(루트 노드)를 확인

In [3]:
mygraph = {
    'vertices': ['A', 'B', 'C', 'D', 'E', 'F', 'G'],
    'edges': [
        (7, 'A', 'B'),
        (5, 'A', 'D'),
        (7, 'B', 'A'),
        (8, 'B', 'C'),
        (9, 'B', 'D'),
        (7, 'B', 'E'),
        (8, 'C', 'B'),
        (5, 'C', 'E'),
        (5, 'D', 'A'),
        (9, 'D', 'B'),
        (7, 'D', 'E'),
        (6, 'D', 'F'),
        (7, 'E', 'B'),
        (5, 'E', 'C'),
        (7, 'E', 'D'),
        (8, 'E', 'F'),
        (9, 'E', 'G'),
        (6, 'F', 'D'),
        (8, 'F', 'E'),
        (11, 'F', 'G'),
        (9, 'G', 'E'),
        (11, 'G', 'F')
    ]
}

In [4]:
parent = dict()
rank = dict()


def find(node):
    # path compression 기법
    if parent[node] != node:
        parent[node] = find(parent[node])
    return parent[node]


def union(node_v, node_u):
    root1 = find(node_v)
    root2 = find(node_u)
    
    # union-by-rank 기법
    if rank[root1] > rank[root2]:
        parent[root2] = root1
    else:
        parent[root1] = root2
        if rank[root1] == rank[root2]:
            rank[root2] += 1
    
    
def make_set(node):
    parent[node] = node
    rank[node] = 0

def kruskal(graph):
    mst = list()
    
    # 1. 초기화
    for node in graph['vertices']:
        make_set(node)
    
    # 2. 간선 weight 기반 sorting
    edges = graph['edges']
    edges.sort()
    
    # 3. 간선 연결 (사이클 없는)
    for edge in edges:
        weight, node_v, node_u = edge
        if find(node_v) != find(node_u):
            union(node_v, node_u)
            mst.append(edge)
    
    return mst

In [5]:
kruskal(mygraph)

[(5, 'A', 'D'),
 (5, 'C', 'E'),
 (6, 'D', 'F'),
 (7, 'A', 'B'),
 (7, 'B', 'E'),
 (9, 'E', 'G')]

### 프림 알고리즘(Prim's algorithm)
- 시작 정점을 선택한 후, 정점에 인접한 간선 중 최소 간선으로 연결된 정점을 선택하고 해당 정점에서 다시 최소 간선으로 연결된 정점을 선택하는 방식으로 최소 신장 트리를 확장해가는 방식
- 크루스칼과 프림의 비교
    - 둘 다 탐욕 알고리즘을 깇로 한다
    - 크루스칼은 가장 가중치가 적은 간선부터 선택하며 MST를 구한다
    - 프림은 특정 정점에서 시작하여 해당 정점에 연결된 가중치가 제일 작은 간선을 선택하여 간선으로 연결된 정점들에 연결된 간선 중 가장 가중치가 작은 간선을 선택하는 방식으로 MST를 구한다

In [2]:
myedges = [
    (7, 'A', 'B'), (5, 'A', 'D'),
    (8, 'B', 'C'), (9, 'B', 'D'), (7, 'B', 'E'),
    (5, 'C', 'E'),
    (7, 'D', 'E'), (6, 'D', 'F'),
    (8, 'E', 'F'), (9, 'E', 'G'),
    (11, 'F', 'G')
]

In [3]:
from collections import defaultdict
from heapq import *

def prim(start_node, edges):
    mst = list()
    adjacent_edges = defaultdict(list)
    for weight, n1, n2 in edges:
        adjacent_edges[n1].append((weight, n1, n2))
        adjacent_edges[n2].append((weight, n2, n1))

    connected_nodes = set(start_node)
    candidate_edge_list = adjacent_edges[start_node]
    heapify(candidate_edge_list)
    
    while candidate_edge_list:
        weight, n1, n2 = heappop(candidate_edge_list)
        if n2 not in connected_nodes:
            connected_nodes.add(n2)
            mst.append((weight, n1, n2))
            
            for edge in adjacent_edges[n2]:
                if edge[2] not in connected_nodes:
                    heappush(candidate_edge_list, edge)

    return mst

In [4]:
prim ('A', myedges)

[(5, 'A', 'D'),
 (6, 'D', 'F'),
 (7, 'A', 'B'),
 (7, 'B', 'E'),
 (5, 'E', 'C'),
 (9, 'E', 'G')]