# 최소 신장 트리의 이해

## 1) 신장트리란?(= Spanning Tree)
- 트리의 조건을 만족하면서 모든 노드가 연결된 그래프
- Spainning Tree의 조건? <BR>
    1) 모든 노드가 서로 연결 되어 있어야 한다. <BR>
    2) 트리의 속성을 만족 시켜야 한다. (사이클 존재 X)
    
    
<img src="./image/Chapter-20_008.png" width=400>
    
## 2) 최소 신장 트리(= Minimum Spanning Tree)
- 가능한 Spanning Tree 중 가장 가중치가 적은 것. MST라고 불림.
<img src="./image/Chapter-20_009.png" width=400>
    
    
- 그래프에서 MST를 찾는 대표적인 알고리즘으로
    Kruskal's algorithm과 Prim's algorithm이 있음.<br><br><br><br><br>
 
    
    
    

# Kruskal's algorithm

- 그래프에서 MST를 찾는 대표적인 알고리즘.
- 로직 순서.<br>
    1) 모든 정점을 독립적인 집합으로 만든다.<br>
    2) 모든 간선을 비용 기준으로 정렬하고 비용이 적은 간선부터 양 끝의 두 정점을 비교한다.<br>
    3) 두 정점의 최상위 정점을 확인하고 서로다를 경우 두 정점을 연결한다.(사이클 체크)<br>
    
    
<img src="./image/Chapter-20_010.png" width=100><img src="./image/Chapter-20_011.png" width=400>

<br><br>
* 사이클 체크가 관건임.<br>
이를 체크하는 알고리즘 중에서는 Union-Find algorithm이 많이 쓰임.

# Union-Find algorithm

- Disjoint Set을 표현할 때 사용하는 algorithm
- 노드들 중에 연결된 노드를 찾거나 노드를 연결할때 사용함.

* Disjoint Set?
  서로소 집합 자료구조
  공통 원소가 없는 (서로소) 상호 배타적인 부분 집합들로 나누어진 원소들에 대한 자료구조.
              

### 구현할 메서드 
1) 초기화
- n개의 원소가 개별 집합으로 이루어지도록 초기화
        
2) Union
- 두 개별 집합(트리)을 하나의 집합으로 합침

3) Find
- 여러 노드가 존재할 때, 두개의 노드를 선택해서 현재 두 노드가 서로 같은 그래프에 속하는지 판별하기 위해.
    각 그룹의 루트노드를 찾아 체크한다.
<img src="./image/Chapter-20_012.png" width=400>
    
    
### 고려할 점.
- Union시 링크드리스트 형태로 가게 될 수 있다. 이 경우에는 시간 복잡도가 O(N)으로 올라감.
  이를 해결 위해 union-by-rank, path compression 기법을 사용한다.

## Union-by-rank algorithm

- 각 트리의 rank를 기억해 두고 진행

1) 두 rank가 차이나는 경우
- union시 rank가 큰 트리에 작은 트리를 붙임.
<img src="./image/Chapter-20_013.png" width=400>

2) 두 rank가 같은 경우
- 한 tree의 h를 증가시켜 합침.
<img src="./image/Chapter-20_014.png" width=400>



## Path Compression algorithm

- Union-Find에서 Find를 거쳐간 노드를 해당 노드의 루트 노드에에 다이렉트로 연결함.

<img src="./image/Chapter-20_015.png" width=200>

- Union-by-rank와 Path Compression을 사용시 시간복잡도를 O(1) 까지 낮출 수 있음.

# Kruskal's algorithm 구현


<img src="./image/Chapter-20_010.png" width=100>

In [16]:
grahp = {
    'vertices': ['A', 'B', 'C', 'D', 'E', 'F', 'G'],
    'edges':[
        (7, 'A', 'B'),
        (5, 'A', 'D'),
        (7, 'B', 'A'),
        (8, 'B', 'C'),
        (9, 'B', 'D'),
        (7, 'B', 'E'),
        (8, 'C', 'B'),
        (5, 'C', 'E'),
        (5, 'D', 'A'),
        (9, 'D', 'B'),
        (7, 'D', 'E'),
        (6, 'D', 'F'),
        (7, 'E', 'B'),
        (5, 'E', 'C'),
        (7, 'E', 'D'),
        (8, 'E', 'F'),
        (9, 'E', 'G'),
        (6, 'F', 'D'),
        (8, 'F', 'E'),
        (11, 'F', 'G'),
        (9, 'G', 'E'),
        (11, 'G', 'F'),
    ]
}

In [21]:
parent = dict()
rank = dict()

# 1. 모든 정점을 독립적인 집합으로 만든다.
def make_set(node):
    parent[node] = node
    rank[node] = 0

# 2. Path Compression
def find(node):
    if parent[node] != node: # 부모 노드가 자기 자신인 경우에는 본인이 루트인 경우임.
        parent[node] = find(parent[node])
    return parent[node]

def union(node_v, node_u):
    root1 = find(node_v)
    root2 = find(node_u)

    # Union-by-rank
    if rank[root1] > rank[root2]:
        parent[root2] = root1
    else:
        parent[root1] = root2
        if rank[root1] == rank[root2]:
            rank[root2] += 1
 
    
def kruskal(graph):
    mst = list()
    
    for node in graph['vertices']:
        make_set(node)
        
    
# 2. 이 집합을 적은 가중치 순으로 정렬한다.
    edges = graph['edges']
    edges.sort() 
    
    
# 3. 순회하면서 사이클이 생기지 않으면 Union 한다.
    for edge in edges:
        weight, node_v, node_u = edge
        if find(node_v) != find(node_u): 
            union(node_v, node_u)
            mst.append(edge)
    
    return mst

In [22]:
kruskal(grahp)

[(5, 'A', 'D'),
 (5, 'C', 'E'),
 (6, 'D', 'F'),
 (7, 'A', 'B'),
 (7, 'B', 'E'),
 (9, 'E', 'G')]

# 시간복잡도

O(E log E)

1) O(V) - make set 

2) O(E log E) - sort 

3) O(E) - Union-by-rank + Path Compression