# Kruskal's Algorithm

## 1) Define Graph

In [1]:
graph = {
    'vertices':['a','b','c','d','e','f','g'],
    'edges':[
        (7,'a','b'),
        (5,'a','d'),
        (7,'b','a'),
        (8,'b','c'),
        (9,'b','d'),
        (7,'b','e'),
        (8,'c','b'),
        (5,'c','e'),
        (5,'d','a'),
        (9,'d','b'),
        (7,'d','e'),
        (6,'d','f'),
        (7,'e','b'),
        (5,'e','c'),
        (7,'e','d'),
        (8,'e','f'),
        (9,'e','g'),
        (6,'f','d'),
        (8,'f','e'),
        (11,'f','g'),
        (9,'g','e'),
        (11,'g','f')
    ]
}

## 2) Define Functions

In [8]:
parent = dict() # parent node
rank = dict() # node's rank

#### 1. node 생성

In [9]:
def make_set(node):
    parent[node] = node # 처음 만들어지는 node는 그 부모 노드가 자기 자신!
    rank[node] = 0  

#### 2. root node 찾기
- 이후 cycle 여부 확인 위해 ( 서로 다른 두 node의 root node가 같다면, 연결 시 cycle 생김 )

In [10]:
def find(node):
    if parent[node] != node: 
        parent[node] = find(parent[node]) # parent node될 때까지 타고 올라감
    return parent[node]

#### 3. union by rank 기법
- 두 부분 집합의 rank를 찾은 뒤, union 

In [11]:
def union(node_v,node_u):
    root1 = find(node_v)
    root2 = find(node_u)
    
    if rank[root1] > rank[root2]: # rank1 > rank2
        parent[root2] = root1
        
    else :
        parent[root1] = root2 # rank2 >= rank1
        if rank[root1] == rank[root2]: # rank=rank2면 한 쪽에 +1
            rank[root2] +=1 

## 3) Kruskal Algorithm

In [12]:
def kruskal(graph):
    mst = list()
    
    # 1. 초기화 (node 생성)
    for node in graph['vertices']:
        make_set(node)
    
    # 2. Sort ( edge의 weight )
    edges = graph['edges']
    edges.sort() 
    
    #. 3. Edge 연결 ( cycle X )    
    for edge in edges:
        weight, node_v, node_u = edge
        if find(node_v) != find(node_u): # parent node 다를 경우 ( cycle이 아닐 경우)
            union(node_v,node_u) # 두 집합 합치기
            mst.append(edge)
            
    return mst

In [13]:
kruskal(graph)

[(5, 'a', 'd'),
 (5, 'c', 'e'),
 (6, 'd', 'f'),
 (7, 'a', 'b'),
 (7, 'b', 'e'),
 (9, 'e', 'g')]

### 시간복잡도 : O(E*logE)