# Prim's Algorithm

### 순서
- 1)  모든 adjacent edges 정보 저장
- 2) 임의로 node 선택 ( connected_nodes 리스트에 넣기 )
- 3) 선택된 node에 연결된 edge들을 candidate_edge_list에 넣기
- 4) candidate_edge_list에서 최소 weight를 가지는 edge부터 추출!

위의 4)에서 유의할 점
- 해당 edge에 연결된 node가 이미 connected_nodes에 있다면 SKIP, 없다면 mst에 넣기 ( cycle 방지 )

## [ 기본 문법 : heapq & defaultdict ]

### 1. heapq
- 사용 이유 : edge의 weight가 작은 순으로 pop하기 위해

1) heappush
- list에 data 집어 넣고, heap 형태로!

In [14]:
import heapq

queue = []
graph_data = [[2,'a'],[5,'b'],[3,'c']]

for edge in graph_data:
    heapq.heappush(queue,edge)

2) heappop 
- weight 작은 순으로 뽑아내기

In [16]:
for index in range(len(queue)):
    print(heapq.heappop(queue))

[2, 'a']
[3, 'c']
[5, 'b']


In [17]:
print(queue)

[]


3) heapify
- list를 heap 형태로

In [18]:
graph_data

[[2, 'a'], [5, 'b'], [3, 'c']]

In [21]:
heapq.heapify(graph_data)

for index in range(len(graph_data)):
    print(heapq.heappop(graph_data))

[2, 'a']
[3, 'c']
[5, 'b']


### 2. defaultdict
- key에 대한 value를 지정하지 않았을 시, 빈 리스트(혹은 다른 형태)로 초기화

In [22]:
from collections import defaultdict

list_dict = defaultdict(list) # error X
print(list_dict['key1'])

list_dict2 = dict() # error O
print(list_dict2['key1'])

[]


KeyError: 'key1'

## [ Prim's Algorithm 구현 ]

### 1) Define Edges
- 단계1) 모든 adjacent edges 정보 저장

In [5]:
myedges = [
        (7,'a','b'),(5,'a','d'),
        (8,'b','c'),(9,'b','d'),(7,'b','e'),
        (5,'c','e'),
        (7,'d','e'),(6,'d','f'),
        (8,'e','f'),(9,'e','g'),        
        (11,'f','g')
]

### 2) Define Functions

In [6]:
from collections import defaultdict
from heapq import *

In [12]:
def prim(start_node,edges):
    mst = list()
    adj_edges = defaultdict(list)
    
    for weight,n1,n2 in edges:
        adj_edges[n1].append((weight,n1,n2))
        adj_edges[n2].append((weight,n2,n1))  # 1단계
    
    connected_nodes = set(start_node) # 2단계 
    candidate_edge_list = adj_edges[start_node] # 3단계 
    heapify(candidate_edge_list) # 4단계 (가장 weight 작은 순으로 나열)
    
    while candidate_edge_list: 
        w,n1,n2 = heappop(candidate_edge_list)
        if n2 not in connected_nodes: # cycle 방지
            connected_nodes.add(n2)
            mst.append((w,n1,n2))            
            for edge in adj_edges[n2]:
                if edge[2] not in connected_nodes: # cycle 방지 (굳이 안 넣어도 될 edge 미리 안넣기)
                    heappush(candidate_edge_list,edge)
                
    return mst

In [13]:
prim('a',myedges)

[(5, 'a', 'd'),
 (6, 'd', 'f'),
 (7, 'a', 'b'),
 (7, 'b', 'e'),
 (5, 'e', 'c'),
 (9, 'e', 'g')]

### 시간 복잡도 : O(E*logE) ( E : number of edges )

## 개선된 Prim's Algorithm 
- 시간 복잡도 : O(E*logV) ( V : number of nodes/vertices )

edge가 아닌 node를 중심으로 우선순위 queue를 적용

1) 초기화 : 선택한 node의 key값은 0, 나머지는 무한대로

2) 가장 key값이 작은 node 선택, 인접한 node의 key는 그 edge의 weight로 업데이트!

3) 남은 node들 중, 가장 key값이 작은 node 선택, ~ 

( 위 과정 반복 )