# 19. 프림 알고리즘 (Prim's Algorithm)

- 크루스칼 알고리즘과 함께 대표적인 최소 신장 트리 알고리즘

<br>

## 19.1 프림 알고리즘 로직

- 시작 정점을 선택
- 정점에 인접한 간선 중 최소 간선으로 연결된 정점을 선택
- 해당 정점에서 다시 최소 간선으로 연결된 정점을 선택
- 위와 같은 방식으로 최소 신장 트리를 확장해가는 방식

<br>

## 19.2 크루스칼 알고리즘과 비교

- 둘 다 **탐욕 알고리즘을 기초**로 하고 있음
  - 당장 눈 앞의 최소 비용을 선택
  - 결과적으로 최적의 솔루션을 찾음  
  
  
- 크루스칼 알고리즘
  - 가장 가중치가 작은 간선부터 선택하면서 MST를 구함  
  
  
- 프림 알고리즘
  - 특정 정점에서 시작
  - 해당 정점에 연결된 가장 가중치가 작은 간선 선택
  - 간선으로 연결된 정점들에 연결된 간선 중에서 가장 가중치가 작은 간선 선택
  - 위와 같은 방식으로 MST를 구함

<br>

## 19.3 그림으로 이해하는 프림 알고리즘

1. 임의의 정점을 선택하여 "연결된 노드 집합"에 삽입
2. 선택된 정점에 연결된 간선들을 간선 리스트에 삽입
3. 간선 리스트에서 최소 가중치를 가지는 간선부터 추출
  - 해당 간선에 연결된 인접 정점이 "연결된 노드 집합"에 이미 들어 있음  
  $\rightarrow$ 스킵 (cycle 발생 방지)
  - 해당 간선에 연결된 인접 정점이 "연결된 노드 집합"에 들어 있지 않음  
  $\rightarrow$ 해당 간선을 선택하고, 해당 간선 정보를 "최소 신장 트리"에 삽입
4. 추출한 간선은 간선 리스트에서 제거
5. 간선 리스트에 더 이상의 간선이 없을 때 까지 3-4번을 반복

<img src="./img/prim_01.jpg" width=300 />

<img src="./img/prim_02.jpg" width=300 />

<img src="./img/prim_03.jpg" width=300 />

<img src="./img/prim_04.jpg" width=300 />

<img src="./img/prim_05.jpg" width=300 />

<img src="./img/prim_06.jpg" width=300 />

<br>

## 19.4 프림 알고리즘(Prim's Algorithm) 코드 작성

### 19.4.1 (참고) `heapq` 라이브러리를 활용한 우선순위 큐 사용

#### 19.4.1.1 `heapq.heappush()`

- 데이터를 heap 형태로 삽입
- `0`번 인덱스를 우선 순위로 인지

<br>

#### 19.4.1.2 `heapq.heappop()`

- 가장 우선순위가 높은 데이터 반환
- 반환된 데이터는 삭제됨

In [1]:
import heapq

queue = []
graph_data = [[2, 'A'], [5, 'B'], [3, 'C']]

for edge in graph_data:
    heapq.heappush(queue, edge)
    
for index in range(len(queue)):
    print(heapq.heappop(queue))
    
print(queue)

[2, 'A']
[3, 'C']
[5, 'B']
[]


<br>

#### 19.4.1.3 `heapq.heapify()`

- 리스트 데이터를 heap 형태로 한 번에 변환
- `0`번 인덱스를 우선순위로 인지함

In [3]:
import heapq

graph_data = [[2, 'A'], [5, 'B'], [3, 'C']]

heapq.heapify(graph_data)

for index in range(len(graph_data)):
    print(heapq.heappop(graph_data))

print(graph_data)

[2, 'A']
[3, 'C']
[5, 'B']
[]


<br>

### 19.4.2 (참고) `collections` 라이브러리의 `defaultdict` 함수 활용

- `defaultdict` 함수를 사용해서 `key`에 대한 `value`를 지정하지 않았을 시, 빈 리스트로 초기화하기

In [1]:
from collections import defaultdict

list_dict = defaultdict(list)
print(list_dict['key1'])

[]


<br>

### 19.4.3 프림 알고리즘 파이썬 코드

0. 모든 간선 정보를 저장 (`adjacent_edges`)  
  
  
1. 임의의 정점을 선택, "연결된 노드 집합(`connected_nodes`)"에 삽입  
  
  
2. 선택된 정점에 연결된 간선들을 간선 리스트(`candidate_edge_list`)에 삽입  
  
  
3. 간선 리스트(`candidate_edge_list`)에서 최소 가중치를 가지는 간선부터 추출
  - 해당 간선에 연결된 인접 정점이 "연결된 노드 집합"에 이미 들어 있는 경우
    - 스킵 (cycle 발생 방지)
  - 해당 간선에 연결된 인접 정점이 "연결된 노드 집합"에 들어 있지 않는 경우
    - 해당 간선을 선택
    - 해당 간선 정보를 "최소 신장 트리(`mst`)"에 삽입
  - 해당 간선에 연결된 인접 정점의 간선들 중, "연결된 노드 집합(`connected_nodes`)"에 없는 노드와 연결된 간선들만 간선 리스트(`candidate_edge_list`)"에 삽입
    - "연결된 노드 집합(`connected_nodes`)에 있는 노드와 연결된 간선들을 간선 리스트에 삽입해도, 해당 간선은 스킵될 것이기 때문
    - 어차피 스킵될 간선을 간선 리스트(`candidate_edge_list`)에 넣지 않으므로 해서, 간선 리스트(`candidate_edge_list`)에서 최소 가중치를 가지는 간선부터 추출하기 위한 자료구조 유지를 위한 노력을 줄일 수 있음  
    (ex. 최소힙 구조 사용)  
  
  
4. 선택된 간선은 간선 리스트에서 제거  
  
  
5. 간선 리스트에 더 이상의 간선이 없을 때 까지 3-4번을 반복

<img src="./img/prim-algorithm.jpg" width=250 />

In [1]:
myedges = [
    (7, 'A', 'B'), (5, 'A', 'D'),
    (8, 'B', 'C'), (9, 'B', 'D'), (7, 'B', 'E'),
    (5, 'C', 'E'),
    (7, 'D', 'E'), (6, 'D', 'F'),
    (8, 'E', 'F'), (9, 'E', 'G'),
    (11, 'F', 'G')
]

In [2]:
from collections import defaultdict
from heapq import *

def prim(start_node, edges):
    mst = list()
    adjacent_edges = defaultdict(list)
    for weight, n1, n2 in edges:
        adjacent_edges[n1].append((weight, n1, n2))
        adjacent_edges[n2].append((weight, n2, n1))
        
    connected_nodes = set(start_node)
    candidate_edge_list = adjacent_edges[start_node]
    heapify(candidate_edge_list)
    
    while candidate_edge_list:
        weight, n1, n2 = heappop(candidate_edge_list)
        if n2 not in connected_nodes:
            connected_nodes.add(n2)
            mst.append((weight, n1, n2))
            
            for edge in adjacent_edges[n2]:
                if edge[2] not in connected_nodes:
                    heappush(candidate_edge_list, edge)
                    
    return mst

In [3]:
prim('A', myedges)

[(5, 'A', 'D'),
 (6, 'D', 'F'),
 (7, 'A', 'B'),
 (7, 'B', 'E'),
 (5, 'E', 'C'),
 (9, 'E', 'G')]