### 1. 프림 알고리즘 (Prim's algorithm)

* 대표적인 최소 신장 트리 알고리즘
  * 크루스칼 알고리즘, 프림 알고리즘
* 프림 알고리즘
  * 시작 정점을 선택한 후, 정점에 인접한 간선중 최소 간선으로 연결된 정점을 선택하고, 해당 정점에서 다시 최소 간선으로 연결된 정점을 선택하는 방식으로 최소 신장 트리를 확장해가는 방식
* Kruskal's algorithm과 Prim's algorithm 비교
  * 둘 다 탐욕 알고리즘을 기초로 하고 있음 (당장 눈 앞의 최소 비용을 선택해서 결과적으로 최적의 솔루션을 찾음)
  * Kruskal's algorithm은 가장 가중치가 작은 간선부터 선택하면서 MST를 구함
  * Prim's algorithm은 특정 정점에서 시작, 해당 정점에 연결된 가장 가중치가 작은 간선을 선택, 간선으로 연결된 정점들에 연결된 간선 중에서 가장 가중치가 작은 간선을 택하는 방식으로 MST를 구함

In [11]:
mygraph = {
    'vertices': ['A', "B", "C", "D", "E", "F", "G"],
    'edges': [(7, 'A', 'B'),
              (5, 'A', 'D'),
              (7, 'B', 'A'),
              (8, 'B', 'C'),
              (9, 'B', 'D'),
              (7, 'B', 'E'),
              (8, 'C', 'B'),
              (5, 'C', 'E'),
              (5, 'D', 'A'),
              (9, 'D', 'B'),
              (7, 'D', 'E'),
              (6, 'D', 'F'),
              (5, 'E', 'C'),
              (7, 'E', 'D'),
              (8, 'E', 'F'),
              (9, 'E', 'G'),
              (6, 'F', 'D'),
              (8, 'F', 'E'),
              (11, 'F', 'G'),
              (9, 'G', 'E'),
              (11, 'G', 'F')
    ]
}

In [66]:
## 프림 알고리즘 직접 구현
import heapq

def prim(graph, start_node):
    nodes = [start_node]
    edges_queue = []
    mst = []
    for edge in graph["edges"]:
        if edge[1] == start_node:
            heapq.heappush(edges_queue, (edge[0], [edge[1], edge[2]]))
   
    while edges_queue:
        current_edge = heapq.heappop(edges_queue)
        if current_edge[1][1] not in nodes: 
            mst.append(current_edge)
            nodes.append(current_edge[1][1])
            for edge in graph["edges"]:
                if edge[1] == current_edge[1][1] and edge[2] not in nodes:
                    heapq.heappush(edges_queue, (edge[0], [edge[1], edge[2]]))
    return mst

In [67]:
prim(mygraph, "A")

[(5, ['A', 'D']),
 (6, ['D', 'F']),
 (7, ['A', 'B']),
 (7, ['B', 'E']),
 (5, ['E', 'C']),
 (9, ['E', 'G'])]

In [27]:
# heap 연습1
import heapq

queue = []
graph_data = [[2, 'A'], [5, 'B'], [3, 'C']]

for edge in graph_data:
    heapq.heappush(queue, edge)
    
for index in range(len(queue)):
    print(heapq.heappop(queue))
    
print(queue)

[2, 'A']
[3, 'C']
[5, 'B']
[]


In [28]:
# heap 연습2
import heapq

graph_data = [[2, 'A'], [5, 'B'], [3, 'C']]
heapq.heapify(graph_data)

for index in range(len(graph_data)):
    print(heapq.heappop(graph_data))
    
print(graph_data)

[2, 'A']
[3, 'C']
[5, 'B']
[]


In [53]:
from collections import defaultdict

list_dict = defaultdict(list)
print(list_dict['key1'])

[]


In [54]:
list_dict

defaultdict(list, {'key1': []})

In [59]:
myedges = [(7, 'A', 'B'),
          (5, 'A', 'D'),
          (8, 'B', 'C'),
          (9, 'B', 'D'),
          (7, 'B', 'E'),
          (5, 'C', 'E'),
          (7, 'D', 'E'),
          (6, 'D', 'F'),
          (8, 'E', 'F'),
          (9, 'E', 'G'),
          (11, 'F', 'G')
]

In [68]:
## 프림 알고리즘 구현
from collections import defaultdict
from heapq import *

def prim(start_node, edges):
    mst = list()
    adjacent_edges = defaultdict(list)
    for weight, n1, n2 in edges:
        adjacent_edges[n1].append((weight, n1, n2))
        adjacent_edges[n2].append((weight, n2, n1))
    
    connected_nodes = set(start_node)
    candidate_edge_list = adjacent_edges[start_node]
    heapify(candidate_edge_list)
    
    while candidate_edge_list:
        weight, n1, n2 = heappop(candidate_edge_list)
        
        if n2 not in connected_nodes:
            connected_nodes.add(n2)
            mst.append((weight, n1, n2))
            
            for edge in adjacent_edges[n2]:
                if edge[2] not in connected_nodes:
                    heappush(candidate_edge_list, edge)
    return mst

In [69]:
prim("A", myedges)

[(5, 'A', 'D'),
 (6, 'D', 'F'),
 (7, 'A', 'B'),
 (7, 'B', 'E'),
 (5, 'E', 'C'),
 (9, 'E', 'G')]

### 시간 복잡도
* 최악의 경우, while 구문에서 모든 간선에 대해 반복하고, 최소 힙 구조를 사용하므로 $O(ElogE)$ 시간 복잡도를 가짐

### 참고: 개선된 프림 알고리즘

* 간선이 아닌 노드를 중심으로 우선순위 큐를 적용하는 방식
  * 초기화 - 정점: key 구조를 만들어놓고, 특정 정점의 key 값을 0, 이외의 정점들의 key값은 무한대로 놓음. 모든 정점: key 값은 우선순위 큐에 놓음
  * 가장 key 값이 적은 정점: key를 추출한 후 (pop 하므로 해당 정점: key 정보는 우선순위 큐에서 삭제됨), (extract min 로직이라고 부름)
  * 해당 정점의 인접한 정점들에 대해 key 값과 연결된 가중치 값을 비교하여 key 값이 작으면 해당 정점:key 값을 갱신
    * 정점: key 값 갱신시, 우선순위 큐는 최소 key 값을 가지는 정점: key를 루트노드로 올려놓도록 재구성함 (decrease key 로직이라고 부름)

In [12]:
mygraph = {
    'A': {'B': 7, 'D': 5},
    'B': {'A': 7, 'D': 9, 'C': 8, 'E': 7},
    'C': {'B': 8, 'E': 5},
    'D': {'A': 5, 'B': 9, 'E': 7, 'F': 6},
    'E': {'B': 7, 'C': 5, 'D': 7, 'F': 8, 'G': 9},
    'F': {'D': 6, 'E': 8, 'G': 11},
    'G': {'E': 9, 'F': 11}    
}

In [26]:
from heapdict import heapdict

def prim(graph, start):
    mst, keys, pi, total_weight = list(), heapdict(), dict(), 0
    for node in graph.keys():
        keys[node] = float('inf')
        pi[node] = None
    keys[start], pi[start] = 0, start
    
    while keys:
        current_node, current_key = keys.popitem()
        mst.append([pi[current_node], current_node, current_key])
        total_weight += current_key
        for adjacent, weight in graph[current_node].items():
            if adjacent in keys and weight < keys[adjacent]:
                keys[adjacent] = weight
                pi[adjacent] = current_node
    return mst, total_weight

In [27]:
prim(mygraph, "A")

([['A', 'A', 0],
  ['A', 'D', 5],
  ['D', 'F', 6],
  ['A', 'B', 7],
  ['D', 'E', 7],
  ['E', 'C', 5],
  ['E', 'G', 9]],
 39)

###  개선된 프림 알고리즘의 시간 복잡도: $O(ElogV)$

* $O(V) + O(VlogV) + O(ElogV)$ -> 상대적으로 영향력이 적은 $O(V)$와 $O(VlogV)$를 제거하면 결과적으로 $O(ElogV)$