In [None]:

주어진 그래프에서 만들 수 있는 신장 트리 중, 그 값이 가장 작은 신장 트리를 말한다. 
최소 신장 트리는 통신망, 도로망같은 네트워크를 최소의 비용으로 구축하는 문제의 답을 말한다. 주로 나오는 예제는 다음과 같다.

- 도로 건설: 도시들을 모두 연결하면서 도로의 길이를 최소가 되도록 하는 문제
- 정기 회로: 단자들을 모두 연결하면서, 전선의 길이를 가장 최소로 하는 문제
- 통신: 전화선의 길이가 최소가 되도록 하는 전화 케이블 망을 구성하는 문제
- 배관: 파이프를 모두 연결하면서, 파이프의 총 길이를 최소로 하는 문제

공통적으로, 정점들(도로, 전화기 등)을 최소의 간선,최소의 비용(간선의 가중치)으로 모두 연결하는 것을 목표로 한다. 
앞으로 이러한 문제를 본다면, 프림 알고리즘 또는 크루스칼 알고리즘을 활용할 수 있다. 


- 간선의 갯수가 적은 그래프인 경우는 크루스칼 알고리즘을 사용하는 것이 유리하고, 
- 밀집한(간선의 갯수가 많은)그래프라면 프림 알고리즘을 사용하는 것이 좋다. 


In [None]:
# 프림 알고리즘 

1. 시작 정점에서부터 출발해서, 신장 트리 집합을 단계적으로 확장한다. 
    - 시작 단계에서는 시작 정점만이 신장 트리 집합에 포함된다.

2. 신장 트리 집합에 인접한 정점 중에서, 최저 간선으로 연결된 정점을 선택해서 신장 트리 집합에 추가한다. 
    - 기존에 신장 트리 집합에서 도달할 수 있는 정점들 중에서, 가장 낮은 가중치로 도달할 수 있는 정점을 선택해서 
    신장 트리 집합에 추가한다는 뜻,

3.신장 트리 집합이 n-1개의 간선을 가질 때까지 반복한다. 


In [None]:
"""
주어진 인접행렬에서, Prim 알고리즘을 통해 최소 신장 트리를 구한다.

입력: 인접 행렬, 시작 정점
출력: 시작 정점에서 만든 최소 신장 트리

알고리즘:
1. dist 배열을 INF로 초기화
2. dist[start] = 0
3. 우선 순위 큐 queue에 모든 정점 삽입(우선 순위는 dist[])
4. i는 0부터 n-1까지 반복
    1). u에 weight가 가장 작은 간선 삽입
    2). u의 인접 정점들인 v를 반복
        v가 Q의 원소이고, weight[u][v] < dist[v]라면
            dist[v]에 weight[u][v]를 할당

설명:
0. 프림 알고리즘은 시작 정점을 최초의 신장 트리로 놓는다.
1. 시작 정점만이 포함된 신장 트리에서, 더 포함시킬 수 있는 노드들을 찾아놓는다.
2. 더 포함시킬수 있는 노드 중, 비용(가중치)가 가장 작은 노드를 포함시킨다.
3. 2에서 포함된 정점에서 가장 낮은 비용으로 도달할 수 있는 노드를 찾아서, 
	그 노드를 신장 트리에 포함시킨다.
"""

INF = 999
adj_mat = [[0, 29, INF, INF, INF, 10, INF],
           [29, 0, 16, INF, INF, INF, 15],
           [INF, 16, 0, 12, INF, INF, INF],
           [INF, INF, 12, 0, 22, INF, 18],
           [INF, INF, INF, 22, 0, 27, 25],
           [10, INF, INF, INF, 27, 0, INF],
           [INF, 15, INF, 18, 25, INF, 0]]

node_num = len(adj_mat)
visited = [False] * node_num
distances = [INF] * node_num


"""
get_min_node 메소드
1. i가 0부터 node 갯수만큼 반복한다.
    i 노드가 방문한 적 없는 노드라면, 
        v에 i를 저장한다. 
        멈춘다. 
    
2. i가 0부터 node_num 만큼 반복한다.
        i가 방문하지 않았고, 방금 저장한 v보다 비용이 작은(기존의 신장트리로부터의 거리가 작은) 
        노드 i를 발견한다면
            v에 i를 덮어쓴다. 
    
    v를 리턴한다. 
"""


def get_min_node(node_num):
    print("get_min_node 함수 진입했다")
    for i in range(node_num):
        if not visited[i]:
            v = i
            break
    print("아직 방문하지 않은 v: ", v)
    for i in range(node_num):
        if not visited[i] and distances[i] < distances[v]:
            print("i: ", i, "\tv: ", v)
            print("distaces[i], distances[v]: ", distances[i], distances[v])
            v = i
            print("아직 방문 안됐고, 기존 v보다 distances값 작은 정점 발견 교체, 최종 v: ", v)

    return v


def prim(start, node_num):
    # distances 배열과 visted 배열 초기화
    for i in range(node_num):
        visited[i] = False
        distances[i] = INF

    # 시작노드의 distance 값을 0으로 초기화
    distances[start] = 0
    for i in range(node_num):
        print("--------------------")
        print("prim 메소드 내부 반복 시작, 반복 회차: ", i)
        node = get_min_node(node_num)
        visited[node] = True    # node 를 방문했다 표시
        print("\nget_min_node 에서 선택된 노드: ", node)

        for j in range(node_num):
            if adj_mat[node][j] != INF:
                if not visited[j] and adj_mat[node][j] < distances[j]:
                    print("방금 포함된 ", node, "와 연결되어있고, "
                                           "아직 방문하지 않았으며, "
                                           "기존의 신장트리로부터의 거리보다 작은 경로가 발견되어, "
                                           "distances[j]의 값을 갱신해야 하는 j: ", j)
                    distances[j] = adj_mat[node][j]

        print("distances: ", distances)
        print("--------------------")


print(prim(0, node_num))
print("distances: ", distances)
print("minimum cost: ", sum(distances))

In [None]:
1. vistied 배열과 distances배열을 각각 False, INF(무한대)로 초기화, ditances[start]의 값을 0으로 초기화

2. 인덱스인 i가 (0부터 node의 갯수-1) 만큼 아래 과정을 반복한다. 

3. 현재 신장 트리에서 도달할 수 있는 노드 중, 가장 비용이 작은 노드를 선택해서 node에 저장한다. 
    visited[node]를 True로 한다

4. 인덱스 j가 0부터 노드의 갯수-1 만큼 아래 과정을 반복한다.

5. node로부터 갈 수 있는 정점들 중에서, node와 연결되어 있고, 아직 방문하지 않았으며, 
    기존의 신장트리로부의 거리보다 distance 값이 작은 정점이 있다면, 그 정점의 distance값을 갱신한다.

In [None]:
# 크루스칼 알고리즘

1. 기존 프림 알고리즘은, 하나의 정점을 기준으로 간선을 채택하며 신장(spanning)했지만, 
크루스칼 알고리즘은 각각의 정점을 독립적인 집합으로 신장(간선을 채택)한다.

2. 그렇기 때문에, 흩어져 있는 간선들 중 weight가 가장 작은 순으로 선택해 나간다.

3. 간선을 차례로 연결하면서, cycle이 생기지 않도록 신장(spanning)한다.

* 이 과정에서 union-find(disjoint-set) 연산을 사용한다.

In [None]:
parent = dict()
rank = dict()
# 비방향 그래프 임을 확인 (방향그래프도 가능하다)
graph = {
    'vertices': ['v1','v2','v3','v4','v5'],
    'edges' : [(1,'v1','v2'),
               (3,'v1','v3'),
               (3,'v2','v3'),
               (6,'v2','v4'),
               (4,'v3','v4'),
               (5,'v4','v5'),
               (2,'v3','v5')]
}

def find(node):
    # path compression 기법
    if parent[node] != node:
        parent[node] = find(parent[node])
    return parent[node]

def union(node_v, node_u):
    root1 = find(node_v)
    root2 = find(node_u)

    # union-by-rank 기법
    if rank[root1] > rank[root2]:
        parent[root2] = root1
    else:
        parent[root1] = root2
        if rank[root1] == rank[root2]:
            rank[root2] += 1


def make_set(node):
    parent[node] = node
    rank[node] = 0


def kruskal(graph):
    mst = list()

    # 1. 초기화
    for node in graph['vertices']:
        make_set(node)

    # 2. 간선 weight 기반 sorting
    edges = graph['edges']
    edges.sort()

    # 3. 간선 연결 (사이클 없는)
    for edge in edges:
        weight, node_v, node_u = edge
        if find(node_v) != find(node_u):
            union(node_v, node_u)
            mst.append(edge)
        print('mst:', mst)

    return mst

print(kruskal(graph))