## 최소 신장 트리 (MST)

- 그래프에서 최소 비용 문제
    1. 모든 정점을 연결하는 간선들의 가중치의 합이 최소가 되는 트리
    2. 두 정점 사이의 최소 비용의 경로 찾기

- 신장 트리
    n개의 정점으로 이루어진 무방향 그래프에서 n개의 정점과 n-1개의 간선으로 이루어진 트리
    -- 모든 정점을 연결한, 사이클이 존재하지 않는 부분 그래프.
    -- 한 그래프에서 여러 개의 신장 트리가 나올 수 있다.

**최소 신장 트리**: 
무방향 가중치 그래프에서 신장 트리를 구성하는 간선들의 가중치의 합이 최소인 신장 트리.

**사용사례**

네트워크- 라우팅 경로 최적화
도로건설, 배관, 전기회로

### 최단 경로

간선의 가중치가 있는 그래프에서 두 정점 사이의 경로들 중에 간선의 가중치가 합이 최소인 경로

하나의 시작 정점에서 끝 정점까지의 최단 경로 구하기:
 다익스트라(양수 가중치만 있을 때 가능), 벨만포드(음의 가중치 허용)

모든 정점들에 대한 최단 경로:
 플로이드-워셜 알고리즘

최단 경로 알고리즘 정리 https://roytravel.tistory.com/340


**Kruskal Algorithm**  

크루스칼 알고리즘 https://c4u-rdav.tistory.com/48 
 
그리디 알고리즘 기반. 최소신장 트리를 구하는 대표적 알고리즘. 
간선의 가중치가 작은 것부터 하나하나 포함해서 그래프가 신장 트리가 되면 --> 최소신장트리
! 무작정 작은 가중치의 간선부터 막 포함시키면 사이클을 형성할 수 있음!! 사이클 형성 간선은 미포함

- 동작 방식
    1. 간선의 가중치가 작은 것부터 그래프에 포함-모든 간선 정보를 오름차순으로 정렬하고 하나씩 포함.    
    사이클을 형성하면안되기 떄문에 union-find 알고리즘으로 연결 확인
    2. 간선 선택, 노드가 서로 연결되어있지 않으면 연결하고, 루트 노드가 더 작은 걸로 다른 노드의 루트 노드를 바꿈
    3. 간선 선택, 노드가 서로 연결되어 있으면 사이클이 발생하므로 연결X
    4. 루트 노드가 모두 같아지면 종료


In [None]:
'''
7 11
0 1 32
0 2 31
0 5 60
0 6 51
1 2 21
2 4 46
2 6 25
3 4 34
3 5 18
4 5 40
4 6 51
'''

# 모든 간선 중 비용이 가장 적은 걸 우선으로 선택

V, E = map(int, input().split())
edge = []
for _ in range(E):
    f, t, w = map(int, input().split())
    edge.append([f, t, w])

# w 를 기준으로 정렬
edge.sort(key=lambda x: x[2])

# 사이클 발생 여부를 union find로 해결
parents = [ i for i in range(V)]

def find_set(x):
    if parents[x] == x:
        return x
    parents[x] = find_set(parents[x])
    return  parents[x]

def union(x, y):
    x= find_set(x)
    y= find_set(y)

    if x == y:
        return

    if x< y:
        parents[y] = x
    else:
        parents[x] = y

cnt = 0
sum_weight = 0
for f, t, w in edge:
    # 사이클이 발생하지 않으면(루트노드 체크), 둘을 같은 집합으로 묶기
    if find_set(f) != find_set(t):
        cnt += 1
        sum_weight += w
        union(f, t)
        # MST 구성이 끝나면
        if cnt == V:
            break

print(f'최소 비용 = {sum_weight}')

In [None]:
# 강사님코드

p = []  # 서로소 집합을 만드는데 사용할 트리

def find_set(x):
    while x != p[x]:
        x = p[x]

    return x


def union(x, y):
    x = find_set(x)
    y = find_set(y)

    if x < y:
        p[y] = x
    else:
        p[x] = y

V, E = map(int, input().split())
edge = []

"""
7 11
0 1 32
0 2 31
0 5 60
0 6 51
1 2 21
2 4 46
2 6 25
3 4 34
3 5 18
4 5 40
4 6 51
"""

for _ in range(E):
    s, e, w = map(int, input().split())
    edge.append((w, s, e)) # 리스트 넣을때 가중치를 맨 앞으로


edge.sort() # 맨 앞 원소(가중치) 기준으로 오름차순 정렬
p = [i for i in range(V)] # make_set

cnt = 0
total = 0

# 정렬된 리스트를 순회하면서 가중치가 작은 간선의 정보부터 확인
for w, s, e in edge:
    # s 정점이 속한 집합의 대표와  e정점이 속한 집합의 대표가 달라야 한다.
    # 대표가 같으면 같은 집합에 속해있다는 의미 => 사이클이 생겨버린다.
    if find_set(s) != find_set(e):
        cnt += 1
        union(s, e)
        total += w
        # MST 구성이 끝나면 종료
        if cnt == V:
            break

print(total)


**Prim Algorithm** 

프림 알고리즘 https://c4u-rdav.tistory.com/49

크루스칼 알고리즘처럼 그리디를 기반으로 한 알고리즘이나, 간선을 중심으로 최소 신장 트리를 구하는 것이 아닌 노드를 중심으로 최소 신장 트리 구함.

임의의 노드를 선택해 그래프를 만들고 해당 그래프와 연결되어 있는 노드 중 가장 작은 가중치의 간선으로 이어진 노드를 선택해 그래프에 포함시킴(연결 노드 중 이미 그래프에 포함된 노드는 연결 노드에서 제외(disjoint set))

하나의 정점에서 연결된 간선들 중에 하나씩 선택하면서 MST를 만들어가는 방식.
1. 임의 정점을 하나 선택해서 시작
2. 선택한 정점과 인접하는 정점들 중의 최소 비용의 간선이 존재하는 정점을 선택
3. 모든 정점이 선택될 때 까지 1, 2 과정을 반복

서로소인 2개의 집합 정보를 유지
- 트리정점들(MST를 만들기 위해 선택된 정점들)/ 비트리정점들(선택되지 않은 정점들)

그래프에 속하지 않은 연결 노드 중 간선의 가중치가 작은순으로 노드를 그래프에 포함시킴
-> 그래프와 연결된 노드들을 간선의 가중치를 우선순위로 저장하는 우선순위 큐로 적용
-> 이미 연결된 노드는 제외하기 위해 connected 테이블 사용

+ https://www.acmicpc.net/problem/1197
  

In [None]:

'''
7 11
0 1 32
0 2 31
0 5 60
0 6 51
1 2 21
2 4 46
2 6 25
3 4 34
3 5 18
4 5 40
4 6 51
'''

import heapq

def prim(start):
    heap = []
    # MST에 포함되었는지의 여부
    MST = [0] * V

    # 가중치, 정점 정보
    heapq.heappush(heap, (0, start))

    # 누적합 저장
    sum_weight = 0

    while heap:
        # 가장 적은 가중치를 가진 정점을 꺼냄
        weight, v = heapq.heappop(heap)

        # 갈 수 있는 노드라면 pass
        if MST[v]:
            continue

        # 방문체크
        MST[v] = 1

        # 누적합 추가
        sum_weight += weight

        # 갈 수 있는 노드들을 체크
        for next in range(V):
            # 갈 수 없다 or 이미 방문했다면 pass
            if graph[v][next] == 0 or MST[next]:
                continue

            heapq.heappush(heap, (graph[v][next], next))

    return sum_weight

# V: 노드 수 E: 간선 수
V, E = map(int, input().split())

# 인접행렬
graph = [[0] * V for _ in range(V)]

for _ in range(E):
    # f 에서 t로 w만큼의 가중치
    f, t, w = map(int, input().split())
    graph[f][t] = w
    graph[t][f] = w


result = prim(0)
print(f'최소 비용 = {result}')

In [None]:
# 강사님 코드
from heapq import heappop, heappush

"""
7 11
0 1 32
0 2 31
0 5 60
0 6 51
1 2 21
2 4 46
2 6 25
3 4 34
3 5 18
4 5 40
4 6 51
"""


# s : 시작 정점
def prim(s):
    heap = []  # 최소 힙 (루트가 최소값, 원소를 꺼내면 루트에서 꺼내므로 최소값)

    MST = [0] * V  # 내가 만들 신장 트리에 포함시킨 정점 정보

    # MST[1] = 1 : 1번 정점은 신장트리에 포함되어 있다
    # MST[1] = 0 : 1번 정점은 신장트리에 포함되지 않았다.

    heappush(heap, (0, s))  # 시작 정점 넣고 시작 (가중치, 정점)

    # 최소 신장 트리(가중치 합)
    MIN_V = 0

    while heap:
        # 가장 작은 가중치를 가진 정점을 꺼낸다.
        # 힙을 사용하면 반복문을 돌면서 최소 가중치를 가진 정점을 찾을 필요가 없다.
        w, v = heappop(heap)

        # 정점 v가 지금 내가 만들고있는 신장트리에 이미 포함이 되어있으면
        # continue
        if MST[v]:
            continue

        # 신장트리에 포함이 되지 않은 정점 v를 꺼낸 경우 체크
        # 신장트리에 포함시킨다.
        MST[v] = 1

        # 방금 꺼낸 정점과 가중치는 연결된적이 없고, 최소 가중치를 가졌으므로
        # 가중치 합 추가
        MIN_V += w

        # v와 연결된 모든 노드들을 확인
        for u in range(V):

            # u 노드가 v노드와 인접해 있지 않거나
            # u 노드가 이미 신장트리에 포함되어있으면 u번 정점은 볼필요 없음
            if adjm[v][u] == 0 or MST[u]:
                continue

            # u노드가 v노드와 인접해 있고, 신장트리에 포함된 적이 없는 노드다.
            # 힙에 일단 넣어 (자동으로 최소 가중치를 꺼내줄 수 있도록)
            heappush(heap, (adjm[v][u], u))

    return MIN_V


V, E = map(int, input().split())
adjm = [[0] * V for _ in range(V)]

for _ in range(E):
    # s : 시작 정점 , e : 도착 정점 , w : 가중치
    s, e, w = map(int, input().split())
    adjm[s][e] = w
    adjm[e][s] = w

print(prim(0))


**Dijikstra Algorithm** 

다익스트라 
https://c4u-rdav.tistory.com/50
https://dev-gorany.tistory.com/63

시작 정점에서 거리가 최소인 정점을 선택해 나가면서 최단 경로를 구함

시작 정점(s)에서 끝정점(t) 까지의 최단 경로에 정점 x가 존재.
이 때 최단경로는 s에서 x까지의 최단 경로와 x에서 t까지의 최단경로가 구성

현 시점 중심으로 다음 노드까지 가장 짧은 거리를 구했다면 최단 거리임이 보장된다.

Greedy + DP

**사용조건**
방향 그래프(무방향 그래프 주어질 시 간선 분리해 방향 그래프로 바꿔야 함)
0 이상의 가중치(음수 가중치 존재X. 이전까지 계산해 둔 최소값이 최소라고 보장할수 없음)
사이클 X

**동작**

1. 거리, 방문 테이블 준비
2. 시작 노드 선택(방문 처리)
3. 연결되어있는 노드와의 최단 거리 구함(거리 테이블 갱신)
4. 갱신 후 아직 방문하지 않은 노드 중 가장 거리가 짧은 노드를 선택(방문 처리)
5. 3~4 반복

구현 - 순차탐색/우선순위큐(better)

우선순위 큐 https://c4u-rdav.tistory.com/34

다익스트라로 음수 간선을 연산할 수 없는 이유
: 음수 사이클 때문에 --> 애초에 사이클이 존재하면 다익스트라가 성립하지 않는 것이 아닌가?


다만 시간복잡도는 벨만-포드가 더 큼. 양수 가중치만 존재한다면 다익스트라 이용.


In [None]:
# 우선순위큐를 이용한 다익스트라 구현 - 라이브
'''
6 8
0 1 2
0 2 4
1 2 1
1 3 7
2 4 3
3 4 2
3 5 1
4 5 5
'''
# 내가 갈 수 있는 경로 중 누적거리가 가장 짧은 것부터 고름
import heapq

# 입력
n, m = map(int, input().split())
# 인접리스트
graph = [[] for i in range(n)]
for _ in range(m):
    f, t, w = map(int, input().split())
    graph[f].append([t, w])


# 1. 누적 거리를 계속 저장
INF = int(1e9) # 갈 수 없다면 엄청 큰 값을 가지도록 설정
distance = [INF] * n

def dijikstra(start):
    # 2. 우선순위 큐
    pq = []
    # 출발점 초기화
    heapq.heappush(pq, (0, start))
    distance[start] = 0

    while pq:
        # 현재시점에서 누적거리가 가장 짧은 노드에 대한 정보 꺼내기
        dist, now = heapq.heappop(pq)

        # 이미 방문한 지점 + 누적 거리가 더 짧게 방문한 적이 있다면 pass
        if distance[now] < dist:
            continue

        # 인접 노드를 확인
        for next in graph[now]:
            next_node = next[0]
            cost = next[1]

            # next_code로 가기 위한 누적 거리
            new_cost = dist + cost

            # 누적 거리가 기존보다 크다?
            if distance[next_node] <= new_cost:
                continue

            distance[next_node] = new_cost
            heapq.heappush(pq, (new_cost, next_node))


dijikstra(0)
print(distance)


In [None]:
# 우선순위 큐 이용 - 강사님코드
'''
6 8
0 1 2
0 2 4
1 2 1
1 3 7
2 4 3
3 4 2
3 5 1
4 5 5
'''
from heapq import heappop, heappush

INF = 10000000 # 무한대 초기화용

def dijkstra(s):
    q = []
    heappush(q, (0, s)) # (가중치, 정점번호)
    D[s] = 0 # 시작정점 비용은 0 (s에서 s까지 가는데는 가중치 0)

    while q:
        print(D) # 가중치 배열

        # w: 가중치, v: 정점 번호
        w, v = heappop(q)

        # 방금 꺼내온 v번 노드까지의 가중치 w가 이전에 계산해둔 v번까지의 최소 거리보다 크면 계산X
        # D[t]는 처음에 무한대로 초기화 해 뒀으니 계산한 적이 있는지 체크도 가능
        if D[v] < w:
            continue

        # v와 연결된 정점을 탐색.
        # u: v와 연결된 정점 번호
        # uw: v에서 u까지의 가중치
        for u, uw in adjl[v]:
            cost = D[v] + uw # v까지의 가중치 + v에서 u까지의 가중치 = v에서 u까지의 가중치
            if cost < D[u]: # 방금 계산한 거리가 이전에 계산한 거리보다 작으면
                D[u] = cost
                heappush(q, (cost, u)) # 최단거리가 갱신된 경우에만 q에 삽입.

V, E = map(int, input().split())
adjl = [[] for _ in range(V)]

for _ in range(E):
    s, e, w = map(int, input().split())
    adjl[s].append((e, w))

# 시작지점 e에서 i까지 가는데 걸리는 최소 비용
D = [INF] * V

dijkstra(0)

추가

플로이드-워셜 https://c4u-rdav.tistory.com/51?category=1082802

벨만-포드 

https://velog.io/@kimdukbae/%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98-%EB%B2%A8%EB%A7%8C-%ED%8F%AC%EB%93%9C-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98-Bellman-Ford-Algorithm

https://8iggy.tistory.com/153


