## 7. 최단 경로

- 가장 짧은 경로를 찾는 알고리즘
    - 한 지점에서 다른 한 지점까지의 최단 경로
    - 한 지점에서 다른 모든 지점까지의 최단 경로
    - 모든 지점에서 다른 모든 지점까지의 최단 경로
- 그래프 형태로 표현. 노드와 엣지 형태
- 기본적으로 다이나믹 프로그래밍의 한 분류 (즉 특정 노드를 거쳐서 가는 경우를 고려할때의 최단경로를 구하려면 A -> B의 최단 경로 + B -> C의 최단경로로 나눠서 구해야하므로)

<br> 

### 다익스트라 Dijkstra 알고리즘
- 특정한 노드에서 출발하여 **다른 모든 노드로 가는** 최단 경로문제에 사용
- 그리디 알고리즘으로도 분류 -> 매 시행마다 가장 비용이 적은 노드를 선택
- 작동 방식
    - 출발 노드를 설정
    - 최단 거리 테이블을 초기화 (다른 노드와의 거리를 무한으로 설정, 자신의 거리는 0)
    - 출발 노드 기준 방문하지 않은 노드 중 최단 거리가 **가장 짧은 노드**를 선택
    - 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 테이블을 갱신
    - 위의 과정을 반복
- 기준 노드를 설정한 이후 매 단계마다 방문하지 않은 노드를 방문처리 할 때 해당 노드의 최단 거리는 고정됨
    - 따라서 매 단계마다 방문한 노드, 즉 하나의 노드에 대해서는 최단 거리를 무조건 찾게됨     
    -> 매 단계마다 최소값이 변할 이유가 없음. 그리디 알고리즘이 사용가능한 이유

In [2]:
#기본 다익스트라 알고리즘 구현
#매 단계마다 방문하지 않은 노드 중 최단거리가 가장 짧은 노드 선택을 위해서 순차탐색 방식으로 진행
import sys
#https://velog.io/@yeseolee/Python-%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EC%9E%85%EB%A0%A5-%EC%A0%95%EB%A6%ACsys.stdin.readline
#sys로 입력받는 방법에 대한 이유와 설명

#input = sys.stdin.readline 
#sys.stdin.readline을 사용하면 코딩테스트 환경이 아닌 환경에서는 실행되지 않으므로 일단 주석처리함
#코테 환경에서는 sys.stdin.readline사용을 권장. input을 사용할 경우 시간초과의 위험성 존재
INF = int(1e9)

#노드, 엣지의 개수를 입력
n, m = map(int, input().split())
#시작 노드번호 입력
start = int(input())
#각 노드의 연결 정보를 담는 리스트 초기화
graph = [[] for i in range(n+1)]
#방문여부 체크 리스트 생성
visited = [False] * (n + 1)
#최단 거리 테이블 초기화
distance = [INF] * (n + 1)

#각 노드의 연결정보 값 추가하기
for _ in range(m):
    a, b, c = map(int, input().split())
    graph[a].append((b, c)) #a노드에서 b노드로 가는 비용이 c라는 정보를 추가
    
#방문하지 않은 노드 중, 최단 거리가 짧은 노드의 번호를 반환
def get_smallest_node():
    min_value = INF
    index = 0 #노드 번호 초기화
    for i in range(1, n + 1):
        if distance[i] < min_value and not visited[i]: #i번째 노드의 거리값이 min_value보다 작고 방문처리가 되어있지 않다면
            min_value = distance[i] #최소거리값을 갱신. inf > inf 보다 작은 값 > 그 보다 작은 값 순으로 최소값이 이동하게 됨
            index = i
    return index

def dijkstra(start):
    #시작 노드 거리값을 초기화
    distance[start] = 0
    visited[start] = True
    for j in graph[start]: #1. 시작 노드와 직접 연결된 노드들의 튜플정보를 바탕으로 거리를 할당
        distance[j[0]] = j[1]
    
    for i in range(n-1): #n-1개의 경유노드에 대해서 튜플정보를 바탕으로 거리를 계산하여 최단거리 테이블 갱신하기
        now = get_smallest_node() #매번마다 가장 거리가 짧은 경유 노드 찾기
        visited[now] = True
        
        for j in graph[now]:
            cost = distance[now] + j[1] #시작노드 ~ 경유노드 거리 + 경유노드 ~ 도달노드 거리의 합
            
            if cost < distance[j[0]]: #위 거리의 합이 이전에 주어졌던 거리테이블 값보다 작은 경우 갱신
                distance[j[0]] = cost
                
dijkstra(start)

#모든 노드별 최단거리를 출력:
for i in range(1, n+1):
    if distance[i] == INF:
        print('INFINITY')
    else:
        print(distance[i]) 

6 11
1
1 2 2
1 3 5
1 4 1
2 3 3
2 4 2
3 2 3
3 6 5
4 3 3
4 5 1
5 3 1
5 6 2
0
2
3
1
2
4


### 기본 Dijkstra 알고리즘의 문제점
- for문의 반복은 노드개수 V에 의해서 영향을 받는다
- 그리고 각 노드 선택시 다시 V개의 노드들간의 거리를 확인한다
- 따라서 시간 복잡도는 $O(V^2)$이다
    - 5000개 이하의 노드 개수의 경우에는 해당 코드로 풀어도 무방하나 그 이상의 수에대해서는 코드의 수행시간이 매우 크므로 보다 효율적인 연산방법이 필요하다
    
<br> 

### 우선순위 큐 Priority Queue
- **우선순위가 가장 높은**데이터를 먼저 처리하는 구조
- 힙 Heap은 우선순위 큐를 구현하는 자료구조
- 최소 힙 Min Heap은 우선순위값이 낮은것부터
- 최대 힙 Max Heap은 우선순위값이 높은것부터
- 힙의 삽입, 삭제 시간복잡도는 $O(logN)$

In [4]:
#파이썬 heap
import heapq

def heapsort(iterable):
    h = []
    result = []
    
    for value in iterable: #모든 원소를 힙에 넣음
        heapq.heappush(h, value) #heap에 원소를 삽입하는 메서드 heappush
    
    #힙에 삽입된 원소들 중 Min Heap 방식으로 원소들을 차례로 꺼내서 result에 담기
    #파이썬의 heapq는 기본적으로 MIn Heap방식의 알고리즘을 구현
    for i in range(len(h)):
        result.append(heapq.heappop(h)) #Min Heap방식의 원소 추출 heappop
    return result

result = heapsort([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])
print(result)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [5]:
#Max Heap구현
import heapq

def heapsort(iterable):
    h = []
    result = []
    
    for value in iterable: #모든 원소를 힙에 넣음
        heapq.heappush(h, -value) #모든 원소들에 -부호를 넣어줌
    
    for i in range(len(h)):
        result.append(-heapq.heappop(h)) 
        #음의 값 중 최소값순서대로 추출하도록 함
        #즉 양수의 경우에는 최대값부터 추출하게 되므로 Max Heap방식에 해당
    return result

result = heapsort([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])
print(result)

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]


### 힙을 사용한 개선된 Dijkstra 알고리즘
- 작동 방식
    - 출발 노드를 설정
    - 최단 거리 테이블을 초기화 (다른 노드와의 거리를 무한으로 설정, 자신의 거리는 0)
    - 출발 노드 기준 방문하지 않은 노드들을 **힙에 투입**
    - 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 테이블을 갱신
    - 테이블이 갱신되면 Min Heap방식으로 **최단거리 노드**를 선택
    - 위의 과정을 반복

In [10]:
#개선된 Dijkstra
import heapq
import sys

#input = sys.stdin.readline
INF = int(1e9)

#노드와 간선의 개수
n, m = map(int, input().split())
#시작노드 번호
start = int(input())
#각 노드의 연결관계를 담은 테이블
graph = [[] for i in range(n + 1)]
#노드별 거리테이블
distance = [INF] * (n + 1)

#노드 연결관계 테이블을 채우기
for _ in range(m):
    a, b, c = map(int, input().split())
    graph[a].append((b,c))
    
def dijkstra(start):
    q = []
    # 시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
    heapq.heappush(q, (0, start))
    distance[start] = 0
    while q: # 큐가 비어있지 않다면
        # 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
        dist, now = heapq.heappop(q)
        # 현재 노드가 이미 처리된 적이 있는 노드라면 무시
        if distance[now] < dist:
            continue
        # 현재 노드와 연결된 다른 인접한 노드들을 확인
        for i in graph[now]:
            cost = dist + i[1]
            # 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
            if cost < distance[i[0]]:
                distance[i[0]] = cost
                heapq.heappush(q, (cost, i[0]))
dijkstra(start)

for i in range(1, n+1):
    if distance[i] == INF:
        print('INFINITY')
    else:
        print(distance[i])

6 11
1
1 2 2
1 3 5
1 4 1
2 3 3
2 4 2
3 2 3
3 6 5
4 3 3
4 5 1
5 3 1
5 6 2
0
2
3
1
2
4


### 플로이드 워셜 알고리즘
- 모든 노드에서 다른 모든 노드까지의 최단 경로를 모두 계산
- 2차원 테이블에 최단 거리정보를 저장
- 다이나믹 프로그래밍 유형에 속함
- 점화식 : $D_{ab} = min(D_{ab}, D_{ak} + D_{kb})$
    - a에서 b로 바로 가는 경우와 a -> b -> k로 가는 경우와 비교하여서 최단거리를 갱신

In [13]:
#플로이드 워셜 알고리즘 구현
INF = int(1e9)

#노드 및 간선의 개수 입력
n = int(input())
m = int(input())

#노드 간 거리 2차원 배열 초기화
graph = [[INF] * (n + 1) for _ in range(n + 1)]

#자기 자신에 해당하는 거리는 0으로 변경
for a in range(1, n+1):
    for b in range(1, n + 1):
        if a == b:
            graph[a][b] = 0
            
#그래프 정보 추가하기
for i in range(m):
    a, b, c = map(int, input().split())
    graph[a][b] = c #a에서 b로 가는 비용이 c

#점화식에 의한 플로이드 워셜 알고리즘 수행
for k in range(1, n+1): #거쳐가는 노드
    for a in range(1, n+1): #출발노드
        for b in range(1, n+1): #도착노드
            graph[a][b] = min(graph[a][b], graph[a][k] + graph[k][b])

#수행된 결과 출력
for a in range(1, n+1):
    for b in range(1, n + 1):
        if graph[a][b] == INF:
            print('INFINITY', end = ' ')
        else:
            print(graph[a][b], end = ' ')
    print()

4
7
1 2 4
1 4 6
2 1 3
2 3 7
3 1 5
3 4 4
4 3 2
0 4 8 6 
3 0 7 9 
5 9 0 4 
7 11 2 0 


In [29]:
#실전문제 1. 미래 도시
#1 -> k -> x로 가는 최단시간 구하기
#이는 다시말하면 1 -> k, k->x 각각의 최단시간을 구해서 더하면 된다
import heapq
INF = int(1e9)
n, m = map(int, input().split())
graph = [[]for _ in range(n+1)]

for _ in range(m): #그래프 정보 추가하기
    a, b = map(int, input().split())
    graph[a].append((b, 1))
    graph[b].append((a, 1))
    
x, k = map(int, input().split()) #종착지 x, 경유지 k

start = 1

distance_k = [INF] * (n+1) #1 -> K로의 거리배열
distance_x = [INF] * (n+1) #k -> x로의 거리배열

def dijkstra(start, end, distance):
    #heap초기화 및 초기 위치, 거리값 설정
    q = []
    heapq.heappush(q, (0, start))
    distance[start] = 0
    
    while q: 
        dist, now = heapq.heappop(q) #매번마다 거쳐서 갈 노드를 선정
        if distance[now] < dist: 
            continue
        for i in graph[now]: #비교하며 업데이트 함
            cost = i[1] + dist #1은 now인덱스 노드와 다른 노드와의 거리를 의미
            if cost < distance[i[0]]: #거쳐감에도 거리가 짧다면 변경
                distance[i[0]] = cost
                heapq.heappush(q, (cost, i[0]))
            
    return distance[end]

result = dijkstra(1, k, distance_k) + dijkstra(k, x, distance_x)
if result > INF:
    print(-1)
else:
    print(result)

4 2
1 3
2 4
3 4
-1


In [31]:
#모범답안
#문제의 의도는 플로이드 워셜로 풀이를 요구했었음
INF = int(1e9)
n, m = map(int, input().split())
graph = [[INF] * (n + 1) for i in range(n + 1)] #그래프 정보를 INF로 초기화

#자기 자신에게 가는 비용을 0
for a in range(1, n + 1):
    for b in range(1, n + 1):
        if a == b:
            graph[a][b] = 0
            graph[b][a] = 0

#그래프 정보 추가하기
for _ in range(m):
    a, b = map(int, input().split())
    graph[a][b] = 1
    graph[b][a] = 1
    
x, k = map(int, input().split())

for k in range(1, n + 1): #경유지
    for a in range(1, n + 1): #출발
        for b in range(1, n + 1): #도착지
            graph[a][b] = min(graph[a][b], graph[a][k] + graph[k][b])
            
distance = graph[1][k] + graph[k][x]

if distance >= INF:
    print(-1)
else:
    print(distance)

4 2
1 3
2 4
3 4
-1


In [41]:
#실전문제 2. 전보
#개선된 다익스트라 알고리즘을 이용하여 구한다
import heapq
INF = int(1e9)
n, m, c = map(int, input().split())

graph = [[] for i in range(n + 1)]
for i in range(m):
    x, y, z = map(int, input().split())
    graph[x].append((y, z)) #x에서 y로 가는 시간정보 z를 추가

distance = [INF] * (n +1)

def dijsktra(c):
    q = []
    heapq.heappush(q, (0, c))
    distance[c] = 0
    
    while q:
        dist, now = heapq.heappop(q)
        if distance[now] < dist:
            continue
            
        for i in graph[now]:
            cost = dist + i[1]
            if cost < distance[i[0]]:
                distance[i[0]] = cost
                heapq.heappush(q, (cost, i[0]))
        
    cities = sum([i < INF and i > 0 for i in distance])
    time = max([i for i in distance if i < INF])
    
    return print(cities, time)

dijsktra(c)

3 2 1
1 2 4
1 3 2
2 4
