- 특정 지점까지 가장 빠르게 도달하는 방법을 찾는 알고리즘

# Chapter 09. 최단 경로 (Shortest Path)
## 9-1. 가장 빠르게 도달하는 방법

- 말 그대로 가장 짧은 경로를 찾는 알고리즘
- 길 찾기 문제라고도 불린다.
- 최단 경로 알고리즘 유형에는 다양한 종류가 있는데, 상황에 맞는 효율적인 알고리즘이 이미 정립되어있음.
> - 한 지점에서 다른 특정 지점까지의 최단경로 구하기
> - 모든 지점에서 다른 모든 지점까지의 최단 경로를 모두 구해야 하는 경우 등


- 최단 경로 문제는 보통 그래프를 이용해 표현하는데 각 지점은 그래프에서 **'노드'**로 표현
- 지점간 연결된 도로는 그래프에서 **'간선'**으로 표현


- 다루는 최단 거리 알고리즘:
> - 다익스트라 최단 경로
> - 플로이드 워셜 알고리즘
- +앞서 공부한 그리디 알고리즘과 다이나믹 프로그래밍 알고리즘이 최단 경로 알고리즘에 그대로 적용됨

## 9-2. 다익스트라 (Dijkstra) 최단 경로 알고리즘

- 그래프에서 여러 개의 노드가 있을 때, 특정한 노드에서 출발하여 다른 노드로 가는 각각의 최단 경로를 구해주는 알고리즘
- 다익스트라 최단 경로 알고리즘은 기본적으로 그리디 알고리즘으로 분류함
    - 매번 '가장 비용이 적은 노드'를 선택해서 임의의 과정을 반복하기 때문
    
    
- 알고리즘의 원리:
> 1. 출발 노드를 설정
> 2. 최단 거리 테이블을 초기화
> 3. 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택
> 4. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신
> 5. 위 과정에서 3,4번을 반복

- 다익스트라 알고리즘은 최단 경로를 구하는 과정에서 '각 노드에 대한 현재까지의 최단 거리' 정보를 항상 1차원 리스트에 저장하며 리스트를 계속 갱신한다는 특징이 있다.
- '방문하지 않은 노드 중에서 현재 최단 거리가 가장 짧은 노드를 확인'해 그 노드에 대하여 4번 과정을 수행한다 -> 그리디 알고리즘으로 볼 수 있다.


- 다익스트라 알고리즘을 구현하는 방법은 2가지:
    1. 구현하기 쉽지만 느리게 동작하는 코드
    2. 구현하기에 조금 더 까다롭지만 빠르게 동작하는 코드
    - ✨**방법 2를 정확히 이해하고 구현할 수 있을 때까지 연습해야함!**✨


- 다익스트라 최단 경로 알고리즘에서는 <U>**'방문하지 않은 노드 중에서 가장 최단 거리가 짧은 노드를 선택'**</U>하는 과정을 반복
    - 이렇게 선택된 노드는 '최단 거리'가 완전히 선택된 노드이므로, 더 이상 알고리즘을 반복해도 최단거리가 줄어들지 않는다.
    
    - 다시 말해, 다익스트라 알고리즘이 진행되면서 **한 단계당 하나의 노드에 대한 최단 거리를 확실히 찾는 것으로 이해**할 수 있다.
    
    
## 방법 1. 간단한 다익스트라 알고리즘

- $V$:노드의 개수
- 간단한 다익스트라 알고리즘의 시간 복잡도: $O(V^2)$
- 이 알고리즘은 직관적이고 쉽게 이해할 수 있다.
>    - 처음에 각 노드에 대한 최단 거리를 담는 1차원 리스트를 선언
>    - 이후에 단계마다 
>        - 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택하기 위해서
>        - 매 단계마다 1차원 리스트의 모든 원소를 확인(순차 탐색)
- 입력되는 데이터의 수가 많다는 가정하에 파이썬 내장 함수인 `input()`을 더 빠르게 동작하는 `sys.std.realine()`으로 치환하여 사용하는 방법을 적용






In [1]:
### 간단한 다익스트라 알고리즘 소스코드 ###
#import sys
#input = sys.stdin.readline
INF = int(1e9) # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수, 간선의 개수를 입력받기
n, m = map(int, input().split())
# 시작 노드 번호를 입력받기
start = int(input())
# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for i in range(n + 1)]
# 방문한 적이 있는지 체크하는 목적의 리스트를 만들기
visited = [False] * (n + 1)
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n + 1)

# 모든 간선 정보를 입력받기
for _ in range(m):
    a, b, c = map(int, input().split())
    # a번 노드에서 b번 노드로 가는 비용이 c라는 의미
    graph[a].append((b, c))

# 방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환
def get_smallest_node():
    min_value = INF
    index = 0 # 가장 최단 거리가 짧은 노드(인덱스)
    for i in range(1, n + 1):
        if distance[i] < min_value and not visited[i]:
            min_value = distance[i]
            index = i
    return index

def dijkstra(start):
    # 시작 노드에 대해서 초기화
    distance[start] = 0
    visited[start] = True
    for j in graph[start]:
        distance[j[0]] = j[1]
    # 시작 노드를 제외한 전체 n - 1개의 노드에 대해 반복
    for i in range(n - 1):
        # 현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
        now = get_smallest_node()
        visited[now] = True
        # 현재 노드와 연결된 다른 노드를 확인
        for j in graph[now]:
            cost = distance[now] + j[1]
            # 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
            if cost < distance[j[0]]:
                distance[j[0]] = cost

# 다익스트라 알고리즘을 수행
dijkstra(start)

# 모든 노드로 가기 위한 최단 거리를 출력
for i in range(1, n + 1):
    # 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
    if distance[i] == INF:
        print("INFINITY")
    # 도달할 수 있는 경우 거리를 출력
    else:
        print(distance[i])

6 11
1
1 2 2
1 3 5
1 4 1
2 3 3
2 4 2
3 2 3
3 6 5
4 3 3
4 5 1
5 3 1
5 6 2
0
2
3
1
2
4


- 노드의 개수가 10,000개를 넘어가면 이 코드로는 문제를 해결하기 어렵다
- 노드의 개수 및 간선의 개수가 많을 때는 '개선된 다익스트라 알고리즘'을 이용해야 한다.

## 방법 2. 개선된 다익스트라 알고리즘

- 다익스트라 최단 경로 문제를 최악의 경우에도 시간 복잡도 $O(E \log V)$를 보장하여 해결할 수 있다.
    - $V$: 노드의 개수
    - $E$: 간선의 개수
    
    
- 최단 거리가 가장 짧은 노드를 단순히 선형적으로 찾는 것이 아니라 더욱더 빠르게 찾을 수 있다면?
- 알고리즘의 시간 복잡도를 더욱 줄일 수 있을 것이다.


- 개선된 다익스트라 알고리즘에서는 **힙(Heap)** 자료구조를 사용한다.
    - 힙 자료구조를 이용하면 특정 노드까지의 최단 거리에 대한 정보를 힙에 담아서 철
    - 출발 노드로부터 가장 거리가 짧은 노드를 더욱 빠르게 찾을 수 있다.
    
    
### 힙 설명

- 힙 자료구조는 우선순위 큐(Priority Queue)를 구현하기 위하여 사용하는 자료구조 중 하나
    - 우선순위 큐: 우선순위가 가장 높은 데이터를 가장 먼저 삭제한다는 특징이 있다.
    
|자료구조|추출되는 데이터|
|---|---|
|스택(Stack)|가장 나중에 삽입된 데이터|
|큐(Queue)|가장 먼저 삽입된 데이터|
|우선순위 큐(Priority Queue)|가장 우선순위가 높은 데이터|


- 파이썬에서 우선순위 큐가 필요할 때 `heapq`를 사용한다.

- 우선순위 큐를 구현할 때는 내부적으로 최소 힙(Min Heap) 또는 최대 힙(Max Heap)을 이용
    - 최소 힙을 이용 -> 값이 낮은 데이터가 먼저 삭제 (기본적인 파이썬 라이브러리)
    - 최대 힙을 이용 -> 값이 큰 데이터가 먼저 삭제
    
- 데이터의 개수가 N개일 때, 구현 방식에 따라서 시간 복잡도를 비교한 내용



|구현 방식|삽입 시간|삭제 시간|
|:---:|:---:|:---:|
|리스트| O(1) |O(N)|
|힙(Heap)|O(log N)|O(log N)|

- 힙을 이용하는 경우 모든 원소를 저장한 뒤에 우선순위에 맞게 빠르게 뽑아낼 수 있으므로
- <U>힙은 '우선순위 큐'를 구현하는 데 가장 많이 사용된다.</U>


- 파이썬의 우선순위 큐 라이브러리는 최소 힙에 기반
- $\Rightarrow$ 우리는 이러한 최소 힙을 다익스트라 최단 경로 알고리즘에 적용할 것이다.


> - 최단 거리를 저장하기 위한 1차원 리스트(최단 거리 테이블)는 그대로
> - 현재 가장 가까운 노드를 저장하기 위한 목적으로만 우선순위 큐를 추가로 이용


In [3]:
# 개선된 다익스트라 알고리즘 소스코드

import heapq
INF = int(1e9) # 무한을 의미하는 값으로 10억을 설정

In [6]:
# 노드의 개수, 간선의 개수를 입력받기
n, m = map(int, input().split())
# 시작 노드 번호를 입력받기
start = int(input())
# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for i in range(n + 1)]
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n + 1)

6 11
1


In [7]:
# 모든 간선 정보를 입력받기
for _ in range(m):
    a, b, c = map(int, input().split())
    # a번 노드에서 b번 노드로 가는 비용이 c라는 의미
    graph[a].append((b, c))

1 2 2
1 3 5
1 4 1
2 3 3
2 4 2
3 2 3
3 6 5
4 3 3
4 5 1
5 3 1
5 6 2


In [8]:
def dijkstra(start):
    q = []
    
    # 시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
    heapq.heappush(q, (0,start))
    
    distance[start] = 0
    
    while q: #큐가 비어있지 않다면
        
        # 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
        dist, now = heapq.heappop(q)
        
        # 현재 노드가 이미 처리된 적이 있는 노드라면 무시
        if distance[now] < dist:
            continue
        
        # 현재 노드와 연결된 다른 인접한 노드들을 확인
        for i in graph[now]:
            cost = dist + i[1]
            
            # 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
            if cost < distance[i[0]]:
                distance[i[0]] = cost
                heapq.heappush(q, (cost, i[0]))

In [9]:
# 다익스트라 알고리즘을 수행
dijkstra(start)

In [10]:
# 모든 노드로 가기 위한 최단 거리를 출력
for i in range(1, n+1):
    # 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
    if distance[i] == INF:
        print("INFINITY")
        
    # 도달할 수 있는 경우 거리를 출력
    else:
        print(distance[i])

0
2
3
1
2
4


### 개선된 다익스트라 알고리즘의 시간 복잡도

- 개선된 다익스트라 알고리즘은 시간 복잡도가 $O(E \log V)$로 훨씬 빠르다.
- 한 번 처리된 노드는 더 이상 처리되지 않는다.


- 우선순위 큐는 실제로는 단순히 힙 자료구조로 구현할 수 있다.
    - '항상 가장 작은 값이 먼저 나온다'라는 특징을 지키면서,
    - 단일 데이터의 삽입과 삭제연산을 $O(\log N)$에 수행하는 `heapq` 라이브러리를 이용하면 된다.
    
    
## 9-3. 플로이드 워셜 알고리즘 (Floyd-Warshall Algorithm)

- **플로이드 워셜 알고리즘 (Floyd-Warshall Algorithm)**: 모든 지접에서 다른 모든 지점까지의 최단 경로를 모두 구해야 하는 경우에 사용할 수 있는 알고리즘
- 플로이드 워셜 알고리즘 또한 단계마다 '거쳐 가는 노드'를 기준으로 알고리즘을 수행
- 노드의 개수가 N개일 때 알고리즘상으로 N번의 단계를 수행하며, 단계마다 $O(N^2)$의 연산을 통해 현재 노드를 거쳐 가는 모든 경로를 고려한다.
    - 따라서 플로이드 워셜 알고리즘의 총시간 복잡도는 $O(N^3)$이다.
 
 
- 2차원 리스트에 '최단 거리' 정보를 저장
    - 모든 노드에 대하여 다른 모든 노드로 가는 최단 거리 정보를 담아야 하기 때문이다.
    
    
- 다익스트라 알고리즘: 그리디 알고리즘
- 플로이드 워셜 알고리즘: 다이나믹 프로그래밍
    - 노드의 개수가 N이라고 할 때, N번 만큼의 단계를 반복하며 '점화식에 맞게' 2차원 리스트를 갱신하기 때문
    
    
    
    


> - 알고리즘에서는 현재 확인하고 있는 노드를 제외하고, N-1개의 노드 중에서 서로 다른 노드 $(A,B)$ 쌍을 선택한다.
> - 이후에 A $\rightarrow$ 1번 노드 $\rightarrow$ B로 가는 비용을 확인한 뒤에 최단 거리를 갱신한다.
> - 다시말해 $_{N-1}P_{2}$개의 쌍을 단계마다 반복해서 확인하면 된다.


- 구체적인 (K번의 단계에 대한) 점화식은 다음과 같다:
$$D_{ab} = \min(D_{ab}, D_{ak} + D_{kb})$$
    - A에서 B로 가는 최소비용과 A에서 K를 거쳐 B로 가는 비용을 비교하여 더 작은 값으로 갱신하겠다.
 

In [15]:
INF = int(1e9) # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수 및 간선의 개수를 입력받기
n = int(input())
m = int(input())
# 2차원 리스트(그래프 표현)를 만들고, 모든 값을 무한으로 초기화
graph = [[INF] * (n + 1) for _ in range(n + 1)]

# 자기 자신에서 자기 자신으로 가는 비용은 0으로 초기화
for a in range(1, n + 1):
    for b in range(1, n + 1):
        if a == b:
            graph[a][b] = 0

# 각 간선에 대한 정보를 입력 받아, 그 값으로 초기화
for _ in range(m):
    # A에서 B로 가는 비용은 C라고 설정
    a, b, c = map(int, input().split())
    graph[a][b] = c

# 점화식에 따라 플로이드 워셜 알고리즘을 수행
for k in range(1, n + 1):
    for a in range(1, n + 1):
        for b in range(1, n + 1):
            graph[a][b] = min(graph[a][b], graph[a][k] + graph[k][b])

# 수행된 결과를 출력
for a in range(1, n + 1):
    for b in range(1, n + 1):
        # 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
        if graph[a][b] == 1e9:
            print("INFINITY", end=" ")
        # 도달할 수 있는 경우 거리를 출력
        else:
            print(graph[a][b], end=" ")
    print()

4
7
1 2 4
1 4 6
2 1 3
2 3 7
3 1 5
3 4 4
4 3 2
0 4 8 6 
3 0 7 9 
5 9 0 4 
7 11 2 0 


## 실전 문제 1. 미래도시

### 문제 설명

- 공중 미래 도시에는 1번부터 N번까지의 회사가 있다.
- 따라서 방문 판매원 A는 1번 회사에서 출발하여 K번 회사를 방문한 뒤에 X번 회사로 가는 것이 목표
- 방문 판매원이 회사 사이를 이동하게 되는 최소 시간을 계산하는 프로그램을 작성하시오.



### 문제 해설

- 이 문제는 전형적인 플로이드 워셜 알고리즘 문제
- 문제에서 N의 범위가 100 이하로 매우 한정적이다 -> 따라서 플로이드 워셜 알고리즘을 이용해도 빠르게 풀 수 있다.
- 💡이 문제의 핵심 아이디어:
    - 1번 노드에서 K를 거쳐 X로 가는 최단 거리 = 1번 노드에서 K까지의 최단 거리 + K에서 X까지의 최단거리

In [19]:
# 답안 예시 #

INF = int(1e9) # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수 및 간선의 개수를 입력받기
n, m = map(int, input().split())

# 2차원 리스트(그래프 표현)를 만들고, 모든 값을 무한으로 초기화
graph = [[INF]*(n+1) for _ in range(n+1)]

# 자기 자신에서 자기 자신으로 가는 비용은 0으로 초기화
for a in range(1, n+1):
    for b in range(1, n+1):
        if a == b:
            graph[a][b] = 0
            
# 각 간선에 대한 정보를 입력받아, 그 값으로 초기화
for _ in range(m):
    # A와 B가 서로에게 가는 비용은 1이라고 설정
    a, b = map(int, input().split())
    graph[a][b] = 1
    graph[b][a] = 1
    
    
# 거쳐 갈 노드 X와 최종 목적지 노드 K를 입력받기
x, k = map(int, input().split())


5 7
1 2
1 3
1 4
2 4
3 4
3 5
4 5
4 5


In [20]:
# 점화식에 따라 플로이드 워셜 알고리즘을 수행

for k in range(1, n+1):
    for a in range(1, n+1):
        for b in range(1, n+1):
            graph[a][b] = min(graph[a][b], graph[a][k] + graph[k][b])

In [22]:
# 수행된 결과를 출력
distance = graph[1][k] + graph[k][x]
if distance >= INF:
    print("-1")
else:
    print(distance)

3


## 실전문제 2. 전보
### 문제 설명





- 어떤 나라에는 N개의 도시가 있다
- 도시 C에서 메시지가 출발하여 각 도시 사이에 설치된 통로를 거쳐, 최대한 많이 퍼져나갈 것이다.
- 각 도시의 번호와 통로가 설치되어 있는 정보가 주어졌을 때, 도시 C에서 보낸 메시지를 받게 되는 도시의 개수는 총 몇 개이며 도시들이 모두 메시지를 받는 데까지 걸리는 시간은 얼마인지 계산하는 프로그램을 작성하시오.

### 문제 해설

- 이 문제를 들여다보면 한 도시에서 다른 도시까지의 최단 거리 문제로 치환할 수 있으므로 다익스트라 알고리즘을 이용해서 풀 수 있다.
- 또한 N과 M의 범위가 충분히 크기 때문에, 우선순위 큐를 이용하여 다익스트라 알고리즘을 작성해야 한다.

In [26]:
# 답안 예시

import heapq
INF = int(1e9) # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수, 간선의 개수, 시작 노드를 입력받기
n, m, start = map(int, input().split())
# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for i in range(n + 1)]
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n + 1)

# 모든 간선 정보를 입력받기
for _ in range(m):
    x, y, z = map(int, input().split())
    # X번 노드에서 Y번 노드로 가는 비용이 Z라는 의미
    graph[x].append((y, z))

3 2 1
1 2 4
1 3 2


In [27]:
def dijkstra(start):
    q = []
    
    # 시작 노드로 가기 위한 최단 경로는 0으로 설정하며, 큐에 삽입
    heapq.heappush(q, (0,start))
    distance[start] = 0
    
    while q: # 큐가 비어있지 않다면
        # 가장 최단 거리가 짧은 노드에 대한 정보를 꺼내가
        dist, now = heapq.heappop(q)
        if distance[now] < dist:
            continue
            
        # 현재 노드와 연결된 다른 인접한 노드들을 확인
        for i in graph[now]:
            cost = dist + i[1]
            
            # 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
            if cost < distance[i[0]]:
                distance[i[0]] = cost
                heapq.heappush(q, (cost, i[0]))
                
        

In [29]:
# 다익스트라 알고리즘을 수행
dijkstra(start)

# 도달할 수 있는 노드의 개수
count = 0
# 도달할 수 있는 노드 중에서, 가장 멀리 있는 노드와의 최단 거리
max_distance = 0
for d in distance:
    # 도달할 수 있는 노드인 경우
    if d != 1e9:
        count += 1
        max_distance = max(max_distance, d)

# 시작 노드는 제외해야 하므로 count - 1을 출력
print(count - 1, max_distance)

2 4


In [30]:
3

3

In [31]:
2

2