### 최단 경로 문제란?
* 최단 경로 문제란 두 노드를 잇는 가장 짧으 경로를 찾는 문제임
* 가중치 그래프에서 간선의 가중치 합이 최소가 되도록 하는 경로를 찾는 것이 목적

### 최단 경로 문제 종류
1. 단일 출발 및 단일 도착 최단 경로 문제
  * 그래프 내의 특정 노드 u에서 출발, 또 다른 특정 노드 v에 도착하는 가장 짧은 경로를 찾는 문제
2. 단일 출발 최단 경로 문제
  * 그래프 내의 특정 노드 u와 그래프 내 다른 모든 노드 각각의 가장 짧은 경로를 찾는 문제
3. 전체 쌍 최단 경로: 그래프 내의 모든 노드 쌍(u, v)에 대한 최단 경로를 찾는 문제

### 2. 최단 경로 알고리즘 - 다익스트라 알고리즘
* 다익스트라 알고리즘은 위의 최단 경로 문제 종류 중, 2번에 해당
  * 하나의 정점에서 다른 모든 정점 간의 각각 가장 짧은 거리를 구하는 문제

### 다익스트라 알고리즘 로직
* 첫 정점을 기준으로 연결되어 있는 정점들을 추가해 가며, 최단거리를 갱신하는 기법
* 다익스트라 알고리즘은 너비우선탐색과 유사
  * 첫 정점부터 각 노드간의 거리를 저장하는 배열을 만든 후, 첫 정점의 인접 노드 간의 거리부터 먼저 계산하면서 업데이트

### 가장 개선된 다익스트라 알고리즘: 우선순위 큐 사용
* 우선순위 큐 사용 장점
  * 지금까지 발견된 가장 짧은 거리의 노드에 대해서 먼저 계산
  * 더 긴 거리로계산된 루트에 대해서는 계산을 스킵할 수 있음

### 다익스트라 알고리즘 구현 (우선순위 큐 활용 포함)

#### 기초

In [1]:
import heapq

In [2]:
queue = [] # 최소힙의 구조를 가진 우선순위 큐를 만듦

heapq.heappush(queue, [2, 'A'])
heapq.heappush(queue, [5, 'B'])
heapq.heappush(queue, [1, 'C'])
heapq.heappush(queue, [7, 'D'])

In [4]:
print(queue)
for index in range(len(queue)):
    print(heapq.heappop(queue))

[[1, 'C'], [5, 'B'], [2, 'A'], [7, 'D']]
[1, 'C']
[2, 'A']
[5, 'B']
[7, 'D']


In [7]:
mygraph = {
    'A': {"B": 8, "C": 1, "D": 2},
    'B': {},
    'C': {'B': 5, 'D': 2},
    'D': {'E': 3, 'F': 5},
    'E': {'F': 1},
    'F': {'A': 5}
}

In [39]:
## 다익스트라 알고리즘 직접 구현
import numpy as np
import heapq


def dstra(mygraph, start_node):
    min_distance_dict = {"A": np.inf, "B": np.inf, "C": np.inf,
                         "B": np.inf, "C": np.inf, "D": np.inf,
                         "E": np.inf, "F": np.inf}
    queue = []
    heapq.heappush(queue, [0, start_node])
    min_distance_dict[start_node] = 0
    
    while len(queue) > 0:
        current = heapq.heappop(queue)
        if current[0] <= min_distance_dict[current[1]] or current[1] == start_node:
            for node, distance in mygraph[current[1]].items():
                if current[0] + distance < min_distance_dict[node]:
                    min_distance_dict[node] = current[0] + distance
                    heapq.heappush(queue, [current[0] + distance, node])
    return min_distance_dict

In [47]:
## 다익스트라 알고리즘 직접 구현2
import heapq


def dstra(mygraph, start_node):
    min_distance_dict = {node: float("inf") for node in mygraph}
    queue = []
    heapq.heappush(queue, [0, start_node])
    min_distance_dict[start_node] = 0
    
    while queue:
        current = heapq.heappop(queue)
        if current[0] <= min_distance_dict[current[1]] or current[1] == start_node:
            for node, distance in mygraph[current[1]].items():
                total_distance = current[0] + distance
                if total_distance < min_distance_dict[node]:
                    min_distance_dict[node] = total_distance
                    heapq.heappush(queue, [total_distance, node])
    return min_distance_dict

In [48]:
dstra(mygraph, 'A')

{'A': 0, 'B': 6, 'C': 1, 'D': 2, 'E': 5, 'F': 6}

In [59]:
import heapq

def dijkstra(graph, start):
    distances = {node: float('inf') for node in graph}
    distances[start] = 0    
    queue = []
    heapq.heappush(queue, [distances[start], start])

    while queue:
        current_distance, current_node = heapq.heappop(queue)
        
        if distances[current_node] < current_distance:
            continue
        
        for adjacent, weight in graph[current_node].items():
            distance = current_distance + weight

            if distance < distances[adjacent]:
                distances[adjacent] = distance
                heapq.heappush(queue, [distance, adjacent])
    return distances

In [60]:
dijkstra(mygraph, "A")

{'A': 0, 'B': 6, 'C': 1, 'D': 2, 'E': 5, 'F': 6}

## 시간 복잡도

* 과정1: 각 노드마다 인접한 간선들을 모두 검사하는 과정
* 과정2: 우선순위 큐에 노드/거리 정보를 넣고 삭제(pop)하는 과정

* 과정1에서 각 노드는 최대 한 번씩 방문하므로, 그래프의 모든 간선은 최대 한 번씩 검사함
  * 즉, 각 노드마다 인접한 간선들을 모두 검사하는 과정은 O(E) 시간이 걸림, E는 간선 (edge)의 약자
* 과정2에서 우선순위 큐에 가장 많은 노드, 거리 정보가 들어가는 경우, 우선순위큐에 노드/거리 정보를 넣고, 삭제하는 과정이 최악의 시간이 걸림.
  * 우선순위 큐에 가장 많은 노드, 거리 정보가 들어가는 시나리오는 그래프의 모든 간선이 검사될 때마다, 배열의 최단 거리가 갱신되고, 우선순위 큐에 노드/거리가 추가되는 것임
  * 이 때 추가는 각 간선마다 최대 한 번 일어날 수 있으므로, 최대 O(E)의 시간이 걸리고, O(E) 개의 노드/거리 정보에 대해 우선순위 큐를 유지하는 작업은 $O(logE$)가 걸림
  * 따라서 해당 과정의 시간 복잡도는 $O(ElogE$)


### 총 시간 복잡도
* 과정1 + 과정2 = $O(E)$ + $O(ElogE$) = $O(E + ElogE$) = $O(ElogE$)