## 최단 경로 알고리즘

### 1.1. 최단 경로 문제란?
- 두 노드를 잇는 가장 짧은 경로를 찾기
- 가중치 그래프 (Weighted Graph)에서, 간선(Edge)의 가중치 합이 최소가 되는 경로를 찾기 

### 1.2. 최단 경로 문제 종류
1. 단일 출발 및 단일 도착 (Single-Source and Single-Destination Shortest Path Problem) 최단 경로 문제
  - 그래프 내의 특정 노드 u 에서 출발, 또다른 특정 노드 v 에 도착하는 가장 짧은 경로를 찾는 문제
<br><br>
2. 단일 출발 (Single-Source Shortest Path Problem) 최단 경로 문제
  - 그래프 내의 특정 노드 u 와 그래프 내 모든 다른 노드의 가장 짧은 경로를 찾는 문제
  - 예: A, B, C, D 라는 노드를 가진 그래프에서 특정 노드를 A 라고 한다면, A - B, A - C, A - D 의 각각의 가장 짧은 경로를 찾는 문제를 의미함
<br><br>
3. 전체 쌍 (All-Pair) 최단 경로: 그래프 내의 모든 노드 쌍 (u, v) 에 대한 최단 경로를 찾는 문제

### 2.1. 다익스트라 알고리즘 (Dijkstra Algorithm) - 최단 경로 알고리즘 
- 위 최단 경로 문제 종류 중, 2번에 해당
- 하나의 정점에서 **각 모든 노드 간의 가장 짧은 거리**를 구하기
- 첫 정점을 기준으로 연결되어 있는 정점들을 추가해가며, 최단 거리를 갱신하는 기법
<br><br>
- 다익스트라 알고리즘의 다양한 변형 로직이 있지만, 가장 개선된 방식이 **우선순위 큐**를 사용하는 것
    - 발견된 가장 짧은 거리의 노드에 대해서 먼저 계산
    - 불필요한 거리 계산 과정을 줄일 수 있음

### 2.2. 다익스트라 알고리즘 과정 

- 우선순위 큐(MinHeap)를 활용한 다익스트라 알고리즘

  1) 초기 설정 
     - **첫 정점부터 각 노드간의 거리 저장 배열** 만들기
         - 첫 정점의 거리(자기 자신과의 거리)는 0, 나머지는 거리는 무한대(inf)로 저장함
     - **우선순위 큐**에 [ 첫 정점, 거리 0 ]을 먼저 넣기
  <br><br>
  
  2) 우선순위 큐에서 가장 짧은 거리를 가진 노드를 꺼내기
     - 큐에서 정점이 꺼내짐
     - 정점에서 인접한 각 노드들에 대해, 
         - 정점이 지닌 거리가 배열에 기록된 거리 (현재까지 발견된 가장 짧은 거리) 보다 크다면, 인접 노드와의 거리 계산을 하지 않음
         - [ 정점이 지닌 거리 + 인접 노드 거리 ]와 현재 배열에 저장되어 있는 거리를 비교
     - 배열에 저장되어 있는 거리보다 더 짧을 경우, 배열에 해당 노드의 거리 업데이트
     - 거리가 업데이트된 경우, 우선순위 큐에 넣는다.
  <br><br>
  
  3) 2번의 과정을 우선순위 큐에서 꺼낼 노드가 없을 때까지 반복

### 3. 다익스트라 알고리즘 예시

<img src="https://www.fun-coding.org/00_Images/dijkstra.png" width=200>

#### 1단계: 초기화
<img src="https://www.fun-coding.org/00_Images/dijkstra_initial.png" width=800>

#### 2단계: 우선순위 큐에서 (A, 0) 추출 후, 인접 노드와의 거리 계산
<img src="https://www.fun-coding.org/00_Images/dijkstra_1st.png" width=800>

#### 3단계: 우선순위 큐에서 (C, 1) 추출 후, 인접 노드와의 거리 계산 
- 우선순위 큐가 MinHeap(최소 힙) 방식이므로, (C, 1), (D, 2), (B, 8) 중 (C, 1) 이 먼저 추출됨 (pop)
<br><br>
- 위 표에서 보듯이 1단계까지의 A-B 최단 거리는 8
- A-C 까지의 거리는 1 
<br><br>
- C 에 인접한 B, D에서 C-B는 5, 즉 A-C-B 는 1 + 5 = 6 이므로, A-B 최단 거리 8보다 더 작은 거리를 발견, 이를 배열에 업데이트
- 배열에 업데이트했으므로 (B, 6)가 우선순위 큐에 넣어짐. (현재까지 발견한 A-B 최단 거리)
<br><br>
- C-D 의 거리는 2, 즉 A-C-D 는 1 + 2 = 3 이므로, A-D의 현재 최단 거리 2 보다 긴 거리, 따라서 D 의 거리는 업데이트되지 않음

<img src="https://www.fun-coding.org/00_Images/dijkstra_2nd.png" width=800>

#### 4단계: 우선순위 큐에서 (D, 2) 추출 후,  인접한 노드와의 거리 계산
- 지금까지 접근하지 못했던 E와 F 거리가 계산됨
- A-D 까지의 거리인 2 에 D-E 가 3 이므로 이를 더해서 E, 5
- A-D 까지의 거리인 2 에 D-F 가 5 이므로 이를 더해서 F, 7

<img src="https://www.fun-coding.org/00_Images/dijkstra_3rd.png" width=800>

#### 5단계: 우선순위 큐에서 (E, 5) 추출 후, 인접한 노드와의 거리 계산
<img src="https://www.fun-coding.org/00_Images/dijkstra_3-2th.png" width=800>

#### 6단계: 우선순위 큐에서 (B, 6), (F, 6) 를 순차적으로 추출, 인접한 노드와의 거리 계산
- 예제 방향 그래프에서 B 노드는 다른 노드로 가는 길이 없음 
- F 노드는 A 노드로 가는 루트가 있으나, 현재 A-A 가 0 인 반면에 A-F-A 는 6 + 5 = 11, 즉 더 긴 거리이므로 업데이트되지 않음
<img src="https://www.fun-coding.org/00_Images/dijkstra_4th.png" width=800>

#### 6단계: 우선순위 큐에서 (F, 7), (B, 8) 를 순차적으로 추출, 인접한 노드와의 거리 계산
<img src="https://www.fun-coding.org/00_Images/dijkstra_5th.png" width=800>

### 4. 다익스트라 알고리즘 구현하기

<img src="https://www.fun-coding.org/00_Images/dijkstra.png" align="left" width=200>

In [22]:
mygraph = {
    'A': {'B': 8, 'C': 1, 'D': 2},
    'B': {},
    'C': {'B': 5, 'D': 2},
    'D': {'E': 3, 'F': 5},
    'E': {'F': 1},
    'F': {'A': 5}
}

In [25]:
# heapq 라이브러리로 우선순위 큐 사용하기
# 데이터가 리스트 형태일 경우, 0번 인덱스를 우선순위로 인지, 우선순위가 낮은 순서대로 pop 할 수 있음
import heapq

def dijkstra(graph, start):
    
    # 시작 정점에서 각 정점까지의 [최단 거리, 어디로부터 온 노드인지]를 저장할 딕셔너리를 생성하고, 무한대(inf)로 초기화
    distances = {}
    
    for vertex in graph:
        distances[vertex] = [float('inf'), start]
        
    # 그래프의 시작 정점의 거리는 0으로 초기화 해줌
    distances[start] = [0, start]

    # 우선순위 큐 생성 
    queue = []

    # 그래프의 시작 정점과 시작 정점의 거리(0)을 최소힙에 넣어줌 
    heapq.heappush(queue, [distances[start][0], start])

    while queue:
        
        # 큐에서 정점을 꺼내기
        current_distance, current_vertex = heapq.heappop(queue)
        
        # 꺼낸 정점의 거리가 더 길다면, 스킵
        if distances[current_vertex][0] < current_distance:
            continue
            
        # 인접한 정점들의 가중치를 모두 확인하여 업데이트
        for adjacent, weight in graph[current_vertex].items():
            
            distance = current_distance + weight
            
            # 현재 정점을 통해 가는 것이 더 가까울 경우, 거리 업데이트, 우선순위 큐에 넣어주기  
            if distance < distances[adjacent][0]:
                distances[adjacent] = [distance, current_vertex]
                heapq.heappush(queue, [distance, adjacent])
    
    return distances


def dijkstra_path(distances, start, end):

    path = [end]
    visited = end
    
    while distances[visited][1] != start:
        path.append(distances[visited][1])
        visited = distances[visited][1]
    
    path.append(start)
    
    path.reverse()
    
    return path

In [26]:
distance_arr = dijkstra(mygraph, 'A')
dijkstra_result = dijkstra_path(distance_arr, 'A', 'F')

print(distance_arr)
print(dijkstra_result)

{'A': [0, 'A'], 'B': [6, 'C'], 'C': [1, 'A'], 'D': [2, 'A'], 'E': [5, 'D'], 'F': [6, 'E']}
['A', 'D', 'E', 'F']


### 5. 알고리즘 분석

- 시간 복잡도 : $ O(Elog{E}) $
<br><br>

- 다익스트라 알고리즘은 크게 다음 두 가지 과정을 거침
  - 과정1: 각 노드마다 인접한 간선들을 모두 검사하는 과정
      - 각 노드는 최대 한 번씩 방문, 그래프의 모든 간선은 최대 한 번씩 검사
      - 따라서, 해당 과정의 시간 복잡도는 O(E) 
  - 과정2: 우선순위 큐에 노드/거리 정보를 넣고 삭제(pop)하는 과정
      - 최악의 시나리오는 그래프의 모든 간선이 검사될 때마다, 최단 거리가 갱신되고, 우선순위 큐에 추가되는 것
      - 이 때 추가는 각 간선마다 최대 한 번 일어날 수 있으므로, 최대 O(E)의 시간이 걸리고, 우선순위 큐를 유지하는 작업은 $ O(log{E}) $ 가 걸림
      - 따라서, 해당 과정의 시간 복잡도는 $ O(Elog{E}) $ 

- 과정1 + 과정2 = O(E) + $ O(Elog{E}) $  = $ O(E + Elog{E}) = O(Elog{E}) $