#### 0. 깊이 우선 탐색(Depth-First-Search)
- BFS : 너비우선탐색, 정점들과 같은 레벨(형제 노드)에 있는 노드를 먼저 탐색
- 한 단계씩 내려가면서, 해당 노드와 같은 레벨에 있는 노드를 탐색
- A => B => C => D => G => H => I => E => F => J
- DFS : 깊이우선탐색, 정점들의 자식들을 먼저 탐색
- 한 노드의 자식을 타고 끝까지 탐색한 후 다시 돌아와서 다른 형제 탐색
- A => B => D => E => F => C => G => H => I => J

In [1]:
# 파이썬으로 그래프 표현하는 방법
# 딕셔너리와 리스트를 활용
graph = dict()

graph['A'] = ['B', 'C'] # 'A'노드와 인접한 노드를 작성
graph['B'] = ['A', 'D']
graph['C'] = ['A', 'G', 'H', 'I']
graph['D'] = ['B', 'E', 'F']
graph['E'] = ['D']
graph['F'] = ['D']
graph['G'] = ['C']
graph['H'] = ['C']
graph['I'] = ['C', 'J']
graph['J'] = ['I']

In [2]:
graph

{'A': ['B', 'C'],
 'B': ['A', 'D'],
 'C': ['A', 'G', 'H', 'I'],
 'D': ['B', 'E', 'F'],
 'E': ['D'],
 'F': ['D'],
 'G': ['C'],
 'H': ['C'],
 'I': ['C', 'J'],
 'J': ['I']}

#### 1. DFS(Depth-First-Search)
- DFS는 깊이 우선 탐색이라 부른다.
- 스택 자료구조(or 재귀함수)와 큐를 이용한다.
- 한 노드의 자식을 타고 끝까지 탐색한 후 다시 돌아와서 다른 형제 탐색
- A => B => D => E => F => C => G => H => I => J 

##### DFS 탐색방법
- 탐색 시작노드를 스택에 삽입하고 방문 처리한다.
- 스택의 최상단 노드에 방문하지 않은 인접한 노드가 하나라도 있다면 그노드를 스택에 넣고 방문처리한다. 방문하지 않은 인접 노드가 없으면 최상단 노드를 꺼낸다.
- 더이상 2번의 과정을 수행할 수 없을 때까지 반복수행한다.

In [23]:
def dfs(graph, start_node):
    # 방문한 노드와 아직 방문하지 않은 노드를 담을 공간
    visited, need_visit = list(), list() # 비어 있음.
    need_visit.append(start_node) # A 넣었다
          
    while need_visit:           # pop은 Stack 구조와 동일하게 LIFO
        node = need_visit.pop() # A 끄낸다 => 중복 방문 피하기위해
        if node not in visited: # visited에 표시 없다면 
            visited.append(node) # A 넣기
            #             pop 함수를 사용하여 B가 아닌 C가 된다.
            need_visit.extend(reversed(graph[node])) # append와 동일, 뒤에 추가, 
                        # 여러개 넣을 수O, 다양한 자료형 넣을 수O 
            
    
    return visited

In [24]:
dfs(graph, 'A')

['A', 'B', 'D', 'E', 'F', 'C', 'G', 'H', 'I', 'J']

In [19]:
def bfs(graph, start_node):
    # 방문한 노드와 아직 방문하지 않은 노드를 담을 공간
    visited, need_visit = list(), list() # 비어 있음.
    need_visit.append(start_node) # A 넣었다
          
    while need_visit:           # pop은 Stack 구조와 동일하게 LIFO
        node = need_visit.pop(0) # pop()-> LIFO, pop(0) ->FIFO
        if node not in visited: # visited에 표시 없다면 
            visited.append(node) # A 넣기
            #             pop 함수를 사용하여 B가 아닌 C가 된다.
            need_visit.extend(graph[node]) # append와 동일, 뒤에 추가, 
                        # 여러개 넣을 수O, 다양한 자료형 넣을 수O 
    return visited

In [20]:
bfs(graph, 'A')

['A', 'B', 'C', 'D', 'G', 'H', 'I', 'E', 'F', 'J']

### 2. 최단경로 알고리즘
- 최단경로는 두 노드를 잇는 가장 짧은 경로를 찾는 알고리즘
- 그래프에서 간선의 가중치 합이 최소가 되도록 하는 경로를 찾는 것이 목적이다.
- 다익스트라 알고리즘 로직을 일반적으로 사용한다.

#### 다익스트라 알고리즘 : 하나의 정점에서 다른 모든 정점 간의 각각 짧은 거리를 구하는 알고리즘

#### 우선순위 큐를 활용한 다익스트라 알고리즘
- 우선순위 큐는 현재 가장 짧은 거리를 가진 노드 정보를 먼저 꺼낸다.
- step1. 첫 정점을 기준으로 배열(리스트)을 선언하고 첫 정점에서 각 정점에 가중치를 저장, 
        첫 정점 : 0, 나머지는 무한대(inf).<-이건 float 타입
        우선순위 큐에 첫정점만 먼저 넣는다.
- step2. 우선순위 큐의 노드를 꺼낸다 -> 첫 정점을 꺼낸다
        첫 정점에 인접한 노드에 대해 첫 정점에서 각 노드로 가는 거리와 현재 배열(리스트)에 
        저장되어 있는 첫 정점에서 해당 노드로 가는 거리가 더 짧을 경우, 배열에 해당 노드의 거리를 갱신.
        배열에 해당 노드의 거리가 업데이트된 경우, 우선순위 큐에 넣는다.
- step3. step2를 반복해서 우선순위 큐에 꺼낼 노드가 없을 경우, 프로그램 종료.

In [26]:
# 우선순위 큐 구현
import heapq

queue = []

heapq.heappush(queue, [3, 'A'])
heapq.heappush(queue, [7, 'B'])
heapq.heappush(queue, [1, 'C'])
heapq.heappush(queue, [10, 'D'])

print(queue) # 우선 순위 큐에 저장된 data 보여주는 것

for _ in range(len(queue)):
    print(heapq.heappop(queue))

[[1, 'C'], [7, 'B'], [3, 'A'], [10, 'D']]
[1, 'C']
[3, 'A']
[7, 'B']
[10, 'D']


In [53]:
# 탐색할 그래프의 시작 정점과 다른 정점들간의 거리 구하기
mygraph = {
    'A':{'B':8, 'C':1, "D":2},
    'B':{},
    'C':{'B':5, 'D':2},
    'D':{'E':3, 'F':5},
    'E':{'F':1},
    'F':{}
}

In [38]:
import heapq # 우선순위 큐를 사용하기 위한 모듈 로딩

def dijkatra(graph, first): # 탐색그래프값과 첫정점
    # 거리값을 초기화(inf)하는 작업
    distance = {node:float("inf") for node in graph} #키값을 읽어옴
    
    # 첫정점의 거리값은 0으로 초기화한다.
    distance[first] = 0
    
    # 우선순위 큐를 정의
    queue = []
    # 우선순위 큐에 첫 정점의 값을 넣어준다
    heapq.heappush(queue, [distance[first], first]) # 거리 : 값
    
    # queue에 데이터가 없을 때 까지 반복
    while queue:
        # 첫 정점에 값을 꺼낸다.
        current_distance, current_node = heapq.heappop(queue)
        
        # 우선순위 큐의 값이 더 클 경우 반복처리 할 필요 없음
        if distance[current_node] < current_distance:
            continue
            
        for adjacent, weight in graph[current_node].items():
            total_distance = current_distance + weight
            
            if total_distance < distance[adjacent]:
                distance[adjacent] = total_distance
                heapq.heappush(queue, [total_distance, adjacent])
    
    return distance

In [39]:
dijkatra(mygraph, 'A') # 각 정점의 최단 거리

{'A': 0, 'B': 6, 'C': 1, 'D': 2, 'E': 5, 'F': 6}

In [54]:
# 시작정점과 마지막정점을 이용해서 최단거리를 찾아 출력하는 프로그램
# 최단경로를 출력
import heapq # 우선순위 큐를 사용하기 위한 모듈 로딩

def dijkatra(graph, start, end): # 탐색그래프값과 시작점과 마지막점
    # 시작정점에서 각 정점까지의 거리를 초기화 작업, 딕션으로 만들어 다 무한으로 준다.
    distance = {node:[float("inf"), start] for node in graph} #키값을 읽어옴
    
    # 시작정점의 거리를 0으로 초기화 작업.
    distance[start] = [0, start] 
    
    # 모든 정점이 저장될 큐를 생성
    queue = []
    
    # 시작정점과 시작정점의 거리 우선순위 큐에 담는 작업
    heapq.heappush(queue, [distance[start][0], start]) # 거리 : 값
    
    # queue에 데이터가 없을 때 까지 반복
    while queue:
        # 큐에서 정점을 하나씩 꺼내서 인접한 정점들의 거리를 확인.
        current_distance, current_node = heapq.heappop(queue)
        
        # 더 짧은 거리가 큐에 존재한다면 무시
        if distance[current_node][0] < current_distance:
            continue
            
        for adjacent, weight in graph[current_node].items():
            total_distance = current_distance + weight
            
            # 만약에 시작정점에서 인접정점으로 가는 것보다
            # 현재 정점을 거쳐가는 것이 가까울 경우
            if total_distance < distance[adjacent][0]:
                # 거리를 갱신하는 작업
                distance[adjacent] = [total_distance, current_node]
                heapq.heappush(queue, [total_distance, adjacent])
    
    
    # 마지막노드부터 첫 번째 노드까지 순서대로 출력하는 작업
    path = end
    
    output = end + " => "
    while distance[path][1] != start:
        output += distance[path][1] + " => "
        path = distance[path][1]
        
    output += start
    print(output)
    return distance

In [55]:
dijkatra(mygraph, 'A', 'F')

F => E => D => A


{'A': [0, 'A'],
 'B': [6, 'C'],
 'C': [1, 'A'],
 'D': [2, 'A'],
 'E': [5, 'D'],
 'F': [6, 'E']}

### 3. 최소 신장 트리(Kruskal Algorithm)
- Spanning Tree : 신장트리
- 그래프처럼 모든 노드가 연결되어 있으면서 트리의 속성을 만족
- 신장 트리의 조건 : 모든 노드를 포함, 모든 노드가 서로 연결, 사이클이 존재하지 않는다.
- 최소 신장 트리 : MST, 간선의 가중치의 합이 최소인거
- 대표적인 최소 신장 알고리즘은 크루스칼 알고리즘이다.

#### 크루스칼 알고리즘(Kruskal's Algorithm)
- 모든 정점을 독립적인 집합으로 만든다.
- 모든 간선을 비용(가중치) 기준으로 정렬하고, 비용이 작은 간선부터 양 끝의 두정점을 비교한다.
- 두 정점의 최상위 정점을 확인하고, 서로 다른 경우 두 정점을 연결한다.
- 탐욕 알고리즘을 기초로 한다.

In [None]:
# ssabi.tistory.com/60

In [None]:
# 최소 신장 트리를 이용해 계산한 그래프
mygraph = {
    # 노드를 리스트로 담는다.
    'v':['A', 'B', 'C', 'D', 'E', 'F', 'G'],
    # 간선을 리스트로(가중치, 각끝점)
    'e':[(7, 'A', 'B'), (5, 'A', 'D'), (7, 'B', 'A'), (8, 'B', 'C'), (9, 'B', 'D')
        (7, 'B', 'E'), (8, 'C', 'B'), (5, 'C', "E"), (5, 'D', 'A'), (9, 'D', 'B')
        (7, 'D', 'E'), (6, 'D', 'F'), (7, 'E', 'B'), (5, 'E', 'C'), (7, 'E', 'D')
        (8, 'E', 'F'), (9, "E", 'G'), (6, 'F', 'D'), (8, 'F', 'E'), (11, 'F', 'G')
        (9, 'G', 'E'), (11, 'G', 'F')]
}