### 그래프 탐색 알고리즘 : DFS / BFS

- 탐색(search)이란 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정을 말합니다
- 대표적인 그래프 탐색 알고리즘으로는 DFS와 BFS가 있습니다

#### 스택 자료구조 (pop 활용)

- 먼저 들어온 데이터가 나중에 나가는 선입후출 방식의 자료구조입니다
- 입구와 출구가 동일한 형태로 스택을 시각화 할 수 있습니다

In [3]:
stack = []
stack.append(5)
stack.append(2)
stack.append(3)
stack.append(7)
stack.pop()
stack.append(1)
stack.append(4)
stack.pop()
print(stack)
print(stack[::-1]) # 역순

[5, 2, 3, 1]
[1, 3, 2, 5]


#### 큐 자료구조(popleft 활용)

- 먼저 들어온 데이터가 먼저 나가는 선입선출 방식의 자료구조입니다
- 큐는 입구와 출구가 모두 뚫려 있는 터널과 같은 형태로 시각화 할 수 있습니다

In [11]:
from collections import deque
# list를 이용하여 큐를 구현하면 시간복잡도가 높기에 비효율적임 deque 쓰세요
que = deque()
que.append(5)
que.append(2)
que.append(3)
que.append(7)
que.popleft()
que.append(1)
que.append(4)
que.popleft()
print(que)
que.reverse()
print(que)

deque([3, 7, 1, 4])
deque([4, 1, 7, 3])


In [14]:
que[0:4] # deque는 인덱싱은 가능하지만 슬라이싱은 안됩니다

TypeError: sequence index must be integer, not 'slice'

#### 재귀함수

- 재귀함수(recursive function)은 자기 자신을 다시 호출하는 함수를 의미합니다
- 재귀함수는 어느 정도 출력하다가 최대 재귀 깊이 초과 메시지가 출력됩니다

In [38]:
# 팩토리얼 재귀 함수
def factorial(n):
    if n <= 1: # 종료 조건
        return 1
    return n * factorial(n-1) # 재귀함수

factorial(10)

3628800

In [42]:
# 유클리드 호제법 재귀 함수
# Greatest Common Divisor(GCD)
def GCD(a, b):
    if a > b:
        r = a % b # 두 자연수 a,b에 대하여 a를 b로 나눈 나머지를 r이라 한다
        if r == 0:
            return b # 이때 a와 b의 최대공약수는 b와 r의 최대공약수와 같다
    return GCD(b, r)

GCD(192, 162)

6

재귀 함수를 잘 활용하면 복잡한 알고리즘을 간결하게 작성할 수 있습니다  
단, 오히려 다른 사람이 이해하기 어려운 형태의 코드가 될 수도 있으므로 신중하게 사용해야 합니다  
모든 재귀함수는 반복문을 이용하여 동일한 기능을 구현할 수 있습니다  
재귀 함수가 반복문보다 유리한 경우도 있고 불리한 경우도 있습니다  
컴퓨터가 함수를 연속적으로 호출하면 컴퓨터 메모리 내부의 스택 프레임에 쌓입니다  
그래서 스택을 사용해야 할 때 구현상 스택 라이브러리 대신에 재귀 함수를 이용하는 경우가 많습니다

#### DFS (Depth-First Search)

- DFS는 깊이 우선 탐색이라고도 부르며 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘입니다
- DFS는 스택 자료구조(혹은 재귀함수)를 이용하여, 구체적인 동작과정은 다음과 같습니다
    1. 탐색 시작 노드를 스택에 삽입하고 방문처리를 합니다
    2. 스택의 최상단 노드에 방문하지 않은 인접한 노드가 하나라도 있으면 그 노드를 스택에 넣고 방문처리합니다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼냅니다
    3. 더 이상 2번의 과정을 수행할 수 없을 때까지 반복합니다

In [46]:
# 그래프 문제는 2차원 리스트 형태의 데이터를 다룹니다
# 인덱스 노드와 인접 노드를 표현한 인접 리스트 방식
graph = [
    [],
    [2, 3, 8],
    [1, 7],
    [1, 4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]
visited = [False] * 9

def dfs(graph, v, visited):
    visited[v] = True # v 위치는 방문 처리.
    print(v, end=" ")
    for i in graph[v]: # 모든 리스트를 훑어봄.
        if not visited[i]: # 방문하지 않은 부분은
            dfs(graph, i, visited) # graph에 맞게 방문 처리 하겠음.

dfs(graph, 1, visited)

1 2 7 6 8 3 4 5 

#### BFS (Breadth-First Search)

- BFS는 너비(거리) 우선 탐색이라고도 부르며, 그래프에서 가까운 노드부터 우선적으로 탐색하는 알고리즘입니다
- BFS 알고리즘은 특정 조건에서의 최단 경로 문제를 해결하는데에도 사용이 가능합니다
- BFS는 큐 자료구조를 이용하여 구체적인 동작과정은 다음과 같습니다
    1. 탐색 시작 노드를 큐에 삽입하고 방문처리를 합니다
    2. 큐에서 노드를 꺼낸 뒤에 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문처리 합니다
    3. 더 이상 2번의 과정을 수행할 수 없을 때까지 반복합니다

In [48]:
from collections import deque

graph = [
    [],
    [2, 3, 8],
    [1, 7],
    [1, 4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]
visited = [False] * 9


def bfs(graph, start, visited):
    queue = deque([start])
    visited[start] = True # 첫 노드를 방문 처리
    while queue:
        v = queue.popleft() # 방문 처리 완료된 노드 방출
        print(v, end=" ")
        for i in graph[v]: # 방문처리 완료된 주변 각 노드들이
            if not visited[i]: # 방문처리 안된 노드라면 
                queue.append(i) # 큐 자료구조에 추가후
                visited[i] = True # 방문 처리

bfs(graph, 1, visited)

1 2 3 8 7 4 5 6 

음료수 얼려먹기(연결 요소 찾기 : connected component 찾기)

In [50]:
n, m = 4, 5
graph = ["00110", "00011", "11111", "00000"]

visited = [[False for _ in range(m)] for _ in range(n)]
graph

['00110', '00011', '11111', '00000']