# DFS / BFS (탐색 알고리즘)

## 자료구조 기초

### 탐색
탐색(Search)이란 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정을 말한다. 대표적인 탐색 알고리즘으로 DRS, BFS를 꼽을 수 잇는데 두 알고리즘을 제대로 이해하기 위해서는 기본 자료구조인 스택과 큐에 대한 이해가 전제되어야 한다.

### 자료구조 (Data Structure)
자료구조란 데이터를 표현하고 관리하고 처리하기 위한 구조를 의미한다. 그중 스택과 큐는 자료구조의 기초개념으로 아래의 두 핵심적인 함수로 구성된다.

    - 삽입(Push) : 데이터를 삽입한다.
    - 삭제(Pop) : 데이터를 삭제한다.

물론 실제로 스택과 큐를 사용할 때는 삽입과 삭제 이외에도 오버플로와 언더플로를 고민해야한다. 오버플로(Overflow)란 특정한 자료구조가 수용할 수 있는 데이터의 크기를 이미 가득 찬 상태에서 삽입 연산을 수행할 때 발생한다. 즉, 저장 공간을 벗어나 데이터가 넘쳐흐를 때 발생한다. 반면에 특정한 자료구조에 데이터가 전혀 들어 있지 않은 상태에서 삭제 연산을 수행하면 데이터가 전혀 없는 상태이므로 언더플로(Underflow)가 발생한다.

### Stack

Stack은 박스 쌓기에 비유할 수 있다. 박스는 아래에서 위로 차곡차곡 쌓는다. 아래에 있는 박스를 치우기 위해서는 위에 있는 박스를 먼저 내려야 한다. 이러한 구조를 선입후출(First In Last Out) 구조 또는 후입선출(Last In First Out) 구조라고 한다.

Python에서 stack을 사용할 때에는 별도의 라이브러리를 사용할 필요가 없다. 기본 리스트에서 append, pop method를 사용하면 stack 자료구조와 동일하게 동작한다. append method는 list의 가장 뒤쪽에 data를 삽입하고, pop method는 list의 가장 뒤쪽에서 data를 꺼낸다.

In [3]:
# Stack Ex

stack = []

# insert(5) - insert(2) - insert(3) - insert(7) - delete - insert(1) - insert(4) - delete()
stack.append(5)
stack.append(2)
stack.append(3)
stack.append(7)
stack.pop()
stack.append(1)
stack.append(4)
stack.pop()

print(stack)

[5, 2, 3, 1]


### Queue
Queue는 대기 줄에 비유할 수 있다. Queue는 선입선출(First In First Out, FIFO) 구조라고 한다.

파이썬으로 Queue를 구현할 때는 collections module에서 제공하는 deque 자료구조를 활용할 수 있다. deque는 stack과 queue의 장점을 모두 채택한 것인데 데이터를 넣고 빼는 속도가 list 자료형에 비해 효율적이며 queue 라이브러리를 이용하는 것보다 더 간단하다.

In [5]:
# Queue Ex

from collections import deque

queue = deque()

# insert(5) - insert(2) - insert(3) - insert(7) - delete - insert(1) - insert(4) - delete()
queue.append(5)
queue.append(2)
queue.append(3)
queue.append(7)
queue.popleft()
queue.append(1)
queue.append(4)
queue.popleft()

print(queue)
print(type(queue))

print("*"*40)

# transform queue to list
list_queue = list(queue)
print(list_queue)
print(type(list_queue))

deque([3, 7, 1, 4])
<class 'collections.deque'>
****************************************
[3, 7, 1, 4]
<class 'list'>


### 재귀 함수
DFS, BFS를 구현하려면 재귀 함수도 이해하고 있어야 한다. 재귀 함수(Recursive Function)이란 자기 자신을 다시 호출하는 함수를 의미한다.

재귀 함수를 문제 풀이에서 사용할 때는 재귀 함수가 언제 끝날지, 종료 조건을 꼭 명시해야 한다. 종료 조건을 명시하지 않으면 함수가 무한 호출되게 된다.

컴퓨터 내부에서 재귀 함수의 수행은 stack 자료구조를 이용한다. 함수를 계속 호출했을 때 가장 마지막에 호출한 함수가 먼저 수행을 끝내야 그 앞의 함수 호출이 종료되기 때문이다. 컴퓨터의 구조 측면에서 보자면 연속해서 호출되는 함수는 메인 메모리의 스택 공간에 적재되기에 재귀 함수는 스택 자료구조와 같다는 말은 틀린 말이 아니다. 스택 자료구조를 활용해야 하는 상당수 알고리즘은 재귀 함수를 이용해서 간편하게 구현될 수 있다. DFS가 대표적인 예시이다.

In [7]:
# Recursive function ex

def factorial_recursive(n):
    
    if n == 1:
        return 1
    else:
        result = factorial_recursive(n - 1) * n
        return result

result = factorial_recursive(10)
print(result)

3628800


재귀 함수를 사용하면 코드가 더 간결해지는 것을 확인할 수 있다. 이렇게 간결해지는 이유는 재귀 함수가 수학의 점화식(재귀식)을 그대로 소스코드로 옮겼기 때문이다. 수학에서 점화식은 특정한 함수를 자신보다 더 작은 변수에 대한 함수와의 관계로 표현한 것을 의미한다.

일반적으로 점화식에서 종료 조건을 찾을 수 있는데, 재귀 함수 내에서 특정 조건일 때 더이상 재귀적으로 함수를 호출하지 않고 종료할 수 있도록 꼭 종료 조건을 구현해주어야 한다.

## 탐색 알고리즘 DFS/BFS

### DFS
DFS(Depth Fisrt Search), 깊이 우선 탐색이라고 부르며, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘이다. DFS를 이해하기 위해서 먼저 Graph의 기본 구조를 알아야 한다.

#### Graph
    Graph는 Node와 Egde(간선)으로 표현되며, Node를 Vertex(정점)이라고도 말한다. 그래프 탐색이란 하나의 노드를 시작으로 다수의 노드를 방문하는 것을 말한다. 또한 두 노드가 간선으로 연결되어 있다면 두 노드는 인접해 있다라고 표현한다. 노드를 도시, 간선을 도로라고 비유하여 A라는 도시(노드)에서 B라는 도시(노드)로 이동하기 위해서 A, B를 연결하는 도로(간선)을 거친다고 이해할 수 있다.
    프로그래밍에서 그래프는 크게 2가지 방식으로 표현할 수 있다.
        
        - 인접 행렬(Adjacency Matrix) : 2차원 배열로 그래프의 연결 관계를 표현하는 방식
            인접 행렬 방식은 2차원 배열에 각 노드가 연결된 형태를 기록하는 방식이다.
            연결되어 있는 노드끼리의 비용을 기록한다. 연결이 되어 있지 않은 노드끼리는 무한(infinity)의 비용으로 작성한다.
        
        - 인접 리스트(Adjacency List) : List로 그래프의 연결 관계를 표현하는 방식
            인접 리스트 방식에서는 모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장하는 방식이다.

    (두 방식의 차이)
    메모리 측면에서 보자면 인접 행렬 방식은 모든 관계를 저장하기에 노드 개수가 많을 수록 메모리가 불필요하게 낭비된다. 반면에 인접 리스트 방식은 연결된 정보만을 저장하기에 메모리를 효율적으로 사용한다. 하지만 이와 같은 속성 때문에 인접 리스트 방식은 인접 행렬에 비해 특정한 두 노드가 연결되어 있는지에 대한 정보를 얻는 속도가 느리다. 인접 리스트 방식에서는 연결된 데이터를 하나씩 확인해야 하기 때문이다.

DFS는 깊이 우선 탐색 알고리즘이다. 이 알고리즘은 특정한 경로로 탐색하다가 특정한 상황에서 최대한 깊숙이 들어가서 노드를 방문한 후, 다시 돌아가 다른 경로로 탐색하는 알고리즘이다.

(DFS의 구체적인 동작 과정)
    
    1. 탐색 시작 노드를 스택에 삽입하고 방문처리를 한다.
    2. 스택의 최상단 노드에 방문하지 않은 인접 노드가 있다면 그 인접 노드를 스택에 넣고 방문 처리를 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.
    3. 2번 과정을 더 이상 수행할 수 없을 때까지 반복한다.
    

In [9]:
# DFS ex

def dfs(graph, v, visited):
    
    # 현재 노드 방문 처리
    visited[v] = True
    print(v, end = ' ')
    
    # 현재 노드와 연결된 다른 노드로 재귀적 방문
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i, visited)

graph = [
    [],
    [2, 3, 8],
    [7],
    [4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]

visited = [False] * 9

dfs(graph, 1, visited)

1 2 7 6 8 3 4 5 

### BFS
BFS(Breadth First Search) 알고리즘은 너비 우선 탐색 알고리즘이다. 쉽게 말해 가장 가까운 노드부터 탐색하는 알고리즘이다.

BFS 구현에서는 선입선출 방식인 queue 자료구조를 사용한다. 인접한 노드를 반복적으로 que에 넣도록 알고리즘을 작성하면 자연스럽게 먼저 들어온 것이 먼저 나가게 되어, 가까운 노드부터 탐색을 진행하게 된다.

(BFS의 구체적인 동작 과정)
    
    1. 탐색 시작 노드를 queue에 삽입하고 방문처리
    2. queue에서 노드를 꺼내 해당 노드의 인접 노드중에서 방문하지 않은 노드를 모두 queue에 삽입하고 방문처리
    3. 2번 과정을 더이상 수행할 수 없을 때까지 반복한다.


In [11]:
# BFS ex

from collections import deque

def bfs(graph, start, visited):
    
    # queue 정의
    queue = deque([start])
    
    # 현재 node 방문 처리
    visited[start] = True
    
    # queue가 빌 때까지 반복
    while queue:
        # queue에서 하나의 원소를 뽑아 출력
        v = queue.popleft()
        print(v, end = ' ')
        
        # 해당 원소와 연결된, 아직 방문하지 않은 원소들을 queue에 삽입
        for i in graph[v]:
            if not visited[i]:
                queue.append(i)
                visited[i] = True

graph = [
    [],
    [2, 3, 8],
    [7],
    [4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]

visited = [False] * 9

bfs(graph, 1, visited)

1 2 3 8 7 4 5 6 

In [46]:
# exercise problem. 음료수 얼려 먹기

"""
N X M 크기의 얼음틀이 있다. 구멍이 뚫려 있는 부분은 0, 칸막이가 있는 부분은 1로 표시된다.
구멍이 뚫려 잇는 부분끼리 상, 하, 좌, 우로 붙어 있는 경우 서로 연결되어 있는 것으로 간주한다.
이때 얼음 틀의 모양이 주어졌을 때 생성되는 총 아이스크림의 갯수를 구하라

입력 조건
    * 첫번째 줄에 얼음 틀의 세로 길이 N과 가로 길이 M이 주어진다.
    * 두번째 줄부터 N + 1번째 줄까지 얼음 틀의 형태가 주어진다.
    * 이때 구멍이 뚫려 있는 부분은 0, 아닌 부분은 1이다.

출력 조건
    * 한번에 만들 수 있는 아이스크림의 갯수를 출력하라
"""

import numpy as np
from collections import deque

first_str = input("")

# N : # of rows, M : # of columns
N = int(first_str.split()[0])
M = int(first_str.split()[1])

array_info = np.zeros((N, M))

for i in range(0, N):
    input_str = input("")
    input_list = list(map(int, input_str.split()))
    
    array_info[i] = input_list

def make_graph(array_info):
    N = array_info.shape[0]
    M = array_info.shape[1]
    
    graph = []
    
    for i in range(0, N):
        for j in range(0, M):
            search_coord_list = [[i-1, j], [i+1, j], [i, j-1], [i, j+1]]
            
            temp_list = []
            
            if array_info[i, j] == 1:
                pass
            elif array_info[i, j] == 0:
                for k in search_coord_list:
                    if (k[0] < 0) | (k[0] >= N) | (k[1] < 0) | (k[1] >= M):
                        pass
                    else:
                        if array_info[k[0], k[1]] == 0:
                            temp_list.append([k[0], k[1]])
            
            graph.append(temp_list)
    
    return graph

def bfs(graph, visited_history, current_coord):
    # current_coord : list
    # in node_number : current_coord[0] * M + current_coord[1]
    
    N = visited_history.shape[0]
    M = visited_history.shape[1]
    
    node = current_coord[0] * M + current_coord[1]
    
    # queue 정의
    queue = deque([current_coord])
    
    # 현재 node 방문 처리
    visited_history[current_coord[0]][current_coord[1]] = 1
    
    # queue가 빌 때까지 반복
    while queue:
        v = queue.popleft()      
        node_v = v[0] * M + v[1]
        # 해당 원소와 연결된, 아직 방문하지 않은 원소들을 queue에 삽입
        for i in graph[node_v]:
            if visited_history[i[0]][i[1]] == 0:
                queue.append(i)
                visited_history[i[0]][i[1]] = 1   

visited_history = array_info.copy()
                
graph = make_graph(array_info)

count_icecream = 0

for i in range(0, N):
    for j in range(0, M):
        if (array_info[i][j] == 0) & (visited_history[i][j] == 0):
            bfs(graph, visited_history, [i, j])
            count_icecream += 1
            
print(count_icecream)

15 14
0 0 0 0 0 1 1 1 1 0 0 0 0 0
1 1 1 1 1 1 0 1 1 1 1 1 1 0
1 1 0 1 1 1 0 1 1 0 1 1 1 0
1 1 0 1 1 1 0 1 1 0 0 0 0 0
1 1 0 1 1 1 1 1 1 1 1 1 1 1
1 1 0 1 1 1 1 1 1 1 1 1 0 0
1 1 0 0 0 0 0 0 0 1 1 1 1 1
0 1 1 1 1 1 1 1 1 1 1 1 1 1
0 0 0 0 0 0 0 0 0 1 1 1 1 1
0 1 1 1 1 1 1 1 1 1 1 0 0 0
0 0 0 1 1 1 1 1 1 1 1 0 0 0
0 0 0 0 0 0 0 1 1 1 1 0 0 0
1 1 1 1 1 1 1 1 1 1 0 0 1 1
1 1 1 0 0 0 1 1 1 1 1 1 1 1
1 1 1 0 0 0 1 1 1 1 1 1 1 1
8


In [45]:
# exercise problem. 미로 탈출

"""
N X M 크기의 직사각형 형태의 미로에 갇혀있다. 미로에는 여러 마리의 괴물이 있어 이를 피해 탈출해야 한다.
현재 위치는 (1, 1)이고 출구는 (N, M)의 위치에 존재하며 한번에 1칸씩 이동할 수 있다.
괴뭉리 있는 부분은 0으로, 괴물이 없는 부분은 1로 표시되어 있다.
미로는 반드시 탈출할 수 잇는 형태로 제시된다.
이때 탈출하기 위해 움직여야 하는 최소 칸의 개수를 구하라

입력 조건
    - 첫째 줄에 두 정수가 주어진다.
    - 다음 N개의 줄에는 각 주람다 M개의 정수가 주어진다. 공백없이 주어진다.

출력 조건
    - 첫째 줄에 최소 이동 칸의 갯수를 출력한다.
"""
import numpy as np
from collections import deque

first_str = input("")

N = int(first_str.split()[0])
M = int(first_str.split()[1])

array_info = np.zeros((N, M))

for i in range(0, N):
    input_str = input("")
    temp_list = []
    for j in range(0, M):
        temp_list.append(int(input_str[j]))
    
    array_info[i] = temp_list

def make_graph(array_info):
    N = array_info.shape[0]
    M = array_info.shape[1]
    
    graph = []
    
    for i in range(0, N):
        for j in range(0, M):
            search_coord_list = [[i-1, j], [i+1, j], [i, j-1], [i, j+1]]
            
            temp_list = []
            
            if array_info[i, j] == 0:
                pass
            elif array_info[i, j] == 1:
                for k in search_coord_list:
                    if (k[0] < 0) | (k[0] >= N) | (k[1] < 0) | (k[1] >= M):
                        pass
                    else:
                        if array_info[k[0], k[1]] == 1:
                            temp_list.append([k[0], k[1]])
            
            graph.append(temp_list)
    
    return graph

def translate_node(a, N, M):
    return a[0] * M + a[1]

def bfs(graph, start, visited, N, M, visited_cnt):
    
    # queue 정의
    queue = deque([start])
      
    # 현재 node 방문 처리
    visited[translate_node(start, N, M)] = True
    
    cnt = 1
    
    graph_copy = graph.copy()
    
    # queue가 빌 때까지 반복
    while queue:
        # queue에서 하나의 원소를 뽑아 출력
        v = queue.popleft()
        print(v, end = ' ')
                
        # 해당 원소와 연결된, 아직 방문하지 않은 원소들을 queue에 삽입
        for i in graph[translate_node(v, N, M)]:
            if not visited[translate_node(i, N, M)]:
                queue.append(i)
                visited[translate_node(i, N, M)] = True
            
                visited_cnt[i[0]][i[1]] = cnt
                
                graph_copy[translate_node(i, N, M)].remove(v)
            
        
        cnt += 1

graph = make_graph(array_info)

visited_cnt = np.zeros((N, M))

visited = [False] * N * M

bfs(graph, [0, 0], visited, N, M, visited_cnt)

5 6
101010
111111
000001
111111
111111
[0, 0] [1, 0] [1, 1] [1, 2] [0, 2] [1, 3] [1, 4] [0, 4] [1, 5] [2, 5] [3, 5] [4, 5] [3, 4] [4, 4] [3, 3] [4, 3] [3, 2] [4, 2] [3, 1] [4, 1] [3, 0] [4, 0] 

In [46]:
visited_cnt[4][5]

11.0