# Week3. DFS/BFS_개념

> ### 자료구조 기초  
  1.탐색 알고리즘에는 DFS/BFS가 있고, DFS/BFS를 이해하기 위해서는 `스택`과 `큐`, 그리고 `재귀함수`를 이해해야 함  
  2.`스택` : 박스 넣고 빼기  
  3.`큐` : 놀이동산 줄  
  4.`재귀함수` : return값에 점화식을 그대로 적어주면 됨. (예외/종료 조건은 `if`문으로 명시해주기)

> ### 탐색 알고리즘 DFS/BFS 
  1.그래프 표현방식 : 인접행렬(2차원), 인접리스트  
  2.DFS : 스택, 재귀함수 사용  
  3.BFS : 큐 사용

# 자료구조 기초

## 탐색 
  * 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정  
  * 프로그래밍에서는 그래프, 트리 등의 자료구조 안에서 탐색하는 문제가 주로 등장
  * 대표적인 탐색 알고리즘으로 **DFS, BFS** 가 있음  
  * DFS와 BFS를 제대로 이해하려면 기본 자료구조인 **스택, 큐**에 대한 이해가 전제되어야 함
  
## 자료구조  
  * 데이터를 표현하고 관리하고 처리하기 위한 구조  
  * `스택`과 `큐`를 구성하는 핵심 함수  
    * 삽입(Push)  
    * 삭제(Pop)  
  * 오버플로와 언더플로도 고려해야 함  
    * 오버플로 : 저장 공간을 벗어나 데이터가 넘쳐흐를 때  
    * 언더플로 : 데이터가 전혀 없는 상태에서 삭제 연산을 수행할 때  
    

### 1. 스택  
  * **선입후출** 구조 : 박스는 아래에서부터 위로 차곡차곡 쌓는다(먼저 들어가면 나중에 나온다)  
  * **후입선출** 구조 : 아래에 있는 박스를 치우기 위해선 위에 있는 박스를 먼저 내려야 한다(나중에 들어가면 먼저 나온다)  
  * 기본 리스트에서 `append`와 `pop` method 이용  
    * `append` : 맨 뒤에 삽입  
    * `pop` : 맨 뒤에서 삭제  

In [1]:
stack = []

stack.append(5)
stack.append(2)
stack.append(3)
stack.append(7)
stack.pop()
stack.append(1)
stack.append(4)
stack.pop()

print(stack) # 최하단 원소부터 출력
print(stack[::-1]) # 최상단 원소부터 출력 

[5, 2, 3, 1]
[1, 3, 2, 5]


### 2. 큐  
* `collection` 모듈에서 제공하는 `deque`자료구조 사용  
* deque : 스택과 큐의 장점을 모두 채택한 것. 데이터를 넣고 빼는 속도가 리스트 자료형에 비해 효율적이다.
* **선입선출** 구조  : 먼저 들어가면 먼저 나온다

In [6]:
from collections import deque

# 큐(queue) 구현을 위해 deque 라이브러리를 사용  
queue = deque()

queue.append(5)
queue.append(2)
queue.append(3)
queue.append(7)
queue.popleft()
queue.append(1)
queue.append(4)
queue.popleft()

print(queue) # 먼저 들어온 순서대로 출력
queue.reverse() # 다음 출력을 위해 역순으로 바꾸기 
print(queue) # 나중에 들어온 원소부터 출력
print(list(queue)) # 리스트 자료형 출력

deque([3, 7, 1, 4])
deque([4, 1, 7, 3])
[4, 1, 7, 3]


### 3. 재귀 함수

* DFS와 BFS를 구현하려면 재귀 함수도 이해할 필요가 있음  
* 재귀함수 : **자기 자신을 다시 호출하는 함수**  
* 컴퓨터 내부에서 재귀 함수의 수행은 스택 자료구조와 동일  
  (함수를 호출했을 때, 가장 마지막에 호출한 함수가 먼저 수행을 끝내야 그 앞의 함수 호출이 종료되기 때문)  
* 스택 자료구조를 사용해야 하는 상당수 알고리즘은 재귀 함수를 통해 간편하게 구현 가능 → DFS가 대표적인 예

In [7]:
def recursive_function():
    print('재귀 함수를 호출합니다.')
    recursive_function()
    
recursive_function() # 무한 출력

재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를 호출합니다.
재귀 함수를

RecursionError: maximum recursion depth exceeded in comparison

* 재귀 함수는 프랙털 구조와 흡사... (ex. 시에르핀스키의 삼각형)

#### 재귀 함수의 종료 조건  
* if문을 통해 종료할 수 있음

In [9]:
def recursive_function(i):
    # 100번째 출력했을 때 종료되도록 종료 조건 명시
    if i == 100:
        return
    print(i, '번째 재귀 함수에서', i+1, '번째 재귀 함수를 호출합니다.')
    recursive_function(i+1)
    print(i, '번째 재귀함수를 종료합니다.')
    
recursive_function(1)

1 번째 재귀 함수에서 2 번째 재귀 함수를 호출합니다.
2 번째 재귀 함수에서 3 번째 재귀 함수를 호출합니다.
3 번째 재귀 함수에서 4 번째 재귀 함수를 호출합니다.
4 번째 재귀 함수에서 5 번째 재귀 함수를 호출합니다.
5 번째 재귀 함수에서 6 번째 재귀 함수를 호출합니다.
6 번째 재귀 함수에서 7 번째 재귀 함수를 호출합니다.
7 번째 재귀 함수에서 8 번째 재귀 함수를 호출합니다.
8 번째 재귀 함수에서 9 번째 재귀 함수를 호출합니다.
9 번째 재귀 함수에서 10 번째 재귀 함수를 호출합니다.
10 번째 재귀 함수에서 11 번째 재귀 함수를 호출합니다.
11 번째 재귀 함수에서 12 번째 재귀 함수를 호출합니다.
12 번째 재귀 함수에서 13 번째 재귀 함수를 호출합니다.
13 번째 재귀 함수에서 14 번째 재귀 함수를 호출합니다.
14 번째 재귀 함수에서 15 번째 재귀 함수를 호출합니다.
15 번째 재귀 함수에서 16 번째 재귀 함수를 호출합니다.
16 번째 재귀 함수에서 17 번째 재귀 함수를 호출합니다.
17 번째 재귀 함수에서 18 번째 재귀 함수를 호출합니다.
18 번째 재귀 함수에서 19 번째 재귀 함수를 호출합니다.
19 번째 재귀 함수에서 20 번째 재귀 함수를 호출합니다.
20 번째 재귀 함수에서 21 번째 재귀 함수를 호출합니다.
21 번째 재귀 함수에서 22 번째 재귀 함수를 호출합니다.
22 번째 재귀 함수에서 23 번째 재귀 함수를 호출합니다.
23 번째 재귀 함수에서 24 번째 재귀 함수를 호출합니다.
24 번째 재귀 함수에서 25 번째 재귀 함수를 호출합니다.
25 번째 재귀 함수에서 26 번째 재귀 함수를 호출합니다.
26 번째 재귀 함수에서 27 번째 재귀 함수를 호출합니다.
27 번째 재귀 함수에서 28 번째 재귀 함수를 호출합니다.
28 번째 재귀 함수에서 29 번째 재귀 함수를 호출합니다.
29 번째 재귀 함수에서 30 번째 재귀 함수를 호출합니다.
30 번째 재귀 함수에서 31 번째 재귀 함수를 호출합니

#### 2가지 방식의 팩토리얼 예제

In [11]:
# 반복적으로 구현한 n!
def factorial_iterative(n):
    result = 1
    for i in range(1,n+1):
        result *= i
    return result

# 재귀적으로 구현한 n!
def factorial_recursive(n):
    if n<=1:
        return 1
    # n! = n * (n-1)! 을 그대로 코드로 작성
    return n * factorial_recursive(n-1) 

# 각각의 방식으로 구한  5! 출력
print('반복적으로 구현 :', factorial_iterative(5))
print('재귀적으로 구현 :', factorial_recursive(5))

반복적으로 구현 : 120
재귀적으로 구현 : 120


재귀적으로 구현 시 코드가 더 간결 → **점화식을 그대로 소스코드로** 옮겼기 때문

# 탐색 알고리즘 DFS/BFS  
  
* 그래프 : **노드 - 엣지** 로 구성 
* 그래프 탐색 : 하나의 노드를 시작으로 다수의 노드를 방문  
* 두 노드가 엣지로 연결되어 있다면, '두 노드는 인접하다'라고 표현  
  
## 그래프의 표현 방식  
#### 인접 행렬(Adjacency Matrix)  
2차원 배열로 그래프의 연결 관계를 표현하는 방식  
  * 연결되어 있지 않은 노드끼리는 무한의 비용이라고 작성 

In [12]:
INF = 999999999 # 무한의 비용 선언  

# 2차원 리스트를 이용해 인접 행렬 표현
graph = [
    [0, 7, 5],
    [7, 0, INF],
    [5, INF, 0]
]

print(graph)

[[0, 7, 5], [7, 0, 999999999], [5, 999999999, 0]]


#### 인접 리스트(Adjacency List) 
리스트로 그래프의 연결 관계를 표현하는 방식 (차례대로 연결)  
  * 연결되어 있지 않은 노드끼리는 작성하지 않음

In [14]:
# 행(Row)이 3개인 2차원 리스트로 인접 리스트 표현
graph = [[] for _ in range(3)]

# 노드 0에 연결된 노드 정보 저장(노드, 거리)  
graph[0].append((1,7))
graph[0].append((2,5))

# 노드 1에 연결된 노드 정보 저장(노드, 거리)
graph[1].append((0,7))

# 노드 2에 연결된 노드 정보 저장(노드, 거리)
graph[2].append((0,5))

print(graph)

[[(1, 7), (2, 5)], [(0, 7)], [(0, 5)]]


* 인접 행렬 : 메모리 낭비  
* 인접 리스트 : 메모리 효율, 정보를 얻는 속도가 느리다(연결된 데이터를 하나하나 연결해야해서)  

## DFS (깊이 우선 탐색)
* Depth-First Search, 깊이 우선 탐색, 그래프에서 **깊은 부분을 우선적으로** 탐색하는 알고리즘  
* 특정 경로로 탐색하다가 특정한 상황에서 최대한 깊숙이 들어가서 노드를 방문하고, 다시 돌아가 다른 경로로 탐색하는 알고리즘  
* 최대한 멀리 있는 노드를 우선적으로 탐색하는 방식
* 동작 과정  
    * 탐색 시작 노드를 **스택**에 삽입하고 방문처리  
    * 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문처리. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼냄  
    * 위 과정을 수행불가능할때까지 반복 (**재귀함수** 사용)  
    * 방문처리는 스택에 한 번 삽입되어 처리된 노드가 다시 삽입되지 않게 체크하는 것을 의미

In [15]:
# DFS METHOD 정의
def dfs(graph, v, visited):
    # 현재 노드를 방문 처리
    visited[v] = True
    print(v, end=' ')
    # 현재 노드와 연결된 다른 노드를 재귀적으로 방문
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i, visited)
            
graph = [ 
    [],
    [2,3,8],
    [1,7],
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]

# 각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원 리스트)
visited = [False] * 9

# 정의된 DFS 함수 호출
dfs(graph, 1, visited)

1 2 7 6 8 3 4 5 

## BFS (너비 우선 탐색)  
* 가까운 노드부터 탐색하는 알고리즘  
* 동작  
  * 탐색 시작 노드를 **큐**에 삽입하고 방문 처리  
  * 큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 **모두** 큐에 삽입하고 방문 처리  
  * 위 과정을 수행불가능할때까지 반복  

In [18]:
from collections import deque

# BFS METHOD 정의
def bfs(graph, start, visited):
    # 큐 구현을 위해 deque 라이브러리 사용
    queue = deque([start])
    # 현재 노드를 방문 처리 
    visited[start] = True
    # 큐가 빌 때까지 반복
    while queue:
        # 큐에서 하나의 원소를 뽑아 출력
        v = queue.popleft()
        print(v, end = ' ')
        # 해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
        for i in graph[v]:
            if not visited[i]:
                queue.append(i)
                visited[i] = True
                
graph = [ 
    [],
    [2,3,8],
    [1,7],
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]

# 각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원 리스트)
visited = [False] * 9

# 정의된 BFS 함수 호출
bfs(graph, 1, visited)

1 2 3 8 7 4 5 6 

* 코딩 테스트 중, 2차원 배열의 탐색 문제를 그래프 형태로 바꿔서 생각하기

# 예제

## 3. 음료수 얼려 먹기

In [23]:
n, m = map(int, input().split())

ice = []
for _ in range(n):
    ice.append(list(map(int, input())))
    
# DFS로 특정한 노드를 방문한 뒤에 연결된 모든 노드들도 방문    
def dfs(x, y):
    # 주어진 범위를 벗어나는 경우에는 즉시 종료
    if x<=-1 or x>=n or y<=-1 or y>=m:
        return False
    # 현재 노드를 아직 방문하지 않았다면
    if graph[x,y] == 0:
        # 해당 노드 방문 처리
        graph[x,y] = 1
        # 상, 하, 좌, 우의 위치도 모두 재귀적으로 호출
        dfs(x-1, y)
        dfs(x, y-1)
        dfs(x+1, y)
        dfs(x, y+1)
        return True
    return False

# 모든 노드(위치)에 대하여 음료수 채우기
result = 0
for i in range(n):
    for j in range(m):
        # 현재 위치에서 DFS 수행
        if dfs(i, j) == True:
            result += 1

print(result)

4 5
00110
00011
111111
00000


## 4. 미로 탈출

In [None]:
from collections import deque

# n, m을 공백으로 구분하여 입력받기
n, m = map(int, input().split())
# 2차원 리스트의 맵 정보 입력받기  
graph = []
for _ in range(n):
    graph.append(list(map(int, input())))
    
# 이동할 네 방향 정의(좌, 우, 상, 하)
dx = [-1, 1, 0, 0]
dy = [0, 0, -1, 1]

# BFS 소스코드 구현
def bfs(x,y):
    # 큐 구현을 위해 deque 라이브러리 사용
    queue = deque()
    queue.append((x,y))
    # 큐가 빌때까지 반복
    while queue:
        x,y = queue.popleft()
        # 현재 위치에서 4 방향으로의 위치 확인
        for i in range(4):
            nx = x + dx[i]
            ny = y + dy[i]
            # 미로 찾기 공간을 벗어난 경우 무시
            if nx < 0 or ny < 0 or nx>=n or ny>=m:
                continue
            # 벽인 경우 무시
            if graph[nx][ny] == 0:
                continue
            # 해당 노드를 처음 방문하는 경우에만 최단 거리 기록
            if graph[nx][ny] == 1:
                graph[nx][ny] = graph[x][y] + 1
                queue.append((nx, ny))
        # 가장 오른쪽 아래까지의 최단 거리 반환
        return graph[n-1][m-1]
    
# BFS를 수행한 결과 출력
print(bfs(0,0))