# 그래프 탐색 알고리즘 : DFS/BFS
- 탐색(Search)이란 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정을 말한다.
- 대표적인 그래프 탐색 알고리즘으로는 DFS와 BFS가 있습니다.

## 스택 자료구조(LIFO, Last In First Out)
- 먼저 들어 온 데이터가 나중에 나가는 형식(선입후출)의 자료구조이다.
- 입구와 출구가 동일한 형태이다. 

In [1]:
#스택 구현 예제 - 시간복잡도 O(1)
stack = []

# 삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제()
stack.append(5)
stack.append(2)
stack.append(3)
stack.append(7)
stack.pop()
stack.append(1)
stack.append(4)
stack.pop()

print(stack[::-1]) #최상단 원소부터 출력
print(stack)#최하단 원소부터 출력

[1, 3, 2, 5]
[5, 2, 3, 1]


## 큐 자료구조(FIFO, First In First Out)
- 먼저 들어 온 데이터가 먼저 나가는 형식(선입선출)의 자료구조이다.
- 큐는 입구와 출구가 모두 뚫려 있는 터널과 같은 형태로 시각화 할 수 있다.

In [3]:
# 큐 구현 예제
from collections import deque

queue = deque()

# 삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제()
queue.append(5) # 오른쪽으로 들어감
queue.append(2)
queue.append(3)
queue.append(7)
queue.popleft() # 왼쪽부터 제거됨
queue.append(1)
queue.append(4)
queue.popleft()

print(queue) # 먼저 들어온 순서대로 출력
queue.reverse() # 역순으로 바꾸기
print(queue) # 나중에 들어온 원소부터 출력

deque([3, 7, 1, 4])
deque([4, 1, 7, 3])


## 재귀 함수(Recursive Function)
- 재귀 함수란 자기 자신을 다시 호출하는 함수를 의미한다.
- 단순한 형태의 재귀 함수 예제
    - '재귀 함수를 호출한다.' 라는 문자열을 무한히 출력한다.
    - 어느 정도 출력하다가 최대 재귀 깊이 초과 메시지가 출력된다.
- 최대 재귀 깊이를 늘려주기 위해서는 설정이 필요
    
    ```python
    import sys
    sys.setrecursionlimit(10**6)
    ```

In [4]:
def recursive_function():
    print('재귀 함수를 호출한다.')
    recursive_function()

recursive_function

재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.
재귀 함수를 호출한다.

RecursionError: maximum recursion depth exceeded while calling a Python object

In [26]:
def recursive_function(i):
    # 5번째 호출을 했을 때 종료되도록 종료 조건 명시
    if i == 5:
        return 
    print(i, '번째 재귀함수에서', i+1,'번째 재귀함수를 호출합니다.')
    recursive_function(i+1)
    print(i,'번째 재귀함수를 종료합니다.')

recursive_function(1)

1 번째 재귀함수에서 2 번째 재귀함수를 호출합니다.
2 번째 재귀함수에서 3 번째 재귀함수를 호출합니다.
3 번째 재귀함수에서 4 번째 재귀함수를 호출합니다.
4 번째 재귀함수에서 5 번째 재귀함수를 호출합니다.
4 번째 재귀함수를 종료합니다.
3 번째 재귀함수를 종료합니다.
2 번째 재귀함수를 종료합니다.
1 번째 재귀함수를 종료합니다.


### 팩토리얼 구현 예제
- n! = 1 x 2 x 3 x ・・・ x (n-1) x n
- 수학적으로 0!과 1!의 값은 1이다.

In [10]:
# 반복적으로 구현한 n!
def factorial_iterative(n):
    result = 1
    # 1부터 n까지의 수를 차례대로 곱하기
    for i in range(1, n+1):
        result *= i
    return result

# 재귀적으로 구현한 n!
def factorial_recursive(n):
    if n <= 1: # n이 1 이하인 경우 1을 반환
        return 1
    # n! = n * (n-1)!를 그대로 코드로 작성하기
    return n * factorial_recursive(n - 1)

# 각각의 방식으로 구현한 n! 출력(n = 5)
print('반복적으로 구현:', factorial_iterative(5))
print('재귀적으로 구현:', factorial_recursive(5))

반복적으로 구현: 120
재귀적으로 구현: 120


### 최대공약수 계산(유클리드 호제법)예제
- 두 개의 자연수에 대한 최대공약수를 구하는 대표적인 알고리즘으로는 유클리드 호제법이 있다.
- 유클리드 호제법
    - 두 자연수 A, B에 대하여 (A > B) A를 B로 나눈 나머지를 R이라고 하자
    - 이때 A와 B의 최대공약수는 B와 R의 최대공약수와 같다.
- 유클리드 호제법의 아이디어를 그대로 재귀 함수로 작성할 수 있다.
    - 예시 : GCD(192, 162)
    
        |단계|A|B|
        |--|--|--|
        |1|192|162|
        |2|162|30|
        |3|30|12|
        |4|12|6|

In [11]:
def gcd(a, b):
    if a% b == 0:
        return b
    else:
        return gcd(b, a % b)
    
print(gcd(192, 162))

6


### 재귀 함수 사용의 유의 사함
- 재귀 함수를 잘 활용하면 복잡한 알고리즘을 간결하게 작성할 수 있다.
    - 단, 오히려 다른 사람이 이해하기 어려운 형태의 코드가 될 수도 있으므로 신중하게 사용해야 한다.
- 모든 <U>재귀 함수는 반복문을 이용하여 동일한 기능을 구현</U>할 수 있다.
- 재귀 함수가 반복문보다 유리한 경우도 있고 불리한 경우도 있다.
- 컴퓨터가 함수를 연속적으로 호출하면 컴퓨터 메모리 내부의 스택 프레임에 쌓인다.
    - 그래서 스택을 사용해야 할 때 구현상 스택 라이브러리 대신에 재귀 함수를 이용하는 경우가 많다.

# DFS(Depth-First Search)
- DFS는 **깊이 우선 탐색**이라고도 부르며 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘이다.
- DFS는 **스택 자료구조(혹은 재귀 함수)를 이용**라며, 구체적인 동작 과정은 다음과 같다.
    1. 탐색 시작 노드를 스택에 상ㅂ입하고 방문 처리를 한다.
    2. 스택의 최상단 노드에 방문하지 않은 인접한 노드가 하나라도 있으면 그 노드를 스택에 넣고 방문 처리한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼냅니다.
    3. 더 이상 2번의 과정을 수행할 수 없을 때까지 반복한다.

## DFS 동작 예시
- **[Step 0]** 그래프를 준비한다.(방문 기준: 번호가 낮은 인접 노드부터)
    - 시작 노드 : 1
    
    <img src="img/dfs1.png" width="50%" />

- **[Step 1]** 시작 노드인 '1'을 스택에 삽입하고 방문 처리를 한다.
- **[Step 2]** 스택의 최상단 노드인 '1'에 방문하지 않은 인접 노드 '2', '3', '8'이 있다.
    - 이 중에서 가장 작은 노드인 '2'를 스택에 넣고 방문 처리를 한다.
- **[Step 3]** 스택의 최상단 노드인 '2'에 방문하지 않은 인접 노드 '7'이 있다. 따라서 '7' 노드를 스택에 넣고 방문처리 한다.
- **[Step 4]** 스택의 최상단 노드인 '7'에 방문하지 않은 인접 노드 '6', '8'이 있다. 
    - 이 중에서 가장 작은 노드인 '6'을 스택에 넣고 방문 처리를 한다.
- **[Step 5]** 스택의 최상단 노드인 '6'에 방문하지 않은 인접 노드가 없다.
    - 따라서 스택에서 '6'번 노드를 꺼낸다.
- **[Step 6]** 스택의 최상단 노드인 '7'에 방문하지 않은 인접 노드 '8'이 있다.
    - 따라서 '8'번 노드를 스택에 넣고 방문 처리를 한다.
- 이러한 과정을 반복하였을 때 **전체 노드의 탐색 순서**(스택에 들어간 순서)는 다음과 같다.
    - 탐색 순서 : 1 → 2 → 7 → 6 → 8 → 3 → 4 → 5 

In [12]:
# DFS 메서드 정의
def dfs(graph, v, visited):
    # 현재 노드를 방문 처리
    visited[v] = True
    print(v, end=' ')
    # 현재 노드와 연결된 다른 노드를 재귀적으로 방문
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i , visited)

# 각 노드가 연결괸 정보를 표현 (2차원 리스트)
graph = [
    []  # 보통 그래프가 1번부터 시작하는 경우가 많아서 0번째는 비워둠
    ,[2, 3, 8] # 1번 노드와 인접한 노드들
    ,[1, 7]    # 2번 노드와 인접한 노드들
    ,[1, 4, 5]
    ,[3, 5]
    ,[3, 4]
    ,[7]
    ,[2, 6, 8]
    ,[1, 7]
]

# 각 노드가 방문된 정보를 표현 (1차원 리스트)
visited = [False] * 9

# 정의된 DFS 함수 호출
dfs(graph, 1, visited)

1 2 7 6 8 3 4 5 

# BFS(Breadth-First Search)
- BFS는 **너비 우선 탐색**이라고도 부르며, 그래프에서 가까운 노드부터 우선적으로 탐색하는 알고리즘이다.
- BFS는 **큐 자료구조**를 이용하며, 구체적인 동작 과정은 다음과 같다.
    1. 탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다.
    2. 큐에서 노드를 꺼낸 뒤에 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리한다.
    3. 더 이상 2번의 과정을 수행할 수 없을 때까지 반복한다.

## BFS 동작 예시
- **[Step 0]** 그래프를 준비한다.(방문 기준: 번호가 낮은 인접 노드부터)
    - 시작 노드 : 1
    
    <img src="img/dfs1.png" width="50%" />

- **[Step 1]** 시작 노드인 '1'을 스택에 삽입하고 방문 처리를 한다.
- **[Step 2]** 큐에서 노드 '1'을 꺼내 방문하지 않은 인접 노드 '2', '3', '8'을 큐에 삽입하고 방문 처리한다.
- **[Step 3]** 큐에서 노드 '2'를 꺼내 방문하지 않은 인접 노드 '7'을 큐에 삽입하고 방문 처리한다.
- **[Step 4]** 큐에서 노드 '3'을 꺼내 방문하지 않은 인접 노드 '4', '5'를 큐에 삽입하고 방문 처리한다.
- **[Step 5]** 큐에서 노드 '8'을 꺼내고 방문하지 않은 인접 노드가 없으므로 무시한다.
- 이러한 과정을 반복하였을 때 **전체 노드의 탐색 순서**(큐에 들어간 순서)는 다음과 같다.
    - 탐색 순서 : 1 → 2 → 3 → 8 → 7 → 4 → 5 → 6

In [13]:
# BFS 소스코드 예제
from collections import deque

# BFS 메서드 정의
def bfs(graph, start, visited):
    # 큐(Queue) 구현을 위해 deque 라이브러리 사용
    queue = deque([start])
    # 현재 노드를 방문 처리
    visited[start] = True
    # 큐가 빌 때까지 반복
    while queue:
        # 큐에서 하나의 원소를 뽑아 출력하기
        v = queue.popleft()
        print(v, end=' ')
        # 아직 방문하지 않은 인접한 원소들을 큐에 삽입
        for i in graph[v]:
            if not visited[i]:
                queue.append(i)
                visited[i] = True

# 각 노드가 연결괸 정보를 표현 (2차원 리스트)
graph = [
    []  # 보통 그래프가 1번부터 시작하는 경우가 많아서 0번째는 비워둠
    ,[2, 3, 8] # 1번 노드와 인접한 노드들
    ,[1, 7]    # 2번 노드와 인접한 노드들
    ,[1, 4, 5]
    ,[3, 5]
    ,[3, 4]
    ,[7]
    ,[2, 6, 8]
    ,[1, 7]
]

# 각 노드가 방문된 정보를 표현 (1차원 리스트)
visited = [False] * 9

# 정의된 DFS 함수 호출
bfs(graph, 1, visited)

1 2 3 8 7 4 5 6 

In [23]:
def dfs(x,y):
    if x<=-1 or x >= n or y<=-1  or y >=m:
        return False
    if graph[x][y] == 0:
        graph[x][y] = 1
        dfs(x-1, y)
        dfs(x, y-1)
        dfs(x+1, y)
        dfs(x, y+1)
        return True
    return False

n, m = map(int, input().split())
graph = []
for i in range(n):
    graph.append(list(map(int,input())))
result = 0
for i in range(n):
    for j in range(m):
        if dfs(i, j) == True:
            result += 1
print(result)

3


In [25]:
from collections import deque

def bfs(x, y):
    queue = deque()
    queue.append((x,y))
    while queue:
        x, y = queue.popleft()
        for i in range(4):
            nx = x + dx[i]
            ny = y + dy[i]
            if nx >=n or ny>=m or ny<=-1 or nx <=-1:
                continue
            if graph[nx][ny]==0:
                continue
            if graph[nx][ny] ==1:
                graph[nx][ny]=graph[x][y]+1
                queue.append((nx,ny))
    return graph[n - 1][m - 1]

n, m = map(int, input().split())
graph = []
for _ in range(n):
    graph.append(list(map(int, input())))

dx = [-1, 1, 0, 0]
dy = [0, 0, -1, 1]

print(bfs(0, 0))

10


In [31]:
def dfs(graph, v, visited):
    visited[v] = True
    print(v, end=' ')
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i, visited)

graph = [
    [], 
    [7, 5, 3], 
    [], 
    [6],
    [9], 
    [8, 10], 
    [], 
    [4], 
    [2],
    [], 
    []
]
visited = [False] * 11

dfs(graph, 1, visited)


1 7 4 9 5 8 2 10 3 6 

# BJ 문제 풀이

## [BJ 1260) DFS와 BFS](https://www.acmicpc.net/problem/1260)

In [39]:
# bj 1260
from collections import deque

def dfs(graph, v, visited):
    visited[v] = True
    print(v, end=' ')
    for i in sorted(graph[v]):
        if not visited[i]:
            dfs(graph, i, visited)

def bfs(graph, v, visited):
    queue = deque([v])
    visited[v] = True
    while queue:
        v = queue.popleft()
        print(v, end=' ')
        for i in sorted(graph[v]):
            if not visited[i]:
                queue.append(i)
                visited[i] = True

n, m, v = map(int,input().split())
arr = [list(map(int, input().split())) for _ in range(m)]
graph=[[] for _ in range(n+1)]

for i in arr:
    graph[i[0]].append(i[1])
    graph[i[1]].append(i[0])

dfsVisited = [False] * (n+1)
bfsVisited = [False] * (n+1)
dfs(graph, v, dfsVisited)
print()
bfs(graph, v, bfsVisited)

1 2 3 4 

## [BJ 2606) 바이러스](https://www.acmicpc.net/problem/2606)

In [10]:
def dfs(graph, v, visited):
    visited[v] = True
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i, visited)

n = int(input())  # 노드(컴퓨터) 개수
m = int(input())  # 간선 개수

graph = [[] for _ in range(n+1)]
result = 0
# print(graph)

for _ in range(m):
    a, b = map(int, input().split())
    graph[a].append(b)
    graph[b].append(a)
    
visited = [False] * (n+1)
dfs(graph, 1, visited)

for i in visited:
    if i:
        result += 1
print(result - 1)

[False, True, True, True, False, True, True, False]
