# **DFS BFS**


## **목차**

---
##### 1. DFS, BFS 단어 정의   
##### 2. 코드로 알아보는 DFS, BFS   
##### 3. 알고리즘 예제
##### 4. 결론   

---

## 1. **DFS, BFS 란?**
- BFS, DFS는 그래프를 탐색하는 방법으로 정점(node)와 그 정점을 연결하는   
간선(edge)로 이루어진 자료구조의 일종을 탐색하는 기법을 말한다.

##### **1. DFS - 깊이 우선 탐색 (Depth-First Search)**
- 루트 노드에서 시작해서 **다음 분기로 넘어가기 전에 해당 분기를 완벽하게 탐색**하는 방식
   
![image.png](attachment:image.png)   

- **구체적인 동작과정**
    1. 탐색 시작 노드를 스택에 삽입하고 방문 처리 한다.
    2. 스택의 최상단 노드에 방문하지 않은 인접한 노드가 하나라도 있다면 그 노드를 스택에 넣고 방문 처리한다.   
    방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.   
    즉, 매번 최상단 원소를 기준으로 방문하지 않은 인접 노드가 있으면 그 노드로 방문을 수행한다.
    3. 더 이상 2번 과정을 할 수 없을 때까지 반복한다.   


##### **2. BFS - 너비 우선 탐색 (Breadth-First Search)**
- 루트 노드에서 시작해서 **인접한 노드를 먼저 탐색**하는 방법으로,   
시작 정점으로부터 가까운 정점을 먼저 방문하고 멀리 떨어져 있는 정점을 나중에 방문하는 순회 방식

![image.png](attachment:image.png)

- **구체적인 동작과정**
    1. 탐색 시작 노드를 큐에 삽입하고, 방문 처리를 한다.
    2. 큐에서 노드를 꺼낸 뒤에 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 **모두 큐에 삽입**하고 방문 처리한다.   
    DFS를 수행할 때에는 인접하지 않은 노드에 대해 다시 한번 스택에 넣으면서 수행하였지만,   
    BFS는 해당 시점에서 **인접한 노드를 한 번에 전부** 큐에 넣는다.
    3. 더 이상 2번 과정을 할 수 없을 때까지 반복한다.   



##### **3. DFS, BFS 비교**
> 1. 모든 노드를 방문하고자 하는 경우에 BFS 방법을 선택
> 2. 깊이 우선 탐색(DFS)이 너비 우선 탐색(BFS)보다 좀 더 간단한 방식
> 3. 검색 속도 자체는 너비 우선탐색(BFS)에 보다 느림   

|종류|내 용|
|:-----:|:-----|
|DFS| 현재 정점에서 갈 수 있는 점들까지 들어가면서 탐색 (**스택 또는 재귀함수**로 표현) |
|BFS| 현재 정점에 연결된 가까운 점들부터 탐색 (**큐**를 이용해서 구현) |
   

![image-4.png](attachment:image-4.png)

##### **4. 시간복잡도**
- 모든 노드를 검색한다는 점에서 시간 복잡도는 동일하다.
- 일반적으로는 DFS를 재귀 함수로 구현하면 DFS보다 BFS가 조금 더 빠르게 동작    

N이 노드의 개수, E가 간선의 개수일 때   
> 인접 리스트 : O(N+E)   
> 인접 행렬 : O(N^2)   

---

## **2. 코드로 확인해보기**

##### **1. DFS 소스코드**
```python
# DFS 메서드 정의
def dfs(graph, v, visited):
    # 현재 노드를 방문 처리
    visited[v] = True
    print(v, end=' ')
    # 현재 노드와 연결된 다른 노드를 재귀적으로 방문
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i, visited)

# 각 노드가 연결된 정보를 표현 (2차원 리스트)
graph = [
    [],
    [2, 3, 8],
    [1, 7],
    [1, 4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]

# 각 노드가 방문된 정보를 표현 (1차원 리스트)
visited = [False] * 9

# 정의된 DFS 함수 호출
dfs(graph, 1, visited)

```
![image-3.png](attachment:image-3.png)

##### **2. BFS 소스코드**
```python
from collections import deque

# BFS 메서드 정의
def bfs(graph, start, visited):
    # 큐 구현을 위해 deque 라이브러리 사용
    queue = deque([start])
    # 현재 노드를 방문 처리
    visited[start] = True
    # 큐가 빌 때까지 반복
    while queue:
        # 큐에서 하나의 원소를 뽑아 출력하기
        v = queue.popleft()
        print(v, end=' ')
        # 아직 방문하지 않은 인접한 원소들을 큐에 삽입
        for i in graph[v]:
            if not visited[i]:
                queue.append(i)
                visited[i] = True

# 각 노드가 연결된 정보를 표현 (2차원 리스트)
graph = [
    [],
    [2, 3, 8],
    [1, 7],
    [1, 4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]

# 각 노드가 방문된 정보 표현 (1차원 리스트)
visited = [False] * 9

# 정의된 BFS 함수 호출
bfs(graph, 1, visited)
```
![image-2.png](attachment:image-2.png)

---

## 3. **알고리즘 예제**

#### 1. **DFS**
- Q. N x M 크기의 얼음 틀이 있다. 구멍이 뚫린 부분은 0, 칸막이가 존재하는 부분은 1로 표시된다.   
구멍이 뚫려 있는 부분끼리 상, 하, 좌, 우로 붙어 있는 경우 서로 연결되어 있는 것으로 간주한다.   
이때 얼음 틀의 모양이 주어졌을 때 생성되는 총 아이스크림의 개수를 구하는 프로그램을 작성하시오.

![image-5.png](attachment:image-5.png)

1. 입력 조건
    - 첫 번째 줄에 얼음 틀의 세로 길이 N과 가로 길이 M이 주어진다. (1 <= N, M <= 1000)
    - 두 번째 줄부터 N+1 번째 줄까지 얼음 틀의 형태가 주어진다.
    - 이때 구멍이 뚫려있는 부분은 0, 그렇지 않은 부분은 1이다.
2. 출력 조건
    - 한 번에 만들 수 있는 아이스크림의 개수를 출력한다.

3. 풀이 방법
    - 문제는 DFS 혹은 BFS로 해결할 수 있으며, **'연결 요소 찾기' Connected Component**를 찾는 문제로 볼 수 있다.   

얼음을 얼릴 수 있는 공간이 '상, 하, 좌, 우'로 연결되어 있다고 표현할 수 있으므로, **그래프 형태로 모델링** 할 수 있다.

![image-6.png](attachment:image-6.png)

- DFS 활용 알고리즘 풀이 로직
    1. 특정 지점의 주변 상, 하, 좌, 우를 살펴본 뒤 주변 지점 중에서 값이 '0'이면서 아직 방문하지 않은 지점이 있다면 해당 지점을 방문한다.
    2. 방문한 지점에서 다시 상, 하, 좌, 우를 살펴보며 방문을 진행하는 과정을 반복하면, **연결된 모든 지점을 방문**하게 된다.
    3. 모든 노드에 대해 1, 2번 과정을 반복하면서 방문하지 않은 지점의 수를 카운트 한다.


### * python 코드 - DFS
```python
import sys

# DFS로 특정 노드를 방문하고 연결된 모든 노드들도 방문
def dfs(x, y):
    # 주어진 범위를 벗어나는 경우 즉시 종료
    if x <= -1 or x >= n or y <= -1 or y >= m:
        return False
    # 현재 노드를 아직 방문하지 않았다면
    if graph[x][y] == 0:
        # 해당 노드 방문 처리
        graph[x][y] = 1
        # 상, 하, 좌, 우의 위치들도 모두 재귀적으로 호출
        dfs(x - 1, y)
        dfs(x, y - 1)
        dfs(x + 1, y)
        dfs(x, y + 1)
        return True
    return False

# N, M을 공백을 기준으로 구분하여 입력 받음
n, m = map(int, sys.stdin.readline().rstrip().split())

# 2차원 리스트의 맵 정보 입력 받기
graph = []
for i in range(n):
    graph.append(list(map(int, input())))
    
# 모든 노드(위치)에 대하여 음료수 채우기
result = 0
for i in range(n):
    for j in range(m):
        # 현재 위치에서 DFS 수행
        if dfs(i, j) == True:
             result += 1

print(result) # 정답 출력
```


#### 2. **BFS**
- 신종 바이러스인 웜 바이러스는 네트워크를 통해 전파된다. 한 컴퓨터가 웜 바이러스에 걸리면 그 컴퓨터와   
네트워크 상에서 연결되어 있는 모든 컴퓨터는 웜 바이러스에 걸리게 된다.   
예를 들어 7대의 컴퓨터가 아래와 같이 연결되어 있을 때 1번 컴퓨터가 바이러스에 걸리면 그와 인접한 모든 컴퓨터가 바이러스에 걸리게 된다.   
하지만 4번과 7번 컴퓨터는 연결되어 있지 않기 때문에 영향을 받지 않는다.

![image-7.png](attachment:image-7.png)

1. 입력 조건
    - 첫째 줄에는 컴퓨터의 수가 주어진다.
    - 컴퓨터의 수는 100 이하인 양의 정수이고 각 컴퓨터에는 1번 부터 차례대로 번호가 매겨진다.
    - 둘째 줄에는 네트워크 상에서 직접 연결되어 있는 컴퓨터 쌍의 수가 주어진다.
    - 이어서 그 수만큼 한 줄에 한 쌍씩 네트워크 상에서 직접 연결되어 있는 컴퓨터의 번호 쌍이 주어진다.

2. 출력 조건
    - 1번 컴퓨터가 웜 바이러스에 걸렸을 때, 1번 컴퓨터를 통해 웜 바이러스에 걸리게 되는 컴퓨터의 수를 첫째 줄에 출력한다.

3. 풀이 방법
    - 문제는 DFS 혹은 BFS로 해결할 수 있으며, **'연결 요소 찾기' Connected Component**를 찾는 문제로 볼 수 있다.   

### * python 코드 - BFS
```python
import sys
N_computer = int(input())
visited = [False]*(N_computer+1)
N_E = int(input())
E=[[] for i in range(N_computer+1)]

for i in range(N_E):
    S,D = map(int, input().split())
    E[S].append(D)
    E[D].append(S)
count = 0

from collections import deque
def bfs(E,v,visited):
    queue = deque([v])  #시작점을 큐에 넣는다.
    visited[v]=True   #시작점 방문처리
    global count
    while queue: 
        x = queue.popleft()      #큐에서 가장 앞에 있는 노드와 인접한 노드 탐색
        for i in E[x]:
            if not visited[i]:
                queue.append(i)
                visited[i]=True 
                count+=1
bfs(E,1,visited)
print(count)
```
---

## **4. 결론**

### * 내가 생각하는 DFS, BFS
#### 1. DFS
    - DFS는 깊이를 탐색하기 때문에 해가 없는 경우에도 끝까지 탐색을 한다. 따라서 특정 경우에는 효율성이 나쁘다.
    - DFS는 최단 경로를 찾는 보장이 없다. 해를 찾는 순간 종료되기 때문!
    - 완전 탐색 시에는 BFS보다는 DFS 채택!!
        - 재귀함수를 사용하기 때문에 자체의 시간 복잡도는 높은 편이지만, 공간복잡도 측면에서는 우수함
    - 일반 Array보다 공간복잡도에서 안 좋은 경우도 있음
    - Stack 방식의 구조로 재귀함수를 사용하여 재귀함수를 층층이 쌓는 그림을 생각하면 이해하기 쉽다. (함수의 콜스택)
    - Stack 자료의 구조를 잘 파악하고 DFS의 순환 방식에 대해서 깊은 이해를 해야함

#### 2. BFS
    - 최단경로나 수단을 탐색할 때 주로 쓰임
    - BFS의 성능을 좌우하는 것은 Queue! -> 이 Queue 를 잘 만드는 것이 Point
        - 성능이 좋지 않은 Queue를 만들면 시간복잡도가 엄청 커질 수 있다는 것을 주의할 것
    - BFS는 Queue를 이용하는 구조로 지속적으로 인접 노드에 대해서 Queue에 추가하고 비우는 방식으로   
    제일 마지막 인접한 노드가 없을 때 하나씩 비워지기 시작하는 것을 생각할 것!
    - Queue 자료의 구조를 잘 파악하고 BFS의 순환 방식에 대해서 깊은 이해를 해야함


- DFS와 BFS 전부 탐색의 일종이지만 상황에 맞추어 각 탐색법의 특징을 살려 적용하는 것이 중요하다.   
시간, 공간 복잡도를 생각하여 최적의 효율을 낼 수 있는 탐색법을 사전에 생각할 수 있는 능력이 중요함
