## DFS / BFS

## 1. 꼭 필요한 자료구조 기초

- 탐색 : 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정 → 스택, 큐, 재귀 함수
- 자료구조 : 데이터를 표현하고 관리하고 처리하기 위한 구조
    - 오버플로(특정한 자료구조가 수용할 수 있는 데이터의 크기를 이미 가득 찬 상태에서 삽입 연산을 수행할 때 발생)와 언더플로(데이터가 전혀 들어있지 않은 상태에서 삭제 연산을 수행할 때 발생) 고민해야함

### 스택

- FILO(First in Last Out) 구조

In [4]:
stack = []

stack.append(5)
stack.append(2)
stack.append(3)
stack.append(7)
stack.pop()
stack.append(1)
stack.append(4)
stack.pop()


print(stack) # 최하단 원소부터 출력
print(stack[::-1]) # 최상단 원소부터 출력

[5, 2, 3, 1]
[1, 3, 2, 5]


### 큐

- 선입선출 구조
- 파이썬으로 큐를 구현할 때 collections 모듈의 deque 자료구조 활용
    - 스택과 큐의 장점 모두 채택
    - 데이터를 넣고 빼는 속도가 리스트 자료형에 비해 효율적이며 queue 라이브러리를 이용하는 것보다 더 간단함

In [3]:
from collections import deque

# 큐(Queue) 구현을 위해 deque 라이브러리 사용
queue = deque()

queue.append(5)
queue.append(2)
queue.append(3)
queue.append(7)
queue.popleft()
queue.append(1)
queue.append(4)
queue.popleft()

print(queue)
queue.reverse() # 다음 출력을 위해 역순으로 바꾸기
print(queue)    # 나중에 들어온 원소부터 출력

deque([3, 7, 1, 4])
deque([4, 1, 7, 3])


### 재귀함수

- 자기 자신을 다시 호출하는 함수

In [5]:
# 재귀함수 예제
def recursive_function():
    print('재귀 함수를 호출합니다.')
    recursive_function()

# recursive_function()

In [6]:
# 재귀함수의 종료 조건 예제
def recursive_function(i):
    # 100번째 출력했을 때 종료되도록 종료 조건 명시
    if i == 100:
        return
    print(i, '번째 재귀 함수에서', i+1, '번째 재귀 함수를 호출합니다.')
    recursive_function(i+1)
    print(i, '번째 재귀 함수를 종료합니다.')

recursive_function(1)

1 번째 재귀 함수에서 2 번째 재귀 함수를 호출합니다.
2 번째 재귀 함수에서 3 번째 재귀 함수를 호출합니다.
3 번째 재귀 함수에서 4 번째 재귀 함수를 호출합니다.
4 번째 재귀 함수에서 5 번째 재귀 함수를 호출합니다.
5 번째 재귀 함수에서 6 번째 재귀 함수를 호출합니다.
6 번째 재귀 함수에서 7 번째 재귀 함수를 호출합니다.
7 번째 재귀 함수에서 8 번째 재귀 함수를 호출합니다.
8 번째 재귀 함수에서 9 번째 재귀 함수를 호출합니다.
9 번째 재귀 함수에서 10 번째 재귀 함수를 호출합니다.
10 번째 재귀 함수에서 11 번째 재귀 함수를 호출합니다.
11 번째 재귀 함수에서 12 번째 재귀 함수를 호출합니다.
12 번째 재귀 함수에서 13 번째 재귀 함수를 호출합니다.
13 번째 재귀 함수에서 14 번째 재귀 함수를 호출합니다.
14 번째 재귀 함수에서 15 번째 재귀 함수를 호출합니다.
15 번째 재귀 함수에서 16 번째 재귀 함수를 호출합니다.
16 번째 재귀 함수에서 17 번째 재귀 함수를 호출합니다.
17 번째 재귀 함수에서 18 번째 재귀 함수를 호출합니다.
18 번째 재귀 함수에서 19 번째 재귀 함수를 호출합니다.
19 번째 재귀 함수에서 20 번째 재귀 함수를 호출합니다.
20 번째 재귀 함수에서 21 번째 재귀 함수를 호출합니다.
21 번째 재귀 함수에서 22 번째 재귀 함수를 호출합니다.
22 번째 재귀 함수에서 23 번째 재귀 함수를 호출합니다.
23 번째 재귀 함수에서 24 번째 재귀 함수를 호출합니다.
24 번째 재귀 함수에서 25 번째 재귀 함수를 호출합니다.
25 번째 재귀 함수에서 26 번째 재귀 함수를 호출합니다.
26 번째 재귀 함수에서 27 번째 재귀 함수를 호출합니다.
27 번째 재귀 함수에서 28 번째 재귀 함수를 호출합니다.
28 번째 재귀 함수에서 29 번째 재귀 함수를 호출합니다.
29 번째 재귀 함수에서 30 번째 재귀 함수를 호출합니다.
30 번째 재귀 함수에서 31 번째 재귀 함수를 호출합니

### 2가지 방식으로 구현한 팩토리얼 예제

In [7]:
# 반복적으로 구현한 n!
def factorial_iterative(n):
    result = 1
    # 1부터 n까지의 수를 차례대로 곱하기
    for i in range(1, n+1):
        result *= i
    return result

# 재귀적으로 구현한 n!
def factorial_recursive(n):
    if n <= 1:  # n이 1이하인 경우 1을 반환
        return 1
    
    # n! = n * (n-1)!를 그대로 코드로 작성하기
    return n * factorial_recursive(n-1)

# 각각의 방식으로 구현한 n! 출력(n = 5)
print('반복적으로 구현 : ', factorial_iterative(5))
print('재귀적으로 구현 : ', factorial_recursive(5))

반복적으로 구현 :  120
재귀적으로 구현 :  120


# 탐색 알고리즘 DFS/BFS

## DFS
- 깊이 우선 탐색, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘


#### 인접 행렬 방식 : 2차원 배열에 각 노드가 연결된 형태를 기록하는 방식

In [8]:
INF = 999999999 # 무한의 비용 선언

# 2차원 리스트를 이용해 인접 행렬 표현
graph = [
    [0, 7, 5],
    [7, 0, INF],
    [5, INF, 0]
]

print(graph)

[[0, 7, 5], [7, 0, 999999999], [5, 999999999, 0]]


#### 인접 리스트 방식 : 모든 노트에 연결된 노드에 대한 정보를 차례로 연결하여 저장

In [9]:
# 행(Row)이 3개인 2차원 리스트로 인접 리스트 표현
graph = [[] for _ in range(3)]

# 노드 0에 연결된 노드 정보 저장(노드, 거리)
graph[0].append((1, 7))
graph[0].append((2, 5))

# 노드 1에 연결된 노드 정보 저장(노드, 거리)
graph[1].append((0, 7))

# 노드 2에 연결된 노드 정보 저장(노드, 거리)
graph[2].append((0, 5))

print(graph)

[[(1, 7), (2, 5)], [(0, 7)], [(0, 5)]]


- 인접 행렬 방식
    - 모든 관계를 저장하므로 노드 개수가 많을수록 메모리가 불필요하게 낭비됨
- 인접 리스트 방식
    - 메모리 공간의 낭비가 적음. 
    - 연결된 정보만을 저장하기 때문에 인접 행렬 방식에 비해 특정한 두 노드가 연결되어 있는지에 대한 정보를 얻는 속도가 느리다.(연결된 데이터를 하나씩 확인해야 하기 때문)

#### 구체적인 동작 과정
1. 탐색 시작 노드를 스택에 삽입하고 방문 처리를 한다.
2. 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리를 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.
3. 2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.

In [12]:
%%writefile DFS.py
# DFS 예제
def dfs(graph, v, visited):
    # 현재 노드를 방문 처리
    visited[v] = True
    print(v, end = ' ')
    # 현재 노드와 연결된 다른 노드를 재귀적으로 방문
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i, visited)

# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph = [
    [],
    [2,3,8],
    [1,7],
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]

# 각 노드가 방문한 정보를 리스트 자료형으로 표현(1차원 리스트)
visited = [False] * 9

# 정의된 DFS 함수 호출
dfs(graph, 1, visited)

Writing DFS.py


## BFS
- 너비 우선 탐색, 가까운 노드부터 탐색하는 알고리즘
- 큐를 주로 이용
    - 인접한 노드를 반복저긍로 큐에 넣도록 알고리즘을 작성하면 자연스럽게 먼저 들어온 것이 먼저 나가게 되어 가까운 노드부터 탐색을 진행하게 됨


#### 구체적인 동작 과정
1. 탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다
2. 큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리를 한다
3. 2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다

### 일반적인 경우 실제 수행 시간은 DFS보다 좋은 편임

In [14]:
%%writefile BFS.py
# BFS 예제
from collections import deque

# BFS 메서드 정의
def bfs(graph, start, visited):
    # 큐(Queue) 구현을 위해 deque 라이브러리 사용
    queue = deque([start])
    # 현재 노드를 방문 처리
    visited[start] = True
    # 큐가 빌 때까지 반복
    while queue:
        # 큐에서 하나의 원소를 뽑아 출력
        v = queue.popleft()
        # 해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
        for i in graph[v]:
            if not visited[i]:
                queue.append(i)
                visited[i] = True

# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph = [
    [],
    [2,3,8],
    [1,7],
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]

# 각 노드가 방문한 정보를 리스트 자료형으로 표현(1차원 리스트)
visited = [False] * 9

# 정의된 DFS 함수 호출
bfs(graph, 1, visited)

Overwriting BFS.py
