# 탐색알고리즘 DFS / BFS

# 필요 사전 개념

- 앞에서 배운 Stack, Queue,  재귀함수이다.
- 혹시 혼동되거나 정확하지 않은 부분이 있다면 다시 가서 확인을 할 것!!!
- 아래의 DFS, BFS의 경우에는 다른 경우와 마찬가지로 기본적인 용어에 대해서 정확하게 파악을 하고, 그 이름에 힌트가 있으며 기본적인 개념을 놓치면 다시 생각을 할 수 있도록 할 것!!!!

# 그래프 탐색

## 그래프의 개념?

### 구성 요소

$$G = (V,E)
$$

$$V(G) : set of vertices \\ E(G) : set of edge$$

→ 간단히 말하면, 노드(node)와 간선(edge)로 표현이 된다.
경우에 따라서 노드는 정점(Vertex)라고 표현을 하기도 한다!!!
→ 그래프는  Node & Link  or Vertext & Edge로 표현한다고 개념을 가지고 있어야 함!!!

### 종류

- 선에 대해서 방향을 생각할 수 있음!
- 방향성이 없는  Undirected Graph, 방향성이 있는 Directed Graph
- (Vi, Vj) = (Vj, Vi) : Undirected Graph
- (Vi, Vj) ≠  (Vj, Vi) : Directed Graph

### 기타 용어

- 완전 그래프 : Complete Graph

- 인접 adjacent : 무방향 그래프에서 정점(Vertex) a,b에 대해서 Edge가 있을 때

<aside>
💡 중요한 사항!!!
위의 일반적인 것들에 대해서는 일반적인 가중치가 없는 경우에 있어서는 연결이 되면1, 아니면 0으로 하고, 가중치가 있는 경우에서도 **연결이 없으면 0으로 표시**를 한다.
그러나 우리가 경로에 대한 탐색을 위해서는 연결이 안 되는 것들에 대해서는 0으로 하게 된다면 길이가 짧은0으로 계산이 될 수 있어서 보통의 경우에는 inf의 무한대의 값으로 처리를 해서 그 길에 대해서는 엄청나게 긴 길이 된 것이라고 우회적으로 표현을 한다!! → 그 경로는 불가능하다는 식으로 처리를 하게 된다.
그 결과 경우에 따라서 자기 자신도 inf로 하는 경우도 있지만, **여기서는 자기 자신에 대해서는0으로 표기, 연결이 안 된 곳은 inf, 연결이 된 경우에서는 1 or 가중치를 반영을 통해서 처리를 기본으로 한다!!!
→ 연결은 1 or 가중치, 연결이 없는 곳은 Inf(무한대), 자기 자신은 0 or inf or 연결이 있으면 1 or 가중치로.**

</aside>

## 인접행렬 및 인접리스트 파이썬을 이용한 구현 예시

### 인접행렬

- 예시

In [1]:
##### 방법1) 직접 큰 숫자 지정
# 무한 비용선언
INF = 999999999


graph = [
    [0, 7, 5],
    [7, 0, INF],
    [5, INF, 0]
]

print(graph)
#######################################################################
### 참고) 명시적으로 inf 만들기
# 파이썬에서의 inf에 대한 활용법..
num = float('inf')
print(type(num))
print(num>1)
print(num>99999999999999)
#######################################################################
#### 방법2) 명시적으로 inf 로 만들어서 하기
# 무한 비용선언 -> 파이썬을 활용한 부분
INF = float("inf")

graph = [
    [0, 7, 5],
    [7, 0, INF],
    [5, INF, 0]
]

print(graph)

[[0, 7, 5], [7, 0, 999999999], [5, 999999999, 0]]
<class 'float'>
True
True
[[0, 7, 5], [7, 0, inf], [5, inf, 0]]


In [2]:
# 직접 구현해보기
# 무한 비용 선언
INF = float('inf')

graph = [
    [0, 1, INF, 1],
    [1, 0, 1, 1],
    [INF, 1, 0, 1],
    [1, 1, 1, 0]
]

print(graph)

[[0, 1, inf, 1], [1, 0, 1, 1], [inf, 1, 0, 1], [1, 1, 1, 0]]


### 인접리스트

기본 방법 : 위에서도 언급을 하였듯이 기본적으로 모든 노드에 연결된 노드에 대한 정보를 차례차례 연결하여 저장을 한다.

In [4]:
# _ 는 자기 자신이 되고, 아래와 같이 3개의 가로줄이 있는 빈 리스트에 대해서 만들어 둠...
graph = [[] for _ in range(3)]
print(graph)
#########################################################################



# 가로 3줄에 대한 빈 리스트 생성..
graph = [[] for _ in range(3)]

# 노드 0에 대한 정보 기입 -> 노드 번호, 가중치
graph[0].append((1,7))
graph[0].append((2,5))

# 노드 1에 대한 정보 기입 -> 노드 번호, 가중치
graph[1].append((0,7))

# 노드 2에 대한 정보 기입 -> 노드 번호, 가중치
graph[2].append((0,5))

print(graph)

[[], [], []]
[[(1, 7), (2, 5)], [(0, 7)], [(0, 5)]]


### 인접행렬과 인접리스트의 차이?

동일한 그래프를 가지고 한 경우에서는 인정행렬로 표현을 하였고, 한 경우는 인접 리스트로 표현을 하였다. 
이 두가지 방법에 대해서 좀 더 고찰을 해보자..
→ 관점 포인트 : 메모리 & 속도

인접행렬 : 모든 관계를 다 저장을 하게 된다 → 노드의 수 ^2의 정보가 필요하게 됨.
인접리스트 : 필요한 정보만 저장을 하게 된다. → but 연결에 대한 정보들은 있지만, 두 노드가 연결이 되었는지에 대한 판단에 대해서는 시간 소요가 있음. → Why? 연결된 데이터를 하나씩 확인을 해야지만 가능하기에.....

인접행렬의 경우에는 위의 우리가 직접 구현한 것들에 대해서 0번 노드가 1번 노드와 연결이 되어 있는데, 이것에 대한 접근을 위해서는 graph[0][1]만 확인하면 된다.
But 인접리스트의 경우에 있너서는 노드0에 대해서 인접리스트를 앞에서부터 차례대로 확인을 해야한다. → `여기서 포인트!!!` 특정한 노드와 연결된 모든 인접 노들들을 순회하면서 확인을 해야하는 경우에 있어서는 인접리스트가 인접행렬에 비해서 메모리 공간의 낭비가 적다!!!!!

<aside>
💡 가장 크게
 "두 노드 간에 연결이 있는지 없는지에 대한 확인"의 경우 → 인접행렬 > 인접리스트(속도가 리스트의 경우 느리다)
"노드에 연결된 모든 노드들을 순회/탐색"의 경우 → 인접리스트 > 인접행렬(메모리 효율적)

</aside>

> [메모리]
- 인접 행렬(Adjacency Matrix): 모든 관계를 저장하므로 노드 개수가 많을 수록 불필요한 메모리가 소요된다.
- 인접 리스트(Adjacency List): 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용한다.

[속도]
- 인접 행렬(Adjacency Matrix): 모든 경우의 수가 제시되어 있으므로 인접리스트보다 빠르다.
- 인접 리스트(Adjacency List): 인접행렬방식에 비해 정보를 얻는 속도가 느리다. 인접리스트방식에서는 연결된 데이터를 하나씩 확인해야 하기 때문이다.
>

## 그래프 탐색?

- 모든 Node를 Edge를 따라서 모든 Node를 방문하는 것을 그래프 탐색이라고 함. → 대표적인 방법이 DFS, BFS가 있음.

ref) [https://seing.tistory.com/29](https://seing.tistory.com/29)

# DFS : Depth First Search

## 기본 원리 및 동작

- 기본 아이디어 : 깊은 부분을 우선적으로 탐색을 하자!!!(이름 그대로!!) → `Stack`이라는 것을 활용하여 구현이 됨!!! → Stack의 특성인 `FILO(First In Last Out)` 방식에 대한 것을 다시 상기해야 함!!!( 데이터를 집어넣는 순서와 꺼내는 순서가 역방향이라는 점!!)

![https://upload.wikimedia.org/wikipedia/commons/thumb/7/7f/Depth-First-Search.gif/220px-Depth-First-Search.gif](https://upload.wikimedia.org/wikipedia/commons/thumb/7/7f/Depth-First-Search.gif/220px-Depth-First-Search.gif)

> [DFS]
1) 탐색 시작 노드를 스택에 삽입을 하고 방문처리르 함.
2) 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으며, 그 인접 노드ㅜ를 스택에 넣고 방문 처리를 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.
3) 2번의 과정을 더 이상 수행할 수 없을 때 까지 반복한다.
(참고) 방문 처리: 스택에 한 번 삽입되어 처리된 노드가 다시 삽입되지 않게 체크하는 것을 의미한다. 방문 처리를 함으로써 각노드를 한 번씩 처리를 할 수 있음.
(참고) 한 노드에서 여러 노드로 갈림길이 있을 때 일정한 규칙에 의해서, 여기서는 작은 숫자를 먼저 수행을 하는 것으로 처리를 함.
>

## DFS알고리즘 구현

### 방법1) 파이썬의 리스트를 활용하여서 Stack의 구조 구현

- 기본적인 내용을 구현하기 위해서는 
(입력) 그래프의 정보, 시작 노드 → (출력) 탐색한 노드들의 순서
0) 기본적으로 지금 어느 노드에 가봐야 하는지 하는 것과 내가 이미 방문을 했는지에 대한 것을 처리하는 2개의 대상이 필요함. 
1) 시작점을 통해서 일단 그 시작점에 연결된 것들을 다 탐색을 해본다.
2) 탐색을 하는 과정에서 이미 방문을 하였는지, 안 하였는지에 따라서 → 이미 방문을 했다면 안 하고 새로운 곳이면 방문을 해야하는 곳으로 가서 할 것.
- 참고) 이 경우에 좀 더 쉽게 처리를 하기 위해서 파이썬의 Dict로 인접리스트를 구현을 한다. Why? 파이썬의 dict는 Hash Table의 역할을 하고 있으며, 노드의 중복 여부에 대해서 key로 처리를 하고 있으며, 탐색에 대한 시간도 O(1)의 복잡도를 가지고 있어서임.

In [6]:
# dictionary로 구현
graph = {
    "1" : ["2","3","8"],
    "2" : ["1","7"],
    "3" : ["4","5"],
    "4" : ["3","5"],
    "5" : ["3","4"],
    "6" : ["7"],
    "7" : ["2","6","8"],
    "8" : ["1","7"]
}
graph

{'1': ['2', '3', '8'],
 '2': ['1', '7'],
 '3': ['4', '5'],
 '4': ['3', '5'],
 '5': ['3', '4'],
 '6': ['7'],
 '7': ['2', '6', '8'],
 '8': ['1', '7']}

In [7]:
def dfs_list(graph, start_node):
    # 사전에 필요한 두 개의 리스트
    need_visit = list()
    visited = list()
    
    # 시작노드에 대한 정보를 일단 방문해야할 리스트에 추가를 하고 시작준비
    need_visit.append(start_node)
    
    # 지속적으로 방문할 노드에 대해서 하기 위해서는 -> need_visit에서 빌 때 까지 visit에 추가를 하면 되는 것임!!!!!!!
    # 마치 To Do List는 하면서 지워야하고, 맨 마지막에는 할 리스트가 하나도 남지 말아야 하는 경우처럼...
    while need_visit:
        ## Stack 구조를 활용해서 맨 뒤에 있는 노드에 대해서 확인을해보자.
        node = need_visit.pop()
        ## 일단 꺼내서 우리가 지나온 목록에 있는지 없는지 확인을하고,
        ## 없다면 꺼내서 그 노드에 가서 목록에 추가를 해야한다.
        if node not in visited: # 방문 목록에 없다면...
            # 방문 목록에 없는 경우에는 방문을 하고 추가를 한다
            visited.append(node)
            # 그리고 그 노드에서 정보들(인접 리스트)를 바탕으로 stack에 다시 쌓아서 다시 위의 경우들에 대해서 반복
            # append로 할 수 있지만, 여러 리스트들이 덩어리로 있으니, 그 인접 리스트들을 전체를 합병을 한다....
            # 예를 들어서 1번 노드에 대한 값이 [2,8]이라면 [2,8]이라는 리스트를 우리가 가야할 리스트에 넣는다!!!!!-
            # 그래서 append가 아니라 extend로 병합 처리로... & 그리고 지금의 노드가 dict의 key로 되어 있으니ㅣ...
            need_visit.extend(graph[node])
    # while이 다 끝나면,,,,,,need_visit의 정보가 다 비워지면....
    # 즉, 해야할 일들에 대한 리스트를 다 했다면..
    return visited


dfs_list(graph, "1")

['1', '8', '7', '6', '2', '3', '5', '4']

<aside>
💡 앞에서는 지나간 노드들에 대해서 보면 **1 → 2 → 7 → 6 → 8 → 3 → 4 →5였는데, 지금 위에서 한 대로 하면 순서가 좀 다르게 1→ 8 → 7 → 6 → 2 → 3 → 5 → 4로 순서가 조금 다른 부분을 볼 수 있다.
이유는 리스트에서 병합을 하면서 pop으로 꺼내면서 제일 큰 숫자의 값이 제일 먼저 나오게 되어서 다 노드들을 돌지만, 위에서 한 그림과 그 순서가 다르게 된다.
아래의 경우는 각 노드에서 그 다음 노드를 갈 때, 큰 값이 아니라 제일 작은 값으로 기준을 해서 하기 위해서는 graph[node]에서 [2,8]에 대한 값을 ['8,2]로 순서를 뒤집어서 해주면 된다.**

</aside>

- 다음 노드를 탐색을 할 때, 작은 값을 기준으로 하도록 코드 수정

In [13]:
def dfs_list_sort(graph, start_node):
    # 사전에 필요한 두 개의 리스트
    need_visit = list()
    visited = list()
    
    # 시작노드에 대한 정보를 일단 방문해야할 리스트에 추가를 하고 시작준비
    need_visit.append(start_node)
    
    # 지속적으로 방문할 노드에 대해서 하기 위해서는 -> need_visit에서 빌 때 까지 visit에 추가를 하면 되는 것임!!!!!!!
    # 마치 To Do List는 하면서 지워야하고, 맨 마지막에는 할 리스트가 하나도 남지 말아야 하는 경우처럼...
    while need_visit:
        ## Stack 구조를 활용해서 맨 뒤에 있는 노드에 대해서 확인을해보자.
        node = need_visit.pop()
        ## 일단 꺼내서 우리가 지나온 목록에 있는지 없는지 확인을하고,
        ## 없다면 꺼내서 그 노드에 가서 목록에 추가를 해야한다.
        if node not in visited: # 방문 목록에 없다면...
            print('node',node)
            # 방문 목록에 없는 경우에는 방문을 하고 추가를 한다
            visited.append(node)
            print('visited', visited)
            # 그리고 그 노드에서 정보들(인접 리스트)를 바탕으로 stack에 다시 쌓아서 다시 위의 경우들에 대해서 반복
            # append로 할 수 있지만, 여러 리스트들이 덩어리로 있으니, 그 인접 리스트들을 전체를 합병을 한다....
            # 예를 들어서 1번 노드에 대한 값이 [2,8]이라면 [2,8]이라는 리스트를 우리가 가야할 리스트에 넣는다!!!!!-
            # 그래서 append가 아니라 extend로 병합 처리로... & 그리고 지금의 노드가 dict의 key로 되어 있으니ㅣ...
            # need_visit.extend(graph[node])
            
            ## 그 노드에 연결된 노드를  ----> 물론 일반적인 경우에서는 작은 것 부터 해야하는 경우는 없지만,
            ## 간혹 문제의 경우에서는 작은 값부터 해야한다고 명시할 경우에는 이렇게 reverse로 해서 제일 작은 값이 맨 뒤로와서 
            ## 바로 pop으로빠져나갈 수있어야 함. 
            #need_visited.extend(graph[node])
            ###############################################################################
            temp = graph[node]
            print('temp', temp)
            reversed_temp = list(reversed(temp))
            need_visit.extend(reversed_temp)
            print('need_visit', need_visit)
            #################################################################################
    # while이 다 끝나면,,,,,,need_visit의 정보가 다 비워지면....
    # 즉, 해야할 일들에 대한 리스트를 다 했다면..
    return visited


dfs_list_sort(graph, "1")

node 1
visited ['1']
temp ['2', '3', '8']
need_visit ['8', '3', '2']
node 2
visited ['1', '2']
temp ['1', '7']
need_visit ['8', '3', '7', '1']
node 7
visited ['1', '2', '7']
temp ['2', '6', '8']
need_visit ['8', '3', '8', '6', '2']
node 6
visited ['1', '2', '7', '6']
temp ['7']
need_visit ['8', '3', '8', '7']
node 8
visited ['1', '2', '7', '6', '8']
temp ['1', '7']
need_visit ['8', '3', '7', '1']
node 3
visited ['1', '2', '7', '6', '8', '3']
temp ['4', '5']
need_visit ['8', '5', '4']
node 4
visited ['1', '2', '7', '6', '8', '3', '4']
temp ['3', '5']
need_visit ['8', '5', '5', '3']
node 5
visited ['1', '2', '7', '6', '8', '3', '4', '5']
temp ['3', '4']
need_visit ['8', '5', '4', '3']


['1', '2', '7', '6', '8', '3', '4', '5']

→ 위와 같이 순서를 뒤집어서 넣어주게 되면, 앞에서 본 경우와 마찬가지로 순서가 작은 것을 기준으로 먼저 탐색을 하게 되어서 하는 것을 볼 수 있다!!!

문제에 따라서 순서를 지정을 하게 되는지 or 순서의 지정이 없는지에 따라서 위의 내용에 대해서 확인에 따라서 위의 두가지 방법에 대해서 숙지할 필요가 있음!!!

- 참고) 주로 BFS인 Queue에서 주로 사용하지만, deque를 활용해서 구현해보자.(물론, 뒤에서 deque에 대한 기능과 속도 등에 대해서 자세히 하겠지만, 여기서는 일단 리스트와 동일한데 속도가 좀 더 빠른 객체정도로만 인식하고 넘어가자!!!)

In [14]:
from collections import deque

def dfs_deque(graph, start_node):
    visit = []
    need_visit = deque()
    
    need_visit.append(start_node)
    
    while need_visit:
        node = need_visit.pop()
        if node not in visit:
            visit.append(node)
            need_visit.extend(graph[node])
    return visit

dfs_deque(graph, "1")

['1', '8', '7', '6', '2', '3', '5', '4']

### 방법2) 재귀함수를 활용해서 구현

- 책의 그래프를 리스트로 구현을 하고, 재귀함수를 통해서 구현하는 부분..

In [15]:
# DFS - 깊이 우선 탐색 -> 스택을 이용. 파이썬에서 리스트는 스택으로 구현되어 있음!
graph = [
    [],
    [2, 3, 8],
    [1, 7],
    [1, 4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]
######################################################################
# 방문노드 -> 방문 했는지 안했는지에 대해서 체크를 위한 부분
# -> 그리고 단순히 초기화를 False를 하기 위해서 * 연산으로 처리를 함.
visited = [False] * len(graph)

def dfs(graph, v, visited):
    # 일단 입력에 대해서 받는 부분에 대해서 처음 노드에 대해서 방문했다고 표시부터 하고 시작...
    visited[v] = True
    print(v, end=' ')
    
    for i in graph[v]:
        if not visited[i]:
            visited[i] = True
            # 여기서 다시 재귀 함수를 이용하는 부분이 됨!!!!
            dfs(graph, i, visited)

# 0번 노드가 없으니 1번 노드부터 탐색
dfs(graph, 1, visited)

1 2 7 6 8 3 4 5 

- 앞에서와 같이 graph를 dict로 하고, dict 기반으로 수정

In [16]:
graph = {
    "1" : ["2","3","8"],
    "2" : ["1","7"],
    "3" : ["4","5"],
    "4" : ["3","5"],
    "5" : ["3","4"],
    "6" : ["7"],
    "7" : ["2","6","8"],
    "8" : ["1","7"]
}
graph
##############################################################
def dfs_recursive_dict(graph, start, visited=[]):
    # 일단 시작 노드에 대한 정보를 visited에 추가..
    visited.append(start)
    
    for node in graph[start]:
        if node not in visited:
            # 여기서 다시 재귀 함수를 이용하는 부분이 됨!!!!
            dfs_recursive_dict(graph, node, visited)
    return visited

# 0번 노드가 없으니 1번 노드부터 탐색
dfs_recursive_dict(graph, "1")

['1', '2', '7', '6', '8', '3', '4', '5']

# 잠시) deque에 대해서...

- collections 패키지에서 구현한 `deque` 라는 자료형태가 있음. → `stack과 queue 기능을 모두 가진 객체로 출입구를 양쪽`으로 가지고 있는 것이다.  → Stack,. Queue 모두 필요에 따라서 사용할 수 있는 기능을 제공하고 있어서, 특히 Queue에 대해서 할 때 주로 많이 사용을 하는 부분임.
- 아래 그림과 같이 앞뒤에 다 출입구가 있는 경우라고 개념을 잡으면 된다.

<aside>
💡 앞, 뒤 양쪽방향에서 element를 추가하거나 제거를 할 수 있는 기능이 있음!!!!
→ append, pop이 빠른데, 이유는 일반적인 리스트의 경우에는 원소의 수 n에 따라서 맨 뒤의 경우에 접근하기 위해서는 O(n)이 필요하지만, deque는 O(1)로 접근이 가능하다.

</aside>

[ deque 주요 기능들 ]
`deque.append(item)`: item을 데크의 오른쪽 끝에 삽입<br>
`deque.appendleft(item)`: item을 데크의 왼쪽 끝에 삽입<br>
`deque.pop()`: 데크의 오른쪽 끝 엘리먼트를 가져오는 동시에 데크에서 삭제<br>
`deque.popleft()`: 데크의 왼쪽 끝 엘리먼트를 가져오는 동시에 데크에서 삭제<br>
`deque.extend(array)`: 주어진 배열(array)을 순환하면서 데크의 오른쪽에 추가<br>
`deque.extendleft(array)`: 주어진 배열(array)을 순환하면서 데크의 왼쪽에 추가<br>
`deque.remove(item)`: item을 데크에서 찾아 삭제<br>
`deque.rotate(num)`: 데크를 num만큼 회전한다(양수면 오른쪽, 음수면 왼쪽)

- 참고) 위의 속도에 대한 부분으로 인해서 백준 토마토(7576) 문제에서 일반적인 파이썬의 리스트의 경우에는 속도로 시간통과를 못하지만,  deque로 하면 시간통과를 할 수 있음!!  
ref) [https://chaewonkong.github.io/posts/python-deque.html](https://chaewonkong.github.io/posts/python-deque.html)
- deque에 대한 기본 기능

In [18]:
from collections import deque


# deque만들기
dq = deque("coding")
print('deque("coding")',dq)


# stack 구현
dq.append("a")
print('dq.append("a")', dq)
dq.pop()
print('dq.pop()', dq)

# queue 구현
dq.appendleft("a")
print('dq.appendleft("a")', dq)
dq.pop()
print('dq.pop()', dq)

# deque 확장 : extend, extendleft
dq.extend("test")
print('dq.extend("test")', dq)

dq.extendleft("x")
print('dq.extendleft("x")', dq)

# 주의사항!!!) 여러개의 덩어리를  할 때 순서가 뒤집어서 들어감!!!
dq.extendleft("abc")
print('dq.extendleft("abc")', dq)

dq.extendleft(["A","B"])
print('dq.extendleft(["A", "B"])', dq)

# dequeu를 리스트처럼 중간에 대새허 할 때 : insert, remove
dq[1] = "XX"
print('dq[1] = "XX"', dq)

dq.insert(0, "AAAA")
print('dq.insert(0, "AAAA")', dq)

dq.remove("XX")
print('dq.remove("XX")', dq)

# deque에 대한 반전
dq.reverse()
print('dq.reverse()', dq)


deque("coding") deque(['c', 'o', 'd', 'i', 'n', 'g'])
dq.append("a") deque(['c', 'o', 'd', 'i', 'n', 'g', 'a'])
dq.pop() deque(['c', 'o', 'd', 'i', 'n', 'g'])
dq.appendleft("a") deque(['a', 'c', 'o', 'd', 'i', 'n', 'g'])
dq.pop() deque(['a', 'c', 'o', 'd', 'i', 'n'])
dq.extend("test") deque(['a', 'c', 'o', 'd', 'i', 'n', 't', 'e', 's', 't'])
dq.extendleft("x") deque(['x', 'a', 'c', 'o', 'd', 'i', 'n', 't', 'e', 's', 't'])
dq.extendleft("abc") deque(['c', 'b', 'a', 'x', 'a', 'c', 'o', 'd', 'i', 'n', 't', 'e', 's', 't'])
dq.extendleft(["A", "B"]) deque(['B', 'A', 'c', 'b', 'a', 'x', 'a', 'c', 'o', 'd', 'i', 'n', 't', 'e', 's', 't'])
dq[1] = "XX" deque(['B', 'XX', 'c', 'b', 'a', 'x', 'a', 'c', 'o', 'd', 'i', 'n', 't', 'e', 's', 't'])
dq.insert(0, "AAAA") deque(['AAAA', 'B', 'XX', 'c', 'b', 'a', 'x', 'a', 'c', 'o', 'd', 'i', 'n', 't', 'e', 's', 't'])
dq.remove("XX") deque(['AAAA', 'B', 'c', 'b', 'a', 'x', 'a', 'c', 'o', 'd', 'i', 'n', 't', 'e', 's', 't'])
dq.reverse() deque(['t', 's', 'e',

- 참고) 일반적인 list와 비교해서 deque가 속도가 얼마나 빠른지에 대한 간략 비교 → stack보다는 queue의 구현에서 특히나 많은 시간차이가 발생을 하며, 그 이유는 list.pop( 0 ) 을 하면서 리스트에 대해서 메모리를 재할당을 하기때문에 queue에서 시간의 차이가 많이 발생을 한다. 보통의 경우에서는 stack 보다는 **queue에서는 일반적으로 deque를 이용해서 구현을 많이**한다.

In [21]:
########################################
###        Stack으로 활용할 경우     ###
########################################

from collections import deque
import time

N = 1000 # 초기에_넣어둘_원소_개수
TIMES = 100  # 실험 횟수
M = 1000 # M번 pop, M번 append(push)

# 일단 두 자료구조에 N개의 원소를 집어넣어둡니다.
list_stack = list([i for i in range(0, N)])
deque_stack = deque([i for i in range(0, N)])

########################################
# List as Stack
start_time = time.time()
for _ in range(0, TIMES):
    # M개의 원소를 append, pop
    for i in range(0, M):
        list_stack.append(i)
        list_stack.pop()
print("list",time.time() - start_time)

########################################
# Deque as Stack
start_time = time.time()
for _ in range(0, TIMES):
    # M개의 원소를 append, pop
    for i in range(0, M):
        deque_stack.append(i)
        deque_stack.pop()
print("deque",time.time() - start_time)

list 0.015633821487426758
deque 0.01368093490600586


In [22]:
########################################
###        Queue으로 활용할 경우     ###
########################################
from collections import deque
import time

N = 1000  # 초기에_넣어둘_원소_개수
TIMES = 100  # 실험 횟수
M = 1000  # M번 pop, M번 append(push)

# 일단 두 자료구조에 N개의 원소를 집어넣어둡니다.
list_queue = list([i for i in range(0, N)])
deque_queue = deque([i for i in range(0, N)])

########################################
# List as Queue
start_time = time.time()
for _ in range(0, TIMES):
    # M개의 원소를 append, pop
    for i in range(0, M):
        list_queue.append(i)
        # 앞에서 빼야 하므로 `.pop()`를 실행합니다.
        list_queue.pop(0)
print("list",time.time() - start_time)

########################################
# Deque as Queue
start_time = time.time()
for _ in range(0, TIMES):
    # M개의 원소를 append, popleft
    for i in range(0, M):
        deque_queue.append(i)
        deque_queue.popleft()
print("deque",time.time() - start_time)

list 0.029314041137695312
deque 0.013680696487426758


# BFS( Breadth First Search)

## 기본 원리 및 동작

- 기본적인 동작 :  `가까운 노드`부터 탐색하는 알고리즘이며(→ 그렇기 때문에 아래로 들어가는  것이 아니라 같은 level 에 있는 것부터, 수평적인 탐색이 된다..), 이미지 적으로는 `수평적인 방향`으로(`동일 레벨을 기준으로 먼저 탐색`) 탐색을 하는 과정임.

- **`질문`**  여기서 왜 Queue 구조를 사용하는가? 
→ Queue 가장 중요한 특징은 선입선출(먼저온 놈이 먼저 나간다 → 선착순의 원리)이다.

> [BFS]
1)  탐색 시작 노드를 큐에 삽입 & 방문 처리
2) 큐에서 노드를 꺼낸다 → 인접 노드들 중에서 방문을 했는지 안 했는지 판단 → 방문하지 않았으면 큐에 넣어서 방문을 하도록 한다.
3) 2번의 과정을 방문을 해야할 곳이 없을 때 까지한다.
>

### 방법 1) 리스트롤 활용해서 Queue로 구현하기

In [28]:
graph = {
    "1" : ["2","3","8"],
    "2" : ["1","7"],
    "3" : ["4","5"],
    "4" : ["3","5"],
    "5" : ["3","4"],
    "6" : ["7"],
    "7" : ["2","6","8"],
    "8" : ["1","7"]
}
graph

#####################################
def bfs_list(graph, start_node):
    visit = list()
    queue = list()

    queue.append(start_node)
    while queue:
        # List를 Queue로 사용하기 위해서는 맨 뒤에 것이 아니라
        # 맨 앞의 것을 꺼내야 하므로....pop(0) 으로 명시해야 함..
        node = queue.pop(0)
        if node not in visit:
            visit.append(node)
            queue.extend(graph[node])

    return visit
###########################################
bfs_list(graph,"1")

['1', '2', '3', '8', '7', '4', '5', '6']

### 방법2) deque 사용

In [29]:
from collections import deque

def bfs_deque(graph, start_node):
    visit = [] ## visit 방문한 노드들을 기록한 리스트
    queue = deque() ## bfs에서 방문을해야할 리스트를 deque로 설정..
    queue.append(start_node) ## 초기에 시작하는 노드에 대해서 일단 방문할 리스트에추가
    
    while(queue): ## queue에 남은 것이 없을 때까지 반복
        node = queue.popleft() ## node : 현재 방문하고 있는 노드
        
        ## 현재 node를 방문한 적 없다. -> visited에 추가
        ## visited에 추가 후, 해당 노드의 자식 노드들을 queue에 추가
        if node not in visit:
            visit.append(node)
            queue.extend(graph[node])
    return visit

###################
bfs_deque(graph,"1")

['1', '2', '3', '8', '7', '4', '5', '6']

# DFS vs BFS?

- 기본 원리
    - DFS : 현재 정점에서 갈 수 있는 점들까지 들어가면서 탐색
    - BFS : 현재 정점에서 연결된 가까운 점들부터 탐색
- 구현
    - DFS : Stack 또는 재귀함수
    - BFS : Queue
- 시간 복잡도
    - DFS : O(N) - 노드를 다 탐색하기에 N에 비례한다
    - BFS : O(N) - 노드를 다 탐색하기에 N에 비례한다
- 일반적인 수행시간
    - DFS : 조금 느린편 & 재귀함수 시 반복에 대한 제약 횟수가 있다.
    - BFS : deque를 사용하면 조금 빨라진다.

<aside>
💡 **[ 상황별 접근 방법에 따른 추천 가이드 ]**
1) 그래프의 모든 점을 다 방문을 해야하는 문제 : **모두 다 가능**하지만 **비교적 속도에서 장점이 있는 bfs**를 사용해도 좋음.
2) 경로의 특징을 저장하면서 해야하는 문제 : **DFS** ( 일정한 경로에 대한 이어서 연속적으로 탐색을 하는 것은 DFS이므로)
3) 최단거리를 구해야 하는 문제 : **BFS** ( DFS로 경로를 검색할 경우에는 처음에 나타나는 해답이 최단거리가 아닐 수 있지만, BFS는 현재 노드에서 가까운 곳 부터 찾기 때문에 경로를 탐색 시 먼저 찾아지는 해답이 최단거리가 되는 장점이 있음!!!)

</aside>

# DFS/BFS 연습문제

## 01) 음료수 얼려 먹기(교재 149쪽)

### 문제상황

<aside>
💡 N by M 크기의 얼음 틀이 있음.
구멍이 뚫려 있는 부분은 0
칸막이가 존재하는 부분은 1

구멍이 뚫려있는 부분끼리 상, 하, 좌, 우로 붙어있는 경우 서로 연결되어 있는 것으로 판단.

이러한 경우에서 얼음 틀의 모양이 주어진다면 생성되는 아이스크림의 갯수는?

</aside>

<aside>
🛠 [ 입력조건 ]

- 첫 번째 줄에 얼음 틀의 세로 길의 N과 가로 길이 M이 주어진다.(1 ≤N, M<+ 1000)

- 두 번째 줄부터 N+1 까지 얼음 틀의 형태가 주어진다.
- 구멍이 뚫린 부분은 0, 아닌 부분은 1

[ 출력 조건 }
- 한 번에 만들 수 있는 아이스크림의 갯수 출력

</aside>

<aside>
🛠 15 14

00000111100000

11111101111110

11011101101110

11011101100000

11011111111111

11011111111100

11000000011111

01111111111111

00000000011111

01111111111000

00011111111000

00000001111000

11111111110011

11100011111111

11100011111111

</aside>

### 생각의 출발점

> 잠시 위에서 보았던 부분을 다시 가지고 온다면, 이 문제는 DFS의 일반적인 문제임을 파악할 것!!!
[ 상황별 접근 방법에 따른 추천 가이드 ]
1) 그래프의 모든 점을 다 방문을 해야하는 문제 : 모두 다 가능하지만 비교적 속도에서 장점이 있는 bfs를 사용해도 좋음.
2) 경로의 특징을 저장하면서 해야하는 문제 : DFS ( 일정한 경로에 대한 이어서 연속적으로 탐색을 하는 것은 DFS이므로)
3) 최단거리를 구해야 하는 문제 : BFS ( DFS로 경로를 검색할 경우에는 처음에 나타나는 해답이 최단거리가 아닐 수 있지만, BFS는 현재 노드에서 가까운 곳 부터 찾기 때문에 경로를 탐색 시 먼저 찾아지는 해답이 최단거리가 되는 장점이 있음!!!)
> 

- 주어진 문제를 해결하기 위해서는 0으로 이루어진 덩어리가 몇 개인지 파악하는 것이 핵심
- 특정한 지점의 주변 LRUD( 상하좌우)를 보고, 주변 지점 중에서 값이 0이면서 아직 방문하지 않은 지점이 있다면 해당 지점을 방문을 한다.
- 방문한 지점에서 다시 LRUD를 살펴보고, 다시 방문을 진행을 하면 된다. → 그러면 연결된 모든 지점을 방문할 수 있다.
- 위의 과정을 반복!!
- 위의 과정에서 탐색을 하는 과정에서는 아래와 같이 설계를 하면 좋을 듯..
1) 구멍이 뚫려있는 부분을 찾았으면 True를 반환하게 하는 함수(dfs)를 구현한다.
2) 구체적으로 해당 함수는 찾은 구멍이 뚫려있는 부분을 기준으로 최대한 탐색해서 뚫려있으면서 연결되어 있는 모든 0인 부분을 1로 만들고 True를 반환한다.
3) 이때 모든 탐색하는 알고리즘을 dfs 알고리즘을 사용해 구현하는데 얼음틀을 벗어나면 False를 반환하게 한다.
4) 탐색한 부분이 0이 아닌 칸막이 부분이면 False를 반환하게 한다.
5) dfs 함수 결과가 True인 갯수 카운트

In [40]:
# 입력 테스트를 위해서 아래와 같이 미리 해둠...
graph_45 = [
    [0,0,1,1,0],
    [0,0,0,1,1],
    [1,1,1,1,1],
    [0,0,0,0,0]
]
graph_1514 =[
    [0,0,0,0,0,1,1,1,1,0,0,0,0,0],
    [1,1,1,1,1,1,0,1,1,1,1,1,1,0],
    [1,1,0,1,1,1,0,1,1,0,1,1,1,0],
    [1,1,0,1,1,1,0,1,1,0,0,0,0,0],
    [1,1,0,1,1,1,1,1,1,1,1,1,1,1],
    [1,1,0,1,1,1,1,1,1,1,1,1,0,0],
    [1,1,0,0,0,0,0,0,0,1,1,1,1,1],
    [0,1,1,1,1,1,1,1,1,1,1,1,1,1],
    [0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [0,1,1,1,1,1,1,1,1,1,1,0,0,0],
    [0,0,0,1,1,1,1,1,1,1,1,0,0,0],
    [0,0,0,0,0,0,0,1,1,1,1,0,0,0],
    [1,1,1,1,1,1,1,1,1,1,0,0,1,1],
    [1,1,1,0,0,0,1,1,1,1,1,1,1,1],
    [1,1,1,0,0,0,1,1,1,1,1,1,1,1]
]

# 테스트를 위해서 설정..
n=4
m=5
graph = graph_45

# n=15
# m=14
# graph = graph_1514

In [35]:
# [DFS]
# # N, M을 공백을 기준으로 구분하여 입력 받기
# n, m = map(int, input().split())

# # 2차원 리스트의 맵 정보 입력 받기
# graph = []
# for i in range(n):
#     graph.append(list(map(int, input())))


# DFS로 특정한 노드를 방문한 뒤에 연결된 모든 노드들도 방문
def dfs(x, y):
    # 주어진 범위를 벗어나는 경우에는 즉시 종료
    if x <= -1 or x >= n or y <= -1 or y >= m:
        return False
    # 현재 노드를 아직 방문하지 않았다면
    if graph[x][y] == 0:
        # 해당 노드 방문 처리
        graph[x][y] = 1
        # 상, 하, 좌, 우의 위치들도 모두 재귀적으로 호출
        dfs(x - 1, y)
        dfs(x, y - 1)
        dfs(x + 1, y)
        dfs(x, y + 1)
        return True
    return False

# 모든 노드(위치)에 대하여 음료수 채우기
result = 0
for i in range(n):
    for j in range(m):
        # 현재 위치에서 DFS 수행
        if dfs(i, j) == True:
            result += 1

print(result) # 정답 출력

3


### 참고) 위의 DFS에 대한 문제를 BFS로 할 때..

1. 맵의 위치를 하나씩 받아 BFS를 돌린다.

2-1. BFS에서는 그 곳이 빈 얼음틀일 경우 현재 위치를 방문 처리 및 큐에 삽입/삭제한 뒤, 상하좌우의 위치를 확인하고 해당 위치가 빈 얼음틀일 경우 큐에 해당 위치를 삽입한다.

2-2. BFS에서는 그 곳이 빈 얼음틀이 아닐 경우 0을 반환한다.

3. 큐가 비었을 때 1을 반환하고 BFS를 종료한다.

4. 1 ~ 3번을 n x m 번만큼 반복하고 BFS가 하나씩 돌아갈 때마다 값을 하나씩 증가시켜준다.

In [43]:
# 테스트를 위해서 설정..
graph_45 = [
    [0,0,1,1,0],
    [0,0,0,1,1],
    [1,1,1,1,1],
    [0,0,0,0,0]
]
n=4
m=5
graph = graph_45

# N, M을 공백을 기준으로 구분하여 입력 받기
# n, m = map(int, input().split())

# # 2차원 리스트의 맵 정보 입력 받기
# graph = []
# for i in range(n):
#     graph.append(list(map(int, input())))

from collections import deque
def bfs(row, col):

    # 입력된 값이 0일 때, 즉 얼음을 만들 수 있는 공간일 때
    if graph[row][col] == 0:
        # 큐 생성
        queue = deque([[row, col]])
        # 방문 지점 표시
        graph[row][col] = 1
        # queue가 없어질 때까지 반복 후 없어지면 값을 1 추가하고 break
        while True:
            if not queue:
                return 1
            row, col = queue.popleft()
            # 상하좌우로 이동하며 이동한 장소가 0일 떄 큐에 추가
            for dx, dy in [[0, 1], [0, -1], [1, 0], [-1, 0]]:
                # 이동한 장소가 주어진 범위 이내인 지 확인
                if 0 <= row+dy <= n-1 and 0 <= col+dx <= m-1:  
                    if graph[row+dy][col+dx] == 0:
                        queue.append([row+dy, col+dx])
                        # 방문 지점 표시
                        graph[row+dy][col+dx] = 1
    return 0
    
result = 0
for row in range(len(graph)):
    for col in range(len(graph[row])):
        result += bfs(row, col)

print(result)

3


## 02) 연습문제 : 미로 탐색(백준 2178)

### 문제상황

<aside>
💡 N×M크기의 배열로 표현되는 미로가 있다.

1 	0 	1 	1 	1 	1

1 	0 	1 	0 	1 	0

1 	0 	1 	0 	1 	1

1 	1 	1 	0 	1 	1

미로에서 1은 이동할 수 있는 칸을 나타내고, 0은 이동할 수 없는 칸을 나타낸다. 이러한 미로가 주어졌을 때, (1, 1)에서 출발하여 (N, M)의 위치로 이동할 때 지나야 하는 최소의 칸 수를 구하는 프로그램을 작성하시오. 한 칸에서 다른 칸으로 이동할 때, 서로 인접한 칸으로만 이동할 수 있다.

위의 예에서는 15칸을 지나야 (N, M)의 위치로 이동할 수 있다. 칸을 셀 때에는 시작 위치와 도착 위치도 포함한다.

</aside>

<aside>
🛠 [ 입력조건 ]

- 첫재 줄에 두 정수 N, M(2≤N, M ≤1000)
- 다음 N개의 줄에는 M개의 정수로 미로가 주어짐
- 각각의 수들은 붙어서 입력으로 주어진다.!!!
- 그리고 항상 도착위치로 이동할 수 있는 경우에만 입력으로 주어짐.

[출력조건]

- 첫재 쭐에 지나야 하는 최소의 칸 술을 출력함.

</aside>

<aside>
🔑 [입력 예시1]

4 6

101111

101010

101011

111011

→ 15

[입력 예시2]

4 6

110110

110110

111111

111101

→ 9

[입력예시3]

2 25

1011101110111011101110111

1110111011101110111011101

→ 38

</aside>

### 생각의 출발점

1. 일단 기존의 경우에서와 같이 경로를 탐색을 해나간다.
2. bfs 를 이용을 해서 LRUD를 가면서 1인 값을 찾아 나간다.
3. 1인 값을 찾으면 처음부터 나가는 기준이 되는 숫자를 +1로 증가를 시키면서 접근을 한다.
4. 이렇게 쭉 하면서 맨 마지막에 도착하게 하면 된다.

In [44]:
n = 4
m = 6
graph = [[1, 0, 1, 1, 1, 1],
        [1, 0, 1, 0, 1, 0],
        [1, 0, 1, 0, 1, 1],
        [1, 1, 1, 0, 1, 1]]

#### 움직임 정의
dx = [-1, 1, 0, 0]
dy = [0, 0, -1, 1]

#### bfs
from collections import deque
def bfs(start):
    # 여기서의 정보는 x좌료 y좌표가 하나의 정보로 받아서 처리하기 위해서....
    x_pos = start[0]
    y_pos = start[1]
    # 설정 & 처음값 입력
    q = deque()
    q.append((x_pos, y_pos))
    
    # 빌때까지...
    while q:
        x, y = q.popleft()
        # LRUD의 4가지 방향에 대한 모든 탐색을 위해서...
        for i in range(4):
            nx = x + dx[i]
            ny = y + dy[i]
            # 주어진 범위 내에서...
            if 0 <= nx < n and 0 <= ny < m:
                if graph[nx][ny] == 1:
                    graph[nx][ny] = graph[x][y] + 1
                    q.append((nx, ny))
                else:
                    pass
            else:
                pass

bfs((0, 0))
print(graph[n-1][m-1])


15


## 연습문제) BFS 미로탈출

<aside>
💡 N x M 크기의 직사각형 형태의 미로에 여러 마리의 괴물이 있어 이를 피해 탈출해야 한다. 현재 위치는 (1, 1)이고 미로의 출구는 (N,M)의 위치에 존재하며 한 번에 한 칸씩 이동할 수 있다. 괴물이 있는 부분은 0으로, 괴물이 없는 부분은 1로 표시되어 있다. 미로는 반드시 탈출할 수 있는 형태로 제시된다. 탈출하기 위해 움직여야 하는 최소 칸의 개수를 구하라. 칸을 셀 때는 시작 칸과 마지막 칸을 모두 포함해서 계산한다.

</aside>


<aside>

🛠 입력

    첫째 줄에 두 정수 N, M(4 <= N, M <= 200)이 주어진다. 다음 N개의 줄에는 각각 M개의 정수(0혹은 1)로 미로의 정보가 주어진다. 각각의 수들은 공백 없이붙어서 입력으로 제시된다. 또한 시작 칸과 마지막 칸은 항상 1이다.

출력

첫째 줄에 최소 이동 칸의 개수를 출력한다.

</aside>

### 해결방안

위의 문제에서와 같이 하나씩 지나가면서 길에 대한 것을 업데이트를 하면서 지나가면 된다.

1. BFS 함수 정의

- 초기 큐에 x,y를 넣음
- 큐에서 x,y를 뽑고 4 방향으로 확인

- 주어진 영역을 벗어난 경우 무시

- 0(이동할수 없는 칸)인 경우 무시

- 해당 위치를 처음 방문한다면 전 위치에서 + 1 하고, 큐에 넣음

- 가장 오른쪽 아래까지의 최단 거리 반환

2. (0,0)에서부터의 BFS 출력

In [45]:
from collections import deque

# ############################################
# n, m = map(int, input("가로,세로의 정보를 공란으로 구분하여 입력하세요").split())
# # 초기 맵에 대한 처리
# graph =  []
# ############################################

# for i in range(n):
#     graph.append(list(map(int, input("처음에 입력한 n by m에 대한 {0}번째 가로줄에 대한 값을 공란으로 입력하세요!!!".format(i)).split())))
# print(graph)
n = 4
m = 6
graph = [[1, 0, 1, 1, 1, 1],
        [1, 0, 1, 0, 1, 0],
        [1, 0, 1, 0, 1, 1],
        [1, 1, 1, 0, 1, 1]]


# 이동할 네 가지 방향 정의 (상, 하, 좌, 우)
dx = [-1, 1, 0, 0]
dy = [0, 0, -1, 1]


# BFS 소스코드 구현
def bfs(x, y):
    # 큐(Queue) 구현을 위해 deque 라이브러리 사용
    queue = deque()
    queue.append((x, y))
    # 큐가 빌 때까지 반복하기
    while queue:
        x, y = queue.popleft()
        # 현재 위치에서 4가지 방향으로의 위치 확인
        for i in range(4):
            nx = x + dx[i]
            ny = y + dy[i]
            # 미로 찾기 공간을 벗어난 경우 무시
            if nx < 0 or nx >= n or ny < 0 or ny >= m:
                continue
            # 벽인 경우 무시
            if graph[nx][ny] == 0:
                continue
            # 해당 노드를 처음 방문하는 경우에만 최단 거리 기록
            if graph[nx][ny] == 1:
                graph[nx][ny] = graph[x][y] + 1
                queue.append((nx, ny))
    # 가장 오른쪽 아래까지의 최단 거리 반환
    return graph[n - 1][m - 1]

# BFS를 수행한 결과 출력
print(bfs(0, 0))

15
