<a href="https://colab.research.google.com/github/hwarang97/algorithm/blob/main/DFS%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

[DFS 코드 출처](https://data-marketing-bk.tistory.com/entry/DFS-%EC%99%84%EB%B2%BD-%EA%B5%AC%ED%98%84%ED%95%98%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC)



In [1]:
graph = dict()

graph['A'] = ['B', 'C']
graph['B'] = ['A', 'D']
graph['C'] = ['A', 'G', 'H', 'I']
graph['D'] = ['B', 'E', 'F']
graph['E'] = ['D']
graph['F'] = ['D']
graph['G'] = ['C']
graph['H'] = ['C']
graph['I'] = ['C', 'J']
graph['J'] = ['I']

In [4]:
def dfs(graph, start_node):

    # 방문했던 노드를 기억하는 리스트
    # 앞으로 방문할 노드를 담는 스택(리스트)
    need_visited, visited = list(), list()
    need_visited.append(start_node)

    while need_visited:
        node = need_visited.pop()
        if node not in visited:
            visited.append(node)
            need_visited.extend(graph[node])

    return visited

In [5]:
dfs(graph, 'A')

['A', 'C', 'I', 'J', 'H', 'G', 'B', 'D', 'F', 'E']

In [6]:
def dfs2(graph, start_node):
    from collections import deque

    # 방문했던 노드를 기억하는 리스트
    # 앞으로 방문할 노드를 담는 스택(리스트)
    visited = list()
    need_visited = deque() # deque를 쓰는 이유가 뭐지?? (아래에 기술해놓음.)
    need_visited.append(start_node)

    while need_visited:
        node = need_visited.pop()
        if node not in visited:
            visited.append(node)
            need_visited.extend(graph[node])

    return visited

In [7]:
dfs2(graph, 'A')

['A', 'C', 'I', 'J', 'H', 'G', 'B', 'D', 'F', 'E']

## List 대신 Deque를 쓰는 이유

- 속도가 훨씬 빠르기 때문

    list는 O(n)을 따르지만, deque는 O(1)의 속도.
    속도의 가장 큰 차이는 0번 인덱스에 해당되는 원소를 삭제, 삽일할 때 발생한다.

    각 자료구조는 뒤에서 삽입/삭제는 차이가 없지만, 첫번째 원소를 삽입/삭제한다면

    리스트는 첫번째 원소를 삭제한 다음, 모든 원소를 한칸씩 앞으로 당겨야한다. 따라서 이때 n번의 연산이 발생한다.

    데큐(덱)의 경우, 양끝에서 삽입/삭제가 일어나기에 1번의 연산으로 해결할 수 있다.



## 질문

1. 그럼 데큐가 가운데 있는 원소를 없앨때는, 원소가 한칸씩 이동할수있지 않는가? 이때도 리스트보다 빠르게 처리되는가?

    -> 실험을 통해서 알아봤는데, 중간에 값을 넣어봐도 덱이 리스트보다 좋은 성능을 보여준다.
    
    내부적으로 리스트는 배열 기반 구조이므로, 중간에 삽입/삭제하면 모든 원소를 이동해야한다.

    반면, 데큐(덱)은 양방향 연결 리스트로 구현되어 있어서 중간에 원소를 삽입/삭제 하여도 O(1)의 시간 복잡도를 가진다. 즉, 모든 원소를 이동시키지 않고도 빠르게 처리할 수 있다.

    

2. 리스트가 fast fixed length 라는건 무슨 뜻일까?

    -> fast란 빠르게 접근한다는 의미로 index를 통해서 원소에 접근하면 O(1)의 시간복잡도를 띈다고 해서 fast라고 표현한다.

    fixed length는 자료구조의 크기가 고정되어 있다는걸 의미하는데, 파이썬의 list는 동적 배열(즉, 크기가 변함)이므로 fixed length가 아니다. 아마 다른 언어에서 리스트가 fixed length인 경우가 있는것같다.

In [26]:
# list와 deque의 중간 원소 삽입의 속도 차이 실험

from collections import deque
# import timeit # time과 유사하지만, 자체적으로 반복실행한 후 평균값을 알려준다
import time

l = [n for n in range(1,1000)]
d = deque(l)

start_time = time.time()
for _ in range(1000):
    l.insert(50, 100)
end_time = time.time()
elapsed_time = (start_time - end_time)
print(f'list elapsed_time:{elapsed_time:.10f}')

start_time = time.time()
for _ in range(1000):
    d.insert(50, 100)
end_time = time.time()
elapsed_time = (start_time - end_time)
print(f'deque elapsed_time:{elapsed_time:.10f}')

list elapsed_time:-0.0015447140
deque elapsed_time:-0.0006105900


In [36]:
def dfs_recursive(graph, start, visited = []):
    visited.append(start) # 상태를 저장해주는 공간은 필요

    for node in graph[start]: # need visit을 쓰지 않고 진행. 리스트가 비어있으면 진행되지 않음.
        if node not in visited:
            dfs_recursive(graph, node, visited)
    return visited # 반복문 내에서 return 된 것을 버려지는것 같고, 가장 바깥 return만이 진짜로 반환되는듯

In [37]:
dfs_recursive(graph, 'A')

['A', 'B', 'D', 'E', 'F', 'C', 'G', 'H', 'I', 'J']


### DFS 구현 방법 장단점(경험)

1. 2개의 저장공간을 활용하는 경우

    장점: 이해하기 쉽다.   
    단점: 재귀함수로 구현한것보다는 코드가 길다

2. 재귀함수를 이용해서 구현한 경우

    장점: 코드가 단순하다.   
    단점: 이해하기 어렵다.