### 이론정리

BFS(너비 우선 탐색, Breadth-First Search)와 DFS(깊이 우선 탐색, Depth-First Search)는 그래프나 트리에서 사용되는 두 가지 다른 탐색 알고리즘입니다.
이 두 알고리즘은 탐색 방식과 자료구조 사용에 차이가 있습니다.

1. 탐색 방식:
   - BFS: BFS는 너비(레벨)를 기준으로 탐색합니다.
    - 시작 노드에서 인접한 노드를 모두 방문한 후, 그 다음 레벨의 인접 노드를 탐색합니다.
    - 즉, 한 레벨을 완전히 탐색한 후에 다음 레벨로 이동합니다.
   - DFS: DFS는 깊이를 기준으로 탐색합니다.
    - 시작 노드에서 한 경로를 따라 최대한 깊이 들어간 후, 더 이상 갈 곳이 없으면 이전 단계로 돌아와서 다른 경로를 탐색합니다.
    - 이 과정을 반복합니다.

2. 자료구조 사용:
   - BFS: BFS는 큐(Queue) 자료구조를 사용합니다.
    - 시작 노드를 큐에 넣은 후, 인접한 노드를 큐에 차례로 넣습니다.
    - 따라서, 먼저 들어온 노드부터 탐색되기 때문에 너비를 우선으로 탐색할 수 있습니다.
   - DFS: DFS는 스택(Stack) 또는 재귀 호출을 통해 구현됩니다.
    - 시작 노드를 스택에 넣거나 재귀 호출을 시작한 후, 인접한 노드 중 하나를 선택하여 깊이 들어갑니다.
    - 따라서, 한 경로를 따라 최대한 깊이 들어가기 때문에 깊이를 우선으로 탐색할 수 있습니다.

따라서, BFS는 너비를 우선으로 탐색하며 큐를 사용하고, DFS는 깊이를 우선으로 탐색하며 스택 또는 재귀 호출을 사용합니다.

이러한 차이로 인해 BFS는 최단 경로를 찾는 데 유용하고, DFS는 싸이클을 탐지하거나 특정 경로를 찾는 데 유용한 경우가 많습니다.

또한, BFS는 메모리를 많이 사용하는 경향이 있고, DFS는 재귀 호출 스택의 깊이에 따라 스택 오버플로우의 가능성이 있을 수 있습니다.

### 핸즈온

In [1]:
# BFS 인접 리스트
bfs_graph = {
0:[1, 2, 3],
1:[4],
2:[5],
3:[],
4:[6],
5:[4],
6:[5]
}
def bfs_queue(start_node):
    bfs_list = []  # visited
    queue = [start_node] # need_visit
    while queue:
        node = queue.pop(0)
        if node not in bfs_list:
            bfs_list.append(node)
            queue.extend(bfs_graph[node])
    return bfs_list
bfs_queue(0)

[0, 1, 2, 3, 4, 5, 6]

In [11]:
# DFS 인접 리스트
dfs_graph = {
0:[1, 2, 3],
1:[4],
2:[5],
3:[],
4:[6],
5:[4],
6:[5]
}

def dfs_queue(start_node):
    dfs_list = []  # visited
    stack = [start_node] # need_visit
    while stack:
        node = stack.pop()
        if node not in dfs_list:
            dfs_list.append(node)
            stack.extend(bfs_graph[node][::-1])
    return dfs_list
dfs_queue(0)

[0, 1, 4, 6, 5, 2, 3]

### BFS와 DFS

BFS와 DFS를 구현할 때 자료구조의 선택에 따라 동작 방식과 코드 구현이 달라집니다. 아래는 각각 BFS와 DFS를 구현하는 파이썬 코드 예시입니다.



BFS 구현 예시:

BFS를 구현할 때 큐(Queue) 자료구조를 사용합니다. 파이썬에서는 collections 모듈의 deque를 사용하여 큐를 구현할 수 있습니다.



In [55]:
from collections import deque

def bfs(graph, start):
    visited = set()  # 방문한 노드를 저장하기 위한 집합
    queue = deque([start])  # 시작 노드를 큐에 추가
    visited.add(start)  # 시작 노드를 방문 처리

    while queue:
        node = queue.popleft()  # 큐의 가장 앞에 있는 노드를 꺼냄
        print(node)  # 현재 노드 방문 처리

        for neighbor in graph[node]:  # 현재 노드와 연결된 인접 노드들에 대해
            if neighbor not in visited:  # 아직 방문하지 않은 노드라면
                queue.append(neighbor)  # 큐에 추가
                visited.add(neighbor)  # 방문 처리

# 방문한 노드를 저장하기 위한 집합
visited = set()

# 그래프 정보
graph = {
    'A': ['B', 'C'],
    'B': ['A', 'D', 'E'],
    'C': ['A', 'F'],
    'D': ['B'],
    'E': ['B', 'F'],
    'F': ['C', 'E']
}

bfs(graph, 'A')

A
B
C
D
E
F


DFS 구현 예시:

DFS를 구현할 때는 스택(Stack) 자료구조를 사용하거나 재귀 호출을 활용할 수 있습니다.

스택을 사용한 DFS 구현 예시:


In [59]:
def dfs(graph, start):
    visited = set()  # 방문한 노드를 저장하기 위한 집합
    stack = [start]  # 시작 노드를 스택에 추가

    while stack:
        node = stack.pop()  # 스택의 가장 위에 있는 노드를 꺼냄

        if node not in visited:
            visited.add(node)  # 현재 노드 방문 처리
            print(node)

            for neighbor in graph[node]:  # 현재 노드와 연결된 인접 노드들에 대해
                if neighbor not in visited:  # 아직 방문하지 않은 노드라면
                    stack.append(neighbor)  # 스택에 추가

# 방문한 노드를 저장하기 위한 집합
visited = set()

# 그래프 정보
graph = {
    'A': ['B', 'C'],
    'B': ['A', 'D', 'E'],
    'C': ['A', 'F'],
    'D': ['B'],
    'E': ['B', 'F'],
    'F': ['C', 'E']
}

dfs(graph, 'A')

A
C
F
E
B
D


재귀 호출을 사용한 DFS 구현 예시:


In [3]:
def dfs(graph, node, visited):
    visited.add(node)  # 현재 노드 방문 처리
    print(node)

    for neighbor in graph[node]:  # 현재 노드와 연결된 인접 노드들에 대해
        if neighbor not in visited:  # 아직 방문하지 않은 노드라면
            dfs(graph, neighbor, visited)  # 재귀 호출

# 방문한 노드를 저장하기 위한 집합
visited = set()

# 그래프 정보
graph = {
    'A': ['B', 'C'],
    'B': ['A', 'D', 'E'],
    'C': ['A', 'F'],
    'D': ['B'],
    'E': ['B', 'F'],
    'F': ['C', 'E']
}

dfs(graph, 'A', visited)


A
B
D
E
F
C


### BFS 의사코드

BFS(Breadth-First Search) 알고리즘은 그래프에서 너비 우선으로 탐색하는 알고리즘입니다.

아래에 BFS의 의사코드를 작성해 드리겠습니다.



In [None]:
BFS(graph, start_node):
    visited = []                # 방문한 노드를 저장할 리스트
    queue = []                  # 탐색할 노드를 저장할 큐
    queue.append(start_node)    # 시작 노드를 큐에 추가
    visited.append(start_node)  # 시작 노드를 방문한 노드 리스트에 추가

    while queue is not empty:   # 큐가 비어있지 않은 동안 반복
        current_node = queue.pop(0)    # 큐에서 노드를 하나 꺼냄

        for neighbor in graph[current_node]:   # 현재 노드와 연결된 모든 이웃 노드에 대해
            if neighbor not in visited:        # 방문하지 않은 이웃 노드일 경우
                visited.append(neighbor)       # 방문한 노드 리스트에 추가
                queue.append(neighbor)         # 큐에 이웃 노드 추가

    return visited    # 방문한 노드 리스트 반환


### DFS 의사코드

DFS(Depth-First Search) 알고리즘은 그래프에서 깊이 우선으로 탐색하는 알고리즘입니다.

아래에 DFS의 의사코드를 작성해 드리겠습니다.



In [None]:
DFS(graph, start_node):
    visited = []                # 방문한 노드를 저장할 리스트
    stack = []                  # 탐색할 노드를 저장할 스택
    stack.append(start_node)    # 시작 노드를 스택에 추가

    while stack is not empty:   # 스택이 비어있지 않은 동안 반복
        current_node = stack.pop()    # 스택에서 노드를 하나 꺼냄

        if current_node not in visited:    # 방문하지 않은 노드일 경우
            visited.append(current_node)   # 방문한 노드 리스트에 추가

            for neighbor in graph[current_node]:   # 현재 노드와 연결된 모든 이웃 노드에 대해
                stack.append(neighbor)              # 스택에 이웃 노드 추가

    return visited    # 방문한 노드 리스트 반환


### BFS 사례

BFS는 그래프에서 최단 경로, 네트워크 트래픽, 게임 AI 등 다양한 분야에서 활용될 수 있습니다.

여기서는 그래프에서 최단 경로를 찾는 예시와 파이썬 코드를 제시해 드리겠습니다.


예시: 미로에서 최단 경로 찾기

다음은 미로에서 시작점부터 도착점까지의 최단 경로를 찾는 예시입니다.

미로는 2차원 그래프로 표현되며, 각 셀은 벽("X")이거나 통로(".")로 구성됩니다.

시작점은 (0, 0)이고 도착점은 (N-1, M-1)입니다. BFS 알고리즘을 사용하여 최단 경로를 찾습니다.



In [12]:
from collections import deque

def find_shortest_path(maze):
    rows = len(maze)
    cols = len(maze[0])

    # 방문 여부를 저장하는 2차원 배열
    visited = [[False] * cols for _ in range(rows)]

    # 상하좌우 이동을 위한 방향 벡터
    dx = [-1, 1, 0, 0]
    dy = [0, 0, -1, 1]

    # 시작점 (0, 0)
    start = (0, 0)

    # 도착점 (rows-1, cols-1)
    destination = (rows-1, cols-1)

    queue = deque([(start, 1)])  # 큐에 시작점과 거리 1을 넣음

    while queue:
        current, distance = queue.popleft()
        x, y = current

        if current == destination:
            return distance  # 도착점에 도달한 경우 최단 거리 반환

        if not visited[x][y]:
            visited[x][y] = True  # 현재 위치를 방문 처리

            for i in range(4):
                nx = x + dx[i]
                ny = y + dy[i]

                if 0 <= nx < rows and 0 <= ny < cols and maze[nx][ny] == "." and not visited[nx][ny]:
                    queue.append(((nx, ny), distance+1))

    return -1  # 도착점에 도달할 수 없는 경우

# 미로 예시
maze = [
    [".", ".", ".", ".", "."],
    [".", "X", ".", "X", "."],
    [".", ".", ".", ".", "."],
    [".", "X", "X", "X", "."],
    [".", ".", ".", ".", "."]
]

shortest_distance = find_shortest_path(maze)
print("최단 경로 길이:", shortest_distance)


최단 경로 길이: 9


위의 코드는 주어진 미로에서 BFS를 활용하여 시작점부터 도착점까지의 최단 경로 길이를 찾는 예시입니다.

BFS 알고리즘을 사용하여 미로를 탐색하면서 방문하지 않은 통로를 큐에 추가하고, 도착점에 도달하면 최단 경로 길이를 반환합니다.






### BFS 사례2

예시: 친구 관계 네트워크에서 가장 가까운 친구 찾기

다음은 친구 관계 네트워크에서 특정 사용자와 가장 가까운 친구를 찾는 예시입니다.

네트워크는 그래프로 표현되며, 사용자들은 노드로 표현됩니다.

BFS 알고리즘을 사용하여 사용자와 가장 가까운 친구를 찾습니다.



In [13]:
from collections import deque

def find_closest_friend(network, start_user):
    visited = set()   # 방문한 사용자를 저장하는 집합
    queue = deque([(start_user, 0)])   # 큐에 시작 사용자와 거리 0을 넣음

    while queue:
        current_user, distance = queue.popleft()

        if current_user in visited:
            continue

        visited.add(current_user)

        if is_target_user(current_user):   # 목표 사용자인지 확인하는 함수
            return current_user, distance

        for friend in get_friends(network, current_user):   # 현재 사용자의 친구들을 가져옴
            if friend not in visited:
                queue.append((friend, distance + 1))

    return None

# 네트워크 그래프 예시
network = {
    "Alice": ["Bob", "Charlie", "David"],
    "Bob": ["Alice", "Eve"],
    "Charlie": ["Alice", "David"],
    "David": ["Alice", "Charlie"],
    "Eve": ["Bob"]
}

# 목표 사용자인지 확인하는 함수 예시
def is_target_user(user):
    return user == "David"

# 현재 사용자의 친구들을 가져오는 함수 예시
def get_friends(network, user):
    return network.get(user, [])

start_user = "Alice"
closest_friend, distance = find_closest_friend(network, start_user)
print("가장 가까운 친구:", closest_friend)
print("거리:", distance)


가장 가까운 친구: David
거리: 1


위의 코드는 주어진 친구 관계 네트워크에서 BFS를 활용하여 시작 사용자와 가장 가까운 친구를 찾는 예시입니다.

BFS 알고리즘을 사용하여 친구 관계를 탐색하면서 목표 사용자에 도달하면 가장 가까운 친구와 거리를 반환합니다.






### DFS 사례

예시: 단어 경로 찾기

다음은 주어진 단어 목록에서 시작 단어에서 목표 단어까지의 경로를 찾는 예시입니다.

단어는 그래프의 노드로 표현되며, 두 단어가 한 번에 한 글자만 다른 경우에만 경로로 간주합니다. DFS 알고리즘을 사용하여 경로를 찾습니다.



In [60]:
def find_word_path(words, start_word, target_word):
    visited = set()  # 방문한 단어를 저장하는 집합
    path = []  # 경로를 저장하는 리스트
    path.append(start_word)

    def dfs(current_word):
        if current_word == target_word:  # 목표 단어에 도달한 경우 경로를 반환
            return path

        visited.add(current_word)

        for word in words:
            if word not in visited and is_one_letter_different(current_word, word):
                path.append(word)
                result = dfs(word)
                if result:  # 목표 단어에 도달한 경로가 있는 경우
                    return result
                path.pop()

        return None

    return dfs(start_word)

# 두 단어가 한 글자만 다른지 확인하는 함수 예시
def is_one_letter_different(word1, word2):
    diff_count = sum(c1 != c2 for c1, c2 in zip(word1, word2))
    return diff_count == 1

# 단어 목록 예시
word_list = ["cat", "bat", "hat", "bad", "had", "bed", "red"]

start_word = "bat"
target_word = "red"

word_path = find_word_path(word_list, start_word, target_word)
if word_path:
    print("단어 경로:", "->".join(word_path))
else:
    print("경로를 찾을 수 없습니다.")


단어 경로: bat->cat->hat->had->bad->bed->red


위의 코드는 주어진 단어 목록에서 DFS를 활용하여 시작 단어에서 목표 단어까지의 경로를 찾는 예시입니다.

DFS 알고리즘을 사용하여 단어 간의 관계를 탐색하면서 목표 단어에 도달하면 경로를 반환합니다.

단어 간의 관계는 두 단어가 한 글자만 다른지 여부로 판단합니다.






### DFS 사례2

예시: 그래프에서 사이클 찾기

다음은 주어진 그래프에서 사이클을 찾는 예시입니다.

그래프는 노드와 간선으로 구성되며, DFS 알고리즘을 사용하여 사이클을 탐색합니다.



In [15]:
def has_cycle(graph):
    visited = set()  # 방문한 노드를 저장하는 집합
    rec_stack = set()  # 재귀 스택에 포함된 노드를 저장하는 집합

    def dfs(node):
        visited.add(node)
        rec_stack.add(node)

        for neighbor in graph[node]:
            if neighbor not in visited:
                if dfs(neighbor):  # 이웃 노드를 재귀적으로 탐색하여 사이클이 발견된 경우
                    return True
            elif neighbor in rec_stack:  # 방문한 이웃 노드가 재귀 스택에 있는 경우 사이클 발견
                return True

        rec_stack.remove(node)  # 재귀 스택에서 노드 제거
        return False

    for node in graph:
        if node not in visited:
            if dfs(node):  # 시작 노드를 기준으로 DFS 탐색하여 사이클이 발견된 경우
                return True

    return False

# 그래프 예시
graph = {
    'A': ['B', 'C'],
    'B': ['C'],
    'C': ['D', 'E'],
    'D': [],
    'E': ['A']
}

has_cycle = has_cycle(graph)
if has_cycle:
    print("그래프에 사이클이 있습니다.")
else:
    print("그래프에 사이클이 없습니다.")


그래프에 사이클이 있습니다.


위의 코드는 주어진 그래프에서 DFS를 활용하여 사이클을 찾는 예시입니다.

DFS 알고리즘을 사용하여 그래프를 탐색하면서 방문한 노드를 기록하고, 재귀 스택에 포함된 노드를 확인하여 사이클을 탐지합니다.

만약 사이클이 발견되면 True를 반환하고, 그렇지 않으면 False를 반환합니다.






### DFS 사례3

예시: 연결 요소 개수 세기

다음은 주어진 그래프에서 연결 요소의 개수를 세는 예시입니다.

그래프는 노드와 간선으로 구성되며, DFS 알고리즘을 사용하여 연결된 요소를 탐색합니다.



In [18]:
def count_connected_components(graph):
    visited = set()  # 방문한 노드를 저장하는 집합
    count = 0  # 연결 요소 개수

    def dfs(node):
        visited.add(node)

        for neighbor in graph[node]:
            if neighbor not in visited:
                dfs(neighbor)

    for node in graph:
        if node not in visited:
            dfs(node)
            count += 1

    return count

# 그래프 예시
graph = {
    'A': ['B', 'C'],
    'B': ['A', 'C'],
    'C': ['A', 'B'],
    'D': ['E'],
    'E': ['D'],
    'F': []
}

connected_components = count_connected_components(graph)
print("연결 요소 개수:", connected_components)


연결 요소 개수: 3


위의 코드는 주어진 그래프에서 DFS를 활용하여 연결 요소의 개수를 세는 예시입니다.

DFS 알고리즘을 사용하여 그래프를 탐색하면서 방문한 노드를 기록하고, 방문하지 않은 노드를 시작점으로 하여 새로운 연결 요소를 찾습니다.

연결 요소를 찾을 때마다 개수를 증가시킵니다. 최종적으로 연결 요소의 개수를 반환합니다.






### DFS 스택 사례

예시: 파일 탐색기에서 특정 확장자의 파일 찾기

다음은 파일 탐색기에서 특정 확장자의 파일을 찾는 예시입니다.

파일 시스템은 트리 구조로 표현되며, DFS 알고리즘을 사용하여 특정 디렉토리부터 모든 하위 디렉토리를 순회하며 해당 확장자의 파일을 찾습니다.



In [22]:
import os

def find_files_with_extension(directory, target_extension):
    stack = [directory]   # 탐색할 디렉토리를 스택에 추가
    result = []   # 확장자와 일치하는 파일 결과

    while stack:
        current_dir = stack.pop()   # 스택에서 디렉토리를 꺼냄

        # 디렉토리 내의 파일과 디렉토리를 순회
        for item in os.listdir(current_dir):
            item_path = os.path.join(current_dir, item)

            if os.path.isfile(item_path) and item.endswith(target_extension):
                result.append(item_path)   # 확장자와 일치하는 파일을 결과에 추가
            elif os.path.isdir(item_path):
                stack.append(item_path)   # 하위 디렉토리를 스택에 추가

    return result

# 파일 탐색 예시
directory = '/content/sample_data/'   # 탐색할 디렉토리 경로
extension = '.md'   # 찾고자 하는 확장자

files = find_files_with_extension(directory, extension)
if files:
    print("찾은 파일:")
    for file in files:
        print(file)
else:
    print("일치하는 파일이 없습니다.")


찾은 파일:
/content/sample_data/README.md


위의 코드는 주어진 디렉토리에서 특정 확장자의 파일을 찾는 예시입니다.

DFS 알고리즘을 사용하여 디렉토리 내의 파일과 디렉토리를 순회하며 스택에 추가합니다.

파일일 경우 해당 확장자와 일치하면 결과에 추가하고, 디렉토리일 경우 하위 디렉토리를 스택에 추가합니다. 최종적으로 일치하는 파일들의 리스트를 반환합니다.






### DFS 스택 사례2

예시: 미로 탐색

다음은 미로에서 출발지점부터 도착지점까지의 경로를 찾는 예시입니다.

DFS 알고리즘을 사용하여 미로를 탐색하며, 스택을 활용하여 경로를 탐색합니다.



In [30]:
def find_path(maze, start, end):
    rows = len(maze)
    cols = len(maze[0])

    stack = [(start, [start])]  # (현재 위치, 경로)를 저장하는 스택
    visited = set()  # 방문한 위치를 저장하는 집합

    while stack:
        current, path = stack.pop()  # 스택에서 현재 위치와 경로를 꺼냄

        if current == end:  # 도착지점에 도달한 경우 경로를 반환
            return path

        visited.add(current)  # 현재 위치를 방문 처리

        row, col = current

        # 이웃한 위치를 확인하고 스택에 추가
        neighbors = [(row - 1, col), (row + 1, col), (row, col - 1), (row, col + 1)]

        for neighbor in neighbors:
            neighbor_row, neighbor_col = neighbor

            # 이웃한 위치가 미로 내에 있고, 벽이 아니며 방문하지 않은 위치인 경우
            if 0 <= neighbor_row < rows and 0 <= neighbor_col < cols and maze[neighbor_row][neighbor_col] != '#' and neighbor not in visited:
                stack.append((neighbor, path + [neighbor]))

    return None  # 경로를 찾지 못한 경우


# 미로 탐색 예시
maze = [
    ['S', '.', '.', '.', '#', '.', '.'],
    ['#', '#', '.', '#', '#', '.', '#'],
    ['.', '.', '.', '#', '.', '.', '.'],
    ['.', '#', '#', '#', '.', '#', '.'],
    ['.', '.', '.', '.', '.', '.', 'E']
]

start = (0, 0)  # 출발지점 좌표
end = (4, 6)  # 도착지점 좌표

path = find_path(maze, start, end)
if path:
    print("경로:", path)
else:
    print("경로를 찾을 수 없습니다.")


경로: [(0, 0), (0, 1), (0, 2), (1, 2), (2, 2), (2, 1), (2, 0), (3, 0), (4, 0), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6)]


위의 코드는 주어진 미로에서 DFS를 사용하여 출발지점부터 도착지점까지의 경로를 찾는 예시입니다.

미로는 2차원 배열로 표현되며, 출발지점은 'S'로, 도착지점은 'E'로 표시됩니다.

벽은 '#'로 표시되고, '.'은 갈 수 있는 경로를 의미합니다.

DFS 알고리즘을 사용하여 미로를 탐색하면서 스택을 활용하여 경로를 탐색하고, 도착지점에 도착한 경우 해당 경로를 반환합니다.

경로를 찾지 못한 경우 None을 반환합니다.






### DFS 스택 사례3

예시: 깊이 우선 탐색을 활용한 이진 트리 순회

다음은 이진 트리에서 깊이 우선 탐색(DFS)을 활용하여 노드를 순회하는 예시입니다.

이진 트리는 노드(Node)와 왼쪽, 오른쪽 자식 노드로 구성되며, DFS 알고리즘을 사용하여 트리를 탐색합니다.

스택을 활용하여 노드를 순차적으로 탐색하고, 방문한 노드를 처리합니다.



In [45]:
# 이진 트리 노드 클래스 정의
class TreeNode:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

# 이진 트리 클래스 정의
class BinaryTree:
    def __init__(self):
        self.root = None

    def dfs(self):
        stack = [self.root]  # 루트 노드를 스택에 추가

        while stack:
            current_node = stack.pop()  # 스택에서 현재 노드를 꺼냄

            if current_node:
                print(current_node.value)  # 현재 노드의 값을 출력

                # 오른쪽 자식을 먼저 스택에 추가하여 왼쪽 자식이 먼저 처리되도록 함
                stack.append(current_node.right)
                stack.append(current_node.left)


# 이진 트리 순회 예시
tree = BinaryTree()

# 이진 트리 생성
tree.root = TreeNode('A')
tree.root.left = TreeNode('B')
tree.root.right = TreeNode('C')
tree.root.left.left = TreeNode('D')
tree.root.left.right = TreeNode('E')
tree.root.right.left = TreeNode('F')
tree.root.right.right = TreeNode('G')

tree.dfs()


A
B
D
E
C
F
G


위의 코드는 주어진 이진 트리에서 DFS를 사용하여 노드를 순회하는 예시입니다.

이진 트리는 노드 클래스(TreeNode)와 이진 트리 클래스(BinaryTree)로 구성되며, dfs() 메서드를 사용하여 DFS를 수행합니다.

스택을 활용하여 노드를 탐색하고, 방문한 노드의 값을 출력합니다.

이진 트리의 경우, 오른쪽 자식 노드를 먼저 스택에 추가하여 왼쪽 자식이 먼저 처리되도록 합니다.

이를 통해 이진 트리 순회에 DFS 알고리즘과 스택을 활용할 수 있습니다.






### DFS 이커머스 사례

예시: 고객 구매 패턴 분석

다음은 이커머스 사이트에서 고객들의 구매 패턴을 분석하기 위해 DFS 알고리즘을 사용하는 예시입니다.

이커머스 데이터는 그래프 형태로 구성되며, DFS 알고리즘을 사용하여 관련된 상품을 탐색합니다.

스택을 활용하여 상품을 탐색하고, 방문한 상품을 처리합니다.



In [49]:
class Customer:
    def __init__(self, id, name):
        self.id = id
        self.name = name
        self.purchased_items = []

    def add_purchased_item(self, item):
        self.purchased_items.append(item)

class Item:
    def __init__(self, id, name):
        self.id = id
        self.name = name
        self.related_items = []

    def add_related_item(self, item):
        self.related_items.append(item)

def analyze_purchase_patterns(start_customer):
    stack = [start_customer]  # 시작 고객을 스택에 추가
    visited = set()  # 방문한 고객을 저장하는 집합

    while stack:
        current_node = stack.pop()  # 스택에서 현재 고객을 꺼냄

        if isinstance(current_node, Customer):
            current_customer = current_node

            if current_customer not in visited:
                print(f"고객 ID: {current_customer.id}, 이름: {current_customer.name}")
                visited.add(current_customer)  # 현재 고객을 방문 처리

                # 현재 고객이 구매한 상품들을 탐색
                for purchased_item in current_customer.purchased_items:
                    print(f"- 상품 ID: {purchased_item.id}, 이름: {purchased_item.name}")

                    # 상품과 관련된 상품들을 스택에 추가
                    for related_item in purchased_item.related_items:
                        stack.append(related_item)
        else:
            current_item = current_node
            print(f"- 상품 ID: {current_item.id}, 이름: {current_item.name}")

            # 상품과 관련된 상품들을 스택에 추가
            for related_item in current_item.related_items:
                stack.append(related_item)

# 이커머스 데이터 분석 예시
# 고객 데이터 생성
customer_a = Customer(1, 'Customer A')
customer_b = Customer(2, 'Customer B')
customer_c = Customer(3, 'Customer C')

# 상품 데이터 생성
item_1 = Item(1, 'Item 1')
item_2 = Item(2, 'Item 2')
item_3 = Item(3, 'Item 3')
item_4 = Item(4, 'Item 4')

# 상품과 관련된 상품 설정
item_1.add_related_item(item_2)
item_1.add_related_item(item_3)
item_2.add_related_item(item_4)

# 고객이 구매한 상품 설정
customer_a.add_purchased_item(item_1)
customer_b.add_purchased_item(item_2)
customer_c.add_purchased_item(item_3)

start_customer = customer_a  # 시작 고객

analyze_purchase_patterns(start_customer)


고객 ID: 1, 이름: Customer A
- 상품 ID: 1, 이름: Item 1
- 상품 ID: 3, 이름: Item 3
- 상품 ID: 2, 이름: Item 2
- 상품 ID: 4, 이름: Item 4


위의 코드는 이커머스 데이터 분석을 위해 DFS 알고리즘을 사용하는 예시입니다.

Customer 클래스는 고객을 나타내고, Item 클래스는 상품을 나타냅니다.

analyze_purchase_patterns 함수는 시작 고객을 입력으로 받아 DFS 알고리즘을 사용하여 구매 패턴을 분석합니다.

방문한 고객을 집합에 저장하여 중복 방문을 방지합니다.

각 고객이 구매한 상품들과 관련된 상품들을 출력합니다.

이를 통해 이커머스 데이터 분석에 DFS 알고리즘과 스택을 활용하여 고객의 구매 패턴을 분석할 수 있습니다.






### DFS ETL 사례

In [51]:
class Item:
    def __init__(self, id, name):
        self.id = id
        self.name = name
        self.related_items = []

    def add_related_item(self, item):
        self.related_items.append(item)

def perform_etl(start_item, visited=None):
    if visited is None:
        visited = set()

    print(f"Extract: {start_item.id}, {start_item.name}")
    visited.add(start_item)

    # Extract 작업
    extracted_data = extract_data(start_item)

    # Transform 작업
    transformed_data = transform_data(extracted_data)

    # Load 작업
    load_data(transformed_data)

    for related_item in start_item.related_items:
        if related_item not in visited:
            perform_etl(related_item, visited)

def extract_data(item):
    # 상품 데이터를 추출하는 로직
    extracted_data = {
        "id": item.id,
        "name": item.name
    }
    return extracted_data

def transform_data(data):
    # 추출된 데이터를 변환하는 로직
    transformed_data = {
        "id": data["id"],
        "name": data["name"],
        "formatted_name": data["name"].upper()
    }
    return transformed_data

def load_data(data):
    # 변환된 데이터를 로드하는 로직
    print("Load:", data)

# 이커머스 ETL 예시
# 상품 데이터 생성
item_1 = Item(1, 'Item 1')
item_2 = Item(2, 'Item 2')
item_3 = Item(3, 'Item 3')
item_4 = Item(4, 'Item 4')
item_5 = Item(5, 'Item 5')
item_6 = Item(6, 'Item 6')

# 상품과 관련된 상품 설정
item_1.add_related_item(item_2)
item_1.add_related_item(item_3)
item_2.add_related_item(item_4)
item_3.add_related_item(item_5)
item_3.add_related_item(item_6)

start_item = item_1  # 시작 상품

perform_etl(start_item)


Extract: 1, Item 1
Load: {'id': 1, 'name': 'Item 1', 'formatted_name': 'ITEM 1'}
Extract: 2, Item 2
Load: {'id': 2, 'name': 'Item 2', 'formatted_name': 'ITEM 2'}
Extract: 4, Item 4
Load: {'id': 4, 'name': 'Item 4', 'formatted_name': 'ITEM 4'}
Extract: 3, Item 3
Load: {'id': 3, 'name': 'Item 3', 'formatted_name': 'ITEM 3'}
Extract: 5, Item 5
Load: {'id': 5, 'name': 'Item 5', 'formatted_name': 'ITEM 5'}
Extract: 6, Item 6
Load: {'id': 6, 'name': 'Item 6', 'formatted_name': 'ITEM 6'}


위의 코드는 이커머스에서 더 복잡한 ETL 작업을 처리하는 예시입니다.

Item 클래스는 상품을 나타내며, perform_etl 함수는 시작 상품을 입력으로 받아 DFS 알고리즘을 사용하여 ETL 작업을 수행합니다.

extract_data, transform_data, load_data 함수는 각각 추출, 변환, 로드 작업을 처리합니다.

이를 통해 이커머스 데이터의 ETL 작업에 DFS 알고리즘을 활용할 수 있으며, 추출, 변환, 로드 로직을 더 복잡하게 처리할 수 있습니다.




