# ７주차 : 탐색 알고리즘

- <a href="#1.탐색알고리즘">1. 탐색 알고리즘</a>

------------------------------

## <a name="1.탐색알고리즘">1. 탐색 알고리즘</a>

## 1-1. 탐색 알고리즘

### 깊이 우선 탐색(DFS:Depth-First Search)
- 가능한 모든 경로를 탐색하면서 미로의 출구까지 이동 (보통 우수법 알고리즘으로 사용)
- 재귀 방법 or 스택을 이용한 방법

In [None]:
# 재귀 방법 사용
def dfs(maze, start, end, path=[]):
    # 현재 위치를 경로에 추가
    path = path + [start]
    
    # 현재 위치가 출구인지 확인
    if start == end:
        return path
    
    # 현재 위치에서 이동할 수 있는 모든 방향을 탐색
    row, col = start
    directions = [(0, 1), (0, -1), (1, 0), (-1, 0)]  # 오른쪽, 왼쪽, 아래, 위
    for drow, dcol in directions:
        new_row, new_col = row + drow, col + dcol
        
        # 미로의 경계를 벗어나는지 확인
        if 0 <= new_row < len(maze) and 0 <= new_col < len(maze[0]) and maze[new_row][new_col] == 0:
            # 새로운 위치에서 DFS 재귀 호출
            if (new_row, new_col) not in path:  # 이미 방문한 위치인지 확인
                new_path = dfs(maze, (new_row, new_col), end, path)
                if new_path:
                    return new_path
    
    # 출구까지 도달하는 경로가 없는 경우
    return None

# 미로를 2D 리스트로 표현 (0은 통로, 1은 벽)
maze = [
    [0, 1, 0, 0, 0],
    [0, 0, 0, 1, 0],
    [1, 0, 1, 0, 0],
    [0, 0, 1, 0, 1],
    [0, 0, 0, 0, 0]
]

# 시작 위치와 끝 위치
start = (0, 0)
end = (4, 4)

# DFS 알고리즘을 사용하여 미로 탈출 경로 찾기
escape_path = dfs(maze, start, end)

if escape_path:
    print("미로 탈출 경로:", escape_path)
else:
    print("미로를 탈출할 수 없습니다.")

- Stack 이용

In [None]:
# 스택 사용 방법
def dfs(maze, start, end):
    print('[bfs] 진행합니다.')
    rows, cols = len(maze), len(maze[0])
    stack = [start]
    visited = [[False] * cols for _ in range(rows)]
    visited[start[0]][start[1]] = True
    
    # 방향 벡터 (상, 하, 좌, 우)
    directions = [(-1, 0), (1, 0), (0, -1), (0, 1)]
    
    while stack:
        current = stack.pop()
        print(f"현재 위치: {current}")
        
        # 현재 위치가 도착점인지 확인
        if current == end:
            print("도착했습니다!")
            return True
        
        # 가능한 모든 방향으로 이동
        for direction in directions:
            nr, nc = current[0] + direction[0], current[1] + direction[1]
            
            # 미로 범위 내에 있고, 벽이 아니며, 방문하지 않았던 경우
            if 0 <= nr < rows and 0 <= nc < cols and not maze[nr][nc] and not visited[nr][nc]:
                visited[nr][nc] = True
                stack.append((nr, nc))
    
    print("도착할 수 없습니다.")
    return False

### 너비 우선 탐색(BFS:Breadth-First Search)
- 일반적으로 Queue 이용 (재귀 사용 안함--> 비효율적)
- BFS는 모든 가능한 경로를 동시에 탐색하면서 목표지점에 도달할 수 있는 최단 경로를 찾는데 효과적

In [None]:
from collections import deque

def bfs(maze, start, end):
    print('[bfs] 진행합니다.')
    # 미로의 행과 열 크기
    rows, cols = len(maze), len(maze[0])
    
    # 방문 위치를 저장할 배열
    visited = [[False] * cols for _ in range(rows)]
    
    # 큐 초기화 및 시작점 추가
    queue = deque([start])
    visited[start[0]][start[1]] = True
    
    # 방향 벡터 (상, 하, 좌, 우)
    directions = [(-1, 0), (1, 0), (0, -1), (0, 1)]
    
    while queue:
        current = queue.popleft()
        print(f"현재 위치: {current}")
        
        # 현재 위치가 도착점인지 확인
        if current == end:
            print("도착했습니다!")
            return True
        
        # 가능한 모든 방향으로 이동
        for direction in directions:
            nr, nc = current[0] + direction[0], current[1] + direction[1]
            
            # 미로 범위 내에 있고, 벽이 아니며, 방문하지 않았던 경우
            if 0 <= nr < rows and 0 <= nc < cols and not maze[nr][nc] and not visited[nr][nc]:
                visited[nr][nc] = True
                queue.append((nr, nc))
    
    print("도착할 수 없습니다.")
    return False

In [None]:
# 미로 예시 (0은 길, 1은 벽)
maze = [
    [0, 1, 1, 1, 1],
    [0, 0, 0, 0, 1],
    [1, 1, 0, 1, 1],
    [1, 0, 0, 0, 0],
    [1, 1, 1, 1, 0]
]

start = (0, 0)  # 시작점
end = (4, 4)    # 도착점

bfs(maze, start, end)  # 깊이 우선 탐색
dfs(maze, start, end)  # 너비 우선 탐색

### [참고] DFS 탐색 알고리즘 그래프로 시각화

In [None]:
import matplotlib.pyplot as plt
import numpy as np

plt.rcParams['figure.figsize'] = (3,2)

def plot_maze(maze, visited, path=None):
    r, c = maze.shape
    image = np.zeros((r, c, 3))
    for i in range(r):
        for j in range(c):
            if maze[i, j] == 1:
                image[i, j] = [0, 0, 0]  # 벽은 검정색
            elif visited[i, j]:
                image[i, j] = [0, 1, 0]  # 방문한 곳은 녹색
            else:
                image[i, j] = [1, 1, 1]  # 길은 흰색

    if path:
        for (x, y) in path:
            image[x, y] = [1, 0, 0]  # 경로는 빨간색

    plt.imshow(image)
    plt.show()

def dfs(maze, start, end):
    r, c = maze.shape
    stack = [start]
    visited = np.zeros_like(maze, dtype=bool)
    visited[start] = True
    
    while stack:
        current = stack.pop()
        plot_maze(maze, visited)  # 현재 미로 상태를 그립니다.
        
        if current == end:
            print("도착했습니다!")
            return True
        
        for direction in [(-1, 0), (1, 0), (0, -1), (0, 1)]:
            nr, nc = current[0] + direction[0], current[1] + direction[1]
            if 0 <= nr < r and 0 <= nc < c and not maze[nr, nc] and not visited[nr, nc]:
                visited[nr, nc] = True
                stack.append((nr, nc))
    
    print("도착할 수 없습니다.")
    return False

# 미로 예시
maze = np.array([
    [0, 1, 1, 1, 1],
    [0, 0, 0, 0, 1],
    [1, 1, 0, 1, 1],
    [1, 0, 0, 0, 0],
    [1, 1, 1, 1, 0]
])

start = (0, 0)  # 시작점
end = (4, 4)    # 도착점

dfs(maze, start, end)

### A* 알고리즘

In [None]:
import heapq

def heuristic(node, goal):
    # 휴리스틱 함수: 현재 노드에서 목표 노드까지의 추정 거리를 반환
    x1, y1 = node
    x2, y2 = goal
    return abs(x1 - x2) + abs(y1 - y2)  # 맨해튼 거리(Manhattan Distance) 사용

def astar(maze, start, end):
    # 시작 노드 생성
    open_list = []
    closed_list = set()
    heapq.heappush(open_list, (0, start, []))  # 우선순위 큐에 시작 노드 추가: (거리, 위치, 경로)
    
    while open_list:
        _, current, path = heapq.heappop(open_list)  # 우선순위 큐에서 가장 짧은 거리의 노드 추출
        if current == end:
            return path + [current]  # 목표에 도달한 경우 경로 반환
        
        closed_list.add(current)  # 현재 위치를 closed_list에 추가
        
        # 현재 위치에서 이동 가능한 모든 방향 탐색
        row, col = current
        directions = [(0, 1), (0, -1), (1, 0), (-1, 0)]  # 오른쪽, 왼쪽, 아래, 위
        for drow, dcol in directions:
            new_row, new_col = row + drow, col + dcol
            
            # 미로의 경계를 벗어나는지 확인
            if 0 <= new_row < len(maze) and 0 <= new_col < len(maze[0]) and maze[new_row][new_col] == 0:
                new_node = (new_row, new_col)
                if new_node not in closed_list:
                    new_path = path + [current]  # 새로운 경로 생성
                    cost = len(new_path) + heuristic(new_node, end)  # 새로운 노드의 비용 계산
                    heapq.heappush(open_list, (cost, new_node, new_path))  # 우선순위 큐에 추가
    
    return None  # 목표에 도달할 수 없는 경우 None 반환

# 미로를 2D 리스트로 표현 (0은 통로, 1은 벽)
maze = [
    [0, 1, 0, 0, 0],
    [0, 0, 0, 1, 0],
    [1, 0, 1, 0, 0],
    [0, 0, 1, 0, 1],
    [0, 0, 0, 0, 0]
]

# 시작 위치와 끝 위치
start = (0, 0)
end = (4, 4)

# A* 알고리즘을 사용하여 미로 탈출 경로 찾기
escape_path = astar(maze, start, end)

if escape_path:
    print("미로 탈출 경로:", escape_path)
else:
    print("미로를 탈출할 수 없습니다.")

-----

## 1-2. 선형 탐색(Linear Search)



### 1-2-1. 선형 탐색 알고리즘

In [None]:
array = [ 3, 9, 15, 22, 31, 55, 67, 88, 91 ]
n = len(array)
number = 22   # 찾는 숫자

msg = f'''입력 배열 = {array}
찾는 숫자 = {number}\n'''
print(msg)

In [None]:
def sequential_search(A, key, low, high) :	# 순차탐색
    for i in range(low, high+1) :			# i : low, low+1, ... high
        if A[i] == key :  				    # 탐색 성공하면
            return i 						# 인덱스 반환 
    return -1								# 탐색에 실패하면 -1 반환 

def linear_search(A, key):
    for i in range(len(A)):
        if A[i] == key:
            return i  # 값의 인덱스 반환
    return -1  # 찾지 못한 경우 -1 반환

print(f"{msg}#선형 탐색(idx): {sequential_search(array, number, 0, n-1)}" )
print('-'*30)
print(f"{msg}#선형 탐색(idx): {linear_search(array, number)}" )

### 1-2-2. [교환하기 전략 추가] 선형 탐색 알고리즘

In [None]:
def sequential_search_transpose(A, key, low, high) :
	for i in range(low, high+1) :
		if A[i] == key :
			if i > low :			# 맨 처음 요소가 아니면 이전 요소와 교환
				A[i], A[i-1] = A[i-1], A[i] 
				i = i - 1
			return i				# 탐색에 성공하면 키 값의 인덱스 반환 
	return -1						# 탐색에 실패하면 -1 반환 

print(f"{msg}#선형 탐색[교환 적용]: {sequential_search_transpose(array, number, 0, n-1)}" )

------------------------

## 1-3. 이진 탐색(Binary Search)


### 1-3-1. 이진 탐색 알고리즘(순환 구조:재귀)

In [None]:
def binary_search(A, key, low, high) :
    if low <= high :		    # 항목들이 남아 있으면(종료 조건)
        middle = (low + high)//2
        if key == A[middle] :	
            return middle		
        elif (key<A[middle]) :	
            return binary_search(A, key, low, middle - 1)
        else :			
            return binary_search(A, key, middle + 1, high)
    return -1        		

array = [3, 9, 15, 22, 31, 55, 67, 88, 91]
number = 22
print(f"{msg}#이진 탐색(순환구조）: {binary_search(array, number, 0, n-1)}" )

### 1-3-2. 이진 탐색 알고리즘(반복 구조)

In [None]:
def binary_search_iter(A, key, low, high) :
    while (low <= high) :		# 항목들이 남아 있으면(종료 조건)
        middle = (low + high)//2
        if key == A[middle]:	
            return middle
        elif (key > A[middle]):	
            low = middle + 1	
        else:			
            high = middle - 1	
    return -1      

print(f"{msg}#이진 탐색(순환구조）: {binary_search_iter(array, number, 0, n-1)}" )

### 1-3-3. 이진 탐색 알고리즘(보간 탐색 적용)
- 보간탐색 중앙요소 위치
- middle = low + (high-low) * (key-A[low]) // (A[high]-A[low])

In [None]:
def binary_interpolation_search(A, key, low, high) :
    if low <= high :		    # 항목들이 남아 있으면(종료 조건)
        middle = low + (high-low) * (key-A[low]) // (A[high]-A[low])        
        if key == A[middle] :	
            return middle		
        elif (key<A[middle]) :	
            return binary_search(A, key, low, middle - 1)
        else :			
            return binary_search(A, key, middle + 1, high)
    return -1        		

array = [3, 9, 15, 22, 31, 55, 67, 88, 91]
number = 22
print(f"{msg}#이진 탐색(순환구조）: {binary_interpolation_search(array, number, 0, n-1)}" )

--------

## 1-4. 이진 탐색 트리(Binary Search Tree)

### 1-4-1. 이진 탐색 트리 알고리즘

In [None]:
class BSTNode:
    def __init__(self, key):
        self.val = key
        self.left = None
        self.right = None

In [None]:
# 삽입 연산 : Insertion
def insert(root, key):
    if root is None:
        return BSTNode(key)
    if key < root.val:
        root.left = insert(root.left, key)
    else:
        root.right = insert(root.right, key)
    return root
    

In [None]:
# 탐색 연산 : Search
def search(root, key):
    if root is None or root.val == key:
        return root
    if key < root.val:
        return search(root.left, key)
    return search(root.right, key)


In [None]:
# 삭제 연산 : Deletion
def minValueNode(node):
    current = node
    while current.left is not None:
        current = current.left
    return current

def delete(root, key):
    if root is None:
        return root

    if key < root.val:
        root.left = delete(root.left, key)
    elif key > root.val:
        root.right = delete(root.right, key)
    else:
        if root.left is None:
            temp = root.right
            root = None
            return temp
        elif root.right is None:
            temp = root.left
            root = None
            return temp

        temp = minValueNode(root.right)
        root.val = temp.val
        root.right = delete(root.right, temp.val)
    return root
    

In [None]:
# 트리 출력 (중위 순회 방식)
def inorder_traversal(root):
    if root:
        inorder_traversal(root.left)
        print(root.val, end=" ")
        inorder_traversal(root.right)

In [None]:
# 예시 이진 탐색 트리 생성
root = None
keys = [18, 7, 26, 3, 12, 31, 27]
print(f"생성전: {keys}\n")

# 삽입 예시
for key in keys:
    root = insert(root, key)

print("생성된 이진 탐색 트리:")
inorder_traversal(root)

# 탐색 예시
target = 28
print(f"\n\n트리 탐색: {target}")
result = search(root, target)
if result:
    print(f"{target}를 찾았습니다.")
else:
    print(f"{target}를 찾을 수 없습니다.")

# 삭제 예시
target = 12
print("\n삭제 전 트리:")
inorder_traversal(root)

root = delete(root, target)
print(f"\n{target} 삭제 후 트리:")
inorder_traversal(root)

- 교재 방법

In [None]:
# 이진탐색트리를 위한 노드 클래스
class BSTNode:
    def __init__ (self, key, value):	# 생성자: 키와 값을 받음
        self.key = key		
        self.value = value	
        self.left = None	
        self.right = None	

    def __str__(self) :
        return f"({self.key}:{self.value})" # (3,three)
        
# 이진탐색트리의 탐색 연산(순환 구조)
def search_bst(n, key) :		
    if n == None :
        return None
    elif key == n.key:			# n의 키 값과 동일->탐색성공
        return n
    elif key < n.key:			# key<n의 키
        return search_bst(n.left, key)	# 왼쪽 서브트리 탐색
    else:				        # key>n의 키
        return search_bst(n.right, key)	# 오른쪽 서브트리 탐색

# 이진탐색트리의 값을 이용한 탐색(전위 순회)
def search_value_bst(n, value) :
    if n == None : return None
    elif value == n.value:
        return n
    res = search_value_bst(n.left, value) 	    # 왼쪽서브트리에서 탐색
    if res is not None : 
       return res
    else :				                        # 왼쪽에서 탐색 실패이면
       return search_value_bst(n.right, value)  # 오른쪽 탐색 결과반환


# 이진탐색트리의 삽입 연산
def insert_bst(root, node):
	if root == None : 			# 공백 노드에 도달하면, 이 위치에 삽입
		return node

	if node.key == root.key :	# 동일한 키는 허용하지 않음. root를 바로 반환
		return root

	# 왼쪽 서브트리에 넣어야 하는 경우. 순환호출하고 left를 갱신
	if node.key < root.key :
		root.left = insert_bst(root.left, node)

	# 오른쪽 서브트리에 넣어야 하는 경우. 순환호출하고 right를 갱신
	else :
		root.right= insert_bst(root.right, node)

	return root							# 루트 노드를 반환함


# 이진탐색트리의 삭제 연산
def delete_bst (root, key) :
    if root == None :       # 공백 트리
        return root

    # key가 루트보다 작으면 왼쪽 서브트리에서 삭제하고, left를 갱신
    if key < root.key :
        root.left = delete_bst(root.left, key)

    # key가 루트보다 크면 오른쪽 서브트리에서 삭제하고, right를 갱신
    elif key > root.key :
        root.right= delete_bst(root.right, key)

    # key가 루트와 같으면 root를 삭제
    else : 
        if root.left== None :   # 단말 노드이거나 오른쪽 자식만 가진 노드 삭제
            return root.right   # root 대신에 right로 대체

        if root.right== None :  # 왼쪽 자식만 가진 노드 삭제
            return root.left    # root 대신에 left로 대체


        # 2개의 자식을 모두 가진 경우
        succ = root.right
        while succ.left != None:
            succ = succ.left

        root.key = succ.key                     # 후계자의 데이터를 root에 복사
        root.value = succ.value                 
        root.right = delete_bst(root.right, succ.key)

    return root


# 전위 순회: 트리 구조 출력
def preorder(n) :
    if n is not None :
        print('{', end=' ')
        print(n, end=' ')
        preorder(n.left)
        preorder(n.right)
        print('}', end=' ')


In [None]:
# 이진탐색트리의 테스트 프로그램
def print_node(msg, n) :		# 노드 출력 함수
    print(msg, n if n != None else "탐색실패")

def print_tree(msg, r) :		# 트리 출력 함수
    print(msg, end='')
    preorder(r)
    print()

data = [(6, "여섯"), (8, "여덟"), (2,"둘"), (4,"넷"),  (7,"일곱"), (5,"다섯"), (1,"하나"), (9,"아홉"), (3,"셋"), (0,"영")]

root = None         	        # 루트 노드 생성 및 초기화
for i in range(0, len(data)):	# 노드 순서대로 추가하기 
    root = insert_bst(root, BSTNode(data[i][0], data[i][1]))

print_tree("최초: ", root)		# 최초의 트리 출력

n = search_bst(root, 3);        print_node("srch 3: ", n)
n = search_bst(root, 8);        print_node("srch 8: ", n)
n = search_bst(root, 0);        print_node("srch 0: ", n)
n = search_bst(root, 10);       print_node("srch10: ", n)
n = search_value_bst(root,"둘");print_node("srch둘: ", n)
n = search_value_bst(root,"열");print_node("srch열: ", n)

root = delete_bst(root, 7);     print_tree("del  7: ", root)
root = delete_bst(root, 8);     print_tree("del  8: ", root)
root = delete_bst(root, 2);     print_tree("del  2: ", root)
root = delete_bst(root, 6);     print_tree("del  6: ", root)

----

## 1-５. 해시 탐색

### 1-5-1. 해싱(Hashing) : 분리 연결법(Separate Chaining)
충돌한 키의 자료를 연결 리스트로 저장

In [1]:
# 리스트를 이용한 해시 테이블 구성
class ListNode:
    def __init__(self, key, value):
        self.key = key
        self.value = value
        self.next = None

class HashTable:
    def __init__(self, size):
        self.size = size    # 테이블 크기
        self.table = [None] * size

    def hash_function(self, key):
        """
        간단한 해시 함수: 키의 길이를 해시값으로 사용
        """
        return len(key) % self.size

    def put(self, key, value):
        index = self.hash_function(key)
        print(f"key: {key} index: {index}")
        
        if self.table[index] is None: 
            self.table[index] = ListNode(key, value)
        else:
            # 충돌이 발생한 경우, 연결 리스트를 사용하여 데이터를 추가합니다.
            current = self.table[index]
            while current.next is not None:
                current = current.next
            current.next = ListNode(key, value)
        print(self.table)

    def get(self, key):
        index = self.hash_function(key)
        current = self.table[index]
        while current is not None:
            if current.key == key:
                return current.value
            current = current.next
        return None

# 해시 테이블 생성
hash_table = HashTable(10)  # 테이블 크기 10

# 데이터 추가
hash_table.put("apple", 10)    # key value
hash_table.put("banana", 20)   # key value
hash_table.put("orange", 30)   # key value

# 데이터 검색
key = "banana"
result = hash_table.get(key)  # key 탐색
if result is not None:
    print(f"{key}의 값은 {result}입니다.")
else:
    print(f"{key}를 찾을 수 없습니다.")

key: apple index: 5
[None, None, None, None, None, <__main__.ListNode object at 0x0000015F3DC46F10>, None, None, None, None]
key: banana index: 6
[None, None, None, None, None, <__main__.ListNode object at 0x0000015F3DC46F10>, <__main__.ListNode object at 0x0000015F3DC47910>, None, None, None]
key: orange index: 6
[None, None, None, None, None, <__main__.ListNode object at 0x0000015F3DC46F10>, <__main__.ListNode object at 0x0000015F3DC47910>, None, None, None]
banana의 값은 20입니다.


### 1-5-2. 해싱(Hashing) : 개방 주소법(Open Addressing)
충돌할 때 다음 빈자리를 찾아 자료를 저장(**파이썬 방법**)

In [None]:
class HashTable:
    def __init__(self, size):
        self.size = size
        self.table = [None] * size

    def hash_function(self, key):
        """
        간단한 해시 함수: 키의 길이를 해시값으로 사용
        """
        return len(key) % self.size

    def put(self, key, value):
        index = self.hash_function(key)
        if self.table[index] is None:
            self.table[index] = (key, value)
        else:
            # 충돌이 발생한 경우, 선형 탐색을 사용하여 다음 빈 버킷을 찾습니다.
            while self.table[index] is not None:
                index = (index + 1) % self.size
            self.table[index] = (key, value)

    def get(self, key):
        index = self.hash_function(key)
        while self.table[index] is not None:
            stored_key, value = self.table[index]
            if stored_key == key:
                return value
            index = (index + 1) % self.size
        return None

# 해시 테이블 생성
hash_table = HashTable(10)  # 테이블 크기 10

# 데이터 추가
hash_table.put("apple", 10)    # key value
hash_table.put("banana", 20)   # key value
hash_table.put("orange", 30)   # key value

# 데이터 검색
key = "banana"
result = hash_table.get(key)  # key 탐색
if result is not None:
    print(f"{key}의 값은 {result}입니다.")
else:
    print(f"{key}를 찾을 수 없습니다.")

- **파이썬의 내장 함수 hash() 사용한 방법**

In [None]:
class HashTable:
    def __init__(self, size):
        self.size = size
        self.table = [None] * size

    def put(self, key, value):
        index = hash(key) % self.size
        self.table[index] = (key, value)

    def get(self, key):
        index = hash(key) % self.size
        while self.table[index] is not None:
            stored_key, value = self.table[index]
            if stored_key == key:
                return value
            index = (index + 1) % self.size
        return None

# 해시 테이블 생성
hash_table = HashTable(10)  # 테이블 크기 10

# 데이터 추가
hash_table.put("apple", 10)    # key value
hash_table.put("banana", 20)   # key value
hash_table.put("orange", 30)   # key value

# 데이터 검색
key = "banana"
result = hash_table.get(key)  # key 탐색
if result is not None:
    print(f"{key}의 값은 {result}입니다.")
else:
    print(f"{key}를 찾을 수 없습니다.")

-----------------