## 3. 검색 알고리즘

### 검색 알고리즘이란

key를 이용하여 값을 검색하는 것

배열 검색, 연결 리스트 검색, 이진 검색 트리 검색


### 배열 검색

#### 1. 선형 검색

원하는 키 값을 가진 원소를 찾을 때까지 맨 앞부터 스캔하여 순서대로 검색하는 알고리즘

판단에는 평균 n/2번의 횟수가 필요함

In [1]:
from typing import Any, Sequence

def seq_search(a: Sequence, key : Any) -> int:
    i=0
    
    while True:
        if i == len(a):
            return -1
        if a[i] == key:
            return i
        i+=1
        
if __name__ == '__main__':
    num = int(input('원소 수를 입력하세요:'))
    x=[None]*num
    
    for i in range(num):
        x[i]= int(input(f'x[{i}]: '))
        
    ky = int(input('검색할 값을 입력하세요: '))
    
    idx= seq_search(x,ky)
    
    if idx == -1:
        print('값이 존재하지 않습니다')
        
    else:
        print(f'검색값은 x[{idx}]에 있습니다.')

검색값은 x[2]에 있습니다.


### 보초법이란
선형 검색에서 2가지 종료조건을 체크하는 대신, 배열의 마지막에 검색할 원소를 추가함으로써 값을 찾지 못한 경우를 배제할 수 있음, 이 때, idx와 배열의 길이가 같으면 찾지 못했다고 판단함

In [2]:
from typing import Any, Sequence
import copy

def seq_search(seq: Sequence, key : Any) -> int:
    i=0
    a=copy.deepcopy(seq)
    a.append(key)

    while True:
        if a[i] == key:
            break
        i+=1
    return -1 if i ==len(seq) else i


num = int(input('원소 수를 입력하세요:'))
x=[None]*num

for i in range(num):
    x[i]= int(input(f'x[{i}]: '))
    
ky = int(input('검색할 값을 입력하세요: '))

idx= seq_search(x,ky)

if idx == -1:
    print('값이 존재하지 않습니다')
    
else:
    print(f'검색값은 x[{idx}]에 있습니다.')

값이 존재하지 않습니다


### 2. 이진 검색
오름차순이나 내림차순으로 정렬된 배열에서 더 효율적으로 검색할 수 있는 알고리즘

중간 지점의 값을 목표값과 반복적으로 비교하며 실행

즉, pl, pc, pr이 왼쪽, 중앙, 오른쪽의 값일 때, 값이 작은 경우 pr을 pc-1로 업데이트하며 진행

#### 종료조건
1. a[pc]와 key가 일치하는 경우
2. 검색 범위가 더 이상 없는 경우

In [11]:
from typing import Any, Sequence
def bin_search(a: Sequence, key=Any) -> int:
    pl=0
    pr=len(a)-1

    while True:
        pc=(pl+pr) // 2  #중앙원소 인덱스
        if a[pc]==key:
            return pc
        elif a[pc] <key:
            pl=pc+1
        else:
            pr=pc-1
        if pl>pr:
            return -1
        
if __name__=='__main__':
    num=int(input('원소 수를 입력하세요:'))
    x=[None]*num

    print('배열 데이터를 오름차순으로 입력하세요')

    x[0]=int(input('x[0]= '))
    for i in range(1,num):
        while True:
            x[i]=int(input(f'x[{i}]: '))
            if x[i]>=x[i-1]:
                break

    ky= int(input('검색할 값을 입력하세요: '))
    idx= bin_search(x,ky)

    if idx==-1:
        print('검색값 갖는 원소가 없습니다')
    else: 
        print(f'검색값은 x[{idx}]에 있습니다.')

배열 데이터를 오름차순으로 입력하세요
검색값은 x[3]에 있습니다.


### 복잡도
#### 시간 복잡도, 공간 복잡도

시간복잡도 -> O(f(n)) + O(g(n)) = O(max(f(n),g(n)))으로 계산하므로, 선형 검색의 시간 복잡도는 O(n), 이진 검색의 시간 복잡도는 O(log n)



### 3. 해시법
데이터의 추가, 삭제를 효율적으로 수행할 수 있는 방법

데이터를 추가하고 하나씩 이동하는 방법은 비효율적임

키 값을 어떤 수로 나눈 나머지를 해시값으로 지정, 이를 인덱스로 하여 새로운 배열 생성

#### 해시 충돌
나머지가 일치하는 경우 같은 인덱스에 n개의 원소가 저장되어야 하는 상황 발생

1. 체인법: 해시값이 같은 원소를 연결 리스트로 관리

    연결 리스트에 의해 체인 모양으로 연결, 각 버킷은 연결 리스트의 앞쪽 노드를 참조

2. 오픈 주소법: 빈 버킷을 찰을 때까지 해시를 반복

In [1]:
#체인법으로 해시함수 구현하기
"""node class 만들기: 키, 값, 다음 노드를 참조하는 필드 생성"""

from __future__ import annotations
from typing import Any, Type
import hashlib

class Node:
    """해시를 구성하는 노드"""

    def __init__(self, key: Any, value: Any, next: Node) -> None:
        self.key   = key    
        self.value = value  
        self.next  = next   

class ChainedHash:
    """체인법을 해시 클래스 구현"""

    def __init__(self, capacity: int) -> None:
        self.capacity = capacity             
        self.table = [None] * self.capacity  

    def hash_value(self, key: Any) -> int:
        if isinstance(key, int):
            return key % self.capacity
        return(int(hashlib.sha256(str(key).encode()).hexdigest(), 16) % self.capacity)

    def search(self, key: Any) -> Any:
        """키가 key인 원소를 검색하여 값을 반환"""
        hash = self.hash_value(key) 
        p = self.table[hash]         

        while p is not None:
            if p.key == key:
                 return p.value 
            p = p.next           

        return None              

    def add(self, key: Any, value: Any) -> bool:
        """키가 key이고 값이 value인 원소를 삽입"""
        hash = self.hash_value(key)  
        p = self.table[hash]         

        while p is not None:
            if p.key == key:
                return False     
            p = p.next       

        temp = Node(key, value, self.table[hash])
        self.table[hash] = temp     
        return True       

    def remove(self, key: Any) -> bool:
        """키가 key인 원소를 삭제"""
        hash = self.hash_value(key)  
        p = self.table[hash]         
        pp = None                    

        while p is not None:
            if p.key == key:  
                if pp is None:
                    self.table[hash] = p.next
                else:
                    pp.next = p.next
                return True 
            pp = p
            p = p.next   
        return False   

    def dump(self) -> None:
        """해시 테이블을 덤프"""
        for i in range(self.capacity):
            p = self.table[i]
            print(i, end='')
            while p is not None:
                print(f'  → {p.key} ({p.value})', end='') 
                p = p.next
            print()

In [2]:
# 체인법을 구현하는 해시 클래스 ChainedHash의 사용

from enum import Enum

Menu = Enum('Menu', ['추가', '삭제', '검색', '덤프', '종료'])  # 메뉴를 선언

def select_menu() -> Menu:
    """메뉴 선택"""
    s = [f'({m.value}){m.name}' for m in Menu]
    while True:
        print(*s, sep = '   ', end='')
        n = int(input(': '))
        if 1 <=  n <=  len(Menu):
            return Menu(n)

hash = ChainedHash(13)     # 크기가 13인 해시 테이블을 생성

while True:
    menu = select_menu()   # 메뉴 선택

    if menu == Menu.추가:  # 추가
        key = int(input('추가할 키를 입력하세요.: '))
        val = input('추가할 값을 입력하세요.: ')
        if not hash.add(key, val):
            print('추가를 실패했습니다!')

    elif menu == Menu.삭제:  # 삭제
        key = int(input('삭제할 키를 입력하세요.: '))
        if not hash.remove(key):
            print('삭제를 실패했습니다!')

    elif menu == Menu.검색:  # 검색
        key = int(input('검색할 키를 입력하세요.: '))
        t = hash.search(key)
        if t is not None:
            print(f'검색한 키를 갖는 값은 {t}입니다.')
        else:
            print('검색할 데이터가 없습니다.')

    elif menu == Menu.덤프:  # 덤프
        hash.dump()

    else:  # 종료
        break

(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 1
추가할 키를 입력하세요.: 2
추가할 값을 입력하세요.: 23
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 1
추가할 키를 입력하세요.: 5
추가할 값을 입력하세요.: 24
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 1
추가할 키를 입력하세요.: 10
추가할 값을 입력하세요.: 12
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 1
추가할 키를 입력하세요.: 14
추가할 값을 입력하세요.: 53
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 3
검색할 키를 입력하세요.: 5
검색한 키를 갖는 값은 24입니다.
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 4
0
1  → 14 (53)
2  → 2 (23)
3
4
5  → 5 (24)
6
7
8
9
10  → 10 (12)
11
12
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 5
