## 검색 알고리즘
데이터 집합에서 원하는 값을 가진 원소를 찾아내는 검색 알고리즘   
검색의 종류 : 배열 검색, 연결리스트 검색, 이진 트리 검색

## 선형 검색 linear search
무작위로 늘어 놓은 데이터 집합에서 검색을 수행한다. 
직선 모양으로 늘어선 배열에서 검색하는 경우에 원하는 키값을 가진 원소를 찾을 때까지 맨 앞부터 스캔하여 순서대로 검색하는 알고리즘

In [2]:
# 선형 검색 알고리즘 
from typing import Any, Sequence

def seq_search(a: Sequence, key: Any) -> int:
    i=0
   
    # (1)
    """
    while True:
        if i == len(a):
            return -1
        if a[i] == key:
            return i
        i += 1    
    """
    # (2) 
    for i in range(len(a)):
        if a[i] == key:
            return i
    return i

In [6]:
# 테스트 
if __name__ == '__main__':
    num = int(input('원소 수를 입력하세요.: '))
    x = [None] * num

    for i in range(num):
        x[i] = int(input(f'x[{i}]: '))

    ky = int(input('검색할 값을 입력하세요. '))

    idx = seq_search(x, ky)

    if idx == -1:
        print('검색값을 갖는 원소가 존재하지 않습니다.')
    else:
        print(f'검색값은 x[{idx}]에 있습니다.')

원소 수를 입력하세요.: 5
x[0]: 2
x[1]: 33
x[2]: 4
x[3]: 56
x[4]: 5
검색할 값을 입력하세요. 56
검색값은 x[3]에 있습니다.


- 보초법 : 계속 반복하면 종료 조건을 검사하는 비용을 무시할 수 없다. 이 비용을 반으로 줄이는 방법으로 검색하고자 하는 키값을 배열의 맨 끝에 저장한다. 

In [5]:
import copy

def seq_search(seq: Sequence, key: Any) -> int:
    a = copy.deepcopy(seq)
    a.append(key)

    i = 0
    while True:
        if a[i] == key:
            break
        i += 1
    return -1 if i == len(seq) else i

## 이진 검색 Binary Search
일정한 규칙으로 늘어놓은 데이터 집합에서 아주 빠른 검색을 수행한다.   
값을 찾아내는 시간 복잡도가 $O(logn)$이라는 점에서 대표적인 로그 시간 알고리즘.  
이진 트리 탐색 (Binary Searcy Tree) 와도 유사한 점이 많지만 이진 탐색 트리가 정렬된 구조를 저장하고 탐색하는 자료구조라면,  
이진 검색은 정렬된 배열에서 값을 찾아내는 알고리즘 자체를 지칭한다.   

In [7]:
from typing import Any, Sequence

def bin_search(a:Sequence, key:Any) -> int:
    pl = 0
    pr = len(a) - 1

    print('  |', end='')
    for i in range(len(a)):
        print(f'{i : 4}', end='')
    print()
    print('---+' + (4 * len(a)+2)*'-')

    while True:
        pc = (pl + pr) // 2

        print('  |', end='')
        if pl != pc:
            print((pl*4 + 1)*' '+'<-'+((pc-pl)*4)*' '+'+', end='')
        else:
            print((pc*4+1)*' '+'<+', end='')
        if pc != pr:
            print(((pr-pc)*4-2)*' '+'->')
        else:
            print('->')
        print(f'{pc:3}|', end='')

        for i in range(len(a)):
            print(f'{a[i]:4}', end='')
        print('\n   |')

        if a[pc] == key:
            return pc
        elif a[pc] < key:
            pl = pc + 1
        else:
            pr = pc - 1
        if pl > pr:
            break
    return -1

In [8]:
if __name__ == '__main__':
    num = int(input('원소 수를 입력하세요.: '))
    x = [None] * num

    print('배열 데이터를 오름차순으로 입력하세요.')

    x[0] = int(input('x[0]: '))

    for i in range(1, num):
        while True:
            x[i] = int(input(f'x[{i}]:'))
            if x[i] >= x[i - 1]:
                break
    ky = int(input('검색할 값을 입력하세요.: '))

    idx = bin_search(x, ky)

    if idx == -1:
        print('검색값을 갖는 원소가 존재하지 않습니다.')
    else:
        print(f'검색값은 x[{idx}]에 있습니다.')

원소 수를 입력하세요.: 9
배열 데이터를 오름차순으로 입력하세요.
x[0]: 34
x[1]:56
x[2]:78
x[3]:90
x[4]:98
x[5]:122
x[6]:234
x[7]:567
x[8]:678
검색할 값을 입력하세요.: 900
  |   0   1   2   3   4   5   6   7   8
---+--------------------------------------
  | <-                +              ->
  4|  34  56  78  90  98 122 234 567 678
   |
  |                     <-    +      ->
  6|  34  56  78  90  98 122 234 567 678
   |
  |                             <+  ->
  7|  34  56  78  90  98 122 234 567 678
   |
  |                                 <+->
  8|  34  56  78  90  98 122 234 567 678
   |
검색값을 갖는 원소가 존재하지 않습니다.


## 해시법 Hasing  

'데이터를 저장할 위치 = 인덱스'를 간단한 연산으로 구하는 것  
추가.삭제가 자주 일어나는 데이터 집합에서 아주 빠른 검색을 수행한다. 

저장할 버킷이 중복되는 현상인 충돌 collision이 발생하는 경우 아래의 방법으로 대처할 수 있다. 

- 체인법 : 같은 해시값 데이터를 연결 리스트로 연결하는 방법
- 오픈 주소법 : 데이터를 위한 해시값이 충돌할 때 재해시하는 방법 

### 체인법

In [2]:
# 노드 클래스 만들기
from __future__ import annotations
from typing import Any, Type
import hashlib

# 해시를 구성하는 노드
class Node:
    
    # 초기화
    def __init__(self, key: Any, value: Any, next: Node) -> None:
        self.key = key
        self.value = value
        self.next = next

In [6]:
# 체인법으로 해시 클래스 구현
class ChainedHash:
    
    # 초기화
    def __init__(self, capacity:int) -> None:
        self.capacity = capacity
        self.table = [None] * self.capacity
        #capacity : 해시 테이블의 크기(배열 table의 원소 수)를 나타냄   
        #table : 해시 테이블을 저장하는 list형 배열을 나타냄
    
    # 인수 key에 대응하는 해시값 구하는 함수 
    def hash_value(self, key: Any) -> int:
        if isinstance(key, int):
            return key % self.capacity
        return(int(hashlib.sha256(str(key).encode()).hexdigest(),16)%self.capacity)
        # sha256 : RSA의 FIPS알고리즘을 바탕으로 바이트(byte)문자열의 해시값을 구하는 해시알고리즘 생성자
        # encode() : hashlib.sha256에는 바이트 문자열의 인수를 전달해야하기 때문에 key를 str로 변환한뒤 encode()를 통해 바이트 문자열 생성
        # hexdigest() : sha256 알고리즘에서 해시값을 16진수 문자열 꺼내기
        # int() : hexdigest() 함수로 꺼낸 문자열을 16진수 문자열을 int 형으로 변환 
    
    def search(self, key: Any) -> Any:
        hash = self.hash_value(key)
        p = self.table[hash]

        while p is not None:
            if p.key == key:
                return p.value
            p = p.next

        return None

    def add(self, key: Any, value: Any) -> bool:
        hash = self.hash_value(key)
        p = self.table[hash]
        
        while p is not None:
            if p.key == key:
                return False
            p = p.next
            
        temp = None(key, value, self.table[hash])
        self.table[hash] = temp
        return True
    
    def remove(self, key: Any) -> bool:
        hash = self.hash_value(key)
        p = self.table[hash]
        pp = None
        
        while p is not None:
            if p.key == key:
                if pp is None:
                    self.table[hash] = p.next
                else:
                    pp.next = p.next
                return True
            pp = p
            p = p.next
        return False
    
    def dump(self) -> None:
        for i in range(self.capacity):
            p = self.table[i]
            print(i, end='')
            while p is not None:
                print(f' -> {p.key}({p.value})', end='')
                p = p.next
            print()