# 03-3 이진 검색   

이진 검색 알고리즘을 사용하려면 배열의 데이터가 `정렬`되어 있어야 해요. 

- 선형 검색 < 이진검색 `Faster`

In [19]:
# 실습 3-4 | page.123
# 이진 검색 알고리즘

from typing import Any, Sequence, List, Dict

def bin_search(a: Sequence, key:Sequence) -> int:
    """시퀀스a에서 key와 일치하는 원소를 이진 검색 """
    
    pl = 0              # 검색 범위 맨 앞 원소의 인덱스
    pr = len(a) - 1     # 검색 범위 맨 뒤 원소의 인덱스

    while True:
        pc = (pl + pr) // 2 # 중앙 원소의 인덱스 
        if a[pc] == key:
            return pc       # 검색 성공
        elif a[pc] < key:
            pl = pc + 1     # 검색 범위를 오른쪽 절반으로 좁힘
        else:
            pr = pc -1      # 검색 범위를 왼쪽 절반으로 좁힘
        if pl > pr: 
            break
        return -1           # 검색 실패


if __name__ == '__main__':
    num = int(input('원소 수를 입력하세요.'))
    x = [None] * num        # 원소수가 num인 배열을 생성

    print('배열 데이터를 오름차순으로 입력하세요')

    x[0] = int(input('x[0]: '))
    
    for i in range(1, num):
        while True:
            x[i] = int(input(f'x[{i}]: '))
            if x[i] >=x[i - 1]:
                break               # 바로 직전에 입력한 원솟값보다 큰 값을 입력
    
    ky = int(input('검색할 값을 입력하세요.: ')) # 검색할 키값 ky를 입력
    
    idx = bin_search(x,ky)

    if idx == -1:
        print('검색값을 갖는 원소가 존재하지 않습니다.')
    else:
        print(f'검색 값은 x[{idx}]에 있습니다.')

배열 데이터를 오름차순으로 입력하세요
검색 값은 x[1]에 있습니다.


# 해시법

`검색`과 더불어 데이터의 `추가, 삭제`도 효율적으로 수행하는 해시법

## 체인법(chaining)이란 해시값이 같은 데이터를 체인모양의 연결 리스트로 연결하는 방법 - `오픈 해시법`  



In [21]:
# 실습 3-5
# 체인법으로 해시 함수 구현하기 

from __future__ import annotations
from typing import Any, Type
import hashlib

class Node:
    """해시를 구성하는 노드 """

    def __init__(self, key: Any, value: Any, next: Node) -> None:
        """초기화"""
        self.key = key     # 키
        self.value = value # 값
        self.next = next   # 뒤쪽 노드를 참조




#### Node 클래스 생성   

- key : 키(임의의 자료형)
- value : 키(아무 자료형)
- next : 뒤쪽 노드를 참조(Node형)

노드 클래스 " 키 : 값" 짝 형성
키에 해시 함수를 적용하여 해시값 구하기   


In [22]:
# 실습 3-5 

class ChainedHash:
    """체인법으로 해시 클래스 구현 """
    
    def __init__(self, capacity: int) -> None:
        '''초기화'''
        self.capacity  = capacity           # 해시 테이블의 크기를 지정
        self.table = [None] * self.capacity # 해시 테이블(리스트)을 선언

    def hash_value(self, key: Any) -> int:
        '''해시값 구하기 '''
        if isinstance(key, int):
            return key % self.capacity
        return (inthashlib.sha256(str(key).encode().hexdigest(), 16) % self.capacity)

#### ChaninedHash 해시 클래스 만들기    

- capacity : 해시 테이블의 크기(배열 table의 원소 수)를 나타냅니다. 
- table    : 해시 테이블을 저장하는 list형 배열을 나타냅니다.

#### \__init\__()함수로 초기화 하기 

\__init\__()함수는 빈 해시 테이블을 생성   
- capacity : 해시 테이블의 크기 --> `원소수가 capacity인 list형의 배열 table을 생성하고 모든 원소를 None으로 함`   

#### hash_value() 해시 함수 만들기   
`hash_value()` 함수는 인수 key에 대응하는 함수임

### 보충 | 해시&와 해시함수    

해시와 해시 함수를 알아볼게요. 먼저 해시는 `긁어모음, 뒤죽박죽, 가늘게 썬 고기 음식`을 의미    
만약 충돌 발생(x) --> 해시 함수로 인덱스를 찾는 것만으로 검색, 추가, 삭제가 대부분 완료 되므로 시간 복잡도는 모두 O(1)입니다.   

`해시 테이블을 충분히 크게 만들면 충돌 발생을 억제할 수 있지만 이 방법은 메모리 낭비` --> `즉, 시간과 공간의 트레이드-오프(상충관계) 문재 발생`
충돌을 피하려면 해시 함수가 해시 테이블 크기보다 작거나 같은 정수를 고르게 생성해야함. 따라서 해시 테이블의 크기는 소수를 선호





> - key가 int형(O)   
> key를 해시의 크기 capacity로 나눈 나머지를 해시값으로 합니다. 예를 들어 ChainedHash 클래스를 사용한 프로그램을 보면 key 가 int형이고 크기가 13이므로 키를 13으로 나눈 `나머지`가 `해시값`

> - key가 int형(X)
> key가 int형(X) 아닌 경우(문자열, 리스트, 클래스형 등) 그 값으로는 바로 나눌 수 없어요. 그래서 다음과 같은 표준 라이브러리로 형 변환을 해야 해시값을 얻을 수 있어요.   

|제목|내용|
|---|---|
|sha256알고리즘|hashlib모듈에서 제공하는 sha256은 RSA 알고리즘을 바탕으로 하며, 주어진 바이트(byte) 문자열의 해시값을 구하는 해시 알고리즘의 생성자(constructor)입니다. hashlib모듈은 sha256외에도 md5 등 다양한 해시 알고리즘을 제공합니다. |
|encode()|hashlib.sha256에는 바이트 문자열의 인수를 전달해야해요. 그래서 key를 str형 문자열로 변환한 뒤 그 문자열을 encode() 함수에 전달하여 바이트 문자열을 생성하게 합니다. |
|hexdigest()| sha256 알고리즘에서 해시값을 16진수 문자열로 꺼냄.|
|int()|hexdigest() 함수로 꺼낸 문자열을 16진수 문자열로 하는 int형으로 변환|

### 키로 원소를 검색하는 search()함수   

#### 33 검색하기   
33의 해시값은 7이므로 `table[7]`이 가리키는 연결 리스트를 찾아값니다. 20 - > 33으로 찾아가면 검색에 성공합니다. 

#### 26 검색하기   
26의 해시값은 0입니다. `table[0]`이 None이므로 검색에 실패

search() 함수가 원소를 검색하는 과정    
1. 해시 함수를 사용하여 키를 해시값으 변환    
2. 해시값을 인덱스로 하는 버킷에 주목    
3. 버킷이 참조하는 연결 리스트를 맨 앞부터 차례로 스캔.    
- 키와 같은 값이 발견되면 검색에 `성공`    
- 원소의 맨 끝까지 스캔해서 발견되지 않으면 검색 `실패`   

In [33]:
def search(self, key:Any) -> Any:
    '''키가 key인 원소를 검색하여 값을 반환'''
    hash = self.hash_value(key)     # 검색하는 키의 해시값 
    p = self.table[hash]

    while p is not None:
        if p.key == key:
            return p.value          # 검색 성공
        p = p.next                  # 뒤쪽 노드를 주목

def add(self, key: Any, value: Any) -> bool:
    '''키가 key이고 값이 value인 원소를 추가 '''
    hash = self.hash_value(key)     # ㅜ가하는 key의 해시값 
    p = pself.table[hash]

    while p is not None:
        if p.key == key:
            return False
        p = p.next
    
    temp = Node(key, value, self.table[hash])
    self.table[hash] = temp         # 노드를 추가 
    return True


### 원소를 추가하는 add() 함수   
   
add()함수는 키가 key이고 값이 value인 원소를 추가합니다. 

#### 13추가하기    
먼저 13의 해시값은 0이고 table\[0\]은 None입니다. 13을 저장하는 노드를 새로 생성하고, 그 노드에 대한 참조를 table\[0\]에 대입합니다. 

#### 46 추가하기    
46추가하기    
46의 해시값은  7이고 