# 해시법

해시법은 검색, 추가, 삭제 모두 효율적으로 수행할 수 있는 검색 방법이다.

해시법은 '데이터를 저장할 위치(인덱스)'를 간단한 연산으로 구하는 것이다.<br/>

해시법을 사용하면 데이터의 삭제 또는 추가 시 남은 배열을 모두 옮길 필요가 없이, 해시 함수를 통해 나온 인덱스의 위치에 대입하면 되기 때문에 원소를 이동하는 연산을 줄일 수 있다는 장점이 있다. <br/>

예를 들어 ```a = [1, 2, 3, 4, 5, 6, 7, 8]```과 같은 배열이 있을 때 원소의 개수인 8로 원소의 값을 나눈 나머지를 계산하면 ```1, 2, 3, 4, 5, 6, 7, 0```의 결과를 얻을 수 있다. 이때 이 나머지 값들이 각 요소의 인덱스가 되고, 이 결과(해시 테이블에서 만들어진 원소)를 버킷이라고 한다.

### 해시 충돌

해시 함수의 키와 해시값은 보통 n:1이다. 따라서 같은 버킷값이 나올 수 있고, 이것을 해시 충돌이라고 한다.<br/>


해시 충돌을 해결할 수 있는 방법 두 가지
1. 체인법 : 해시값이 같은 원소를 연결 리스트로 관리한다.
2. 오픈 주소법 : 빈 버킷을 찾을 때까지 해시를 반복한다.

### 체인법

체인법은 아래 그림과 같이 각 버킷에 해당하는 해시값을 갖는 요소들을 연결리스트로 연결하여 저장한다.

(책에 적힌 표현 : 각 버킷은 '해시값이 같은 노드를 연결한 리스트'의 앞쪽 노드를 참조한다.)<br/>
버킷에 연결된 연결리스트가 없거나 연결리스트의 마지막 요소라면 다음 포인터는 None이 된다.

![체인법](https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcSH5X8rSb3RM2Dg3eK41nydYNMCQo2MiaQusA&usqp=CAU)

In [31]:
# 체인법으로 해시 함수 구현하기

from __future__ import annotations
from typing import Any, Type
import hashlib

class Node:
    def __init__(self, key: Any, value: Any, next: Node)-> None:
        self.key = key
        self.value = value
        self.next = next

In [32]:
class ChainedHash:
    def __init__(self, capacity: int) -> None:
        self.capacity = capacity
        self.table = [None] * self.capacity
    
    def hash_value(self, key: Any)-> int:
        if isinstance(key, int):
            return key % self.capacity
        return (int(hashlib.sha256(str(key)).encode()).hexdigest(), 16) % self.capacity

### 해시 함수 구현 방법 두 가지
**1. key가 int형인 경우<br/>**
key가 int 형이라면 각 요소를 capacity로 나누어 나머지에 해당하는 버킷에 연결하면 된다. 예를 들어 key가 int형이고 키를 13으로 나눈 나머지가 해시값이 된다.
<br/>
<br/>
<br/>
**2. key가 int형이 아닌 경우<br/>**
문자열, 리스트, 클래스형의 경우 key를 capacity로 나눌 수 없다. 따라서 다음과 같은 파이썬의 표준 라이브러리를 사용해야 한다.

- sha256 알고리즘 : 주어진 바이트 문자열의 해시값을 구하는 해시 알고리즘의 생성자이다.

- encode() 함수 : hashlib.sha256에는 바이트 문자열의 인수를 전달해야 한다. 따라서 key를 str형 문자열로 변환한 뒤 그 문자열을 encode() 함수에 전달하여 바이트 문자열을 생성한다.

- hexdigest() 함수 : sha256 알고리즘에서 해시값을 16진수 문자열로 꺼낸다.

- int() 함수 : hexdigest() 함수로 꺼낸 문자열을 16진수 문자열로 하는 int형으로 변환한다.

### search(), add() , remove(), dump() 함수의 구현

**[search() 함수]**
1. 해시 함수를 사용하여 키를 해시값으로 변환한다.
2. 키에 해당하는 인덱스로 하는 버킷에 주목한다.
3. 주목한 버킷에 연결되어있는 연결리스트를 스캔한다. 만약 None을 참조하는 요소까지 갔는데도 없다면 검색 실패이다.

**C와 다른 점**
노드를 연결할 때 그냥 대입하면 된다.<br/>
Node.next에 이미 만들어진 연결리스트를 대입하고, table[hash]에 새로 연결할 노드를 대입하면 새로 저장한 노드를 연결리스트의 맨 앞에 추가할 수 있다.

In [33]:
# 위의 코드에 연결

class ChainedHash:
    def __init__(self, capacity: int) -> None:
        self.capacity = capacity
        self.table = [None] * self.capacity
    
    def hash_value(self, key: Any)-> int:
        if isinstance(key, int):
            return key % self.capacity
        return (int(hashlib.sha256(str(key)).encode()).hexdigest(), 16) % self.capacity
    
    def search(self, key: Any)->int:
        hash = self.hash_value(key)
        curNode = self.table[hash]
        while curNode is not None:
            if curNode.key == key:
                return curNode.value
            curNode = curNode.next
        
        return None
    
    def add(self, key: Any, value: Any)->bool:
        hash = self.hash_value(key)
        curNode = self.table[hash]
        
        while curNode is not None:
            if curNode.key == key:
                return False
            curNode = curNode.next
        
        tmp = Node(key, value, self.table[hash])
        self.table[hash] = tmp
        return True  
    
    def remove(self, key: Any, value: Any)->bool:
        hash = self.hash_value(key)
        curNode = self.table[hash]
        pp = None # 바로 앞 노드
        
        

**[dump() 함수]**
dump() 함수는 해시 테이블의 내용을 모두 출력하는 것이다.

In [34]:
# 위의 코드에 연결

class ChainedHash:
    def __init__(self, capacity: int) -> None:
        self.capacity = capacity
        self.table = [None] * self.capacity
    
    def hash_value(self, key: Any)-> int:
        if isinstance(key, int):
            return key % self.capacity
        return (int(hashlib.sha256(str(key)).encode()).hexdigest(), 16) % self.capacity
    
    def search(self, key: Any)->int:
        hash = self.hash_value(key)
        curNode = self.table[hash]
        while curNode is not None:
            if curNode.key == key:
                return curNode.value
            curNode = curNode.next
        
        return None
    
    def add(self, key: Any, value: Any)->bool:
        hash = self.hash_value(key)
        curNode = self.table[hash]
        
        while curNode is not None:
            if curNode.key == key:
                return False
            curNode = curNode.next
        
        tmp = Node(key, value, self.table[hash])
        self.table[hash] = tmp
        return True  
    
    def remove(self, key: Any, value: Any)->bool:
        hash = self.hash_value(key)
        curNode = self.table[hash]
        pp = None # 바로 앞 노드
        
    
    def dump(self)->None:
        for i in range(self.capacity):
            curNode = self.table[i]
            while curNode is not None:
                print(curNode.value)
                curNode = curNode.nesxt
            print()
        

In [37]:
from enum import Enum

Menu = Enum('Menu', ['추가', '삭제', '검색', '덤프', '종료'])

def select_menu()-> Menu:
    s = [f'({m.value}){m.name}' for m in Menu]
    while True:
        print(*s, sep = '   ', end='')
        n = int(input(': '))
        if 1 <= n <= len(Menu):
            return Menu(n)
        
hash = ChainedHash(13)        

while True:
    menu = select_menu()
    
    if menu == Menu.추가:
        key = int(input('추가할 키를 입력하세요: '))
        val = input('추가할 값을 입력하세요: ')
        if not hash.add(key, val):
            print('추가를 실패했습니다.')
    
    elif menu == Menu.검색:
        key = int(input('검색할 키를 입력하세요: '))
        t = hash.search(key)
        if t is not None:
            print(f'검색한 키를 갖는 값은 {t}입니다.')
        else:
            print('검색할 데이터가 없습니다.')
    
    elif menu == Menu.덤포:
        hash.dump()
    
    else:
        break

(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 1
추가할 키를 입력하세요: 0
추가할 값을 입력하세요: hello
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 0
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 1
추가할 키를 입력하세요: 0
추가할 값을 입력하세요: world
추가를 실패했습니다.
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 1
추가할 키를 입력하세요: 1
추가할 값을 입력하세요: helw
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 1
추가할 키를 입력하세요: 0
추가할 값을 입력하세요: 123
추가를 실패했습니다.
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료: 3
검색할 키를 입력하세요: 0


NameError: name 'none' is not defined