# 해시법
- 데이터를 저장할 위치 = 인덱스를 간단한 연산으로 구하는것 
- 원소의 검색 뿐 만이 아니라 추가, 삭제도 효율적으로 작업이 가능 
- 특정한 규칙을 이용하여 인덱스의 값을 설정하는 것을 해시값
    - 예시) 길이가 13인 배열을 생성하는 경우 키 값과 13을 나눈 나머지의 값을 해시값으로 지정하고 인덱스를 해시값으로 지정
- 같은 인덱스에 데이터를 대입(추가)를 하는 경우에 충돌이 발생 이러한 상황을 해시충돌
- 해치 충돌을 대체하는 방법 
    - 체인법 
        - 해시값이 같은 원소를 연결 리스트로 관리 
    - 오픈 주소법
        - 빈 버킷을 찾을때까지 해시를 반복
        - 빈 버킷이 존재하지 않으면 데이터를 대입하지 않는다. 

In [None]:
# 연결 리스트를 생성하는 Class를 선언
from typing import Any
import hashlib

In [None]:
class Node:
    # 생성자 함수 : 초기화 함수라고도 부르고 class가 생성될때 단한번만 실행이 되는 함수 
    def __init__(self, key : Any, value : Any, next : "Node") -> None:
        # 데이터의 키값
        self.key = key
        # 데이터의 벨류값
        self.value = value
        # 데이터의 뒤쪽 노드 
        self.next = next

In [None]:
# 체인 생성 샘플 확인
n3 = Node('A', 100, next = None)
n2 = Node('B', 200, next = n3)
n1 = Node('C', 300, next = n2)
# n1 class 뒤에는 n2 class가 그 뒤에는 n3 class가 존재한다. 
n0 = Node('D', 400, next = None)
# n0 class 뒤에는 아무런 데이터가 존재하지 않는다. 
p = n1
print('n1 class의 연결 리스트는')
while p:
    print(f"{p.key} : {p.value}")
    p = p.next
print()
p0 = n0
print('n0 class의 연결 리스트는')
while p0:
    print(f'{p0.key} : {p0.value}')
    p0 = p0.next

In [None]:
# 체인 해시 클래스를 선언
class ChainHash:

    # 생성자 함수 
    def __init__(self, capacity : int) -> None:
        # 해시 테이블의 크기를 지정 
        self.capacity = capacity
        # 해시 테이블의 크기만큼의 길이가 고정된 리스트 데이터를 생성 
        self.table = [None] * self.capacity

    # 해시값을 생성하는 함수
    def hash_value(self, key : Any) -> int:
        # key 값으로 들어오는 데이터가 숫자의 형태라면
        if isinstance(key, int):
        # if type(key) == 'int'
            return key % self.capacity
        # key가 숫자가 아니라면
        return(
            int(
                hashlib.sha256(str(key).encode()).hexdigest()  # sha256은 문자 데이터를 16진수 형태의 데이터로 변환
                , 16    # 16진수 데이터를 10진수 데이터로 변환
            ) % self.capacity
        )
    # table에서 데이터를 검색하는 함수
    def search(self, key : Any) -> Any:
        # key 값을 hash 데이터로 변경 
        hash = self.hash_value(key)
        # 체인으로 연결되어있는 Node
        p = self.table[hash]

        while p:
            if p.key == key:
                # 검색을 성공했을때 해당하는 Node의 value를 출력력
                return p.value
            # 검색이 실패하는 경우에는 다음 Node로 이동
            p = p.next
        # 해당 인덱스에서 key가 존재하지 않는다면 
        return None
    
    # 데이터를 추가하는 함수 
    def add(self, key : Any, value : Any) -> bool:
        # key값을 hash로 변경 
        hash = self.hash_value(key)
        p = self.table[hash]

        while p is not None:
            if p.key == key:
                # 해당하는 키값에 데이터가 존재한다면 추가가 안되는 형태로 구현 
                return False
            p = p.next
        
        # 위의 반복문이 종료할때까지 False 데이터를 되돌려주지 않는다면 Node를 생성
        temp = Node(key, value, self.table[hash])
        # Node를 table의 특정 인덱스에 대입 
        self.table[hash] = temp
        return True

    # 데이터를 삭제하는 함수 
    def remove(self, key : Any) -> bool:
        hash = self.hash_value(key)
        # 주목하고 있는 노드 
        p = self.table[hash]
        # 주목 노드의 바로 앞의 노드  
        pp = None

        while p is not None:
            if p.key == key:
                if pp is None:
                    self.table[hash] = p.next
                else:
                    pp.next = p.next
                return True
            pp = p
            p = p.next
        return False
    # 전체 데이터를 확인하는 함수
    def dump(self) -> None:
        for i in range(self.capacity):
            p = self.table[i]
            print(i, end = ' ')
            while p is not None:
                # 해시 테이블에 존재하는 노드의 key와 value를 출력
                print(f" -> {p.key} : {p.value}", end= '')
                p = p.next
            print()


In [None]:
# 특정 길이의 해시 테이블을 생성 -> Class 생성
hash = ChainHash(13)

In [None]:
# 데이터를 확인 
hash.dump()

In [None]:
# 데이터를 추가 (hash는 key값에 13으로 나눈 나머지 값 -> 1이라는 인덱스에 데이터가 대입 )
hash.add(1, 'A')

In [None]:
hash.dump()

In [None]:
# 해시값이 1이 되는 key값을 사용
hash.add(14, 'D')

In [None]:
hash.dump()

In [None]:
# 데이터를 검색 
hash.search(1)

In [None]:
# 데이터를 제거 
hash.remove(1)

In [None]:
hash.dump()

In [None]:
hash2 = ChainHash(10)

In [None]:
from random import randint

In [None]:
for i in range(50):
    hash2.add(i, randint(1, 500))

In [None]:
hash2.dump()

In [None]:
# key 값이 문제형 데이터인 경우 
hash2.add('a', 'test_data')

In [None]:
hash2.dump()

In [None]:
hash2.search('b')

### 오픈 주소법

In [None]:
from enum import Enum
# 의미가 있는 상수 집합을 정의할 때 사용
Menu = Enum('Menu', ['추가', '삭제', '검색', '덤프'])

In [None]:
Menu(1) == Menu.삭제

In [None]:
# 상속? -> 부모 클래스에 있는 기능(함수, 변수)을 자식 클래스에서 사용하도록 하는 기능
# 상태를 나타내는 클래스
class Status(Enum):
    OCCUPIED = 0
    EMPTY = 1
    DELETED = 2

class Bucket:

    def __init__(self, key : Any = None, value : Any = None, stat : "Status" = Status.EMPTY):
        self.key = key
        self.value = value
        self.stat = stat
    
    # 필드에 데이터를 대입
    def set(self, key : Any, value : Any, stat : "Status"):
        self.key = key
        self.value = value
        self.stat = stat

    # 버킷의 상태를 변경하는 함수 
    def set_status(self, stat : "Status"):
        self.stat = stat
# 오픈 주소법 class 선언
class OpenHash : 
    def __init__(self, capacity : int) -> None:
        self.capacity = capacity
        # Bucket의 생성자 함수는 key, value는 None stat는 Status.EMPTY로 지정하여 크기만큼 배열을 생성
        self.table = [Bucket()] * self.capacity

    def hash_value(self, key : Any) -> int:
        if isinstance(key, int):
            return key % self.capacity
        return(
            int(
                hashlib.sha256( str(key).encode() ).hexdigest(), 16
            ) % self.capacity
        )
    # 재해시값을 생성하는 함수 : hash 데이터에 + 1
    def refresh_hash(self, key : Any) -> int:
        return( self.hash_value(key) + 1 )

    def search_node(self, key : Any) -> Any:
        hash = self.hash_value(key)
        p = self.table[hash]
        
        for i in range(self.capacity):
            if p.stat == Status.EMPTY:
                break
            elif p.stat == Status.OCCUPIED and p.key == key:
                return p
            # 해시를 재지정
            hash = self.refresh_hash(hash) # hash에 + 1을 한다. 
            p = self.table[hash]
        return None
    
    def search(self, key : Any) -> Any:
        p = self.search_node(key)
        if p is not None:
            # 검색이 성공했을때
            return p.value
        else:
            return None
    
    # 데이터를 추가하는 함수
    def add(self, key : Any, value : Any) -> bool:
        # key가 등록되어있는가? 확인
        if self.search(key) is not None:
            # 해당하는 key가 존재한다 -> 데이터를 대입하지 않는다.
            return False

        hash = self.hash_value(key)
        p = self.table[hash]
        for i in range(self.capacity):
            if p.stat == Status.EMPTY or p.stat == Status.DELETED:
                # 버킷의 상태가 비어있거나 삭제가 된 경우
                # 데이터를 대입 (Bucket의 형태로)
                self.table[hash] = Bucket(key, value, Status.OCCUPIED)
                return True
            hash = self.refresh_hash(hash)
            p = self.table[hash]
        return False
    # 데이터를 제거하는 함수 
    def remove(self, key : Any) -> bool:
        # key 값의 데이터를 검색
        p = self.search_node(key)
        if p is None:
            # 해당하는 key가 존재하지 않는다면
            return False
        # 해당 버킷의 상태만 삭제로 변경
        # search_node 함수에서 데이터의 상태가 존재한다고 이고 key값이 동일해야만 존재이기 때문에
        # 상태만 변경해도 데이터 조회는 불가능
        p.set_status(Status.DELETED)
    
    # 전체 데이터를 확인하는 함수 
    def dump(self) -> None:
        for i in range(self.capacity):
            print(f"{i : 2}", end=' ')
            if self.table[i].stat == Status.OCCUPIED:
                print(f"{self.table[i].key} : {self.table[i].value}")
            elif self.table[i].stat == Status.EMPTY:
                print(" --비어있음--")
            elif self.table[i].stat == Status.DELETED:
                print(" --삭제 완료--")




In [None]:
hash = OpenHash(13)

In [None]:
hash.dump()

In [None]:
hash.add(3, 'C')

In [None]:
hash.dump()

In [None]:
# hash가 3인 key값을 다시 대입 
# 인덱스 3에 데이터가 존재하기 때문에 재해시를 하여 4번 인덱스에 데이터가 대입 
hash.add(16, 'e')

In [None]:
hash.dump()

In [None]:
hash.add(10, 'ASD')

In [None]:
hash.dump()

In [None]:
# key값이 10인 데이터를 제거 
hash.remove(10)
# Bucket의 10인덱스의 key와 value는 그대로 유지 stat만 Status.DELETED로 변경

In [None]:
hash.dump()

In [58]:
hash.add(23, 'QWE')
# Bucket의 key는 23으로 value는 'QWE"로 변경 stat는 Status.OCCUPIED

True

In [59]:
hash.dump()

 0  --비어있음--
 1  --비어있음--
 2  --비어있음--
 3 3 : C
 4 16 : e
 5  --비어있음--
 6  --비어있음--
 7  --비어있음--
 8  --비어있음--
 9  --비어있음--
 10 23 : QWE
 11  --비어있음--
 12  --비어있음--
