## 3장. 검색 알고리즘 - (3) 해시법

### [ 2. 오픈 주소법 -  해시 함수 구현 ] 

: `빈 버킷`을 찾을 때까지 해시를 반복


* **Status** : 버킷의 속성

* **Bucket** : 해시를 구성하는 버킷 구성

* **OpenHash**: 해시 클래스(오픈 주소법 이용)

In [1]:
from __future__ import annotations
from typing import Any, Type
from enum import Enum
import hashlib

In [2]:
# Status : 버킷의 속성

class Status(Enum):
    OCCUPIED = 0   # 데이터 저장  (숫자) 
    EMPTY = 1      # 비어 있음    (-)
    DELETED = 2    # 삭제 완료    (⭐️)

In [3]:
# Bucket : 해시를 구성하는 버킷 구성

class Bucket:
    
    def __init__(self, key:Any=None, value:Any=None, stat:Status=Status.EMPTY)-> None:
        # 초기화
        self.key = key        # key
        self.value = value    # value
        self.stat = stat      # 속성
        
    def set(self, key:Any, value:Any, stat:Status)-> None:
        # 모든 필드에 값을 설정
        self.key = key        # key
        self.value = value    # value
        self.stat = stat      # 속성   
        
    def set_status(self, stat: Status) -> None:
        # 속성을 설정
        self.stat = stat

In [None]:
# OpenHash: 해시 클래스(오픈 주소법 이용)

class OpenHash:
    
    def __init__(self, capacity:int)-> None:
        # 초기화
        self.capacity = capacity                  # 해시 테이블의 크기 지정
        self.table = [Bucket()] * self.capacity   # 해시 테이블
        
    def hash_value(self, key:Any)-> int:
        # 해시값을 구함
        if isinstance(key, int):
            return key % self.capacity  # key를 해시테이블의 크기로 나눠준 나머지
        return(int(hashlib.md5(str(key).encode()).hexdigest(),16) % self.capacity)

### [참고] 함수탐구

1. isinstance(key, int): key가 int형이면 True, 아님 False

2. encode = 코드화 = 암호화 / decode = 역 코드화 = 복호화

3. 크롤링을 하는 중에 파일 경로의 중복을 막기위한 방법 중 md5 해시를 이용할 수 있다.

> import hashlib                    
  hashlib.md5(STRING)

으로 md5로 변환을 한다.    변환 후 암호화를 위해서는 

> hexdigest()        

를 해준다.
