<a href="https://colab.research.google.com/github/channmilee/Algorithm/blob/master/3_4_%ED%95%B4%EC%8B%9C%EB%B2%95.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## 정렬된 배열에서 원소 추가하기

In [None]:
x = [0,1,2,3,4,6,7]
x

[0, 1, 2, 3, 4, 6, 7]

* 5 추가하기
  * x[4]와 x[5]사이에 추가되도록 이진 검색법으로 검사
  * x[5] 이후의 모든 원소는 한 칸씩 뒤로 이동
  * x[5]에 5 대입

In [None]:
x = [0,1,2,3,4,5,6,7]
x

[0, 1, 2, 3, 4, 5, 6, 7]

## 해시법

* `데이터를 저장할 위치 = 인덱스`를 간단한 연산으로 구하는 방법
* 원소 검색, 추가, 삭제도 효율적으로 가능  
* [해시법 정리](https://ddrt44al.tistory.com/45)

## 해시 충돌

* 저장할 버킷이 중복되는 현상
  * 대처 방법  

    1.   **체인법** : 해시값이 같은 원소를 연결 리스트로 관리
    2.   **오픈 주소법** :  빈 버킷을 찾을 떄까지 해시를 반복

## 체인법

### 실습 3-5[A]

* 체인법으로 해시 함수 구현하기

-- **Node 클래스 만들기**
  * **key** : 키(임의의 자료형)
  * **value** : 값(임의의 자료형)
  * **next** : 뒤쪽 노드 참조(Node형)
  * Node 클래스는 키와 값이 짝을 이루는 구조. 키에 해시 함수를 적용하여 해시값을 구함


In [1]:
from __future__ import annotations
from typing import Any, Type
import hashlib

class Node:
  """해시를 구성하는 노드"""

  def __init__(self, key:Any, value:Any, next:Node) -> None:
    """초기화"""
    self.key = key      # 키
    self.value = value  # 값
    self.next = next    # 뒤쪽 노드를 참조

### 실습 3-5.[B]

**-- ChaindeHash 클래스 만들기**
  * **capacity** : 해시 테이블의 크기(배열 table의 원소 수를 나타냄)
  * **table** : 해시 테이블을 저장하는 list형 배열을 나타냄

**-- `__init__()` 함수로 초기화하기**
  * `__init__()` 함수는 빈 해시 테이블을 생성함
  * 매개변수 capacity에 전달받는 것은 해시 테이블의 크기
  * 원소 수가 capacity인 list형의 배열 table을 생성하고 모든 원소를 None으로 함

**-- `hash_value()` 해시 함수 만들기**
  * `hash_value()` 해시 함수는 인수 key에 대응하는 해시 값을 구함
    * **key가 int형인 경우** : key를 해시의 크기 capacity로 나눈 나머지를 해시값으로 함
    * **key가 int형이 아닌 경우** : key가 정수가 아닌 경우 (문자열, 리스트, 클래스형 등) 그 값을 바로 나눌 수 없음. 표준 라이브러리를 이용해 형 변환이 필요함
      * sha256 알고리즘
      * encode() 함수
      * hexdigest() 함수
      * int() 함수



In [2]:
class ChainedHash:
  """체인법으로 해시 클래스 구현"""

  def __init__(self, capacity: int) -> None:
    """초기화"""
    self.capacity = capacity             # 해시 테이블의 크기 지정
    self.table = [None] * self.capacity  # 해시 테이블(리스트) 선언

  def hash_value(self, key: Any) -> int:
    """해시값을 구함"""
    if isinstance(key, int):
      return key % self.capacity
    return(int(hashlib.sha256(str(key).encode()).hexdigest(), 16) % self.capacity)

### 실습 3-5.[C]

**-- 키로 원소를 검색하는 `search() 함수`**
  * hash_value() 함수를 사용하여 키를 해시값으로 변환
  * 해시값을 인덱스로 하는 버킷에 주목
  * 버킷이 참조하는 연결 리스트를 맨 앞부터 차례로 스캔.  
  키와 같은 값이 발견되면 검색에 성공, 원소의 맨 끝까지 스캔해서 발견되지 않으면 검색 실패

In [3]:
def search(self, key: Any) -> Any:
  """키가 key인 원소를 검색하여 값을 반환"""
  hash = self.hash_value(key)     # 검색하는 키의 해시값
  p = self.table[hash]           # 노드 주목

  while p is not None:
    if p.key == key:
      return p.value             # 검색 성공
    p = p.next                   # 뒤쪽 노드 주목
  return None                    # 검색 실패

**-- 원소를 추가하는 `add() 함수`**
  * 해시 함수를 사용하여 키를 해시값으로 변환
  * 해시값을 인덱스로 하는 버킷에 주목
  * 버킷이 참조하는 연결 리스트를 맨 앞부터 차례로 선형 검색  
  키와 같은 값이 발견되면 키가 이미 등록된 경우이므로 추가에 실패  
  원소의 맨 끝까지 발견되지 않으면 해시값인 리스트의 맨 앞에 노드 추가

In [4]:
def add(self, key: Any, value: Any) -> bool:
  """키가 key이고 값이 value인 원소를 추가"""
  hash = self.hash_vale(key)     # 검색하는 키의 해시값
  p = self.table[hash]           # 노드 주목
  
  while p is not None:
    if p.key == key:
      return False               # 추가 실패
    p = p.next                   # 뒤쪽 노드 주목

  temp = Node(key, value, self.table[hash])
  self.table[hash] = temp        # 노드 추가
  return True                    # 추가 성공

### 실습 3-5.[D]

**-- 원소를 삭제하는 `remove() 함수`**
  * 해시 함수를 사용하여 키를 해시값으로 변환
  * 해시값을 인덱스로 하는 버킷에 주목
  * 버킷이 참조하는 연결 리스트를 맨 앞부터 차례로 선형 검색  
  키와 같은 값이 발견되면 그 노드를 리스트에서 삭제  
  그렇지 않으면 삭제에 실패  


    <69를 삭제하려면>
    * 69의 해시값 4로 변환
    * table[4]에 주목. 이 노드의 뒤쪽 노드는 17을 저장하고 있음 [69]->[17]
    * 17을 저장한 노드에 대한 참조를 table[4] 버킷에 대입하면 69 노드가 삭제됨


In [5]:
def remove(self, key: Any) -> bool:
  """키가 key인 원소 삭제"""
  hash = self.hash_value(key)     # 삭제할 key의 해시값
  p = self.table[hash]            # 노드 주목
  pp = None                       # 바로 앞의 노드 주목

  while p is not None:
    if p.key == key:             # 키를 발견하면 아래 실행
      if pp is None:
        self.table[hash] = p.next
      else:
        pp.next = p.next
      return True                # key 삭제 성공
    pp = p
    p = p.next                   # 뒤쪽 노드 주목
  return False                   # 삭제 실패(key가 존재하지 않음)

-- 원소를 출력하는 `dump() 함수`
  * 해시 테이블의 내용을 한꺼번에 출력
  * 해시 테이블의 모든 원소인 table[0] ~ table[capacity - 1]까지 뒤쪽 노드를 찾아가면서 각 노드의 키와 값을 출력하는 작업 반복
  * 해시값이 같은 버킷을 화살표(→)로 연결하여 연결 리스트에 의해 체인 모양으로 묶인 모습 확인

In [6]:
def dump(self) -> None:
  """해시 테이블을 덤프"""
  for i in range(self.capacity):
    p = self.table[i]
    print(i, end = '')
    while p is not None:
      print(f'  → {p.key} ({p.value})', end = '')
      p = p.next
    print()

### 실습 3-6.

* 체인법을 구현하는 해시 클래스 ChainedHash의 사용

In [9]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [10]:
cd '/content/drive/MyDrive/Colab Notebooks/study/자료구조 알고리즘/[예제소스]/chap03'

/content/drive/MyDrive/Colab Notebooks/study/자료구조 알고리즘/[예제소스]/chap03


In [12]:
from enum import Enum
from chained_hash import ChainedHash

Menu = Enum('Menu', ['추가','삭제','검색','덤프','종료'])   # 메뉴 선언

def select_menu() -> Menu:
  """메뉴 선택"""
  s = [f'({m.value}){m.name}' for m in Menu]
  while True:
    print(*s, sep = '   ', end = '')
    n = int(input(':  '))
    if 1 <= n <= len(Menu):
      return Menu(n)

# 크기가 13인 해시 테이블 생성
hash = ChainedHash(13)

while True:
  menu = select_menu()      # 메뉴 선택

  if menu == Menu.추가 :    # 추가
    key = int(input('추가할 키를 입력하세요 : '))
    val = input('추가할 값을 입력하세요 : ')
    if not hash.add(key, val):
      print('추가를 실패했습니다!!')
  
  elif menu == Menu.삭제:   # 삭제
    key = int(input('삭제할 키를 입력하세요 : '))
    if not hash.remove(key):
      print('삭제를 실패했습니다.')
  
  elif menu == Menu.검색:   # 검색
    key = int(input('검색할 키를 입력하세요 : '))
    t = hash.search(key)
    if t is not None:
      print(f'검색한 키를 갖는 값은 {t} 입니다.')
    else:
      print('검색할 데이터가 없습니다.')
  
  elif menu == Menu.덤프:   # 덤프
    hash.dump()
  
  else:
    break                   # 종료

(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료:  1
추가할 키를 입력하세요 : 1
추가할 값을 입력하세요 : 수연
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료:  1
추가할 키를 입력하세요 : 5
추가할 값을 입력하세요 : 동혁
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료:  1
추가할 키를 입력하세요 : 10
추가할 값을 입력하세요 : 예지
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료:  1
추가할 키를 입력하세요 : 12
추가할 값을 입력하세요 : 원준
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료:  1
추가할 키를 입력하세요 : 14
추가할 값을 입력하세요 : 민서
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료:  3
검색할 키를 입력하세요 : 5
검색한 키를 갖는 값은 동혁 입니다.
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료:  4
0
1  → 14 (민서)  → 1 (수연)
2
3
4
5  → 5 (동혁)
6
7
8
9
10  → 10 (예지)
11
12  → 12 (원준)
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료:  2
삭제할 키를 입력하세요 : 14
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료:  4
0
1  → 1 (수연)
2
3
4
5  → 5 (동혁)
6
7
8
9
10  → 10 (예지)
11
12  → 12 (원준)
(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료:  5


#### 실습 3-6 자세히 살펴보기

In [34]:
Menu = Enum('Menu', ['추가','삭제','검색','덤프','종료'])   # 메뉴 선언

def select_menu() -> Menu:
  """메뉴 선택"""
  s = [f'({m.value}){m.name}' for m in Menu]
  while True:
    print(*s, sep = '   ', end = '')
    n = int(input(':  '))
    if 1 <= n <= len(Menu):
      return Menu(n)

In [33]:
s = [f'({m.value}){m.name}' for m in Menu]
s

['(1)추가', '(2)삭제', '(3)검색', '(4)덤프', '(5)종료']

In [35]:
print(*s, sep = '   ', end = '')

(1)추가   (2)삭제   (3)검색   (4)덤프   (5)종료

In [36]:
print(s, sep = '   ', end = '')

['(1)추가', '(2)삭제', '(3)검색', '(4)덤프', '(5)종료']

In [38]:
n = int(input(':  '))
if 1 <= n <= len(Menu):
  print(Menu(n))

:  1
Menu.추가


##### Enum() 함수

In [28]:
from enum import Enum

class Fruit(Enum):
  Apple = 1
  Banana = 2
  Cherry = 3

print(type(Fruit.Apple))
print(Fruit.Apple)
print(Fruit.Apple.name)
print(Fruit.Apple.value)

<enum 'Fruit'>
Fruit.Apple
Apple
1


In [27]:
for f in Fruit:
  print(f'({f.value}) {f.name}')

(1) Apple
(2) Banana
(3) Cherry


In [14]:
for m in Menu:
  print(f'({m.value}){m.name}')

(1)추가
(2)삭제
(3)검색
(4)덤프
(5)종료


In [29]:
from enum import Enum, auto

class Fruit(Enum):
  Apple = auto()
  Banana = auto()
  Cherry = auto()

  print(list(Fruit))

[<Fruit.Apple: 1>, <Fruit.Banana: 2>, <Fruit.Cherry: 3>]


## 오픈 주소법

### 실습 3-7.

* 오픈 주소법으로 해시 함수 구현하기

In [41]:
from __future__ import annotations
from typing import Any, Type
from enum import Enum
import hashlib

# 버킷 속성
class Status(Enum):
  OCCUPIED = 0      # 데이터 저장
  EMPTY = 1         # 비어 있음
  DELETED = 2       # 삭제 완료

class Bucket:
  """해시를 구성하는 버킷"""

  def __init__(self, key: Any = None, value: Any = None, stat: Status = Status.EMPTY) -> None:
    """초기화"""
    self.key = key       # 키
    self.value = value   # 값
    self.stat = stat     # 속성

  def set(self, key: Any, value: Any, stat: Status) -> None:
    """모든 필드에 값을 설정"""
    self.key = key       # 키
    self.value = value   # 값
    self.stat = stat     # 속성
  
  def set_status(self, stat: Status) -> None:
    """속성을 설정"""
    self.stat = stat

class OpenHash:
  """오픈 주소법으로 구현하는 해시 클래스"""

  def __init__(self, capacity: int) -> None:
    """초기화"""
    self.capacity = capacity                  # 해시 테이블의 크기 지정
    self.table = [Bucket()] * self.capacity   # 해시 테이블

  def hash_value(self, key: Any) -> int:
    """해시값을 구함"""
    if isinstance(key, int):
      return key % self.capacity
    return(int(hashlib.md5(str(key).encode()).hexdigest(), 16) % self.capacity)

  def rehash_value(self, key: Any) -> int:
    """재해시값을 구함"""
    return(self.hash_value(key) + 1) % self.capacity

  def serach_node(self, key: Any) -> Any:
    """키가 key인 버킷을 검색"""
    hash = self.hash_value(key)    # 검색하는 키의 해시값
    p = self.table[hash]           # 버킷을 주목

    for i in range(self.capacity):
      if p.stat == Status.EMPTY:
        break
      elif p.stat == Status.OCCUPIED and p.key == key:
        return p
      hash = self.rehash_value(hash)  # 재해시
      p = self.table[hash]
    return None
  
  def search(self, key: Any) -> Any:
    """키가 key인 원소를 검색하여 값을 반환"""
    p = self.search_node(key)
    if p is not None:
      return p.value                 # 검색 성공
    else:
      return None                    # 검색 실패

  def add(self, key: Any, value: Any) -> bool:
    """키가 key이고 값이 value인 원소 추가"""
    if self.search(key) is not None:
      return False                   # 이미 등록된 키
    
    hash = self.hash_value(key)
    p = self.table[hash]
    for i in range(self.capacity):
      if p.stat == Status.Empty or p.stat == Status.DELETED:
        self.table[hash] = Bucket(key, value, Status.OCCUPIED)
        return True
      hash = self.rehash_value(hash) # 재해시
      p = self.table[hash]
    return False                     # 해시 테이블이 가득 참

  def remove(self, key: Any) -> int:
    """키가 key인 원소를 삭제"""
    p = self.search_node(key)        # 버킷 주목
    if p is None:
      return False                   # 이 키는 등록되어 있지 안흠
    p.set_status(Status.DELETED)
    return True

  def dump(self) -> None:
    """해시 테이블 텀프"""
    for i in range(self.capacity):
      print(f'{i:2}', end = '')
      if self.table[i].stat == Status.OCCUPIED:
        print(f'{self.table[i].key} ({self.table[i].value})')
      elif self.table[i].stat == Status.EMPTY:
        print('--미등록--')
      elif self.table[i].stat == Status.DELETED:
        print('--삭제완료--')

### 실습 3-8.

* 오픈 주소법을 구현하는 해시 클래스 Openhash 사용

In [48]:
from enum import Enum
from open_hash import OpenHash

Menu = Enum('Menu', ['추가', '삭제', '검색', '덤프', '종료'])   # 메뉴 선언

def select_menu() -> Menu:
  """메뉴 선택"""
  s = [f'({m.value}){m.name}' for m in Menu]
  while True:
    print(*s, sep = ' ', end = '')
    n = int(input(':  '))
    if 1 <= n <= len(Menu):
      return Menu(n)

# 크기가 13인 해시 테이블 생성
hash = OpenHash(13)

while True:
  menu = select_menu()      # 메뉴 선택

  if menu == Menu.추가 :    # 추가
    key = int(input('추가할 키를 입력하세요 : '))
    val = input('추가할 값을 입력하세요 : ')
    if not hash.add(key, val):
      print('추가를 실패했습니다!!')
  
  elif menu == Menu.삭제:   # 삭제
    key = int(input('삭제할 키를 입력하세요 : '))
    if not hash.remove(key):
      print('삭제를 실패했습니다.')
  
  elif menu == Menu.검색:   # 검색
    key = int(input('검색할 키를 입력하세요 : '))
    t = hash.search(key)
    if t is not None:
      print(f'검색한 키를 갖는 값은 {t} 입니다.')
    else:
      print('검색할 데이터가 없습니다.')
  
  elif menu == Menu.덤프:   # 덤프
    hash.dump()
  
  else:
    break                   # 종료

(1)추가 (2)삭제 (3)검색 (4)덤프 (5)종료:  1
추가할 키를 입력하세요 : 1
추가할 값을 입력하세요 : 수연
(1)추가 (2)삭제 (3)검색 (4)덤프 (5)종료:  1
추가할 키를 입력하세요 : 5
추가할 값을 입력하세요 : 동혁
(1)추가 (2)삭제 (3)검색 (4)덤프 (5)종료:  1
추가할 키를 입력하세요 : 10
추가할 값을 입력하세요 : 예지
(1)추가 (2)삭제 (3)검색 (4)덤프 (5)종료:  1
추가할 키를 입력하세요 : 12
추가할 값을 입력하세요 : 원준
(1)추가 (2)삭제 (3)검색 (4)덤프 (5)종료:  1
추가할 키를 입력하세요 : 14
추가할 값을 입력하세요 : 민서
(1)추가 (2)삭제 (3)검색 (4)덤프 (5)종료:  3
검색할 키를 입력하세요 : 5
검색한 키를 갖는 값은 동혁 입니다.
(1)추가 (2)삭제 (3)검색 (4)덤프 (5)종료:  4
 0 -- 미등록 --
 1 1 (수연)
 2 14 (민서)
 3 -- 미등록 --
 4 -- 미등록 --
 5 5 (동혁)
 6 -- 미등록 --
 7 -- 미등록 --
 8 -- 미등록 --
 9 -- 미등록 --
10 10 (예지)
11 -- 미등록 --
12 12 (원준)
(1)추가 (2)삭제 (3)검색 (4)덤프 (5)종료:  2
삭제할 키를 입력하세요 : 14
(1)추가 (2)삭제 (3)검색 (4)덤프 (5)종료:  4
 0 -- 미등록 --
 1 1 (수연)
 2 -- 삭제 완료 --
 3 -- 미등록 --
 4 -- 미등록 --
 5 5 (동혁)
 6 -- 미등록 --
 7 -- 미등록 --
 8 -- 미등록 --
 9 -- 미등록 --
10 10 (예지)
11 -- 미등록 --
12 12 (원준)
(1)추가 (2)삭제 (3)검색 (4)덤프 (5)종료:  5
