<a href="https://colab.research.google.com/github/RyuMyunggi/data-structure/blob/main/hash_table.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
from google.colab import drive
drive.mount('/content/drive')

## Hasgh Table: 해시테이블
* 키를 값에 연결하여 하나의 키가 0 또는 1개의 값과 연관됨
* 각 키는 해시 함수를 계산할 수 있어야함
* 해시테이블은 해시 버킷 배열로 구성됨
* 두 개의 키가 동일한 버킷에 해시될 때, 문제가 발생. 이를 해시 충돌이라고 함
* 이를 해겨하는 방법은 각 버킷에 대해 키-값 쌍의 연결리스트를 저장하는 것
* 해시 테이블의 조회, 삽입, 삭제의 시간 복잡도는 O(1)
* 최악의 경우 각 키가 동일한 버킷으로 해시 된다면 각 작업의 시간 복잡도는 O(n)

In [5]:
## linked-list
class Node(object):
  def __init__(self, value=None, pointer=None):
    self.value = value
    self.pointer = pointer

  def getData(self):
    return self.value

  def getNext(self):
    return self.pointer

  def setData(self, new_data):
    self.value = new_data
  
  def setNext(self, new_pointer):
    self.pointer = new_pointer

class LinkedListFIFO(object):
  def __init__(self):
    self.head = None
    self.length = 0
    self.tail = None

  def _printList(self):
    node = self.head
    while node:
      print(node.value, end=' ')
      node = node.pointer
    print()

  def _addFirst(self, value):
    self.length = 1
    node = Node(value)
    self.head = node
    self.tail = node

  def _deleteFirst(self):
    self.length = 0
    self.head = None
    self.tail = None
    print('연결 리스트가 비었습니다')

  def _add(self, value):
    self.length += 1
    node = Node(value)
    if self.tail:
      self.tail.pointer = node
    self.tail = node

  def addNode(self, value):
    if not self.head:
      self._addFirst(value)
    else:
      self._add(value)

  def _find(self, index):
    prev = None
    node = self.head
    i = 0
    while node and i < index:
      prev = node
      node = node.pointer
      i += 1

    return node, prev, i

  def _find_by_value(self, value):
    prev = None
    node = self.head
    found = False
    while node and not found:
      if node.value == value:
        found = True
      else:
        prev = node
        node = node.pointer
      
    return node, prev, found

  def deleteNode(self, index):
    if not self.head or not self.head.pointer:
      self._deleteFirst()
    else:
      node, prev, i = self._find(index)
      if i == index and node:
        self.length -= 1
        if i == 0 or not prev:
          self.head = node.pointer
          self.tail = node.pointer
        else:
          prev.pointer = node.pointer
      else:
        print(f'인덱스 {index}에 해당하는 노드가 없습니다')
  
  def deleteNodeByValue(self, value):
    if not self.head or not self.head.pointer:
      self._deleteFirst()
    else:
      node, prev, i = self._find_by_value(value)
      if node and node.value == value:
        self.length -= 1
        if i ==0 or not prev:
          self.head = node.pointer
          self.tail = node.pointer
        else:
          prev.pointer = node.pointer
      else:
        print(f'값 {value}에 해당하는 노드가 없습니다')


ll = LinkedListFIFO()
for i in range(1, 5):
  ll.addNode(i)
print('연결 리스트 출력')
ll._printList()
print('인덱스가 2인 노드 삭제 후, 연결 리스트 출력: ')
ll.deleteNode(2)
ll._printList()

print('값이 15인 노드 추가 후, 연결 리스트 출력')
ll.addNode(15)
ll._printList()
print('모든 노드 삭제 후, 연결 리스트 출력')
for i in range(ll.length-1, -1, -1):
  ll.deleteNode(i)
ll._printList()


연결 리스트 출력
1 2 3 4 
인덱스가 2인 노드 삭제 후, 연결 리스트 출력: 
1 2 4 
값이 15인 노드 추가 후, 연결 리스트 출력
1 2 4 15 
모든 노드 삭제 후, 연결 리스트 출력
연결 리스트가 비었습니다



In [7]:
class HashTableLL(object):
  def __init__(self, size):
    self.size = size
    self.slots = []
    self._createHashTable()

  def _createHashTable(self):
    for i in range(self.size):
      self.slots.append(LinkedListFIFO())

  def _find(self, item):
    return item % self.size
  
  def _add(self, item):
    index = self._find(item)
    self.slots[index].addNode(item)

  def _delete(self, item):
    index = self._find(item)
    self.slots[index].deleteNodeByValue(item)

  def _print(self):
    for i in range(self.size):
      print(f'슬롯 {i}')
      self.slots[i]._printList()

def test_hash_tables():
  H1 = HashTableLL(3)
  for i in range(0, 20):
    H1._add(i)
  H1._print()
  print('\n항목 0,1,2를 삭제합니다')
  H1._delete(0)
  H1._delete(1)
  H1._delete(2)
  H1._print()

test_hash_tables()

슬롯 0
0 3 6 9 12 15 18 
슬롯 1
1 4 7 10 13 16 19 
슬롯 2
2 5 8 11 14 17 

항목 0,1,2를 삭제합니다
슬롯 0
3 6 9 12 15 18 
슬롯 1
4 7 10 13 16 19 
슬롯 2
5 8 11 14 17 
