<h2>해시 테이블</h2>
해시 테이블은 키를 값에 연결하여, 하나의 키가 0 또는 1개의 값과 연관

![](IMG/hash_table1.png)

각 키는 해시 함수를 계산할 수 있어야 함<br>
해시 테이블은 해시 버킷의 배열로 구성<br>
예를 들어 해시 값이 42 이고 5개의 버킷이 있는경우 나머지 연산을 사용하여, 버킷2(=42 mod 5)에 매핑<br><br>
두 개의 키가 동일한 버킷에 해시될 때, 문제가 발생, 이를 해시 충돌이라고 함<br>
이를 처리하는 한가지 방법은, 각 버킷에 대해 키-값 쌍의 연결리스트를 저장하는 것<br><br>
해시 테이블의 조회, 삽입, 삭제의 시간복잡도는 O(1)<br>
최악의 경우 각 키가 동일한 버킷으로 해시된다면(해시 충돌이 발생한다면), 각 작업의 시간 복잡도는 O(n)<br><br>
Hash: 임의 값을 고정 길이로 변환<br>
Hash Table: 키값의 연산에 의해 직접 접근이 가능한 데이터 구조<br>
Hashing Function: key에 대해 산술 연산을 이용해 데이터 위치를 찾을 수 있는 함수<br>
Hash value 또는 Hash address: key를 해싱 함수로 연산해서 해쉬 값을 알ㄹ아내고, 이를 기반으로 해쉬 테이블에서 해당 key에 대한 데이터 위치를 일관성 있게 찾을 수 있음<br>
slot: 한 개의 데이터를 저장할 수 있는 공간<br>
저장할 데이터에 대해 key를 추출할 수 있는 별도 함수도 존재할 수 있음

In [7]:
#간단한 hash table
hash_table= list([i for i in range(10)])
print(hash_table)

#간단한 해쉬 함수 만들기
def hash_func(key):
    return key%5

#해쉬 테이블에 저장하기
data1= 'seunghye'
data2= 'lee'
data3= 'biscoff'
data4= 'Lotus'

#ord(): 문자의 ASCII(아스키)코드 리턴
print(ord(data1[0]), ord(data2[0]))
print(ord(data3[0]), ord(data4[0]))
print(hash_func(ord(data1[0])))
print(hash_func(ord(data2[0])))
print(hash_func(ord(data3[0])))
print(hash_func(ord(data4[0])))

#해쉬 테이블 값 저장
def storage_data(data, value):
    key= ord(data[0])
    hash_address= hash_func(key)
    hash_table[hash_address]= value
    
storage_data('seunghye', '01043809999')
storage_data('cy', '01045006622')

#데이터 읽기
def get_data(data):
    key= ord(data[0])
    hash_address= hash_func(key)
    print(hash_table[hash_address])
    
get_data('seunghye')

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
115 108
98 76
0
3
3
1
01043809999


<h3>해쉬 테이블 장단점</h3>
장점: 데이터 저장/읽기 속도가 빠름<br>
해쉬는 키에 대한 데이터가 있는지 확인 쉬움<br><br>
단점: 일반적으로 저장공간이 좀 더 많이 필요<br>
여러 키에 해당하는 주소가 동일할 경우, 충돌을 해결하기 위한 별도의 자료구조가 필요함

In [4]:
#해시 테이블 구현
#chaining 방식은 LinkedList를 이용하는 방법으로 저장하려 해시테이블에
#같은 키값의 데이터가 있다면, 노드를 추가하여 다음 노드를 가르키는 방식으로 구현

from LinkedListFIFO import LinkedListFIFO

class HashTableLL(LinkedListFIFO):
    #LinkedList 객체가 각 슬롯에 하나씩 들어감
    def __init__(self, size):
        self.size= size
        self.slots= []
        self._createHashTable()
        
    def _createHashTable(self):
        for i in range(self.size):
            self.slots.append(LinkedListFIFO())
            
    def _find(self, item):
        return item% self.size
    
    def _add(self, item):
        index= self._find(item)
        self.slots[index].addNode(item)
        
    def _delete(self, item):
        index= self._find(item)
        self.slots[index].deleteNodeByValue(item)
        
    def _print(self):
        for i in range(self.size):
            print('슬롯(slot) {0}'.format(i))
            self.slots[i]._printList()
            
def test_hash_tables():
    H1= HashTableLL(3)
    for i in range(0, 20):
        H1._add(i)
    H1._print()
    #값이 0, 1, 2인 노드를 삭제
    print('\n항목 0, 1, 2를 삭제')
    H1._delete(0)
    H1._delete(1)
    H1._delete(2)
    H1._print()
    
if __name__== '__main__':
    test_hash_tables()

슬롯(slot) 0
0 3 6 9 12 15 18 
슬롯(slot) 1
1 4 7 10 13 16 19 
슬롯(slot) 2
2 5 8 11 14 17 

항목 0, 1, 2를 삭제
슬롯(slot) 0
3 6 9 12 15 18 
슬롯(slot) 1
4 7 10 13 16 19 
슬롯(slot) 2
5 8 11 14 17 
