# Hash Table
- 키(Key)에 데이터(Value)를 저장하는 데이터 구조
- Key를 통해 데이터를 바로 받아올 수 있음 → 속도가 획기적으로 빨라짐
- 파이썬 딕셔너리(Dictionary) 타입이 해쉬 테이블의 예 - Key를 가지고 바로 데이터(Value)를 꺼냄
- 보통 배열로 미리 Hash Table 사이즈만큼 생성 후 사용(공간과 탐색 시간을 맞바꾸는 기법)
- 파이썬에서는 해쉬를 별도로 구현할 필요 없음 - 딕셔너리 타입을 사용하면 되기 때문

1)장점
- 데이터 저장/읽기 속도가 빠름(검색 속도가 빠름)
- 해쉬는 키에 대한 데이터가 있는지(중복) 확인이 쉬움  

2)단점
- 일반적으로 저장공간이 좀 더 많이 필요함
- 여러 키에 해당하는 주소가 동일할 경우, 충동을 해결하기 위한 별도 자료구조가 핊요함

In [9]:
hash_table = list([i for i in range(10)])
print(hash_table) # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


list comprehension
[출력표현식 for 요소 in 입력 Sequence [if 조건식]]

입력 Sequence는 Iteration이 가능한 데이터 Sequence 혹은 컬렉션  

[if 조건식]에서 []는 리스트 괄호가 아니라 옵션이라는 뜻, 즉 조건이 있을 때만 넣으면 된다는 뜻임

In [10]:
# list comprehension 예시
# 위 코드의 출력표현식을 i에서 i*i로 바꾼 결과

hash_table = list([i*i for i in range(10)])
print(hash_table) # [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

# 종류가 다른 데이터에서 정수 리스트만 가져오기
dataset = [False, 49, "seunghye", 31.43, 6, 10]
int_data = [num for num in dataset if type(num)==int]
print(int_data) # [49, 6, 10]

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
[49, 6, 10]


In [11]:
# 함수로 구현

# 1. 배열로 hashTable 생성.
hash_table = [0 for i in range(10)]

# 2. hashFunc(key) -> hashTableIndex
def hash_func(key):
    hashValue=ord(key) # 여기서는 ord()가 hashFunc
    hashAdress = hashValue%10 # 여기서는 나머지연산이 addressFunc
    return hashAdress

# 3. 저장기능 , 읽기기능 구현 
def save_data(key,value):
    idx=hash_func(key)
    hash_table[idx]=value
def read_data(key):
    idx = hash_func(key)
    return hash_table[idx]

In [12]:
# 클래스로 구현
class HashTable:
    def __init__(self, table_size):
        self.size = table_size
        self.hash_table = [0 for a in range(self.size)]
        
    def getKey(self, data):
        self.key = ord(data[0])
        return self.key
    
    def hashFunction(self, key):
        return key % self.size

    def getAddress(self, key):
        myKey = self.getKey(key)
        hash_address = self.hashFunction(myKey)
        return hash_address
    
    def save(self, key, value):
        hash_address = self.getAddress(key)
        self.hash_table[hash_address] = value
        
    def read(self, key):
        hash_address = self.getAddress(key)
        return self.hash_table[hash_address]
    
    def delete(self, key):
        hash_address = self.getAddress(key)
        
        if self.hash_table[hash_address] != 0:
            self.hash_table[hash_address] = 0
            return True
        else:
            return False


#Test Code
h_table = HashTable(8)
h_table.save('a', '1111')
h_table.save('b', '3333')
h_table.save('c', '5555')
h_table.save('d', '8888')
print(h_table.hash_table)
print(h_table.read('d'))

h_table.delete('d')

print(h_table.hash_table)

[0, '1111', '3333', '5555', '8888', 0, 0, 0]
8888
[0, '1111', '3333', '5555', 0, 0, 0, 0]
