## Hash Table

### 1. 해쉬 구조 
 - 키에 데이터를 저장하는 데이터 구조 (Key-Value)
    * Key를 통해 데이터를 가져오기 때문에 속도가 빠름 
    * 파이썬의 딕셔너리 타입이 해쉬테이블이다. 
    * 보통 배열로 미리 Hash Tabel 사이즈 만큼 생성후의 사용

### 2. 알아둘 용어 
 - 해쉬(Hash) : 임의 값을 고정 길이로 변환 하는것 
 - 해쉬 테이블 : 키값에 연산에 의햐 직접 접근이 가능한 데이터 구조 
 - 해싱 함수: Key에 대해 산술 연산을 히용해 데이터 위치를 찾을수 있는 함수 
 - 해쉬 값 또는 해쉬 주소 : 키를 해싱 함수로 연산해서 해쉬 값을 알아내고 이를 기반으로 해쉬 테이블에서 해당 Key에 대한 데이터 위치를 일관성 있게 찾을수 있음 
 - 슬롯: 한개의 데이터를 저장할수 있는 공간 
 - 저장한 데이터에 대해 Key를 추출할수 있는 별도 함수도 존재할수 있음


### 2. 간단한 해시 예 

In [14]:
# hash 테이블 만들기 
hash_table = list([0 for i in range(10)])
hash_table

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

In [15]:
# 해쉬 함수 만들기 
def hash_func(key):
    return key % 5

In [16]:
# 해쉬 테이블에 데이터 저장
data1 = "HI"
data2 = "hello"
data3 = "Bye"

#ord 문자의 아스키 코드 리턴
print(ord(data1[0]),ord(data2[0]),ord(data3[0]))

72 104 66


In [17]:
# 해쉬 테이블 저장 예 
def storage_data(data,value):
    key = ord(data[0])
    hash_address = hash_func(key)
    hash_table[hash_address] = value


In [18]:
storage_data('Andy',"0101323323")
storage_data('Leo',"010569323043")
storage_data('mark',"0323493849")


In [19]:
def get_data(data):
    key = ord(data[0])
    hash_address = hash_func(key)
    return hash_table[hash_address]

In [20]:
print(get_data('Andy'))
print(get_data('Leo'))
print(get_data('mark'))

0101323323
010569323043
0323493849


### 4. 해쉬 테이블의 장단점과 주요 용도 
 - 장점
    * 데이터의 저장/읽기 속도가 빠르다.
    * 해쉬틑 키에 대한 데이터가 있는지 확인이 쉬움 
 - 단점 
    * 저장공간이 더 필요하다. 
    * 여러키에 해당하는 주소가 동일할 경우 충돌을 해결하기 위한 별도의 자료구조 필요 
 - 주요 용도 
    * 검색이 많이 필요한 경우 
    * 저장, 삭제, 읽기가 빈번한 경우 
    * 캐쉬 구현시 (중복 확인이 쉽기 때문)

### 5. 프로그래밍 연습 
 

In [22]:
# 연습 1 : 리스트 변수를 활용하여 해쉬 테이블 구현해보기 
# 1. 해쉬 함수 : Key %8
# 2. 해쉬 키 생성 : hash(data)

hash_table = list([0 for i in range(8)])

def get_key(data):
    return hash(data)

def hash_function(key):
    return key % 8 

def save(data, value):
    hash_address = hash_function(get_key(data))
    hash_table[hash_address] = value

def read(data):
    hash_address = hash_function(get_key(data))
    return hash_table[hash_address]


In [24]:
save('Leo', '01010101001')
save('andy', 'asdsadsdsd')
read('Leo')

'01010101001'

In [25]:
hash_table

['asdsadsdsd', 0, '01010101001', 0, 0, 0, 0, 0]