In [1]:
# hash table 만들기
hash_table = list([0 for i in range(10)])
hash_table

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

In [2]:
# 해쉬 함수 만들기
def hash_func(key):
    return key % 5

In [3]:
# 해쉬 테이블에 저장
data1 = 'Andy'
data2 = 'Dave'
data3 = 'Trump'

# ord() : 문자의 ASCII(아스키) 코드 리턴
print(ord(data1[0]), ord(data2[0]), ord(data3[0]))
print(ord(data1[0]), hash_func(ord(data1[0])))

65 68 84
65 0


In [4]:
# 해쉬 테이블에 값 저장
def storage_data(data, value):
    key = ord(data[0])
    hash_address = hash_func(key)
    hash_table[hash_address] = value

In [5]:
storage_data('Andy', '01055553333')
storage_data('Dave', '01044443333')
storage_data('Trump', '01022223333')

In [6]:
# 데이터 불러오기
def get_data(data):
    key = ord(data[0])
    hash_address = hash_func(key)
    return hash_table[hash_address]

In [7]:
get_data('Andy')

'01055553333'

In [8]:
# 리스트 변수를 활용해서 해쉬 테이블 구현해보기
hash_table = list([0 for i in range(8)])

def get_key(data): # 해쉬 함수
    return hash(data)

def hash_func(key): # 해쉬 키 생성
    return key % 8

def save_data(data, value):
    hash_address = hash_func(get_key(data))
    hash_table[hash_address] = value

def read_data(data):
    hash_address = hash_func(get_key(data))
    return hash_table[hash_address]

In [9]:
save_data('Dave', '01020302000')
save_data('Andy', '01033232000')
read_data('Dave')

'01020302000'

In [10]:
# 충돌 해결 알고리즘 1
# Chaining 기법 (충돌되는 곳의 데이터는 링크드 리스트로 추가)
hash_table = list([0 for i in range(8)])

def get_key(data): # 해쉬 함수
    return hash(data)

def hash_func(key): # 해쉬 키 생성
    return key % 8

def save_data(data, value):
    index_key = get_key(data) # 같은 곳에 저장된 데이터들을 구분
    hash_address = hash_func(index_key)
    if hash_table[hash_address] != 0: # 해당 key 위치에 데이터가 존재 한다면 (충돌)
        for index in range(len(hash_table[hash_address])):
            if hash_table[hash_address][index][0] == index_key: # 해당 위치의 key값이 같다면
                hash_table[hash_address][index][1] = value # 데이터만 덮어쓰기
                return
        hash_table[hash_address].append(index_key, value) # 같은 위치에 키값이 같은게 없으니 데이터 추가 (링크드 리스트)
    else:
        hash_table[hash_address] = [[index_key, value]] # 해당 위치에 데이터가 존재하지 않으니 (충돌X) 그냥 데이터 추가

def read_data(data):
    index_key = get_key(data)
    hash_address = hash_func(index_key)
    if hash_table[hash_address] != 0:
        for index in range(len(hash_table[hash_address])):
            if hash_table[hash_address][index][0] == index.key:
                return hash_table[hash_address][index][1]
        return None
    else:
        return None

In [11]:
# 충돌 해결 알고리즘 2
# Linear Probing 기법 (충돌이 일어나면 그 다음칸의 주소로 이동하며 빈곳에 데이터 추가)
hash_table = list([0 for i in range(8)])

def get_key(data): # 해쉬 함수
    return hash(data)

def hash_func(key): # 해쉬 키 생성
    return key % 8

def save_data(data, value):
    index_key = get_key(data) # 같은 곳에 저장된 데이터들을 구분
    hash_address = hash_func(index_key)
    if hash_table[hash_address] != 0: # 해당 key 위치에 데이터가 존재 한다면 (충돌)
        for index in range(hash_address, len(hash_table)): # 해당 데이터의 위치부터 순회
            if hash_table[index] == 0: # 해당 위치가 비었다면
                hash_table[index] = [index_key, value] # 데이터 추가
                return
            elif hash_table[index][0] == index_key: # 해당 위치의 데이터 key값이 동일한다면
                hash_table[index][1] = value # 데이터 덮어쓰기
                return
    else:
        hash_table[hash_address] = [index_key, value]

def read_data(data):
    index_key = get_key(data)
    hash_address = hash_func(index_key)
    if hash_table[hash_address] != 0:
        for index in range(hash_address, len(hash_table)):
            if hash_table[index] == 0: # 해당 데이터가 저장된 적이 없을 경우
                return None
            elif hash_table[index][0] == index_key: # 키값 매칭 확인
                return hash_table[index][1]
    else:
        return None

In [12]:
# 해쉬 함수들 (SHA-1)
import hashlib

data = 'test'.encode()
hash_object = hashlib.sha1()
hash_object.update(data) # 바이트 코드로 변환
hex_dig = hash_object.hexdigest() # 16진수
print(hex_dig)

a94a8fe5ccb19ba61c4c0873d391e987982fbbd3


In [13]:
# 해쉬 함수들 (SHA-256)
import hashlib

data = 'test'.encode()
hash_object = hashlib.sha256()
hash_object.update(data) # 바이트 코드로 변환
hex_dig = hash_object.hexdigest() # 16진수
print(hex_dig)

9f86d081884c7d659a2feaa0c55ad015a3bf4f1b2b0b822cd15d6c15b0f00a08


In [14]:
import hashlib

hash_table = list([0 for i in range(8)])

def get_key(data): # 해쉬 함수 (SHA-256)
    hash_object = hashlib.sha256()
    hash_object.update(data.encode())
    hex_dig = hash_object.hexdigest()
    return int(hex_dig, 16)

def hash_func(key): # 해쉬 키 생성
    return key % 8

def save_data(data, value):
    index_key = get_key(data) # 같은 곳에 저장된 데이터들을 구분
    hash_address = hash_func(index_key)
    if hash_table[hash_address] != 0: # 해당 key 위치에 데이터가 존재 한다면 (충돌)
        for index in range(hash_address, len(hash_table)): # 해당 데이터의 위치부터 순회
            if hash_table[index] == 0: # 해당 위치가 비었다면
                hash_table[index] = [index_key, value] # 데이터 추가
                return
            elif hash_table[index][0] == index_key: # 해당 위치의 데이터 key값이 동일한다면
                hash_table[index][1] = value # 데이터 덮어쓰기
                return
    else:
        hash_table[hash_address] = [index_key, value]

def read_data(data):
    index_key = get_key(data)
    hash_address = hash_func(index_key)
    if hash_table[hash_address] != 0:
        for index in range(hash_address, len(hash_table)):
            if hash_table[index] == 0: # 해당 데이터가 저장된 적이 없을 경우
                return None
            elif hash_table[index][0] == index_key: # 키값 매칭 확인
                return hash_table[index][1]
    else:
        return None

In [15]:
print(get_key('db') % 8)
print(get_key('da') % 8)
print(get_key('dh') % 8)


1
2
2


In [16]:
save_data('da', '01011112222')
save_data('dh', '01033334444')
read_data('dh')

'01033334444'

### 시간 복잡도
- 일반적인 경우(Collision이 없는 경우)는 O(1)
- 최악의 경우(Collision이 모두 발생하는 경우)는 O(n)

> 해쉬 테이블의 경우, 일반적인 경우를 기대하고 만들기 때문에, 시간 복잡도는 O(1) 이라고 말할 수 있음

### 검색에서 해쉬 테이블의 사용 예
- 16개의 배열에 데이터를 저장하고, 검색할 때 O(n)
- 16개의 데이터 저장공간을 가진 위의 해쉬 테이블에 데이터를 저장하고, 검색할 때 O(1)
