## 해시 충돌 - 개별 체이닝

In [1]:
import hashlib

SIZE = 8

hash_table = list([0 for i in range(SIZE)])

# Key를 해시테이블의 사이즈로 나눈 값의 나머지를 해시로 사용
def hash_function(key):
    # key가 정수형 타입인 경우
    if isinstance(key, int):
        return key % SIZE
    # key가 정수형이 아닌 경우
    # SHA-256 해시 알고리즘으로 정수형으로 바꿔준다.
    return int(hashlib.sha256(str(key).encode()).hexdigest(), 16) % SIZE

def save_data(key, value):
    hash_address = hash_function(key)
    # hash_table을 0으로 초기화했기 때문에, value가 들어있다면 0이 아닐 것이라고 가정
    # 즉, 0이 아니라면 해당 위치에 데이터가 들어가 있다는 것
    if hash_table[hash_address] != 0:
        # 파이썬에서는 리스트에 append로 데이터를 추가하면 linkedlist와 유사한 효과를 낸다.
        # 특정 주소에 데이터가 하나라도 들어가 있다면 그것이 리스트 타입으로 구현되어 있음.
        # 따라서, len(hash_table[hash_address])를 통해서 해당 주소에 데이터가 하나가 들어가 있는지 2개가 들어있는지
        # 들어간 데이터의 개수를 알아볼 수 있다.
        for index in range(len(hash_table[hash_address])):
            # Chaining에서 동일한 hash를 가질 경우 기존에 있던 값 뒤에 이어서
            # linkedlist 형태로 [key, value] 쌍을 저장해나간다.
            # 따라서, index는 몇 번째로 이어져 있는 [key, value] 쌍인지 확인하는 용도.
            # hash_table[hash_address][index][0] == key 인 경우는 기존에 있던 값을 갱신하는 것.
            if hash_table[hash_address][index][0] == key:
                hash_table[hash_address][index][1] = value
                # 의도한 작업을 마쳤다면 함수를 빠져나감
                return
        # hash_table[hash_address][index][0] != key 인 경우는 기존에 있던 값 뒤에 이어서 새로운 값을 추가하는 것.
        hash_table[hash_address].append([key, value])
    # hash_address 주소를 가지는 위치에 어떤 데이터도 저장되어 있지 않다면
    # [key, value] 형태를 가지는 리스트를 추가한다.
    else:
        hash_table[hash_address] = [[key, value]]
    
def read_data(key):
    hash_address = hash_function(key)

    # 해당 위치에 데이터가 있는 경우
    if hash_table[hash_address] != 0:
        for index in range(len(hash_table[hash_address])):
            if hash_table[hash_address][index][0] == key:
                return hash_table[hash_address][index][1]
        return None
    # 해당 위치에 데이터가 없다면 아무 것도 반환하지 않는다.
    else:
        return None


In [3]:
save_data('da', '01200123123')
save_data('dh', '3333333333')
read_data('dh')

'3333333333'

In [4]:
hash_table

[0, 0, [['da', '01200123123'], ['dh', '3333333333']], 0, 0, 0, 0, 0]