In [1]:
# hash table 만들기
hash_table = list([i for i in range(10)])
hash_table

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [2]:
# 간단한 해시 함수 만들기
def hash_func(key):
  return key % 5

In [3]:
# 해시 테이블에 저장
data1 = 'Andy'
data2 = 'Dave'
data3 = 'Trump'
data4 = 'Anthor'

# ord(): 문자의 ASCII 코드 리턴
print(ord(data1[0]), ord(data2[0]), ord(data3[0]))
print(ord(data1[0]), hash_func(ord(data1[0])))
print(ord(data1[0]), ord(data4[0]))

65 68 84
65 0
65 65


In [4]:
# 해시 테이블에 값을 저장하는 함수의 예
def storage_data(data, value):
  key = ord(data[0])
  hash_address = hash_func(key)
  hash_table[hash_address] = value

In [5]:
# 해시 테이블에서 특정 주소의 데이터를 가져오는 함수를 만들기
storage_data('Andy', '01055553333')
storage_data('Dave', '01044443333')
storage_data('Trump', '01022223333')

In [6]:
# 실제 데이터를 저장하고 읽기
def get_data(data):
  key = ord(data[0])
  hash_address = hash_func(key)
  return hash_table[hash_address]

In [7]:
get_data('Andy')

'01055553333'

In [8]:
# 리스트 변수를 활용해서 해시 테이블을 구현
hash_table = list([0 for i in range(8)])

def get_key(data):
  return hash(data)

def hash_function(key):
  return key % 8

def save_data(data, value):
  hash_address = hash_function(get_key(data))
  hash_table[hash_address] = value

def read_data(data):
  hash_address = hash_function(get_key(data))
  return hash_table[hash_address]

In [9]:
save_data('Dave', '0102030200')
save_data('Andy', '01033232200')
read_data('Dave')

'0102030200'

In [10]:
hash_table

[0, 0, 0, '0102030200', 0, 0, '01033232200', 0]

In [11]:
# 위의 해시 테이블 코드에 chaining 기법으로 충돌해결 코드를 추가
hash_table = list([0 for i in range(8)])

def get_key(data):
  return hash(data)

def hash_function(key):
  return key % 8

def save_data(data, value):
  index_key = get_key(data)
  hash_address = hash_function(index_key)
  
  if hash_table[hash_address] != 0:
    for index in range(len(hash_table[hash_address])):
      if hash_table[hash_address][index][0] == index_key:
        hash_table[hash_address][index][1] = value
        return
    hash_table[hash_address].append([index_key, value])
  else:
    hash_table[hash_address] = [[index_key, value]]

def read_data(data):
  index_key = get_key(data)
  hash_address = hash_function(index_key)

  if hash_table[hash_address] != 0:
    for index in range(len(hash_table[hash_address])):
      if hash_table[hash_address][index][0] == index_key:
        return hash_table[hash_address][index][1]
    return None
  else:
    return None

In [12]:
print(hash('Dave') % 8)
print(hash('Dd') % 8)
print(hash('Data') % 8)

3
7
1


In [13]:
save_data('Dd', '1201023010')
save_data('Data', '3301023010')
read_data('Dd')

'1201023010'

In [14]:
hash_table

[0,
 [[3703731570958055025, '3301023010']],
 0,
 0,
 0,
 0,
 0,
 [[-4006015054301941217, '1201023010']]]

In [15]:
# 첫 번째 연습의 해시 테이블 코드에 Linear Probing 기법으로 충돌해결 코드를 추가
hash_table = list([0 for i in range(8)])

def get_key(data):
  return hash(data)

def hash_function(key):
  return key % 8

def save_data(data, value):
  index_key = get_key(data)
  hash_address = hash_function(index_key)
  
  if hash_table[hash_address] != 0:
    for index in range(hash_address, len(hash_table)):
      if hash_table[index] == 0:
        hash_table[index] = [index_key, value]
        return
      elif hash_table[index][0] == index_key:
        hash_table[index][1] = value
        return
  else:
    hash_table[hash_address] = [index_key, value]

def read_data(data):
  index_key = get_key(data)
  hash_address = hash_function(index_key)

  if hash_table[hash_address] != 0:
    for index in range(hash_address, len(hash_table)):
      if hash_table[index] == 0:
        return None
      elif hash_table[index][0] == index_key:
        return hash_table[index][1]
  else:
    return None

In [16]:
print(hash('dk') % 8)
print(hash('da') % 8)
print(hash('dc') % 8)

3
7
7


In [17]:
save_data('dk', '01200123123')
save_data('da', '3333333333')
read_data('dc')

In [18]:
# 빈번한 충돌을 개선하는 기법으로 해시 함수를 재정의 하거나 해시 테이블의 저장공간을 확대
hash_table = list([None for i in range(16)])

def hash_function(key):
  return key % 16

In [19]:
import hashlib

data = 'test'.encode()
hash_object = hashlib.sha1()
hash_object.update(data)
hex_dig = hash_object.hexdigest()
print(hex_dig)

a94a8fe5ccb19ba61c4c0873d391e987982fbbd3


In [20]:
data = 'test'.encode()
hash_object = hashlib.sha256()
hash_object.update(data)
hex_dig = hash_object.hexdigest()
print(hex_dig)

9f86d081884c7d659a2feaa0c55ad015a3bf4f1b2b0b822cd15d6c15b0f00a08


In [21]:
print(get_key('db') % 8)
print(get_key('da') % 8)
print(get_key('dh') % 8)

0
7
2
