# 4. 해쉬 키 생성 함수 (해쉬 함수)

- `hash()`는 실행할 때마다 값이 달라짐
- 이 단점을 극복하기 위한 해시 키 생성 함수 필요

<br>

## 4.1 SHA (Secure Hash Algorithm)

- 유명한 해시 키 생성 함수
- 안전한 해시 알고리즘
- 어떤 데이터도 유일한 고정된 크기의 고정값을 리턴
- 해쉬 키 생성 함수로 유용하게 활용 가능

<br>

### 4.1.1 SHA-1

- 해시 함수에는 바이트 단위로 변환된 문자열이 입력된다.
- 그래야만 해쉬 함수가 해쉬 값을 추출할 수 있다.
- 문자열을 바이트 단위로 변환하는 방법 (in Python)
  - `'문자열'.encode()`
  - `b'문자열'`
- 바이트 단위 문자열이 입력된 해쉬 함수의 출력값인 해쉬 값은 `hexdigest()`를 통해 16진수로 변환한다.

In [2]:
import hashlib

data = 'test'.encode() 
hash_object = hashlib.sha1()
hash_object.update(data)
hex_dig = hash_object.hexdigest() # 해쉬 값을 16진수로 반환
print(hex_dig)

a94a8fe5ccb19ba61c4c0873d391e987982fbbd3


<br>

### 4.1.2 SHA-256

- SHA-1보다 보안이 강화된 해시 함수

In [5]:
import hashlib

data = b'test'
hash_object = hashlib.sha256()
hash_object.update(data)
hex_dig = hash_object.hexdigest()
print(hex_dig)

9f86d081884c7d659a2feaa0c55ad015a3bf4f1b2b0b822cd15d6c15b0f00a08


<br>

## 4.2 연습 문제 4

- 연습 문제 2의 Chaining 기법이 적용된 해쉬 테이블 코드에 키 생성 함수를 SHA256 해쉬 알고리즘을 사용하도록 변경

In [6]:
import hashlib

hash_table = list([0 for i in range(8)])

def get_key(data):
    hash_object = hashlib.sha256()
    hash_object.update(data.encode())
    hex_dig = hash_object.hexdigest()
    return int(hex_dig, 16) # 16진수 문자열을 10진수 정수로 변환

def hash_function(key):
    return key % 8

def save_data(data, value):
    index_key = get_key(data)
    hash_address = hash_function(index_key)
    
    if hash_table[hash_address] != 0:
        for index in range(len(hash_table[hash_address])):
            if hash_table[hash_address][index][0] == index_key: # 기존에 저장된 데이터 변경
                hash_table[hash_address][index][1] = value
                return
        hash_table[hash_address].append([index_key, value]) # 뒤에 연결하여 데이터 저장
    else:
        hash_table[hash_address] = [[index_key, value]] # 해당 해쉬 주소에 최초 데이터 저장
    
def read_data(data):
    index_key = get_key(data)
    hash_address = hash_function(index_key)
    
    if hash_table[hash_address] != 0:
        for index in range(len(hash_table[hash_address])):
            if hash_table[hash_address][index][0] == index_key:
                return hash_table[hash_address][index][1]
        return None
    else:
        return None

In [7]:
print (get_key('db') % 8)
print (get_key('da') % 8)
print (get_key('dh') % 8)

1
2
2


In [8]:
save_data('da', '01200123123')
save_data('dh', '3333333333')

In [10]:
read_data('da')

'01200123123'

In [11]:
read_data('dh')

'3333333333'

In [12]:
hash_table

[0,
 0,
 [[77049896039817716104633086125973601665927154587286664305423403838091909979274,
   '01200123123'],
  [25902807790238191969936164090115518991880572428612380032453909518048593055890,
   '3333333333']],
 0,
 0,
 0,
 0,
 0]