# 3. 충돌 해결 알고리즘

1. Chaining 기법
2. Linear Probing 기법

<br>

## 3.1 Chaining 기법

- 개방 해슁 or Open Hashing 기법 중 하나
- 해쉬 테이블 저장 공간 외의 **추가적인 공간을 활용**
- 충돌이 발생하면 **링크드 리스트** 자료 구조를 사용하여 데이터를 추가로 뒤로 연결시켜 저장

<br>

### 3.1.1 연습 문제 2

- 해쉬 테이블을 충돌 해결 알고리즘으로 Chaining 기법을 사용하여 구현
- 연습 문제 1의 코드에 Chaining 기법 코드 추가

In [16]:
hash_table = list([0 for i in range(8)])
hash_table

[0, 0, 0, 0, 0, 0, 0, 0]

In [23]:
def get_key(data):
    return hash(data)

def hash_function(key):
    return key % 8

def save_data(data, value):
    index_key = get_key(data)
    hash_address = hash_function(index_key)
    
    if hash_table[hash_address] != 0:
        for index in range(len(hash_table[hash_address])):
            if hash_table[hash_address][index][0] == index_key: # 기존에 저장된 데이터 변경
                hash_table[hash_address][index][1] = value
                return
        hash_table[hash_address].append([index_key, value]) # 뒤에 연결하여 데이터 저장
    else:
        hash_table[hash_address] = [[index_key, value]] # 해당 해쉬 주소에 최초 데이터 저장
    
def read_data(data):
    index_key = get_key(data)
    hash_address = hash_function(index_key)
    
    if hash_table[hash_address] != 0:
        for index in range(len(hash_table[hash_address])):
            if hash_table[hash_address][index][0] == index_key:
                return hash_table[hash_address][index][1]
        return None
    else:
        return None

In [24]:
print (hash('Dayes') % 8)
print (hash('Ded') % 8)
print (hash('Data') % 8)

0
2
2


In [25]:
save_data('Ded', '1201023010')
save_data('Data', '3301023010')

In [26]:
read_data('Ded')

'1201023010'

In [27]:
read_data('Data')

'3301023010'

In [29]:
hash_table

[0,
 0,
 [[-7963833316504217262, '1201023010'], [1891002109542397010, '3301023010']],
 0,
 0,
 0,
 0,
 0]

<br>

## 3.2 Linear Probing 기법

- 폐쇄 해싱 or Close Hashing 기법 중 하나
- 해쉬 테이블 저장 공간 안에서 충돌 문제 해결
- 충돌이 발생하면 해당 hash address의 다음 address부터 맨 처음 나오는 빈 공간에 저장하는 기법
- 저장 공간 활용도를 높이기 위한 기법

<br>

### 3.2.1 연습 문제 3

- 해쉬 테이블을 충돌 해결 알고리즘으로 Linear Probing 기법을 사용하여 구현
- 연습 문제 1의 코드에 Linear Probing 기법 코드 추가

In [114]:
hash_table = list([0 for i in range(8)])

def get_key(data):
    return hash(data)

def hash_function(key):
    return key % 8

def save_data(data, value):
    index_key = get_key(data)
    hash_address = hash_function(index_key)
    
    if hash_table[hash_address] != 0:
        for index in range(hash_address, len(hash_table)): # 현재 해쉬 주소부터 끝까지 탐색
            if hash_table[index] == 0: # 비어있는 슬롯 확인
                hash_table[index] = [index_key, value] # 비어 있는 슬롯에 데이터 추가
                return
            elif hash_table[index][0] == index_key: # 기존 데이터 수정의 경우
                hash_table[index][1] = value
                return
    else:
        hash_table[hash_address] = [index_key, value]
                    
def read_data(data):
    index_key = get_key(data)
    hash_address = hash_function(index_key)
    
    if hash_table[hash_address] != 0:
        for index in range(hash_address, len(hash_table)):
            if hash_table[index] == 0:
                return None
            elif hash_table[index][0] == index_key:
                return hash_table[index][1]
    else:
        return None    

In [115]:
print (get_key('dk') % 8)
print (get_key('do') % 8)
print (get_key('dq') % 8)

6
4
6


In [116]:
save_data('dk', '01200123123')
save_data('dq', '3333333333')

In [117]:
read_data('dk')

'01200123123'

In [118]:
read_data('dq')

'3333333333'

In [119]:
hash_table

[0,
 0,
 0,
 0,
 0,
 0,
 [64988065411884078, '01200123123'],
 [-8932991180149797738, '3333333333']]

<br>

## 3.3 빈번한 충돌 개선 기법

- 해쉬 함수를 재정의
  - `hash_function()`의 `return`을 `key % 8`에서 `key % 16`으로 변경
- 해쉬 테이블 저장 공간 확대
  - `hash_table`의 길이를 `8`에서 `16`으로 확대

```python
hash_table = list([0 for i in range(16)])

def hash_function(key):
    return key % 16
```