# Data Structure
## Chapter 7

## 7.4 충돌 해결

### 물론 해시 테이블에도 문제는 있다
- #### 유의어 사전 예제를 살펴보자. 
    - #### 다음과 같은 항목을 예제의 유의어 사전에 추가하면 무슨 일이 벌어질까?

    ```
    thesaurus["dab"] = "pat"
    ```

### 먼저 컴퓨터는 키를 해싱할 것이다
- #### DAB = 4 * 1 * 2 = 8
- #### 그리고 "pat"를 해시 테이블의 셀 8에 추가하려 할 것이다

```
|1|2|3|4|5|taxi|7|evil|9|10|11|12|13|14|star|....|N|
```

### 셀 8에 이미 "evil"이 들어 있다
- #### 이미 채워진 셀에 데이터를 추가하는 것을  "충돌"이라 부른다
    - 다행히 이 문제를 해결하는 방법들이 있다

### 충돌을 해결하는 고전적인 방법 하나가 "분리 연결법"이다
- #### 충돌이 발생했을 때 셀에 "하나의" 값을 넣는 대신 배열로의 참조를 넣는 방법이다

### 해시 테이블의 내부 데이터 저장소 일부를 좀 더 자세히 들여다보자

```
|5|"taxi"|7|"evil"|9|
```

- #### 예제에서 컴퓨터는 셀 8에 "pat"를 추가하려 했지만 이미 "evil"이 들어 있다

### 따라서 아래와 같이 배열을 대체한다
- #### 이 배열에 포함된 하위 배열의 첫 번째 값은 단어, 두 번째 단어는 그 단어의 동의어다

```
|7| |               8               | |9|
|7| ||"bad"|"evil"|| ||"dab"||"pat"|| |9|
```

### 이렇게 바꿨을 때 해시 테이블 룩업이 어떻게 동작하는지 차례대로 살펴보자
- #### thesaurus["dab"]을 룩업할 때 컴퓨터는 다음과 같은 단계를 밟는다
    - #### 1. 컴퓨터는 키를 해싱한다 DAB = 4 * 1 * 2 = 8
    - #### 2. 셀 8을 룩업한다. 컴퓨터는 셀 8이 하나의 값이 아닌 배열들의 배열을 포함하고 있음을 알게 된다
    - #### 3. 각 하위 배열의 인덱스 0을 찾아보며 룩업하고 있는 단어인 ("dab")을 찾을떄 까지 배열을 차례대로 검색한다.
        - #### 일치하는 하위 배열의 인덱스 1에 있는 값을 반환한다

### 위 단계를 다시 한번 보자

#### DAB이 8로 해싱되므로 컴퓨터는 그 셀을 찾아본다.

```
|7| |               8               | |9|
|7| ||"bad"|"evil"|| ||"dab"||"pat"|| |9|
```

#### 셀 8은 배열을 포함하므로 첫 번째 셀부터 시작해서 각 셀을 선형 검색한다. 첫 셀에 들어 있는 또 다른 배열의 인덱스 0을 확인한다

```
|7| |               8               | |9|
|7| ||"bad"|"evil"|| ||"dab"||"pat"|| |9|
        ^
```

#### 인덱스 0에 찾고 있는 단어인 ("dab")이 없으므로 다음 그림처럼 다음 셀로 넘어간다

```
|7| |               8               | |9|
|7| ||"bad"|"evil"|| ||"dab"||"pat"|| |9|
                         ^
```

#### "dab"를 찾았다.
- #### 즉, 이 하위 배열의 인덱스 1에 있는 값인 ("pat")가 바로 찾고 있던 값이다

### 컴퓨터가 확인 중인 셀이 배열을 참조할 경우 다수의 값이 들어 있는 배열을 선형 검색해야 하므로 검색에 단계가 더 걸린다
- #### 만약 모든 데이터가 해시 테이블의 한 셀에 들어가게 된다면 해시 테이블은 배열보다 나을 게 없다
- #### 따라서 최악의 경우 해시 테이블 룩업 성능은 사실상 O(N)이다

### 이렇기 때문에 해시 테이블에 충돌이 거의 없도록, O(N) 시간이 아닌 O(1) 시간 내에 일반적으로 룩업을 수행하도록 디자인해야 한다