## 02 해시 함수
문자열을 받아서 숫자를 반환하는 함수

- 일관성 --> 같은 이름에 대해서는 항상 같은 인덱스를 할당
- 서로 다른 단어에 대해 모두 서로 다른 숫자가 나와야 함. --> 다른 문자열에 대해서는 다른 인덱스를 할당
- 배열의 크기를 알고 유효하 인덱스만 반환
- **해시 테이블**

    - 해시 함수와 배열을 합친 자료구조
    - 해시 맵(hash maps), 맵(maps), 딕셔너리(dictionaries), 연관 배열(associative arrays) 이라고도 부름.
    - 속도가 빠름.
    - 키(key)와 값(value)을 가짐.
        - 예) python : 딕셔너리(dictionary)
    - 어떤 항목과 다른 항목 간의 관계를 쉽게 모형화

In [1]:
# 제품 가격을 담고 있는 해시 테이블
book = dict()  
book["apple"] = 0.67
book["milk"] = 1.49
book["avocado"] = 1.49
book

{'apple': 0.67, 'avocado': 1.49, 'milk': 1.49}

In [2]:
book["avocado"]

1.49

## 03 해시 테이블을 사용하는 예

### 해시 테이블로 조회하기

In [3]:
# 전화번호부
phone_book = {}
phone_book["jenny"] = 8675309
phone_book["emergency"] = 911
phone_book["jenny"]

8675309

### 중복된 항목을 방지하기

In [4]:
# 투표소 관리
voted = {}

def check_voter(name):
    if voted.get(name):
        print("돌려 보내세요!")
    else:
        voted[name] = True
        print("투표하게 하세요.")

In [5]:
check_voter("tom")

투표하게 하세요.


In [6]:
check_voter("mike")

투표하게 하세요.


In [7]:
check_voter("mike")

돌려 보내세요!


### 해시 테이블을 캐시로 사용하기
캐싱(caching) : 정보를 다시 계산하지 않고 저장했다가 알려주는 것
- 작업속도가 빠르다
- 작업량이 줄어든다

In [8]:
cache = {}

def get_page(url):
    if cache.get(url):
        return cache[url]                  # 캐싱된 자료를 전송
    else:
        data = get_data_from_sever(url)    
        cache[url] = data                  # 캐시에 처음으로 자료를 저장
        return data

### 해시 테이블의 장점
1. 어떤것과 다른 것 사이의 관계를 모형화할 수 있다.
2. 중복을 막을 수 있다.
3. 서버에게 작업을 시키지 않고 자료를 캐싱할 수 있다.

## 04 충돌
- 두 개의 키(key)가 같은 공간에 할당되는 것
- 충돌을 피하려면 다음과 같은 것이 필요
    1. 낮은 사용률
    2. 좋은 해시 함수 

## 05 성능

해시 테이블의 성능 비교

|| 해시 테이블(평균적인 경우) | 해시 테이블(최악의 경우) | 배열(Chapter2) | 연결 리스트(Chapter2) |
|-|-|-|-|-|
| 탐색 | $O(1)$ | $O(n)$ | $O(1)$ | $O(n)$ |
| 삽입 | $O(1)$ | $O(n)$ | $O(n)$ | $O(1)$ |
| 삭제 | $O(1)$ | $O(n)$ | $O(n)$ | $O(1)$ |
* $O(1)$ : 상수 시간(constant time), 항상 똑같은 일정한 시간이 걸린다는 뜻

#### 사용률(load factor)

- $\dfrac{해시 테이블에 있는 항목의 수}{해시 테이블에 있는 공간의 수}$


- 사용률이 낮을 수록 충돌 최소화, 해시 테이블의 성능도 좋아짐.


- 일반적으로 사용률이 0.7보다 커지면 리사이징(resizing) 함.

#### 좋은 해시 함수

- 배열에 값을 고루 분포시키는 함수