# 3-2. 딕셔너리
---


**dictionary** : `key` / `value` 구조로 구성.
- 파이썬 3.7 이상에서는 입력 순서가 유지
- 내부적으로 <u>해시 테이블(Hash Table)</u>로 구현
- 문자를 포함해 다양한 타입을 key로 사용 가능.
    - 인덱스를 숫자로만 지정할 수 있는 리스트와는 대조적
    - 문자, 집합 등 해시가 가능한 불변 객체를 모두 key로 사용할 수 있다. (이 과정을 **해싱**이라고 함.)
    - 거의 대부분의 경우 **`O(1)`의 복잡도로 입력/조회가 가능한 우수한 자료형**
        - 해시 테이블은 최악의 경우 `O(n)`이나, 분할 상환 분석에 따르면 `O(1)`에 해당함.

## 3-2-1 딕셔너리의 활용 방법

### 3-2-1-1 선언

In [1]:
# Case 1
a = dict()

# Case 2
a = {}

# Case 3
a = {'key1':'value1', 'key2':'value2'}
print(a)

{'key1': 'value1', 'key2': 'value2'}


- 나중에 별도로 키와 값을 추가할 수 있다.

In [2]:
a['key3'] = 'value3'
print(a)

{'key1': 'value1', 'key2': 'value2', 'key3': 'value3'}


### 3-2-1-2 조회

딕셔너리에서 존재하지 않는 키를 조회하면 **keyError**가 발생.
- 리스트에서는 존재하지 않는 인덱스를 조회하면 **IndexError**가 발생.
- 예외 처리를 통해 에러 발생을 방지할 수 있다. (`try`, `except` 구문)
    - 미리 해당 키가 존재하는지 검사도 가능 (`key in a` 구문)

In [4]:
# search
print(a['key1'])
try :
    print(a['key4'])
except :
    print('None Excist Key')

value1
None Excist Key


In [5]:
print('key4' in a)

False


- `for` 문을 이용하여 키/값을 조회할 수 있다.
    - 딕셔너리에 `.items()` 함수를 활용함

In [7]:
for key, val in a.items():
    print(key, val)

key1 value1
key2 value2
key3 value3


- `del` 구문을 이용하여 해당 키값을 삭제할 수 있음.

In [8]:
del a['key1']
print(a)

{'key2': 'value2', 'key3': 'value3'}


## 3-2-2 딕셔너리 모듈

- 딕셔너리와 관련된 특수한 형태의 컨테이너 자료형
    - `defaultdict`, `Counter`, `OrderDict`

### 3-2-2-1 defaultdict 객체

`defalutdict`
- 존재하지 않는 키 조회 시, 에러 출력 대신 디폴트 값 기준 해당 키에 대한 딕셔너리 아이템 생성.
- 실제론, `collections.defaultdict` 클래스를 가짐

In [9]:
import collections

a = collections.defaultdict(int)
a['A'] = 5
a['B'] = 4
a

defaultdict(int, {'A': 5, 'B': 4})

In [10]:
a['C'] += 1
a

defaultdict(int, {'A': 5, 'B': 4, 'C': 1})

dictionary의 경우 위의 코드에서 keyError가 발생해야 했지만, 
- `defaultdict` 객체는 에러없이 디폴트 값인 0을 자동으로 생성,
    = 해당 값에 `+=1` 연산을 수행하여 아이템을 추가함.

### 3-2-2-2 Counter 객체

`Counter` : **아이템에 대한 개수를 계산**해 <u>딕셔너리로 리턴</u>함.
- key에 아이템의 값, value에 해당 아이템의 개수가 들어간 딕셔너리 리턴
- 딕셔너리를 한 번 더 래핑(Wrapping)한 `collections.Counter` 클래스를 가짐

In [11]:
a = [1, 2, 3, 4, 5, 5, 5, 6, 6]
b = collections.Counter(a)
b

Counter({5: 3, 6: 2, 1: 1, 2: 1, 3: 1, 4: 1})

- 가장 빈도 수 높은 요소 추출
    - `most_common()` 사용

In [12]:
b.most_common(2) # (n) -> 빈도수 높은 n개 추출

[(5, 3), (6, 2)]

### 3-2-2-3 OrderDict 객체

**OrderDict** : 입력 순서가 그대로 유지되는 익셔너리
- 3.7 버전 이상에서는 딕셔너리가 입력 순서를 유지하기에 3.6 버전 이하에서만 효용성을 가짐.

In [13]:
collections.OrderedDict({'banana' : 3, 'apple' : 4, 'pear' : 1, 'orange' : 2})

OrderedDict([('banana', 3), ('apple', 4), ('pear', 1), ('orange', 2)])

---

### 딕셔너리 주요 연산 시간 복잡도

| 연산 | 시간 복잡도 | 설명 |
| :--: | :--------: | :--: |
| `len(a)` | O(1) | 요소의 개수를 리턴 |
| `a[key]` | O(1) | 키 조회, 해당하는 값 리턴 |
| `a[key] = value` | O(1) | 키/값 삽입 |
| `key in a` | O(1) | 딕셔너리에 키가 존재하는 지 확인 |