# Chapter 3 - 딕셔너리와 집합

dict는 파이썬 구현의 핵심 부분, 중요한 역할을 맡고 있어서 상당히 최적화 되어있다.<br>
딕셔너리 뒤에는 해시 테이블이라는 엔진이 있으며 set도 해시 테이블을 이용해서 구현한다.<br>

## 일반적인 매핑형

표준 라이브러리에서 제공하는 매핑형은 모두 dict를 이용해서 구현.<br>
키가 **해시 가능**해야 한다는 제한이 있다.<br>
<br>
해시 가능하다: 수명 주기동안 결코 변하지 않는 해시값을 갖고 있고(\_\_hash\_\_() 필요) 다른 객체와 비교할 수 있으면(\_\_eq\_\_() 필요), 객체를 해시 가능하다고 한다.
<br>

## 지능형 딕셔너리

In [1]:
DIAL_CODES = [
    (86, 'China'),
    (91, 'India'),
    (82, 'South Korea'),
]

country_code = { country: code for code, country in DIAL_CODES }
print(country_code)

{'China': 86, 'India': 91, 'South Korea': 82}


In [2]:
# 딕셔너리에 존재하지 않는 키에 접근할 땐 setdefault()로 처리하는 것이 좋다.

# 안 좋은 예
my_dict = { 123: ['asdf'], 456: ['zxcv'], 789: ['qwer'] }

if 159 not in my_dict:
    my_dict[159] = []
my_dict[159].append('yuio')

# 좋은 예
my_dict.setdefault(357, []).append('ghjk')

print(my_dict)

{123: ['asdf'], 456: ['zxcv'], 789: ['qwer'], 159: ['yuio'], 357: ['ghjk']}


## \_\_missing\_\_() 메서드

dict 클래스를 상속하고 \_\_missing\_\_() 메서드를 정의하면 dict.\_\_getitem\_\_() 표준 메서드가 키를 발견할 수 없을 때 KeyError를 발생하지 않고 \_\_missing\_\_() 메서드를 호출한다.

In [3]:
class StrKeyDict0(dict):
    def __missing__(self, key):
        if isinstance(key, str):
            raise KeyError(key)
        return self[str(key)]
    
    def get(self, key, default=None):
        try:
            return self[key]
        except:
            return default
        
    def __contains__(self, key):
        return key in self.keys() or str(key) in self.keys()

    
s = StrKeyDict0()
s['123'] = 'asdf'
s['456'] = 'zxcv'

print(s[123]) # missing 메서드가 호출되어 '123'을 찾게 된다
print(s.get(123, '@_@')) # key가 없으면 default 값인 '@_@'가 출력
if 123 in s:
    print('Wa Sans!') # 123이 없으면 '123'을 찾게 된다

asdf
asdf
Wa Sans!


## 불변 매핑

사용자가 실수로 매핑을 변경하지 못하도록 보장하고 싶을 때 사용한다.<br>
파이썬 3.3 이후 types 모듈은 MappingProxyType이라는 래퍼 클래스를 제공한다.

In [4]:
from types import MappingProxyType

d = { 1: 'A' }
d_proxy = MappingProxyType(d)
print(d_proxy)

{1: 'A'}


In [5]:
d_proxy[2] = 'B'

TypeError: 'mappingproxy' object does not support item assignment

In [6]:
d[2] = 'B'
print(d_proxy)

{1: 'A', 2: 'B'}


## 집합

집합은 중복을 허용하지 않는다. 해시 테이블을 사용하기 때문에 각 요소는 해시 가능해야 한다.<br>
set은 해시 가능하지 않지만 frozenset은 해시 가능하므로 set이 frozenset을 요소로 가질 수 있다.<br>
<br>
공집합을 표현할 땐 {}를 사용할 수 없다(딕셔너리가 만들어짐). set()을 사용하자.<br>
set([1, 2, 3])으로 생성자를 호출할 수도 있지만 {1, 2, 3}과 같이 리터럴 집합 구문을 사용할 수도 있다.<br>
생성자를 명시하면 **생성자를 가져오기 위해 집합명을 검색하고, 리스트를 생성하고, 이 리스트를 생성자에 전달해야 하므로 더 느리다**.<br>

## 지능형 집합

지능형 딕셔너리와 비슷하게 지능형 집합도 가능하다.

In [2]:
s = { i for i in range(10) }
s &= { i for i in range(5, 15) }

print(s)

{5, 6, 7, 8, 9}
