## 일반적인 매핑형

collections.abc  
- Mapping, MutableMapping 과 같은 추상 베이스 클래스(ABC)를 제공함  
- dict와 유사한 자료형의 인터페이스를 정의하기 위해  

In [1]:
my_dict = {}
import collections
isinstance(my_dict, collections.abc.Mapping)

True

hashable ?  
원자적 불변형(str, byte, 수치형), frozenset = 해시 가능  
tuple = 항목들이 모두 hashable 이어야 해시 가능  
사용자 정의 자료형 = 기본적으로 해시 가능 (id()를 이용하여 객체의 해시값을 구하기 때문)  
- \__eq\__() 를 직접 구현하는 경우 해시값 계산에 사용된 속성이 모두 불변형일 때만 해시 가능  

해시 가능한 값만 키로 사용할 수 있다.  

In [2]:
tt = (1, 2, (30, 40))

In [3]:
hash(tt)

8027212646858338501

In [5]:
tl = (1, 2, [30, 40])

In [6]:
hash(tl)

TypeError: unhashable type: 'list'

In [7]:
tf = (1, 2, frozenset([30, 40]))

In [8]:
hash(tf)

985328935373711578

In [9]:
hash([1, 2, 3, 4])

TypeError: unhashable type: 'list'

dict를 구현하는 방법들

In [10]:
a = dict(one=1, two=2, three=3)
a

{'one': 1, 'two': 2, 'three': 3}

In [11]:
b = {'one': 1, 'two': 2, 'three': 3}
b

{'one': 1, 'two': 2, 'three': 3}

In [12]:
c = dict(zip(['one', 'two', 'three'], [1, 2, 3]))
c

{'one': 1, 'two': 2, 'three': 3}

In [14]:
d = dict([('two', 2), ('one', 1), ('three', 3)])
d

{'two': 2, 'one': 1, 'three': 3}

In [15]:
e = dict({'three': 3, 'one': 1, 'two': 2})
e

{'three': 3, 'one': 1, 'two': 2}

In [16]:
a == b == c == d == e

True

## Dict Comprehension

listomp, genexps 구문 모두 dictcomp 에도 적용된다.  
모든 반복형 객체에서 키-값 쌍을 생성하여 딕셔너리 객체를 만들 수 있다.  

In [17]:
DIAL_CODE = [
    (86, 'China'),
    (91, 'India'),
    (1, 'United States'),
    (62, 'Indonesia'),
    (55, 'Brazil'),
    (92, 'Pakistan'),
    (880, 'Bangladesh'),
    (234, 'Nigeria'),
    (7, 'Russia'),
    (81, 'Japan'),
]

In [18]:
country_code = {country: code for code, country in DIAL_CODE}

In [19]:
country_code

{'China': 86,
 'India': 91,
 'United States': 1,
 'Indonesia': 62,
 'Brazil': 55,
 'Pakistan': 92,
 'Bangladesh': 880,
 'Nigeria': 234,
 'Russia': 7,
 'Japan': 81}

In [20]:
{code: country.upper() for country, code in country_code.items() 
 if code < 66}

{1: 'UNITED STATES', 62: 'INDONESIA', 55: 'BRAZIL', 7: 'RUSSIA'}

list(dict객체) : dict에 사용된 모든 키들의 리스트를 반환   

In [21]:
list(country_code)

['China',
 'India',
 'United States',
 'Indonesia',
 'Brazil',
 'Pakistan',
 'Bangladesh',
 'Nigeria',
 'Russia',
 'Japan']

## 공통 매핑 메서드  

매핑이 제공하는 기본 API 중 가장 널리 사용되는 것 : defaultdict, OrderedDict. 

dict.update(m) 메서드가 인수 m을 다루는 방식 : 덕 타이핑(duck typing)  
m이 keys() 메서드를 가지는지 확인  
- 가지면 m을 매핑으로 간주 -> m 항목이 (key, val) 쌍으로 되어 있다고 간주하여 m을 반복함   

대부분의 파이썬 매핑을 update() 메서드와 같은 논리를 구현함  
따라서 매핑형은 다른 매핑으로 초기화하거나, (key, val) 쌍을 생성하는 반복형 객체로 초기화 가능  

In [22]:
a

{'one': 1, 'two': 2, 'three': 3}

In [23]:
# 존재하는 키는 해당 값을 바꿈, 나머지는 추가 
a.update({'one': 11, 'four': 4, 'five': 5})

In [24]:
a

{'one': 11, 'two': 2, 'three': 3, 'four': 4, 'five': 5}

In [28]:
a.update([('six', 6)])

In [29]:
a

{'one': 11, 'two': 2, 'three': 3, 'four': 4, 'five': 5, 'six': 6}

fail-fast 철학에 따라, 존재하지 않는 키 k로 d\[k\]를 접근하면 keyError가 발생한다.  
keyError를 처리하는 것보다 기본값을 사용하는 것이 편리할 때 d.get(k, default)를 사용한다.  
하지만 default 값이 가변객체라면 보기에 어색하고 효율성도 떨어진다.  

In [30]:
import sys, re

WORD_RE = re.compile(r'\w+')
index = {}

with open('zen.txt', encoding='utf-8') as fp:
    for line_no, line in enumerate(fp, 1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start() + 1
            location = (line_no, column_no)
            occurrences = index.get(word, [])
            occurrences.append(location)
            index[word] = occurrences
            
for word in sorted(index, key=str.upper):
    print(word, index[word])

FileNotFoundError: [Errno 2] No such file or directory: 'zen.txt'

## 존재하지 않는 키에 대한 매핑

## 기타 매핑형