# 3.4 융통성 있게 키를 조회하는 매핑

1. `dict` 대신 `defaultdict` 쓰기
2. `dict` 등의 매핑형 상속하여 `__missing__()` 메서드 추가하기

### 3.4.1 defaultdict: 존재하지 않는 키에 대한 또 다른 처리

- 그냥 `dict`를 사용했을 때

In [1]:
index = {}
index['dog'].append([1, 2])

KeyError: 'dog'

- `defaultdict`를 사용했을 때

In [2]:
from collections import defaultdict
index = defaultdict(list)
index['dog'].append([1, 2])
index

defaultdict(list, {'dog': [[1, 2]]})

- 그러므로 `defaultdict`를 사용하면 코드를 짜기 쉬워짐

In [3]:
""" 단어가 나타나는 위치를 가리키는 인덱스를 만든다."""

import re
from collections import defaultdict
txt_file = 'txt/proverb.txt'

WORD_RE = re.compile(r'\w+')
index = defaultdict(list)

with open(txt_file, encoding='utf-8') as fp:
    for line_no, line in enumerate(fp, 1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start()+1
            location = (line_no, column_no)
            index[word].append(location)

for word in sorted(index, key=str.upper):
    print(word, index[word])

A [(1, 1), (6, 1)]
and [(5, 21)]
back [(5, 16)]
barking [(1, 3)]
before [(4, 28)]
better [(3, 15)]
bites [(1, 21)]
chickens [(4, 19)]
count [(4, 8)]
Do [(4, 1)]
dog [(1, 11)]
gain [(2, 12)]
hatch [(4, 40)]
I [(5, 25)]
ll [(5, 27)]
more [(3, 5)]
my [(5, 13)]
never [(1, 15)]
No [(2, 1), (2, 9)]
not [(4, 4)]
pain [(2, 4)]
pet [(6, 3)]
scratch [(5, 5), (5, 30)]
The [(3, 1)]
the [(3, 11)]
they [(4, 35)]
You [(5, 1)]
your [(4, 14)]
yours [(5, 38)]


### 3.4.2 __missing 메서드

`dict` 클래스를 상속하고 `__missing__()` 메서드를 정의하면 `dict.__getitem__()` 표준 메서드가 키를 발견할 수 없을 때 `KeyError`를 발생시키지 않고 `__missing__()` 메서드를 호출한다.

In [4]:
class StrKeyDict0(dict):
    
    def __missing__(self, key):
        if isinstance(key, str):
            raise KeyError(key) # 키가 문자열이고 존재하지 않으면 KeyError 발생
        return self[str(key)] # 키에서 문자열을 만들고 조회한다
    
    def get(self, key, default=None):
        try:
            return self[key]
        except KeyError:
            return default
        
    def __contains__(self, key):
        return key in self.keys() or str(key) in self.keys()

In [5]:
d = StrKeyDict0([('2', 'two'), ('4', 'four')])
d

{'2': 'two', '4': 'four'}

In [6]:
d[2]

'two'

In [7]:
d[1]

KeyError: '1'

In [8]:
d.get(2)

'two'

In [9]:
d.get(1)

# 3.5 그 외 매핑형

In [10]:
from collections import Counter
ct = Counter('abcdeaab')
ct

Counter({'a': 3, 'b': 2, 'c': 1, 'd': 1, 'e': 1})

In [11]:
ct.update('aazzzzz')
ct

Counter({'a': 5, 'b': 2, 'c': 1, 'd': 1, 'e': 1, 'z': 5})

In [12]:
ct.most_common(1)

[('a', 5)]

In [13]:
def find_max(word):
    counter = Counter(word)
    max_count = -1
    for letter in counter:
        if counter[letter] > max_count:
            max_count = counter[letter]
            max_letter = letter
    return max_letter, max_count

find_max(ct)

('a', 5)

In [14]:
ct['a']

5