## 3.1 일반적인 매핑형

In [17]:
import collections

my_dict = {}
isinstance(my_dict, collections.abc.Mapping)

True

In [55]:
tf = (1, 2, frozenset([30, 40]))
hash(tf)

5149391500123939311

In [56]:
tf.__eq__(tt)

False

In [59]:
cd = tf
tf.__eq__(cd)

True

In [60]:
print(hash(tf))
print(hash(cd))

5149391500123939311
5149391500123939311


In [61]:
tf = [1, 2, 3]
cd = tf

tf.__eq__(cd)

True

In [64]:
cd = tf.copy.copy()

tf.__eq__(cd)

AttributeError: 'builtin_function_or_method' object has no attribute 'copy'

---

### `type()` vs `instance()`

In [2]:
class Vehicle:
    pass

class Truck(Vehicle):
    pass

In [3]:
print(isinstance(Vehicle(), Vehicle))  
print(type(Vehicle()) == Vehicle)      
print(isinstance(Truck(), Vehicle))    
print(type(Truck()) == Vehicle)

True
True
True
False


---

### 해시 가능하다의 의미

In [53]:
tt = (1, 2, (30, 40))
hash(tt)

-3907003130834322577

In [54]:
t1 = (1, 2, [30, 40])
hash(t1)

TypeError: unhashable type: 'list'

---

### dict를 구현하는 다양한 방법

In [12]:
a = dict(one=1, two=2, three=3)
b = {'one' : 1, 'two' : 2, 'three': 3}
c = dict(zip(['one', 'two', 'three'], [1, 2, 3]))
d = dict([('two', 2), ('one', 1), ('three', 3)])
e = dict({'three': 3, 'one': 1, 'two': 2})
a == b == c == d == e

True

---

## 3.2 지능형 딕셔너리

In [45]:
DIAL_CODES = [
    (81, 'china'),
    (22, 'india'),
    (12, 'usa'),
    (321, 'indonesia'),
    (82, 'korea')
]

country_code = {country: code for code, country in DIAL_CODES}
country_code

{'china': 81, 'india': 22, 'usa': 12, 'indonesia': 321, 'korea': 82}

In [31]:
{code: country.upper() for country, code in country_code.items() if code > 80}

{81: 'CHINA', 321: 'INDONESIA', 82: 'KOREA'}

---

### 3.3 공통적인 매핑 메서드

In [4]:
from collections import defaultdict

def default_factory():
    return 10

age_dict = defaultdict(default_factory)
age_dict['죠르디'] = 10
age_dict['곰돌이'] = 2

print(age_dict)
print(age_dict['라이언'])
print(age_dict)

defaultdict(<function default_factory at 0x1089f78b0>, {'죠르디': 10, '곰돌이': 2})
10
defaultdict(<function default_factory at 0x1089f78b0>, {'죠르디': 10, '곰돌이': 2, '라이언': 10})


In [5]:
from collections import OrderedDict

ordered_age_dict = OrderedDict({'라이언': 10, '곰돌이': 2})
ordered_age_dict['죠르디'] = 20

print(ordered_age_dict)

OrderedDict([('라이언', 10), ('곰돌이', 2), ('죠르디', 20)])


---

### 덕 타이핑

In [24]:
class Duck:
    def quack(self): 
        print("꽥꽥!")
    def feathers(self):
        print("오리에게 흰색, 회색 깃털이 있습니다.")

class Person:
    def quack(self): 
        print("이 사람이 오리를 흉내내네요.")
    def feathers(self):
        print("사람은 바닥에서 깃털을 주워서 보여 줍니다.")

def in_the_forest(duck):
    duck.quack()
    duck.feathers()

def game():
    donald = Duck()
    john = Person()
    in_the_forest(donald)
    in_the_forest(john)

In [25]:
game()

꽥꽥!
오리에게 흰색, 회색 깃털이 있습니다.
이 사람이 오리를 흉내내네요.
사람은 바닥에서 깃털을 주워서 보여 줍니다.


---

In [13]:
my_dict = {}
hash(my_dict)

TypeError: unhashable type: 'dict'

In [14]:
a == b

True

In [17]:
id(a)

4413978368

In [18]:
id(b)

4413978240

---

### 조기 실패 철학

In [6]:
my_dict = {1: 'one', 2 : 'two', 3 : 'three'}

In [31]:
my_dict.keys()

dict_keys([1, 2, 3])

In [34]:
my_dict[4]

KeyError: 4

---

In [11]:
my_dict = {1: 'one', 2 : 'two', 3 : 'three'}

In [12]:
location = (1, 2)

my_dict.get(4, []).append(location)
my_dict

{1: 'one', 2: 'two', 3: 'three'}

In [13]:
my_dict.setdefault(4, []).append(location)
my_dict

{1: 'one', 2: 'two', 3: 'three', 4: [(1, 2)]}

In [71]:
my_dict.__getitem__(4)

{1: 'one', 2: 'two', 3: 'three'}

---

### 존재하지 않는 키를 `setdefault()`로 처리하기

In [72]:
# 좋지 않은 사례

import sys
import re

WORD_RE = re.compile(r'\w+')
index = {}

# f = open('zen.txt', 'w')
# f.close()
    
with open('./zen.txt', encoding='utf-8') as fp:
    for line_no, line in enumerate(fp, 1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start() + 1
            location = (line_no, column_no)
            
            # 1. 단어(word)에 대한 occurrences 리스트를 가져오거나, 단어가 없으면 빈 배열을 가져온다.
            occurrences = index.get(word, [])
            # 2. 새로 만든 location을 occurrences에 추가한다. 
            occurrences.append(location)
            # 3. 변경된 occurrences를 index 딕셔너리에 넣는다. 그러면 index를 한 번 더 검색한다. 
            index[word] = occurrences

            
# 4. sorted() 함수의 key 인수 안에서 str.upper()를 호출하지 않고, 단지 str.upper() 함수에 대한 
# 참조를 전달해서 sorted() 함수가 이 함수를 이용해서 정렬할 단어를 정규화하게 만든다.
for word in sorted(index, key=str.upper):
    print(word, index[word])
    
    
# 이 예제에서 단어 발생(occurrences)을 처리하는 코드 세 줄은 dict.setdefault()를 사용하면 한 줄로 바꿀 수 있다. 

1 [(1, 16), (1, 25), (1, 34), (5, 16)]
11 [(1, 12)]
12 [(3, 11)]
14 [(4, 10)]
15 [(2, 7), (4, 6)]
16 [(1, 21), (4, 16)]
18 [(1, 30)]
20 [(4, 26)]
21 [(3, 7)]
23 [(2, 11)]
27 [(4, 20)]
3 [(5, 13)]
50 [(4, 30)]
Although [(1, 1)]
and [(2, 1)]
are [(3, 1)]
be [(4, 1)]
Beautiful [(5, 1)]


In [73]:
import sys
import re

WORD_RE = re.compile(r'\w+')
index = {}


with open('./zen.txt', encoding='utf-8') as fp:
    for line_no, line in enumerate(fp, 1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start() + 1
            location = (line_no, column_no)
            
            # 1. 단어에 대한 occurrences 리스트를 가져오거나, 단어가 없을 때는 빈 배열을 가져온다. 
            # setdefault()가 값을 반환하므로 한 번 더 검색할 필요 없이 갱신할 수 있다. 
            index.setdefault(word, []).append(location)

            
# 알파벳순으로 출력한다. 
for word in sorted(index, key=str.upper):
    print(word, index[word])

1 [(1, 16), (1, 25), (1, 34), (5, 16)]
11 [(1, 12)]
12 [(3, 11)]
14 [(4, 10)]
15 [(2, 7), (4, 6)]
16 [(1, 21), (4, 16)]
18 [(1, 30)]
20 [(4, 26)]
21 [(3, 7)]
23 [(2, 11)]
27 [(4, 20)]
3 [(5, 13)]
50 [(4, 30)]
Although [(1, 1)]
and [(2, 1)]
are [(3, 1)]
be [(4, 1)]
Beautiful [(5, 1)]


---

## 3.4 융통성 있게 키를 조회하는 매핑

In [2]:
import collections
import re
import sys

WORD_RE = re.compile(r'\w+')

index = collections.defaultdict(list)     
with open("./zen.txt", encoding='utf-8') as fp:
    for line_no, line in enumerate(fp, 1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start() + 1
            location = (line_no, column_no)
            index[word].append(location)  

            
# 알파벳 순으로 출력한다. 
for word in sorted(index, key=str.upper):
    print(word, index[word])

1 [(1, 16), (1, 25), (1, 34), (5, 16)]
11 [(1, 12)]
12 [(3, 11)]
14 [(4, 10)]
15 [(2, 7), (4, 6)]
16 [(1, 21), (4, 16)]
18 [(1, 30)]
20 [(4, 26)]
21 [(3, 7)]
23 [(2, 11)]
27 [(4, 20)]
3 [(5, 13)]
50 [(4, 30)]
Although [(1, 1)]
and [(2, 1)]
are [(3, 1)]
be [(4, 1)]
Beautiful [(5, 1)]


In [4]:
class StrKeyDict0(dict):  # StrKeyDict0이 dict를 상속한다. 

    def __missing__(self, key):
        if isinstance(key, str):  # 키가 문자열인지 확인한다. 
            raise KeyError(key)
        return self[str(key)]  # 키에서 문자열을 만들고 조회한다.

    def get(self, key, default=None):
        try:
            return self[key]  # get()메서드는 self[key] 표기법을 이용해서
                            # __getitem__() 메서드에 위임한다. 
        except KeyError:
            return default  # KeyError가 발생하면 __missing__() 메서드가 이미 실패한 것으로 default를 반환한다.

    def __contains__(self, key):
        return key in self.keys() or str(key) in self.keys()  # 수정하지 않은 키를 검색하고 나서, 키에서 만든 문자열로 검색한다. 

---

## 3.5 그 외 매핑형

In [5]:
ct = collections.Counter('abracadabra')
ct

Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})

In [6]:
ct.update('aaaaazzz')
ct

Counter({'a': 10, 'b': 2, 'r': 2, 'c': 1, 'd': 1, 'z': 3})

In [7]:
ct.most_common(3)

[('a', 10), ('z', 3), ('b', 2)]

---

## 3.6 UserDict 상속하기

In [None]:
import collections


class StrKeyDict(collections.UserDict):  # StrKeyDict는 UserDict를 상속한다.

    def __missing__(self, key):  # __missing__() 메서드는 위 예제와 동일
        if isinstance(key, str):
            raise KeyError(key)
        return self[str(key)]

    def __contains__(self, key):
        return str(key) in self.data  # __containes__() 메서드는 더 간단하다.
    # 저장된 키가 모두 str 형이므로 StrKeyDict0에서 self.keys()를 호출하는 방법과 달리
    # self.data 에서 바로 조회할 수 있다.

    def __setitem__(self, key, item):
        self.data[str(key)] = item   
    # __setitem__() 메서드는 모든 키를 str 형으로 변환하므로, 연산을 self.data에 위임할 때
    # 더 간단히 작성할 수 있다. 

---

## 3.7 불변 매핑

In [8]:
from types import MappingProxyType

d = {1: 'A'}

d_proxy = MappingProxyType(d)
d_proxy

mappingproxy({1: 'A'})

In [9]:
d_proxy[1]

'A'

In [10]:
d_proxy[2]

KeyError: 2

In [11]:
d[2] = "B"
d_proxy

mappingproxy({1: 'A', 2: 'B'})

In [12]:
d_proxy[2]

'B'

---

## 3.8 집합 이론

In [14]:
l = ['spam', 'spam', 'eggs', 'spam']
set(l)

{'eggs', 'spam'}

In [15]:
list(set(l))

['eggs', 'spam']

---

In [16]:
s = {1}
type(s)

set

In [17]:
s.pop()

1

In [18]:
s

set()

---

In [19]:
from dis import dis
dis('{1}')

  1           0 LOAD_CONST               0 (1)
              2 BUILD_SET                1
              4 RETURN_VALUE


In [20]:
dis('set([1])')

  1           0 LOAD_NAME                0 (set)
              2 LOAD_CONST               0 (1)
              4 BUILD_LIST               1
              6 CALL_FUNCTION            1
              8 RETURN_VALUE


---

In [21]:
frozenset(range(10))

frozenset({0, 1, 2, 3, 4, 5, 6, 7, 8, 9})

---

In [22]:
from unicodedata import name
{chr(i) for i in range(32, 256) if 'SIGN' in name(chr(i), '')}

{'#',
 '$',
 '%',
 '+',
 '<',
 '=',
 '>',
 '¢',
 '£',
 '¤',
 '¥',
 '§',
 '©',
 '¬',
 '®',
 '°',
 '±',
 'µ',
 '¶',
 '×',
 '÷'}

---

## 3.9 dict와 set의 내부 구조

In [23]:
DIAL_CODES = [
        (86, 'China'),
        (91, 'India'),
        (1, 'United States'),
        (62, 'Indonesia'),
        (55, 'Brazil'),
        (92, 'Pakistan'),
        (880, 'Bangladesh'),
        (234, 'Nigeria'),
        (7, 'Russia'),
        (81, 'Japan'),
    ]

# 인구가 많은 순서대로 정렬된 튜플로 생성
d1 = dict(DIAL_CODES)  
print('d1:', d1.keys())

# 국제전화 코드로 정렬된 튜플로 생성
d2 = dict(sorted(DIAL_CODES)) 
print('d2:', d2.keys())

# 국가명으로 정렬된 튜플로 생성
d3 = dict(sorted(DIAL_CODES, key=lambda x: x[1]))
print('d3:', d3.keys())

# 딕셔너리가 모두 동일한 키-값 쌍을 갖고 있기 때문에 동일하다고 판단된다. 
assert d1 == d2 and d2 == d3  # <4>

d1: dict_keys([86, 91, 1, 62, 55, 92, 880, 234, 7, 81])
d2: dict_keys([1, 7, 55, 62, 81, 86, 91, 92, 234, 880])
d3: dict_keys([880, 55, 86, 91, 62, 81, 234, 92, 7, 1])
