# 1. 일반적인 매핑형

In [3]:
my_dict = {}
import collections
isinstance(my_dict, collections.abc.Mapping) # 함수 인수가 dict형인지 검사하는 것보다 isinstance()함수를 사용하는 것이 좋다.
                                             # 다른 매핑형이 사용될 수도 있기 때문이다.

True

##### Python 표준 라이브러리에서 제공하는 매핑형은 모두 dict를 이용해서 구현하므로, 키가 해시가능해야 한다는 제한을 갖고 있다.

<h3> 해시 가능 </h3>
  
수명 주기 동안 결코 변하지 않는 해시값을 갖고 있고(__hash__() 메서드가 필요하다) 다른 객체와 비교할 수 있으면(__eq__() 메서드가 필요하다.) 객체를 해시 가능하다고 한다. 동일하다고 판단되는 객체는 반드시 해시값이 동일해야 한다.

In [7]:
tt = (1, 2, (30, 40))
hash(tt)

-3907003130834322577

In [20]:
tl = (1, 2, [30, 40])
hash(tl)

TypeError: unhashable type: 'list'

In [22]:
tf = (1, 2, frozenset([30, 40]))
hash(tf)

5149391500123939311

In [35]:
a = dict(one=1, two=2, three=3)
b = {'one':1, 'two':2, 'three':3}
c = dict(zip(['one', 'two', 'three'], [1,2,3]))
d = dict([('two', 2), ('one', 1), ('three', 3)])
e = dict({'three':3, 'one':1, 'two': 2})
a == b == c == d == e

True

# 2. 지능형 딕셔너리(Dictionary Comprehension)

In [43]:
DIAL_CODES = [
		(86, 'China'),
        (91, 'India'),
        (1, 'United States'),
        (62, 'Indonesia'),
        (55, 'Brazil'),
        (92, 'Pakistan'),
        (880, 'Bangladesh'),
        (234, 'Nigeria'),
        (7, 'Russia'),
        (81, 'Japan'),
   ]

contry_code = {contry : code for code, contry in DIAL_CODES}
contry_code

{'China': 86,
 'India': 91,
 'United States': 1,
 'Indonesia': 62,
 'Brazil': 55,
 'Pakistan': 92,
 'Bangladesh': 880,
 'Nigeria': 234,
 'Russia': 7,
 'Japan': 81}

In [47]:
{code : contry.upper() for contry, code in contry_code.items() if code < 66}

{1: 'UNITED STATES', 62: 'INDONESIA', 55: 'BRAZIL', 7: 'RUSSIA'}

# 3. 공통적인 매핑 메서드

![이미지 설명](https://velog.velcdn.com/images/qsdcfd/post/7e260113-4116-456e-9b18-3c469bf272e5/image.png)


### 3.1 존재하지 않는 키를 setdefault()로 처리하기

In [64]:
import sys
import re

WORD_RE = re.compile(r'\w+')

index = {}

with open(sys.argv[0], encoding='utf-8') as fp:
    for line_no, line in enumerate(fp,1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start() + 1
            location = (line_no, column_no)
            #보기 좋은 코드는 아니지만 설명
            occurrences = index. get(word,[])
            occurrences.append(location)
            index[word] = occurrences
            
for word in sorted(index, key=str.upper):
    print(word, index[word])

0 [(12, 17), (13, 22)]
added [(11, 15)]
after [(4, 1)]
an [(1, 30)]
app [(15, 40), (17, 5)]
as [(15, 37)]
avoid [(3, 55)]
back [(11, 21)]
by [(11, 26)]
can [(3, 51)]
cwd [(4, 20)]
CWD [(10, 18)]
del [(13, 9)]
doing [(3, 61)]
Entry [(1, 4)]
for [(1, 16)]
from [(3, 18), (4, 24), (10, 22), (15, 5)]
if [(9, 1), (12, 5)]
import [(7, 1), (15, 20)]
imports [(3, 67)]
init_path [(11, 49)]
InteractiveShellApp [(11, 29)]
ipykernel [(3, 27), (15, 10)]
IPython [(1, 33)]
is [(3, 6), (11, 12)]
kernel [(1, 41)]
kernelapp [(15, 27)]
launching [(1, 20)]
launch_new_instance [(17, 9)]
load [(10, 45)]
package [(3, 37)]
path [(4, 33), (10, 31), (12, 12), (13, 17)]
point [(1, 10)]
Remove [(10, 7)]
removing [(4, 7)]
separate [(3, 9)]
so [(3, 45)]
stuff [(10, 50)]
sys [(4, 29), (7, 8), (10, 27), (12, 8), (13, 13)]
the [(3, 23), (4, 16), (10, 14)]
This [(3, 1), (11, 7)]
until [(3, 75)]
we [(3, 48), (10, 42)]
while [(10, 36)]
__main__ [(9, 17)]
__name__ [(9, 4)]


In [74]:

"""단어가 나타나는 위치를 가리키는 인덱스를 만든다."""

import sys
import re

WORD_Re = re.compile(r'\w+')

index = {}

with open(sys.argv[0], encoding='utf-8') as fp:
    for line_no, line in enumerate(fp,1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start() + 1
            location = (line_no, column_no)
            index.setdefault(word,[]).append(location) ##dict.setdefault()사용
            
for word in sorted(index, key=str.upper):
    print(word, index[word])


0 [(12, 17), (13, 22)]
added [(11, 15)]
after [(4, 1)]
an [(1, 30)]
app [(15, 40), (17, 5)]
as [(15, 37)]
avoid [(3, 55)]
back [(11, 21)]
by [(11, 26)]
can [(3, 51)]
cwd [(4, 20)]
CWD [(10, 18)]
del [(13, 9)]
doing [(3, 61)]
Entry [(1, 4)]
for [(1, 16)]
from [(3, 18), (4, 24), (10, 22), (15, 5)]
if [(9, 1), (12, 5)]
import [(7, 1), (15, 20)]
imports [(3, 67)]
init_path [(11, 49)]
InteractiveShellApp [(11, 29)]
ipykernel [(3, 27), (15, 10)]
IPython [(1, 33)]
is [(3, 6), (11, 12)]
kernel [(1, 41)]
kernelapp [(15, 27)]
launching [(1, 20)]
launch_new_instance [(17, 9)]
load [(10, 45)]
package [(3, 37)]
path [(4, 33), (10, 31), (12, 12), (13, 17)]
point [(1, 10)]
Remove [(10, 7)]
removing [(4, 7)]
separate [(3, 9)]
so [(3, 45)]
stuff [(10, 50)]
sys [(4, 29), (7, 8), (10, 27), (12, 8), (13, 13)]
the [(3, 23), (4, 16), (10, 14)]
This [(3, 1), (11, 7)]
until [(3, 75)]
we [(3, 48), (10, 42)]
while [(10, 36)]
__main__ [(9, 17)]
__name__ [(9, 4)]


# 4. 융통성 있게 키를 조회하는 매핑

검색할 때 키가 존재하지 않을 때 특별한 값을 반환하는 매핑이 있으면 편리한 경우들이 있고 이를 만드는 것은 두 가지가 있다. 첫 번째, 평벙한 dict대신 defaultdict를 사용하는 방법이고 다른 하나는 dict등의 매핑형을 상속해서 missing()메서드를 추가하는 방법입니다.

### 4.1 defaultdict: 존재하지 않는 키에 대한 또 다른 처리

In [86]:
#index_default.py: setdefault() 메서드 대신 defaultdict 객체 사용하기

# """
# default_factory 에 list 생성자를 갖고 있는 defaultdict를 생성한다.
# f) word가 index에 들어 있지 않으면 default_factory를 호출해서 없는 값에 대한 항목을 생성하는데, 

# 여기서는 빈 리스트를 생성해서 index[word] 에 할당한 후 반환하므로, append (location ) 연산은 언제나 성공한다.

# """
# "＂＂단어가 나타나는 위치를 가리키는 인덱스를 만든다."＂＂
import sys
import re
import collections
WORD_RE = re.compile(r'\w+')
index = collections . defaultdict( list )
with open(sys.argv[0], encoding='utf-8' ) as fp:
    for line_no, line in enumerate(fp, 1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start()+1
            location = (line_no, column_no)
            index[word] .append(location)
#알파벳순으로 출력한다.
for word in sorted(index, key=str.upper):
    print(word, index[word])

0 [(12, 17), (13, 22)]
added [(11, 15)]
after [(4, 1)]
an [(1, 30)]
app [(15, 40), (17, 5)]
as [(15, 37)]
avoid [(3, 55)]
back [(11, 21)]
by [(11, 26)]
can [(3, 51)]
cwd [(4, 20)]
CWD [(10, 18)]
del [(13, 9)]
doing [(3, 61)]
Entry [(1, 4)]
for [(1, 16)]
from [(3, 18), (4, 24), (10, 22), (15, 5)]
if [(9, 1), (12, 5)]
import [(7, 1), (15, 20)]
imports [(3, 67)]
init_path [(11, 49)]
InteractiveShellApp [(11, 29)]
ipykernel [(3, 27), (15, 10)]
IPython [(1, 33)]
is [(3, 6), (11, 12)]
kernel [(1, 41)]
kernelapp [(15, 27)]
launching [(1, 20)]
launch_new_instance [(17, 9)]
load [(10, 45)]
package [(3, 37)]
path [(4, 33), (10, 31), (12, 12), (13, 17)]
point [(1, 10)]
Remove [(10, 7)]
removing [(4, 7)]
separate [(3, 9)]
so [(3, 45)]
stuff [(10, 50)]
sys [(4, 29), (7, 8), (10, 27), (12, 8), (13, 13)]
the [(3, 23), (4, 16), (10, 14)]
This [(3, 1), (11, 7)]
until [(3, 75)]
we [(3, 48), (10, 42)]
while [(10, 36)]
__main__ [(9, 17)]
__name__ [(9, 4)]


### 4.2 __missing__() 메서드

------------
매핑형은 이름으로도 쉽게 추측할 수 있는 missing() 메서드를 이용헤서 존재하지 않는 키를 처리하고 특수 메서드는 기본 클래스인 dict에는 정의되어 있지 않지만, dict는 알고 있다.
그러므로 dicr 클래스를 상속하고 missing() 메서드를 정의하면 dict.getitem() 표준 메서드가 키를 발견할 수 없을 때 KeyError를 발생시키지 않고 missing() 메서드를 호출한다.

In [90]:
# 비문자열 키를 검색할 때 키를 발견하지 못하면 키를 문자열로 변환하는 StrKeyDict0
class StrKeyDict0(dict):
    
    def __missing__(self,key):
        if isinstance(key, str):
            raise KeyError(key)
        return self[str(key)]

    def get(self, key, default=None):
        try:
            return self[key]
        except KeyError:
            return default

    def  __contains__(self, key):
        return key in self.keys() or str(key) in self.keys()

    

##### d[key] 표기법을 이용하여 항목을 가져오는 테스트

In [104]:
d = StrKeyDict0([('2', 'two'), (4, 'four')])
d['2']

'two'

In [105]:
d[4]

'four'

In [106]:
d[1]

KeyError: '1'

##### d.get(key) 표기법을 이용하여 항목을 가져오는 테스트

In [107]:
d.get('2')

'two'

In [108]:
d.get(4)

'four'

In [111]:
d.get(1, 'N/A')

'N/A'

##### in 연산자 테스트 

In [113]:
2 in d

True

In [114]:
1 in d

False

#  그 외 매핑형

##### collections.OrderedDict
키를 삽입한 순서대로 유지함으로써 항목을 반복하는 순서를 예측할 수 있다. 따라서 popitem() 메서드를 사용할 수 있다. popitem(last=True)로 처음 삽입한 항목도 꺼낼 수 있다.

##### collections.ChainMap
매핑들의 목록을 담고 있으며 한꺼번에 모두 검색할 수 있다. 각 매핑을 차례대로 검색하고, 그중 하나에서라도 키가 검색되면 성공한다.

##### collections.Counter
모든 키에 정수형 카운터를 갖고 있는 매핑. 기존 키를 갱신하면 카운터가 늘어난다. n개의 가장 널리 사용된 항목과 그들의 카운터로 구성된 튜플의 리스트를 반환하는 most_commom([n]) 등의 메서드를 제공한다.

In [57]:
from collections import Counter
ct = Counter('asdfasfvsavasdcasdvsadcd')
ct

Counter({'a': 6, 's': 6, 'd': 5, 'f': 2, 'v': 3, 'c': 2})

In [54]:
ct.update('aaaazzzzz')
ct

Counter({'a': 10, 's': 6, 'd': 5, 'f': 2, 'v': 3, 'c': 2, 'z': 5})

##### collections.UserDict
표준 dict처럼 작동하는 매핑을 순수 파이썬으로 구현한 클래스

# 6. UserDict 상속하기

In [58]:
import collections

class StrKeyDict(collections.UserDict): # UserDict 상속
    
    def __missing__(self, key):
        if isinstance(key, str):
            raise KeyError(key)
        return self[str(key)]
    
    def __contains__(self, key):
        return str(key) in self.data
    
    def __setitem__(self, key, item):
        self.data[str(key)] = item

In [71]:
d = StrKeyDict([('2','two'),('4','four')])
d[2]

'two'

UserDict 클래스가 MutableMapping을 상속하므로 StrKeyDict는 매핑의 모든 기능을 가지게 된다. 따라서 StrKeyDict0.get()과 동일하게 구현된 Mapping.get()을 상속받으므로 구현할 필요가 없다.

# 7. 불변 매핑

매핑형은 모두 가변형이지만, types 모듈의 MappingProxyType 래퍼 클래스를 이용하면 원래 매핑의 동적인 뷰를 제공하는 mappingproxy 객체를 반환받는다. 따라서 원래 매핑을 변경하면 mappingproxy에 반영되지만, mappingproxy를 직접 변경할 수는 없다.

In [73]:
from types import MappingProxyType
d = {1: 'A'}
d_proxy = MappingProxyType(d)
d_proxy

mappingproxy({1: 'A'})

In [74]:
d_proxy[1]

'A'

In [77]:
d_proxy[2] = 'x'

TypeError: 'mappingproxy' object does not support item assignment

In [79]:
d[2] = 'sd'
d_proxy

mappingproxy({1: 'A', 2: 'sd'})

In [80]:
d_proxy[2]

'sd'

# 8. 집합 이론

집합 요소는 반드시 해시할 수 있어야 한다. set은 해시 가능하지 않지만 frozenset은 해시 가능하므로, frozenset이 set에 들어갈 수 있다. 또한 집합형은 다음과 같은 연산을 구현한다.  

 - a | b : 합집합
 - a & b : 교집합
 - a - b : 차집합

In [82]:
l = ['spam', 'spam', 'egg', 'spam']
set(l)

{'egg', 'spam'}

In [83]:
list(set(l))

['spam', 'egg']

### 8.1 집합 리터럴

공집합은 리터럴로 표기할 수 없으므로, 반드시 set()으로 표기해야 한다. {1,2,3}과 같은 리터럴 집합 구문은 set([1,2,3])처럼 생성자를 호출하는 것보다 더 빠르고 가독성이 좋다(리터럴 구문을 사용하면 파이썬은 BUILD_SET이라는 특수 바이트코드를 실행한다.

In [96]:
from dis import dis
dis('{1}')

  1           0 LOAD_CONST               0 (1)
              2 BUILD_SET                1
              4 RETURN_VALUE


In [100]:
dis('set([1])')

  1           0 LOAD_NAME                0 (set)
              2 LOAD_CONST               0 (1)
              4 BUILD_LIST               1
              6 CALL_FUNCTION            1
              8 RETURN_VALUE


frozenset은 별도의 리터럴 구문이 없으며, frozenset은 언제나 생성자를 호출해서 생성해야 한다.

In [102]:
frozenset(range(10))

frozenset({0, 1, 2, 3, 4, 5, 6, 7, 8, 9})

### 8.2 지능형 집합(Set Comprehension)

In [103]:
from unicodedata import name
{chr(i) for i in range(32,256) if 'SIGN' in name(chr(i),'')}

{'#',
 '$',
 '%',
 '+',
 '<',
 '=',
 '>',
 '¢',
 '£',
 '¤',
 '¥',
 '§',
 '©',
 '¬',
 '®',
 '°',
 '±',
 'µ',
 '¶',
 '×',
 '÷'}

In [120]:
name(chr(246),''), chr(246)

('LATIN SMALL LETTER O WITH DIAERESIS', 'ö')

In [121]:
name(chr(247),''), chr(247)

('DIVISION SIGN', '÷')

### 8.3 집합 연산
<img src="https://velog.velcdn.com/images/qsdcfd/post/737e35bb-3c9a-40cf-ae97-cadbbba0c97d/image.png"  width="500">
<img src="https://velog.velcdn.com/images/qsdcfd/post/1271204d-0fc1-48c7-8f82-3a40ebcac247/image.png"  width="500">
<img src="https://velog.velcdn.com/images/qsdcfd/post/523158b5-f71a-484f-8ba5-aab9bb1bed00/image.png"  width="500">