In [80]:
#예제1
#지능형 딕셔너리 예제
DIAL_CODES = [
    (86, 'China'),
    (91, 'India'),
    (1, 'United States'),
    (55, 'Brazil'),
    (7, 'Russia')
]

In [81]:
country_code = {country: code for code, country in DIAL_CODES}
country_code

{'China': 86, 'India': 91, 'United States': 1, 'Brazil': 55, 'Russia': 7}

In [82]:
{code: country.upper() for country, code in country_code.items()
    if code < 66}

{1: 'UNITED STATES', 55: 'BRAZIL', 7: 'RUSSIA'}

In [83]:
#예제2
#dict.get()을 이용해서 인덱스에서 발생한 단어 목록을 가져와서 갱신하는 예제
import sys, re

WORD_RE = re.compile(r'\+')
index = {}

with open("sejong.txt", encoding='utf-8') as fp:
    for line_no, line in enumerate(fp, 1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start()+1
            location = (line_no, column_no)
            occurence = index.get(word, [])
            occurence.append(location)
            index[word] = occurence

for word in sorted(index, key=str.upper):
    print(word, index[word])

In [84]:
#예제3
#[예제2]와 같은 결과, dict.setdefault() 사용
import sys, re

WORD_RE = re.compile(r'\+')
index = {}

with open("sejong.txt", encoding='utf-8') as fp:
    for line_no, line in enumerate(fp, 1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start()+1
            location = (line_no, column_no)
            index.setdefault(word, []).append(location)

for word in sorted(index, key=str.upper):
    print(word, index[word])

In [85]:
#예제4
#[예제2]와 같은 결과, defaultdict() 사용
import sys, re

WORD_RE = re.compile(r'\+')

index = {}

with open("sejong.txt", encoding='utf-8') as fp:
    for line_no, line in enumerate(fp, 1):
        for match in WORD_RE.finditer(line):
            word = match.group()
            column_no = match.start()+1
            location = (line_no, column_no)
            index.setdefault(word, []).append(location)

for word in sorted(index, key=str.upper):
    print(word, index[word])

In [86]:
#예제5
#조회할 때 키를 문자열로 변환하는 StrKeyDict0
class StrKeyDict0(dict):
    #dict상속

    def __missing__(self, key):

        if isinstance(key, str):
            #키가 문자열인지 확인, 존재하지 않으면 에러 KeyError 발생
            raise KeyError(key)
        return self[str(key)] #키에서 문자열 만들고 조회

    def get(self, key, default=None):
        try:
            return self[key]
        except KeyError:
            #KeyError가 발생하면 __missing__() 메서드 실패 --> default 반환
            return default

    def __contains__(self, key):
        #'key in self': 재귀적으로 __contains__() 호출
        #수정하지 않은 키 (문자열이 아닐 수 있는)를 검색 후, 키에서 만든 문자열로 검색
        return key in self.keys() or str(key) in self.keys()


In [87]:
#예제6
#[예제5] 수행
d = StrKeyDict0([('2', 'two'), ('4', 'four')])
d['2']

'two'

In [88]:
d[4]

'four'

In [89]:
d.get('2')

'two'

In [90]:
d.get(4)

'four'

In [91]:
d.get(1, 'N/A')

'N/A'

In [92]:
2 in d

True

In [93]:
#예제7
#[예제5]에 대한 KeyError 확인: 문자열로 변환됨
d[1]

KeyError: '1'

In [94]:
#예제8
#삽입/갱신/조회 할 때 비문자열 키를 항상 문자열로 변환 ([예제5]와 비교)
import collections

class StrKeyDict(collections.UserDict):

    def __missing__(self, key):
        if isinstance(key, str):
            raise KeyError(key)
        return self[str(key)]

    def __contains__(self, key):
        return str(key) in self.data

    def __setitem__(self, key, item):
        self.data[str(key)] = item

In [95]:
#예제9
#dict에서 읽기 전용 mappingproxy 객체를 생성하는 MappingProxyType
from types import MappingProxyType
d = {1: 'A'}
d_proxy = MappingProxyType(d)

In [96]:
d_proxy

mappingproxy({1: 'A'})

In [97]:
d_proxy[1]

'A'

In [98]:
d_proxy[2] = 'x'

TypeError: 'mappingproxy' object does not support item assignment

In [99]:
d[2] = 'B'
d_proxy

mappingproxy({1: 'A', 2: 'B'})

In [100]:
#예제10
#set 예제
l = ["spam", "spam", "eggs", "spam"]
set(l)

{'eggs', 'spam'}

In [101]:
list(set(l))

['spam', 'eggs']

In [103]:
#예제11
#'l'안에서 'm'의 발생 횟수 구하기
l = set(["spam", "spam", "eggs", "spam", "eggs", "meats", "onions", "onions"])
m = set(["eggs", "onions"])

found = len(l&m)
found

2

In [104]:
found = 0
for n in m :
    if n in l:
        found += 1

found

2

In [105]:
found = len(l.intersection(m))
found

2

In [106]:
#예제12
#집합 리터럴 확인
s = {1}
print(type(s))
print(s)

s.pop()
print(s)

<class 'set'>
{1}
set()


In [107]:
#예제13
#유니코드명 안에 'SIGN'이 들어있는 단어를 가진 Latin-l 문자들의 집합 만들기
from unicodedata import name
{chr(i) for i in range(32,256) if "SIGN" in name(chr(i), '')}

{'#',
 '$',
 '%',
 '+',
 '<',
 '=',
 '>',
 '¢',
 '£',
 '¤',
 '¥',
 '§',
 '©',
 '¬',
 '®',
 '°',
 '±',
 'µ',
 '¶',
 '×',
 '÷'}

In [110]:
#예제14
#동일한 데이터를 서로 다른 방식으로 정렬한 세 개의 딕셔너리 채우기
DIAL_CODES = [
    (82, 'Korea'),
    (91, 'India'),
    (1, 'United States'),
    (92, 'Pakistan'),
    (7, 'Russia')
]

#인구가 많은 순서대로 정렬된 튜플 생성
d1 = dict(DIAL_CODES)
print(f'd1: {d1.keys()}')

#국제전화 코드로 정렬된 튜플 생성
d2 = dict(sorted(DIAL_CODES))
print(f'd2: {d2.keys()}')

#국가명으로 정렬된 튜플 생성
d3 = dict(sorted(DIAL_CODES, key=lambda x:x[1]))
print(f'd3: {d3.keys()}')

assert d1 == d2 and d2 == d3
#딕셔너리가 모두 동일한 키-값 쌍을 갖고 있음을 판단

d1: dict_keys([82, 91, 1, 92, 7])
d2: dict_keys([1, 7, 82, 91, 92])
d3: dict_keys([91, 82, 92, 7, 1])
