# Chapter3. Dictionaries and Sets
> 어떤 코드든지 우리가 explict 하게 dictionary를 사용하지 않더라도, 내부적으로 dictionary를 사용한다

```python
dict 는 실제로 우리가 코드를 짤 때 뿐만 아니라, fundamental 한 부분에서도 많이 활용되고 있다. 
module namespaces, class, instance attributes, function keyword arguments 같은 것들이 dictionary가 쓰이는 fundamental constructs 에 해당한다. 

```
* namespaces: 프로그램 내의 이름들이 unique하도록 -> 충돌없이 잘 실행될 수 있도록 한다. \
Local, Global, Built-in, Enclosing Namespaces가 있으며, enclosing은 특정 모듈안에 다른 function이 있는 경우를 지칭한다. \
예를 들어, 모듈 math 와 cmath 모두에 log10(), acos() 와 같은 function들이 있고, 이런 function들을 unambiguous 하게 사용하기 위해서는 math.log10() cmath.log10() 이런 식으로 정확히 나타내어 줘야한다. 

python의 경우, `dict` 가 중요한 역할을 하기 때문에, 잘 optimized 되어 있고, 이를 위해 _hash table_ 이 중요한 역할을 하고 있다. 




In [4]:
# built-in Namespaces (built-in function들을 확인할 수 있음)
print(dir(__builtins__))
print(len(dir(__builtins__)))

155


## 3.1 Generic Mapping Types
`collections.abc` 모듈은 Mapping 이랑 MutableMapping ABCs를 제공 <- dict 이나 비슷한 data types의 interface를 formalize 하는 역할\
이 ABCs 는 mapping을 위한 기본적인 최소한의 interface를 documenting하고, formalizing 한다는 데에 주된 의미가 있다. 

모든 standard library에 있는 모든 mapping types 들은 기본적인 dict이라 key가 반드시 _hashable_해야한다는 공통적인 제한점이 있다. (value는 상관 없음)

In [None]:
# import collections
import collections.abc
my_dict = {}
# isinstance(my_dict, collections.Mapping)
isinstance(my_dict, collections.abc.Mapping) #using isinstance for chekcing whether a function argument is of dict type

True

#### what is hashable?
python glossary에서 찾을 수 있는 definition은 다음과 같다
> An object is hashable if it has a hash value which never changes during its lifetime (it needs a `__hash__()` method), and cna be compared to other objects (it needs an `__eq__()` method). Hashable objects which compared equal must have the same hash value 

예를 들면, atomic immutable types(`str`, `bytes`, numerical types) 는 모두 hashable 하다 (immutable)
이는 변수 자체의 변경이 불가능 하다는 것을 의미하는 것이 아니다. 실제, 프로그램 내에서 "="(assignment) 를 통해서 모든 변수는 변경될 수 있다.\
mutable의 의미는 그 객체를 가리키는 (reference) identity(id)의 변경 없이 객체 값을 변경할 수 있다는 것을, immutable 하다는 것은 그 객체를 가리키는 (reference) identity(id) 의 변경 없이 객체값을 변경할 수 없음을 의미한다. 

이것이 가능한 것은 컬렉션 데이터 타입의 경우, 객체 자체의 주소는 동일하게 가져가지만, 그 element의 일부 값을 변경할 수 있기 때문이다.




In [7]:
# id function을 통해 hashable/unhashble 여부 판단하기 (hash function을 대신 사용할 수 있음)
# immutable x, y
from re import X


x = 3
print(id(x))

y = X
print(id(x))
print(id(y)) # x와 id가 달라짐

y = 4
print(id(y)) #y에 다른 값을 할당하면, 그 전의 id와 값이 달라짐 ()

# mutable list: 모두 id가 동일함을 알 수 있음
my_list = [1,2,3]
print(id(my_list))

my_list2 = my_list
print(my_list2)
print(id(my_list2))

my_list2[0] = 4
print(my_list2)
print(id(my_list2)) # 값을 바꾸더라도 id가 동일


94902926730240
94902926730240
139681250437472
94902926730272
139680626140416
[1, 2, 3]
139680626140416
[4, 2, 3]
139680626140416


### dict Comprehensions
하나의 dictionary를 다른 dictionary로 transforming하는 방법으로, 이를 잘 사용하면 코드가 좀 더 읽기 쉬워진다

In [12]:
# Example 3-1. 하나의 list of tuples 로 부터 두개의 서로 다른 dictionary 만들기

DIAL_CODES = [
    (86, 'China'),
    (91, 'India'),
    (1, 'United States'),
    (62, 'Indonesia'),
    (55, 'Brazil'),
    (92, 'Pakistan'),
    (880, 'Bangladesh'),

]

country_code = {country: code for code, country in DIAL_CODES}
print(country_code)
country_code2 = {code: country.upper() for country, code in country_code.items() if code < 66}
print(country_code2)


{'China': 86, 'India': 91, 'United States': 1, 'Indonesia': 62, 'Brazil': 55, 'Pakistan': 92, 'Bangladesh': 880}
{1: 'UNITED STATES', 62: 'INDONESIA', 55: 'BRAZIL'}


### Handling Missing keys with setdefault
일반적인 dictionary 에서 만약 key가 존재하지 않는다면 key error를 발생시키거나, `dict.get(key, default)` 이렇게 해서 alternative를 제공한다.

In [17]:
# using normal dict
d={}
d['Apple']=50
d['Orange']=20
print(d['Apple'])
try:
    print(d['Grapes'])# This gives Key Error
except:
    print('"Grapes" is not in key list, so it raise keyError')
# avoiding KeyError by using defaulting
d={}
d['Apple']=50
d['Orange']=20
print(d['Apple'])
print(d.get('Apple'))
print(d.get('Grapes',0)) # DEFAULTING

# Using Default dict
from collections import defaultdict
d = defaultdict(int) ## inside parenthesis we say what should be the default value.
d['Apple']=50
d['Orange']=20
print(d['Apple'])
print(d['Grapes']) ##→ This gives Will not give error

# using an user defined function to defualt the value
from collections import defaultdict
def mydefault():
        return 0

d = defaultdict(mydefault)
d['Apple']=50
d['Orange']=20
print(d['Apple'])
print(d['Grapes'])


50
"Grapes" is not in key list, so it raise keyError
50
50
0
50
0
50
0


In [19]:
class StrkeyDict0(dict):
    def __missing__(self, key):
        if isinstance(key, str):
            raise KeyError(key)
        return self[str(key)]
    
    def get(self, key, default=None):
        try:
            return self[key]
        except KeyError:
            return default
    
    def __contains__(self, key):
        return key in self.keys() or str(key) in self.keys()


d = StrkeyDict0([('2', 'two'), ('4', 'four')])
print(d['2'])
print(d[4])
# print(d[1]) #raise KeyError

print(d.get('2'))
print(d.get(4))
print(d.get(1, 'N/A'))

2 in d
1 in d

two
four
two
four
N/A


False

### Subclassing UserDict
일반적으로 mapping type 을 새로 만들어주고 싶을 때, `dict` 를 쓰는 것 보다, `UserDict`를 쓰는게 더 쉽다!\
가장 큰 이유는 `UserDict` 을 사용하면  문제없이 inherit 할 수 있는 method들을 그냥 `dict` 를 쓰면 무시하게 된다.

chap12 p.384에 있는 예시를 보면, `__init__`, `update` method가 `__setitem__` method를 그냥 무시해버린다

In [23]:
class DoopelDict(dict):
    def __setitem__(self, key, value):
        super().__setitem__(key, [value]*2)

dd = DoopelDict(one=1)
print(dd)

dd['two'] = 2
print(dd)

dd.update(three=3)
print(dd)

{'one': 1}
{'one': 1, 'two': [2, 2]}
{'one': 1, 'two': [2, 2], 'three': 3}


In [25]:
class StrKeyDict(collections.UserDict):
    def __missing__(self, key):
        if isinstance(key, str):
            raise KeyError(key)
        return self[str(key)]
    
    def __contains__(self, key): # 위의 StrKeyDict0 에서 했던 것과 동일한 역할을 하지만, 훨 simple
        return  str(key) in self.data
    
    def __setitem__(self, key, item):
        self.data[str(key)] = item


d = StrKeyDict([('2', 'two'), ('4', 'four')])
print(d['2'])
print(d[4])
# print(d[1]) #raise KeyError

print(d.get('2'))
print(d.get(4))
print(d.get(1, 'N/A'))

2 in d
1 in d

two
four
two
four
N/A


False

### Immutable Mappings
standard library에서 제공하는 모든 mapping type들은 mutable 하지만, 우리는 가끔 user가 mapping을 실수로라도 변경하지 못하도록 하고싶은 경우가 있다.\
그럴때는 `wrapper` class에서 `MappingProxy`로 감싸주면 read-only instance인 `mappingproxy` 를 return 한다.

수정을 하고 싶을 때에는 원래의 mutable data를 수정하면 이가 반영된 mappingproxy가 나옴을 알 수 있다.

In [29]:
from types import MappingProxyType
d = {1: 'A'}
d_proxy = MappingProxyType(d)
print(d_proxy)

print(d_proxy[1])

# 이건 error 발생
# d_proxy[2] = 'x'

d[2] = 'x'
d_proxy


{1: 'A'}
A


mappingproxy({1: 'A', 2: 'x'})

## Set Theory
set type은 상대적으로 python에서 새롭게 생긴 data type으로, \
collection of unique object로, basic use case로는 removing duplication이 있다. 

set elements 는 반드시 hashable해야 하지만, set type은 hashable 하지 않다./
 그렇기 때문에, frozenset` 을 set 내의 element로서 가질 수 있다. 

말그대로 set 이기 때문에, 우리가 일반적으로 생각하고 있는 '집합' 의 연산이 가능하다 (만약 집합연산으로 하는게 유리한 상황이라면 set을 쓰는 것도 좋은 생각일 것 같다!)

In [32]:
l = ['spam', 'spam', 'eggs', 'spam']
s = set(l)
print(s)
list(s)

{'spam', 'eggs'}


['spam', 'eggs']

### set Literals

In [None]:
wiri