# Dictionary

## Usage

모듈의 네임스페이스, 클래스와 인스턴스의 어트리뷰트(attribute), 함수의 키워드 변수 등에 사용.  
아래는 builtin 함수의 네임스페이스.

In [25]:
__builtin__.__dict__

{'__name__': 'builtins',
 '__doc__': "Built-in functions, exceptions, and other objects.\n\nNoteworthy: None is the `nil' object; Ellipsis represents `...' in slices.",
 '__package__': '',
 '__loader__': _frozen_importlib.BuiltinImporter,
 '__spec__': ModuleSpec(name='builtins', loader=<class '_frozen_importlib.BuiltinImporter'>),
 '__build_class__': <function __build_class__>,
 '__import__': <function __import__>,
 'abs': <function abs(x, /)>,
 'all': <function all(iterable, /)>,
 'any': <function any(iterable, /)>,
 'ascii': <function ascii(obj, /)>,
 'bin': <function bin(number, /)>,
 'callable': <function callable(obj, /)>,
 'chr': <function chr(i, /)>,
 'compile': <function compile(source, filename, mode, flags=0, dont_inherit=False, optimize=-1)>,
 'delattr': <function delattr(obj, name, /)>,
 'dir': <function dir>,
 'divmod': <function divmod(x, y, /)>,
 'eval': <function eval(source, globals=None, locals=None, /)>,
 'exec': <function exec(source, globals=None, locals=None, /)>,

## Dictionary Comprehensions

In [24]:
DIAL_CODES = [(86, 'China'),
              (91, 'India'),
              (1, 'United States'),
              (62, 'Indonesia'),
              (55, 'Brazil'),
              (92, 'Pakistan'),
              (880, 'Bangladesh'),
              (234, 'Nigeria'),
              (7, 'Russia'),
              (81, 'Japan'),
              ]
country_code = {country: code for code, country in DIAL_CODES}
print(country_code)

print({country.upper(): code for country, code in country_code.items()})

{'China': 86, 'India': 91, 'United States': 1, 'Indonesia': 62, 'Brazil': 55, 'Pakistan': 92, 'Bangladesh': 880, 'Nigeria': 234, 'Russia': 7, 'Japan': 81}
{'CHINA': 86, 'INDIA': 91, 'UNITED STATES': 1, 'INDONESIA': 62, 'BRAZIL': 55, 'PAKISTAN': 92, 'BANGLADESH': 880, 'NIGERIA': 234, 'RUSSIA': 7, 'JAPAN': 81}


## Interface check

Dictionay기능을 갖는 객체들은 dict, defaultdict, OrderedDict, ChainMap, Counter등이 존재.  
해당 객체들은 `abc.Mapping` 인터페이스로 타입체크. 

In [1]:
from collections import abc
from collections import OrderedDict, defaultdict, ChainMap, Counter

a = {}
b = OrderedDict()
c = defaultdict()
d = ChainMap()
e = Counter()

print(isinstance(a, abc.Mapping), type(a))
print(isinstance(b, abc.Mapping), type(b))
print(isinstance(b, abc.Mapping), type(c))
print(isinstance(b, abc.Mapping), type(d))
print(isinstance(b, abc.Mapping), type(e))

True <class 'dict'>
True <class 'collections.OrderedDict'>
True <class 'collections.defaultdict'>
True <class 'collections.ChainMap'>
True <class 'collections.Counter'>


## Hash table

### Hashable
수명 주기 동안 변하지 않는 해시값을 갖고, 다른 객체와 비교할 수 있으면 객체를 hashable 가능하다고 한다.  
`mutable` 자료형들은 hash값을 갖지 않는다.  
사용자 자료형은 Hashable하다.  

In [19]:
tt = (1, 2, (30, 40))
print('tuple in tuple: \n\tHash id is', hash(tt))

tf = (1,2, frozenset([30, 40]))
print('frozenset in tuple: \n\tHash id is ', hash(tf))

tl = (1,2, [30, 40])
print('list in tuple: \n\tHash id is', hash(tl))

tuple in tuple: 
	Hash id is 8027212646858338501
frozenset in tuple: 
	Hash id is  985328935373711578


TypeError: unhashable type: 'list'

In [15]:
class Custom(object):
    def __init__(self):
        pass
    
    def __hidden(self, x):
        return x

cus1 = Custom()
cus2 = Custom()

print(id(cus1), hash(cus1))
print(id(cus2), hash(cus2))
print(cus1 == cus2)

print(dir(cus1))
print(cus1._Custom__hidden(1))
cus1.__hidden(1)

140603477241528 -9223363249137448213
140603477241472 8787717327592
False
['_Custom__hidden', '__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__']
1


AttributeError: 'Custom' object has no attribute '__hidden'

### Immutable
Immutable 객체들은 `dict`의 `key`가 될 수 있다.  
`str`, `int`, `float`, `tuple`, `bool`, `frozenset` 등이 가능하다.  
사용자 객체도 `key`로 사용이 가능하다.  

In [26]:
a = dict(zip(['1', '2', '3'], [1,2,3]))  # int
b = dict(zip([1,2,3], [1,2,3])) # float
c = dict(zip([1.1, 1.2, 1.3], [1,2,3]))
d = dict(zip([('a', 'b'),(1,2),(1.1, 1.2)], [1,2,3]))
e = dict(zip([True, False], [1,2]))
f = dict(zip([cus1], [1]))


print(a)
print(b)
print(c)
print(d)
print(e)
print(f, f[cus1])

{'1': 1, '2': 2, '3': 3}
{1: 1, 2: 2, 3: 3}
{1.1: 1, 1.2: 2, 1.3: 3}
{('a', 'b'): 1, (1, 2): 2, (1.1, 1.2): 3}
{True: 1, False: 2}
{<__main__.Custom object at 0x7fe0cc50aeb8>: 1} 1


## get() and \__getitem\__()

d[key]형식은 `__getitme__()`을 호출한다. 해당 method는 default값을 설정할 수 없다.  
d.get()형식은 default값을 설정할 수 있다. 값을 설정하지 않으면, `None`을 리턴한다.

In [11]:
a['4']

KeyError: '4'

In [18]:
print(a.get('4', 1))
print(a.get('4'))

1
None


## Spacial handling for missing keys

`__missing__()`은 `d[k]`혹은`__getitem__()`을 사용할 때 호출.  
`in`연산자를 구현하는 `get()`이나 `__contains()__`등의 다른 method에서는 영향을 미치지 않음  

In [12]:
import collections


class StrKeyDict(collections.UserDict):

    def __missing__(self, key):
        if isinstance(key, str):
            raise KeyError(key)
        return self[str(key)]

    def __contains__(self, key):
        return str(key) in self.data

    def __setitem__(self, key, item):
        self.data[str(key)] = item    

# Set

## Set Constructor

Set 생성자는 `{}`와 `set()`로 구분. `{}`사용시 최적화된 생성자가 사용된다.  
하지만 빈 set 생성시 `set()`을 사용한다.

In [4]:
from dis import dis

In [5]:
%%time
dis('{1}')

  1           0 LOAD_CONST               0 (1)
              2 BUILD_SET                1
              4 RETURN_VALUE
CPU times: user 646 µs, sys: 0 ns, total: 646 µs
Wall time: 489 µs


In [6]:
%%time
dis('set([1])')

  1           0 LOAD_NAME                0 (set)
              2 LOAD_CONST               0 (1)
              4 BUILD_LIST               1
              6 CALL_FUNCTION            1
              8 RETURN_VALUE
CPU times: user 653 µs, sys: 0 ns, total: 653 µs
Wall time: 566 µs


In [2]:
a = {}
b = set()

print(type(a), type(b))

<class 'dict'> <class 'set'>


## Set Comprehensions

In [17]:
from unicodedata import name
{chr(i) for i in range(32, 256) if 'SIGN' in name(chr(i),'')} 

{'#',
 '$',
 '%',
 '+',
 '<',
 '=',
 '>',
 '¢',
 '£',
 '¤',
 '¥',
 '§',
 '©',
 '¬',
 '®',
 '°',
 '±',
 'µ',
 '¶',
 '×',
 '÷'}