# Reference
* https://ddanggle.gitbooks.io/interpy-kr/content/ch12-Collections.html
* https://docs.python.org/3/library/collections.html#module-collections

In [28]:
from collections import defaultdict
from collections import OrderedDict
from collections import Counter

### defaultdict
* dict와는 달리 defaultdict를 사용하면 key값의 존재 유무를 확인할 필요가 없음.
* dict.set_default를 사용하는 것보다 빠름

In [38]:
colours = (
  ('태희', '노랑'),
  ('지훈', '파랑'),
  ('별이', '초록'),
  ('지훈', '검정'),
  ('태희', '빨강'),
  ('샛별', '실버'),
)

favorite_colors = defaultdict(list)
for name, color in colours:
    favorite_colors[name].append(color)
    
favorite_colors

defaultdict(<class 'list'>, {'별이': ['초록'], '샛별': ['실버'], '태희': ['노랑', '빨강'], '지훈': ['파랑', '검정']})

In [43]:
some_dict = {}
some_dict['colors']['favorite'] = "노랑"

KeyError: 'colors'

In [44]:
tree = lambda : defaultdict(tree)
some_dict = tree()
some_dict['colors']['favorite'] = "노랑"

In [45]:
some_dict

defaultdict(<function <lambda> at 0x0000000006B622F0>, {'colors': defaultdict(<function <lambda> at 0x0000000006B622F0>, {'favorite': '노랑'})})

In [46]:
import json
print(json.dumps(some_dict))

{"colors": {"favorite": "\ub178\ub791"}}


In [61]:
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d = {}
for k,v in s:
    d.setdefault(k, []).append(v)

sorted(d.items())

[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

In [62]:
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d = defaultdict(list)
for k,v in s:
    d[k].append(v)
sorted(d.items())

[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

* int() 함수를 defaultdict에 넣어주면 default 값이 0으로 정해짐

In [52]:
s = 'mississippi'
d = defaultdict(int)
for k in s:
    d[k] += 1

sorted(d.items())

[('i', 4), ('m', 1), ('p', 2), ('s', 4)]

A faster and more flexible way to create constant functions 
is to use a lambda function which can supply any constant value (not just zero)

(0이 아닌) 어떠한 상수 값을 지원할 수 있는 lambda function을 사용하는 것은 상수 함수를 만드는 더 빠르고 더 융통적인 방법이다.

In [53]:
def constant_factory(value):
    return lambda : value

d = defaultdict(constant_factory('<missing>'))
d.update(name='youngho', action='ran')
'%(name)s %(action)s to %(object)s' % d

'youngho ran to <missing>'

In [58]:
s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]
d = defaultdict(set)
for k, v in s:
    d[k].add(v)
    
sorted(d.items())

[('blue', {2, 4}), ('red', {1, 3})]

### OrderedDict

* 처음 삽입 될 때의 순서대로 항목을 정렬 된 상태로 유지. 기존 키의 값을 덮어 쓰더라고 해당 키의 위치는 변경되지 않음.

* 그러나 항목을 삭제했다가 다시 삽입하면 키가 사전 끝으로 이동함.

* 기존 dict 에서는 예측할 수 없는 순서로 항목이 검색됨

In [47]:
colors = {'빨강' : 198, '녹색' : 170, '파랑' : 160}
for key, value in colors.items():
    print(key, value)

파랑 160
빨강 198
녹색 170


* Ordereddict를 사용하면 입력 순서가 유지 됨

In [51]:
colors = OrderedDict([('빨강', 198), ('녹색', 170), ('파랑', 160)])
for key, value in colors.items():
    print(key, value)

빨강 198
녹색 170
파랑 160


* 기존 항목을 지웠다가 다시 삽입하면 키가 사전 끝으로 이동

In [60]:
del colors['빨강']
colors['빨강'] = 198
for key, value in colors.items():
    print(key, value)

녹색 170
파랑 160
빨강 198


In [77]:
d = OrderedDict.fromkeys('abcde')
print(d)
d.move_to_end('b')
print(''.join(d.keys()))

OrderedDict([('a', None), ('b', None), ('c', None), ('d', None), ('e', None)])
acdeb


In [78]:
d.move_to_end('b', last=False) # b를 첫번째로 옮기기
print(''.join(d.keys()))

bacde


### Counter

In [32]:
colours = (
  ('태희', '노랑'),
  ('지훈', '파랑'),
  ('별이', '초록'),
  ('지훈', '검정'),
  ('태희', '빨강'),
  ('샛별', '실버'),
)

favs = Counter(name for name, color in colours)
colors = Counter(color for name, color  in colours)
print(favs)
print(colors)

Counter({'태희': 2, '지훈': 2, '별이': 1, '샛별': 1})
Counter({'초록': 1, '검정': 1, '실버': 1, '빨강': 1, '파랑': 1, '노랑': 1})


In [80]:
sorted(favs.elements())

['별이', '샛별', '지훈', '지훈', '태희', '태희']

In [81]:
favs.most_common(3)

[('태희', 2), ('지훈', 2), ('별이', 1)]

### deque

* deque는 추가나 삭제가 양 쪽에서 가능한 double ended queue를 제공한다.

In [82]:
from collections import deque

In [83]:
d = deque()
d.append('1')
d.append('2')
d.append('3')
print(len(d))
print(d[0])
print(d[-1])

3
1
3


* deque가 가질 수 있는 아이템의 수에도 제한을 둘 수 있다. 이 방법을 사용하면 아이템 개수가 최대에 도달했을 때 반대쪽 끝에서 아이템들이 튀어 나옴.

In [89]:
d = deque(maxlen=5)
d.extend([1,2,3,4,5])
print(d)
d.append(6)
print(d)
d.append(7)
print(d)
d.extendleft([1,5,4])
print(d)

deque([1, 2, 3, 4, 5], maxlen=5)
deque([2, 3, 4, 5, 6], maxlen=5)
deque([3, 4, 5, 6, 7], maxlen=5)
deque([4, 5, 1, 3, 4], maxlen=5)


* pop() : 마지막 element가 제거
* popleft() : 맨 왼쪽에 있던 element가 제거 

In [90]:
d.pop()
print(d)
d.popleft()
print(d)

deque([4, 5, 1, 3], maxlen=5)
deque([5, 1, 3], maxlen=5)


### namedtuple

* tuple : 튜플은 기본적으로 값의 순서를 쉼표로 구분하여 저장할 수 있는 불변의 리스트이다. 리스트와 거의 비슷하지만 리스트와 달리, 튜플에 있는 항목을 재할당 할 수 없다.

* namedtuple : 간단한 작업을 위해 튜플을 편리한 컨테이너로 변환함. namedtuple를 사용하면 튜플 안의 값들에 접근하기 위해 정수 인덱스 값들을 사용할 필요가 없다.

* namedtuple은 인자가 두개가 필요
   * 튜플의 이름과 튜플의 필드이름
       * 밑의 예시에서 보면 튜플의 이름 : Animal
       * 튜플의 필드 이름은 'name', 'age', 'cat'
* 네임튜플은 튜플들을 자가문서화(self-document)한다.


* 튜플의 멤버에 엑세스하기 위해 정수 인덱스를 사용할 필요가 없으므로 코드 유지 관리하기가 더 쉬움. 게다가 "*네임튜플" 인스턴스는 인스턴스당 사전들을 가지지 않으므로*, 일반 튜플보다 더 가볍고 메모리 사용량을 줄일 수 있음. 그래서 사전형보다 더 빠름. 그러나 튜플이기 때문에 네임튜플의 속성들은 불변!

In [93]:
from collections import namedtuple

Animal = namedtuple('Animal', 'name age type')
perry = Animal(name="perry", age=31, type='cat')
print(perry)
print(perry.name)

Animal(name='perry', age=31, type='cat')
perry


In [99]:
perry.age = 42

AttributeError: can't set attribute

In [100]:
print(perry[0])

perry


* 네임튜플을 사전형으로 변환할 수 있음

In [102]:
print(perry._asdict())

OrderedDict([('name', 'perry'), ('age', 31), ('type', 'cat')])


### enum.Enum (python 3.4+)


In [103]:
from enum import Enum

In [110]:
class Species(Enum):
    cat = 1
    dog = 2
    horse = 3
    aardvark = 4
    butterfly = 5
    owl = 6
    platypus = 7
    dragon = 8
    unicorn = 9
    # The list goes on and on...

    # But we don't really care about age, so we can use an alias.
    kitten = 1
    puppy = 2

Animal = namedtuple('Animal', 'name age type')
perry = Animal(name="Perry", age=31, type=Species.cat)
dragon = Animal(name="Drogon", age=4, type=Species.dragon)
tom = Animal(name="Tom", age=75, type=Species.cat)
charlie = Animal(name="Charlie", age=2, type=Species.kitten)

print(charlie.type == tom.type)
print(charlie.age)
print(charlie.name)
charlie.type
print(Species.dog == Species.puppy)

True
2
Charlie
True


In [106]:
print(Species(1))
print(Species['cat'])
print(Species.cat)

Species.cat
Species.cat
Species.cat
