In [36]:
import collections

## Python Collections 모듈 이해하기
### tuple, dict에 대한 확장 데이터 구조를 제공

- **namedtuple()** :  Tuple 타입의 subclass를 만들어 주는 function
- **OrderedDict** :  dict subclass that remembers the order entries were added
- **Counter** :  dict subclass for counting has hable objects
- **defaultdict** :  dict subclass that calls a factory function to supply missing values
- **deque** :  list-like container with fast appends and pops on either end

### Tuple vs namedtuple
tuple type은 immutable type으로 내부 원소에 대해 갱신이 불가능하여 리스트처리보다 제한적. 
slicing은 String처럼 처리 가능

### Tuple

In [6]:
T = (1, ); print(T)
# 튜플 생성 시 원소가 하나일 경우 뒤에 ','를 붙여야함

(1,)


In [7]:
T = (1,2,3,4); print(T)
# 일반적인 튜플 생성

(1, 2, 3, 4)


In [8]:
len((1,2,3))
# length로 길이 확인 가능

3

In [10]:
(1,2,3) + (4,5,6)
# 튜플 합치기 Concatenation

(1, 2, 3, 4, 5, 6)

In [20]:
('Hi!')*10
'Hi!'*10 # 두 결과 일치
(1,2,3) * 3
# 곱으로 반복적으로 표현 가능

(1, 2, 3, 1, 2, 3, 1, 2, 3)

In [21]:
3 in (1,2,3)
# 튜플 내 원소들은 Membership

True

In [23]:
for x in (1,2,3) : print(x)
# 튜플 내 원소를 반복자(Iteration)으로 활용가능

1
2
3


In [33]:
T = 1,2,3,4
print(T); print(type(T))

(1, 2, 3, 4)
<class 'tuple'>


In [34]:
# Tuple.count(3) : Tuple 내 원소 3의 개수
T.count(3)

1

In [35]:
# Tuple.index(3) : Tuple 내 원소의 위치
T.index(3)

2

### namedtuple
Tuple은 index를 기준으로 접근하지만 namedtuple은 key를 가지고 접근할 수 있는 것도 추가적으로 지원

In [37]:
help(collections.namedtuple)

Help on function namedtuple in module collections:

namedtuple(typename, field_names, *, rename=False, defaults=None, module=None)
    Returns a new subclass of tuple with named fields.
    
    >>> Point = namedtuple('Point', ['x', 'y'])
    >>> Point.__doc__                   # docstring for the new class
    'Point(x, y)'
    >>> p = Point(11, y=22)             # instantiate with positional args or keywords
    >>> p[0] + p[1]                     # indexable like a plain tuple
    33
    >>> x, y = p                        # unpack like a regular tuple
    >>> x, y
    (11, 22)
    >>> p.x + p.y                       # fields also accessible by name
    33
    >>> d = p._asdict()                 # convert to a dictionary
    >>> d['x']
    11
    >>> Point(**d)                      # convert from a dictionary
    Point(x=11, y=22)
    >>> p._replace(x=100)               # _replace() is like str.replace() but targets named fields
    Point(x=100, y=22)



In [44]:
Point = collections.namedtuple('Point', ['x', 'y'])

print("subclass check: ", issubclass(Point, tuple))
print(Point.__doc__)

p = Point(11, y=22)

# instantiate with positional args or keywords
print(p[0]+p[1])
print(p.x+p.y)

subclass check:  True
Point(x, y)
33
33


In [49]:
with_class = collections.namedtuple('Person', field_names= 'name class age gender')
# field_names에 class 포함불가

ValueError: Type names and field names cannot be a keyword: 'class'

In [56]:
# namedtuple은 class를 정의시 rename=True로 정의하면 필드명이 중복이거나 명명이 불가한 경우 대체해준다.
with_class = collections.namedtuple('Person', field_names= 'name class age gender', rename = True)
print(with_class._fields)
andy = with_class('Andy', 'trippleA', 23, 'M')
print(andy._1) # class => _1

with_double_age = collections.namedtuple('Person', 'name age gender age', rename = True)
print(with_double_age._fields)

('name', '_1', 'age', 'gender')
trippleA
('name', 'age', 'gender', '_3')


#### namedtuple method 1
- _asdict: namedtuple에서 생성된 타입의 인스턴스를 OrderedDict로 전환
- _fields: namedtuple에서 생성된 타입 내의 named 변수를 검색
- _make: namedtuple에서 생성된 타입을 가지고 새로운 인스턴스를 생성

In [68]:
Person = collections.namedtuple('Person', 'name age gender')
print('Type of Person: ', type(Person))

bob = Person(name = 'Bob', age = '30', gender = 'male')
print('\nRepresentation: ', bob)

print('\n_fields: \n', bob._fields)
print('\n_asdict: \n', bob._asdict())

jane = bob._make(['jane', 29, 'female'])
print('\n_make: \nField by name: ', jane.name)

Type of Person:  <class 'type'>

Representation:  Person(name='Bob', age='30', gender='male')

_fields: 
 ('name', 'age', 'gender')

_asdict: 
 {'name': 'Bob', 'age': '30', 'gender': 'male'}

_make: 
Field by name:  jane


#### namedtuple method 2
- _replace: namedtuple에서 생선된 타입에 대한 인스턴스 내의 값을 변경
- count: 내부 값에 대한 갯수
- index: 내부 값에 대한 위치

In [73]:
Person = collections.namedtuple('Person', 'name age gender')
print('Type of Person: ', type(Person))

bob = Person(name = 'Bob', age = '30', gender = 'male')
print('\nRepresentation: ', bob)

# 튜플 변경으로 새로운 객체 생성
bob  = bob._replace(age = 50)
print('\n_replace: \n', bob)
print('\ncount: \n', bob.count(50))
print('\nindex: \n', bob.index(50))


Type of Person:  <class 'type'>

Representation:  Person(name='Bob', age='30', gender='male')

_replace: 
 Person(name='Bob', age=50, gender='male')

count: 
 1

index: 
 1


### OrderedDict
OrderedDict는 dict의 subclass로써 새로운 인스턴스를 만드는 클래스

In [76]:
help(collections.OrderedDict)

Help on class OrderedDict in module collections:

class OrderedDict(builtins.dict)
 |  Dictionary that remembers insertion order
 |  
 |  Method resolution order:
 |      OrderedDict
 |      builtins.dict
 |      builtins.object
 |  
 |  Methods defined here:
 |  
 |  __delitem__(self, key, /)
 |      Delete self[key].
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __init__(self, /, *args, **kwargs)
 |      Initialize self.  See help(type(self)) for accurate signature.
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __le__(self, value, /)
 |      Return self<=value.
 |  
 |  __lt__(self, value, /)
 |      Return self<value.
 |  
 |  __ne__(self, value, /)
 |      Return self!=value.
 |  
 |  __reduce__(...)
 |      Return state information for pickling
 |  
 |  __repr__(self, /)
 |      Return repr(self).
 |  
 |  __reversed__(..

In [77]:
# OderedDict는 dict의 subclass이다.
issubclass(collections.OrderedDict, dict)

True

collections.OrderedDict는 순서를 유지하기 위해 linked list로 내부에 구성되어 각 순서를 유지함

In [115]:
d = {'banana': 3, 'apple': 4, 'pear': 1, 'orange': 2}

# dictionary sorted by key
for t in d.items():
    print(t[0])
print(sorted(d.items(),  key=lambda t: t[0]))

do = collections.OrderedDict(sorted(d.items(), key = lambda t:t[0]))
print(do)

banana
apple
pear
orange
[('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)]
OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)])


#### dict method 1
- dict.clear(): dict 객체 내의 요소들 싹다 삭제
- dict.copy(): dict 객체를 다른곳에 deep 복제
- dict.fromkeys(): dict 객체의 키를 새로운 dict 객체를 생성하는 키로 처리
- dict.get(key, default =None): dict내의 키를 가지고 값을 가져옴
- ~~dict.has_key(key): dict내의 key 존재 여부 boolean 출력~~ *py3에서 없어짐
- dict.items(): dict 객체의 키와 값을 순서쌍으로 나타내어 리스트로 전달  
- dict.keys(): dict 내의 키를 리스트로 전달
- dict.setdefault(key, default = None): dict 내의 키와 값을 추가
- dict.update(dict2): dict에 dict추가
- dict.values(): dict 내의 값을 리스트로 전달
- dict.pop('key'): dict 내의 원소를 삭제, 해당 원소 전달 가능

In [117]:
d = {'apple': 10, 'banana': 4, 'carrot':6, 'pear':3}
type(d)
print('Type: ',type(d),', ',d)

Type:  <class 'dict'> ,  {'apple': 10, 'banana': 4, 'carrot': 6, 'pear': 3}


In [97]:
# dict.clear()
# dict.copy()
d1 = d.copy()
d1.clear()
print(d1)

{}


In [101]:
# dict.fromkeys()
d2 = d.fromkeys(d)
d2

{'apple': None, 'banana': None, 'carrot': None, 'pear': None}

In [102]:
# dict.get(key, default = None)
d.get('apple')

10

In [109]:
# dict.items()
d.items()

dict_items([('apple', 10), ('banana', 4), ('carrot', 6), ('pear', 3)])

In [110]:
# dict.keys()
d.keys()

dict_keys(['apple', 'banana', 'carrot', 'pear'])

In [111]:
# dict.setdefault()
d.setdefault('caco',6)
d

{'apple': 10, 'banana': 4, 'carrot': 6, 'pear': 3, 'caco': 6}

In [121]:
# dict.update(dict2)
d.update({'star':1})
d

{'apple': 10, 'banana': 4, 'carrot': 6, 'pear': 3, 'star': 1}

In [113]:
# dict.values()
d.values()

dict_values([10, 4, 6, 3, 6, 1])

In [122]:
# dict.pop('key')
print('Before: ',d)
d_pop = d.pop('star')
print('After: ',d)
print('POP: ', d_pop)

Before:  {'apple': 10, 'banana': 4, 'carrot': 6, 'pear': 3, 'star': 1}
After:  {'apple': 10, 'banana': 4, 'carrot': 6, 'pear': 3}
POP:  1


#### OrderedDict method
- pop
- move_to_end  

*내부 순서가 바뀔 경우 동등하지 않은 것으로 인식

In [126]:
# pop
d = {}
d['a'] = 1
d['b'] = 2
print('Dict: ',d)

od = collections.OrderedDict({'b':2, 'a':1})
print('\nOrderedDict: ',od)

print('\nWhat PoP at OrderedDict: ', od.pop('b'))
print('After PoP',od)

print('\nWhat PoP at Dict: ', d.pop('b'))
print('After PoP: ',d)

Dict:  {'a': 1, 'b': 2}

OrderedDict:  OrderedDict([('b', 2), ('a', 1)])

What PoP at OrderedDict:  2
After PoP OrderedDict([('a', 1)])

What PoP at Dict:  2
After PoP:  {'a': 1}


In [130]:
# move_to_end:
#
# collections.OrderedDict는 순서를 유지하고 있어서 dict 처럼 처리하기 위해서는 move_to_end method를 사용해야한다.
d1 = collections.OrderedDict([('a',1), ('b',2)])
d1.update({'c':3})
print(d1)

d1.move_to_end('c', last = False)
print(d1)

OrderedDict([('a', 1), ('b', 2), ('c', 3)])
OrderedDict([('c', 3), ('a', 1), ('b', 2)])


In [136]:
# OrderedDict 클래스에 순서가 다르면 동등하지 않은 것으로 간주함

a = collections.OrderedDict(name = 'name', age = 30)
print(a)
print(a['name'])

b = collections.OrderedDict(age = 30, name='name')
print(b)
print(a == b)

b.move_to_end('age')
print(b)
print(a == b)

OrderedDict([('name', 'name'), ('age', 30)])
name
OrderedDict([('age', 30), ('name', 'name')])
False
OrderedDict([('name', 'name'), ('age', 30)])
True


### Counter
dict의 subclass로써 새로운 인스턴스를 만드는 클래스

In [137]:
issubclass(collections.Counter, dict)

True

Counter class로 생성하는 이유:  
실제 key 값들에 연속된 상황이 확인이 필요할 경우 사용

In [138]:
collections.Counter('attacked')

Counter({'a': 2, 't': 2, 'c': 1, 'k': 1, 'e': 1, 'd': 1})

In [142]:
collections.Counter({1:2, 2:2})

Counter({1: 2, 2: 2})

In [143]:
collections.Counter({1:2, 2:2}.items())

Counter({(1, 2): 1, (2, 2): 1})

In [144]:
collections.Counter([1,2,3])

Counter({1: 1, 2: 1, 3: 1})