## collections : 컨테이너 데이터형

* 이 모듈은 파이썬의 범용 내장 컨터에너 dict, list, set 및 tuple에 대한 대안을 제공하는 특수 컨테이너 데이터형을 구현합니다.
* namedtuple : 이름 붙은 필드를 갖는 튜플 서브 클래스를 만들기 위한 팩토리함수
* deque : 양쪽 끝에서 빠르게 추가와 삭제를 할 수 있는 리스트류 컨테이너
* ChainMap : 여러 매핑의 단일 뷰를 만드는 딕셔너리류 클래스
* Counter : 해시 가능한 객체를 세는 데 사용하는 딕셔너리 서브 클래스
* OrderedDict : 항목이 추가된 순서를 기억하는 딕셔너리 서브 클래스
* defaultdict : 누락된 값을 제공하기 위해 팩토리 함수를 호출하는 딕셔너리 서브 클래스
* UserDict : 더 쉬운 딕셔너리 서브 클래싱을 위해 딕셔너리 객체를 감싸는 래퍼
* UserList : 더 쉬운 리스트 서브 클래승을 위해 리스트 객체를 감싸는 래퍼
* UserString : 더 쉬운 문자열 서브 클래싱을 위해 문자열 객체를 감싸는 래퍼


  ## namedtuple

  * 튜플처럼 immutable
  * 이름을 통해 데이터로 접근 가능
  * 메모리 활용 최적화(성능상에 이점이 있음) -> 활용하려는 자료형에 비해 어느정도 성능상에 이점이 있다는 것은 시간 측정 필요

In [4]:
%%time

l = [10, 20, 30]
t = (l, 10, 20)

l[2] = 100
t
#즉, tuple은 해당 자료형을 참조하고 있다는 것이 불변! 데이터는 변할 수 있다


CPU times: total: 0 ns
Wall time: 0 ns


([10, 20, 100], 10, 20)

In [5]:
#Base Example
from collections import namedtuple
 
Point = namedtuple('Point',['x','y']) # 이름은 Point로 명명짓고 x와 y값을 가진다고 선언한다.
p = Point(11, 22) # x,y를 넣는다
p[0] + p[1]

33

In [6]:
p

Point(x=11, y=22)

In [7]:
p.x, p.y
# But p[x]는 error가 난다.

(11, 22)

In [8]:
i,j = p
i, j

(11, 22)

In [9]:
Point

__main__.Point

In [10]:
dir(Point)

['__add__',
 '__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__match_args__',
 '__module__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__slots__',
 '__str__',
 '__subclasshook__',
 '_asdict',
 '_field_defaults',
 '_fields',
 '_make',
 '_replace',
 'count',
 'index',
 'x',
 'y']

In [11]:
d ={'x' : 100, 'y' : 200}

p = Point(**d) # *가 하나일때는 list나 tuple을 넣을 수 있고 *가 두개(**)일때는 dictionary를 넣을 수 있다.

p.x, p.y

(100, 200)

In [13]:
p._asdict() # dictionary의 형태로 출력을 해준다.


{'x': 100, 'y': 200}

In [14]:
p._fields

('x', 'y')

In [16]:
re_p = p._replace(x=1000)
re_p

Point(x=1000, y=200)

In [18]:
p # 즉, p자체는 변경이 된것이 아니기 때문에 immutable이 맞으면서 해당 값을 바꿔서새로운 변수를 만들때 사용한다. 즉, p으 값을 변경할때는 p = p._replace()를 사용

Point(x=100, y=200)

In [21]:
p.index(100) # 몇번째에 존재하는지
p.count(100) # 갯수를 셀 수 있다.

# 해당 메소드(index, count)는 value 값을 이용하기 때문에 x,y로 찾는것은 불가능하다.


1

In [24]:
from dataclasses import dataclass # python 3.7부터 사용가능하며, 구조체 import dataclass

@dataclass
class Point:
    x : int = None
    y : int = None

# type을 명시적으로 주는 이유는 헷갈리지 않고 넣을 수 있기 때문에
print(Point())



Point(x=None, y=None)


In [26]:
p = Point(10, 20)
p

Point(x=10, y=20)

In [27]:
i,j = p # unpacking은 error가 나면서 안된다. 차이점-> collections

TypeError: cannot unpack non-iterable Point object

In [28]:
p.x, p.y

(10, 20)

In [29]:
dir(p) # 해당 방법은 count,와 index가 존재하지는 않는다.

['__annotations__',
 '__class__',
 '__dataclass_fields__',
 '__dataclass_params__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__match_args__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 'x',
 'y']

In [30]:
from collections import namedtuple

# 기술 -> type 이름, 나머지는 인자로 받을때 사용되는 이름

기술명세 = namedtuple('기술', '기술이름,자격증,연차') # csv 파일을 가지고 올 때 유용

이호준 = 기술명세('파이썬','정보처리기사','3')
이호준

기술(기술이름='파이썬', 자격증='정보처리기사', 연차='3')

In [31]:
dir(이호준)

['__add__',
 '__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__match_args__',
 '__module__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__slots__',
 '__str__',
 '__subclasshook__',
 '_asdict',
 '_field_defaults',
 '_fields',
 '_make',
 '_replace',
 'count',
 'index',
 '기술이름',
 '연차',
 '자격증']

## deque

* 양쪽 끝에서 빠르게 추가와 삭제를 할 수 있는 리스트류 컨테이너
* 양방향 큐
* 데이터의 회전도 가능
* maxlen을 설정하여 최대 항목 수를 설정

In [32]:
from collections import deque

a = [10,20,30,40, 50]
d = deque(a)
d

deque([10, 20, 30, 40, 50])

In [33]:
dir(d)

['__add__',
 '__class__',
 '__class_getitem__',
 '__contains__',
 '__copy__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__rmul__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'append',
 'appendleft',
 'clear',
 'copy',
 'count',
 'extend',
 'extendleft',
 'index',
 'insert',
 'maxlen',
 'pop',
 'popleft',
 'remove',
 'reverse',
 'rotate']

In [34]:
d.append(100)
d

In [35]:
d.appendleft(100)
d

In [36]:
temp = d.pop()
d

deque([100, 10, 20, 30, 40, 50])

In [37]:
temp = d.popleft()
d

deque([10, 20, 30, 40, 50])

In [38]:
d.rotate(2)
d

deque([40, 50, 10, 20, 30])

In [39]:
d.rotate(-1)

In [40]:
d

deque([50, 10, 20, 30, 40])

## ChainMap

* 여러개의 컨테이너 자료형을 연결할 수 있음


In [42]:
from collections import ChainMap

oneDict = {'one' : 1, 'two' : 2, 'three' : 3}
twoDict = {'four' : 4}

chain = ChainMap(oneDict, twoDict)
chain

ChainMap({'one': 1, 'two': 2, 'three': 3}, {'four': 4})

In [43]:
dir(chain)

['_MutableMapping__marker',
 '__abstractmethods__',
 '__bool__',
 '__class__',
 '__class_getitem__',
 '__contains__',
 '__copy__',
 '__delattr__',
 '__delitem__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__missing__',
 '__module__',
 '__ne__',
 '__new__',
 '__or__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__ror__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__slots__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 '_abc_impl',
 'clear',
 'copy',
 'fromkeys',
 'get',
 'items',
 'keys',
 'maps',
 'new_child',
 'parents',
 'pop',
 'popitem',
 'setdefault',
 'update',
 'values']

In [44]:
'one' in chain, 'four' in chain

(True, True)

In [45]:
len(chain)

4

In [46]:
chain.values(), chain.keys(), chain.items()

(ValuesView(ChainMap({'one': 1, 'two': 2, 'three': 3}, {'four': 4})),
 KeysView(ChainMap({'one': 1, 'two': 2, 'three': 3}, {'four': 4})),
 ItemsView(ChainMap({'one': 1, 'two': 2, 'three': 3}, {'four': 4})))

In [47]:
chain[0] # error
chain['oneDict'] # error

KeyError: 0

In [49]:
chain.maps[0] # oneDict
chain.maps[1] # twoDict

{'four': 4}

In [52]:
chain['one']

1

In [50]:
one = [1,2,3,4]
two = [5,6,7,8]

three = ChainMap(one, two)
three

ChainMap([1, 2, 3, 4], [5, 6, 7, 8])

In [51]:
three.maps[0] # one
three.maps[1] # two



[5, 6, 7, 8]

## Counter

* 객체의 요소 개수를 key와 value값으로

In [54]:
from collections import Counter

a = [1,1,1,2,3,4,5,5,5,6,7,8,8,8,8]
c = Counter(a)

c #각각의 요소의 개수를 함께 반환해준다.

Counter({8: 4, 1: 3, 5: 3, 2: 1, 3: 1, 4: 1, 6: 1, 7: 1})

In [55]:
dir(c)

['__add__',
 '__and__',
 '__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__iand__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__isub__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__missing__',
 '__module__',
 '__ne__',
 '__neg__',
 '__new__',
 '__or__',
 '__pos__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__ror__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__weakref__',
 '_keep_positive',
 'clear',
 'copy',
 'elements',
 'fromkeys',
 'get',
 'items',
 'keys',
 'most_common',
 'pop',
 'popitem',
 'setdefault',
 'subtract',
 'total',
 'update',
 'values']

In [56]:
for i in c:
    print(i)
    print('---')

#unpacking 은 되지 않음

1
---
2
---
3
---
4
---
5
---
6
---
7
---
8
---
