* 기본적인 타입 외에 collections를 사용하여 자료 구조 설계를 쉽게 할 수 있습니다.
* 해당 문서는 공식문서를 참조하고 있습니다.

## collections : 컨테이너 데이터형

* 이 모듈은 파이썬의 범용 내장 컨테이너 dict, list, set 및 tuple에 대한 대안을 제공하는 특수 **컨테이너 데이터형**을 구현합니다.
* 공식문서 링크 : https://docs.python.org/ko/3.10/library/collections.html
* namedtuple : 이름 붙은 필드를 갖는 튜플 서브 클래스를 만들기 위한 팩토리 함수
* deque : 양쪽 끝에서 빠르게 추가와 삭제를 할 수 있는 리스트류 컨테이너
* ChainMap : 여러 매핑의 단일 뷰를 만드는 딕셔너리류 클래스
* Counter : 해시 가능한 객체를 세는 데 사용하는 딕셔너리 서브 클래스
* OrderedDict : 항목이 추가된 순서를 기억하는 딕셔너리 서브 클래스
* defaultdict : 누락된 값을 제공하기 위해 팩토리 함수를 호출하는 딕셔너리 서브 클래스
* UserDict : 더 쉬운 딕셔너리 서브 클래싱을 위해 딕셔너리 객체를 감싸는 래퍼
* UserList : 더 쉬운 리스트 서브 클래싱을 위해 리스트 객체를 감싸는 래퍼
* UserString : 더 쉬운 문자열 서브 클래싱을 위해 문자열 객체를 감싸는 래퍼

## 01 namedtuple

* 튜플처럼 immutable
* 이름을 통해 데이터로 접근 가능
* 메모리 활용 최적화(성능상에 이점이 있음) -> 활용하려는 자료형에 비해 어느정도 성능상에 이점이 있다는 것은 시간 측정 필요


In [None]:
# Basic example
from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'])
p = Point(11, y=22)     # instantiate with positional or keyword arguments
p[0] + p[1]             # indexable like the plain tuple (11, 22)

33

In [None]:
Point = namedtuple('Point', ['x', 'y'])
p = Point(11, 22)     # instantiate with positional or keyword arguments
p[0] + p[1] 

33

In [None]:
p

Point(x=11, y=22)

In [None]:
p.x

11

In [None]:
p[x] # name 'x' is not defined

NameError: ignored

In [None]:
i, j = p                # unpack like a regular tuple
i, j

(11, 22)

In [None]:
Point

__main__.Point

In [None]:
dir(Point)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__module__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__slots__',
 '__str__',
 '__subclasshook__',
 '_asdict',
 '_field_defaults',
 '_fields',
 '_fields_defaults',
 '_make',
 '_replace',
 'count',
 'index',
 'x',
 'y']

In [None]:
p = Point(**{'x':100, 'y':200})
p.x

100

In [None]:
p._asdict()

OrderedDict([('x', 100), ('y', 200)])

In [None]:
p._fields

('x', 'y')

In [None]:
re_p = p._replace(x=1000)
re_p.x
p.x

11

In [None]:
from dataclasses import dataclass #3.7부터 사용 가능, 구조체import dataclass
	
@dataclass
class Point:
    x: int = None
    y: int = None
	    
print(Point()) 

Point(x=None, y=None)


In [None]:
p = Point(10, 20)
p

Point(x=10, y=20)

In [None]:
p.x, p.y

(10, 20)

In [None]:
dir(p)

['__annotations__',
 '__class__',
 '__dataclass_fields__',
 '__dataclass_params__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 'x',
 'y']

In [None]:
from collections import namedtuple

기술명세 = namedtuple('기술', '기술이름, 자격증, 연차')
이호준 = 기술명세('파이썬', '정보처리기사', '3')
dir(이호준)
이호준

기술(기술이름='파이썬', 자격증='정보처리기사', 연차='3')

## 02 deque

* 양쪽 끝에서 빠르게 추가와 삭제를 할 수 있는 리스트류 컨테이너
* 양방향 큐
* 데이터의 회전도 가능
* maxlen을 설정하여 최대 항목 수를 설정

In [None]:
from collections import deque

a = [10, 20, 30, 40, 50]
d = deque(a)
d

deque([10, 20, 30, 40, 50])

In [None]:
dir(d)

['__add__',
 '__bool__',
 '__class__',
 '__contains__',
 '__copy__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__rmul__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'append',
 'appendleft',
 'clear',
 'copy',
 'count',
 'extend',
 'extendleft',
 'index',
 'insert',
 'maxlen',
 'pop',
 'popleft',
 'remove',
 'reverse',
 'rotate']

In [None]:
d.append(1000) #extend도 가능
d

In [None]:
d.appendleft(10000) #extendleft도 가능
d

deque([10000, 10, 20, 30, 40, 50, 1000])

In [None]:
d.pop()
d

deque([10000, 10, 20, 30, 40, 50])

In [None]:
d.popleft()
d

deque([10, 20, 30, 40, 50])

In [None]:
d.rotate(3)
d

deque([30, 40, 50, 10, 20])

In [None]:
d.rotate(-1)
d

deque([40, 50, 10, 20, 30])

## 03 ChainMap

* 여러개의 컨테이너 자료형을 연결할 수 있음

In [117]:
from collections import ChainMap

oneDict = {'one':1, 'two':2, 'three': 3}
twoDict = {'four':4}

three = ChainMap(oneDict, twoDict)
three

ChainMap({'one': 1, 'two': 2, 'three': 3}, {'four': 4})

In [118]:
dir(three)

['_MutableMapping__marker',
 '__abstractmethods__',
 '__bool__',
 '__class__',
 '__contains__',
 '__copy__',
 '__delattr__',
 '__delitem__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__missing__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__slots__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 '_abc_impl',
 'clear',
 'copy',
 'fromkeys',
 'get',
 'items',
 'keys',
 'maps',
 'new_child',
 'parents',
 'pop',
 'popitem',
 'setdefault',
 'update',
 'values']

In [120]:
'one' in three
len(three)

4

In [None]:
three.values
dir(three.items())
three.items()

ItemsView(ChainMap({'one': 1, 'two': 2, 'three': 3}, {'four': 4}))

In [115]:
from collections import ChainMap

oneDict = [1, 2, 3, 4]
twoDict = [5, 6, 7, 8]

three = ChainMap(oneDict, twoDict)
three

ChainMap([1, 2, 3, 4], [5, 6, 7, 8])

In [116]:
6 in three

True

## 04 Counter

In [121]:
from collections import Counter

a = [1, 2, 3, 4, 5, 5, 5, 5, 5, 1, 2, 3, 1, 2, 3]
c = Counter(a)
c

Counter({1: 3, 2: 3, 3: 3, 4: 1, 5: 5})

In [122]:
dir(c)

['__add__',
 '__and__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__iand__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__isub__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__missing__',
 '__module__',
 '__ne__',
 '__neg__',
 '__new__',
 '__or__',
 '__pos__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__weakref__',
 '_keep_positive',
 'clear',
 'copy',
 'elements',
 'fromkeys',
 'get',
 'items',
 'keys',
 'most_common',
 'pop',
 'popitem',
 'setdefault',
 'subtract',
 'update',
 'values']

In [None]:
c.keys()

dict_keys([1, 2, 3, 4, 5])

In [None]:
c.values()

dict_values([3, 3, 3, 1, 5])

In [None]:
c.elements()

<itertools.chain at 0x7f40347f18d0>

In [None]:
for i in c.elements():
    print(i)

1
1
1
2
2
2
3
3
3
4
5
5
5
5
5


In [None]:
c.most_common()

[(5, 5), (1, 3), (2, 3), (3, 3), (4, 1)]

In [123]:
s = 'hello, world'
sc = Counter(s)
sc

Counter({' ': 1,
         ',': 1,
         'd': 1,
         'e': 1,
         'h': 1,
         'l': 3,
         'o': 2,
         'r': 1,
         'w': 1})

In [124]:
sc.update('hello')
sc

Counter({' ': 1,
         ',': 1,
         'd': 1,
         'e': 2,
         'h': 2,
         'l': 5,
         'o': 3,
         'r': 1,
         'w': 1})

In [127]:
sc.subtract(Counter('hello'))
sc #3번 실행하면 -값을 가짐

Counter({' ': 1,
         ',': 1,
         'd': 1,
         'e': -1,
         'h': -1,
         'l': -1,
         'o': 0,
         'r': 1,
         'w': 1})

In [129]:
sc.subtract('hello') #일반 스트링으로도 가능
sc

Counter({' ': 1,
         ',': 1,
         'd': 1,
         'e': -3,
         'h': -3,
         'l': -5,
         'o': -2,
         'r': 1,
         'w': 1})

## 05 OrderedDict

* 순서가 있는 dict 자료형
* LRU 알고리즘을 구현하는 용도로 자주 사용

In [None]:
from collections import OrderedDict

oneDict = {'one':1, 'two':2, 'three': 3}
d = OrderedDict(oneDict)
d

OrderedDict([('one', 1), ('two', 2), ('three', 3)])

In [None]:
dir(d)

['__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'clear',
 'copy',
 'fromkeys',
 'get',
 'items',
 'keys',
 'move_to_end',
 'pop',
 'popitem',
 'setdefault',
 'update',
 'values']

In [None]:
d.keys()

odict_keys(['one', 'two', 'three'])

In [None]:
d.values()

odict_values([1, 2, 3])

In [None]:
d.pop()

TypeError: ignored

In [None]:
d.pop('one')

1

In [None]:
d

OrderedDict([('two', 2), ('three', 3)])

In [None]:
d['one'] = 100
d

OrderedDict([('two', 2), ('three', 3), ('one', 100)])

In [None]:
for i in d:
    print(i)

two
three
one


## 06 deaultdict

* 키로 어떤 값이 들어올지 모를 경우 사용

In [None]:
from collections import defaultdict

oneDict = {'one':1, 'two':2, 'three': 3}
d = defaultdict(oneDict)
d

TypeError: ignored

In [None]:
d = defaultdict(str)
d['one'] = '1' # 숫자여도 작동함
d['one']
d

defaultdict(str, {'one': '1'})

In [None]:
d['one'] = '2' # 업데이트도 작동함
d

defaultdict(str, {'one': '2'})

In [None]:
dir(d)

['__class__',
 '__contains__',
 '__copy__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__missing__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'clear',
 'copy',
 'default_factory',
 'fromkeys',
 'get',
 'items',
 'keys',
 'pop',
 'popitem',
 'setdefault',
 'update',
 'values']

In [None]:
dir(d['one'])

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmod__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'capitalize',
 'casefold',
 'center',
 'count',
 'encode',
 'endswith',
 'expandtabs',
 'find',
 'format',
 'format_map',
 'index',
 'isalnum',
 'isalpha',
 'isascii',
 'isdecimal',
 'isdigit',
 'isidentifier',
 'islower',
 'isnumeric',
 'isprintable',
 'isspace',
 'istitle',
 'isupper',
 'join',
 'ljust',
 'lower',
 'lstrip',
 'maketrans',
 'partition',
 'replace',
 'rfind',
 'rindex',
 'rjust',
 'rpartition',
 'rsplit',
 'rstrip',
 'split',
 'splitlines',
 'startswith',
 'strip',
 'swapcase',
 'title',
 'translate',
 'upper',


In [None]:
d['three']
d

defaultdict(str, {'one': '2', 'three': ''})

In [None]:
d = defaultdict(int)
d['one']
d['two']
d

defaultdict(int, {'one': 0, 'two': 0})

In [None]:
d = defaultdict(list)
d['one']
d['two']
d

defaultdict(list, {'one': [], 'two': []})

In [None]:
d = defaultdict(int)
for i in range(10):
    d[i] += 1

d

defaultdict(int, {0: 1, 1: 1, 2: 1, 3: 1, 4: 1, 5: 1, 6: 1, 7: 1, 8: 1, 9: 1})

In [None]:
# 특히 리스트의 경우 여러개의 중복값을 저장하기 위한 용도로 많이 사용
강좌 = [
    ('인스타그램클론', 1123),
    ('정규표현식', 23),
    ('MBIT페이지만들기', 1313),
    ('python부트캠프', 312),
    ('눈떠보니코딩테스트전날', 1623),
    ]

강좌

d = defaultdict(list)
for 강의, 수강생 in 강좌:
    if 수강생 < 100 : d['십'].append(강의)
    elif 수강생 < 1000 : d['백'].append(강의)
    elif 수강생 < 10000 : d['천'].append(강의)

d

defaultdict(list,
            {'백': ['python부트캠프'],
             '십': ['정규표현식'],
             '천': ['인스타그램클론', 'MBIT페이지만들기', '눈떠보니코딩테스트전날']})

## 07 UserDict, UserList, UserString

* 문제 없이 메서드를 오버라이드할 수 있기 때문에 dict, list, str을 상속하는 것보다 UserDict, UserList, UserSring을 상속하는 것이 좋습니다.
* 그러나 간단하게 사용할 때에는 dict, list, str을 상속받아 사용하세요.

In [108]:
from collections import UserDict, UserList, UserString

class CustomDict(UserDict):
    def contain_value(self, values):
        return values in self.data.values()

d = CustomDict()
dir(d)
d['one'] = 1
d['two'] = 2
'one' in d
type(d.data)
d.contain_value(1)

True