## Collections

- list, Tuple ,Dict 에 대한 python built-in 확장 자료 구조(모듈)
- 편의성, 실행, 효율 등을 사용자에게 제공함
- 아래의 모듈이 존재함


```
from collections import deque
from collections import Counter 
from collections import OrderedDict
from collections import defaultdict
from collections import namedtuple
```



## deque
- stack 과 Queue 를 지원하는 모듈
- List에 비해 효율적인 자료 저장 방식을 지원함
- rotate , reverse 등 Linked List의 특성을 지원함
- 기존  List 형태의 함수를 지원함
- deque는 기존 list보다 효율적인 자료구조를 제공
- 효율적 메모리 구조로 처리 속도 향상

In [4]:
from collections import deque

deque_list = deque()
for i in range(5) :
  deque_list.append(i)
print(deque_list)

deque_list.appendleft(10)
print(deque_list)

deque_list.rotate(2)
print("rotate(2)", deque_list)
deque_list.rotate(2)
print("rotate(2)",deque_list)

print(deque_list)
print("reversed", deque(reversed(deque_list)))
deque_list.extend([5,6,7])
print("extend", deque_list)

deque_list.extendleft([5,6,7])
print("extendleft" ,deque_list)

deque([0, 1, 2, 3, 4])
deque([10, 0, 1, 2, 3, 4])
rotate(2) deque([3, 4, 10, 0, 1, 2])
rotate(2) deque([1, 2, 3, 4, 10, 0])
deque([1, 2, 3, 4, 10, 0])
reversed deque([0, 10, 4, 3, 2, 1])
extend deque([1, 2, 3, 4, 10, 0, 5, 6, 7])
extendleft deque([7, 6, 5, 1, 2, 3, 4, 10, 0, 5, 6, 7])


In [8]:
from collections import deque
import time

start_time = time.clock()
deque_list = deque()
for i in range(10000) :
  for i in range(10000) :
    deque_list.append(i)
    deque_list.pop()
print(time.clock() - start_time,"seconds" )

start_time = time.clock()
just_list=[]
for i in range(10000) :
  for j in range(10000):
    just_list.append(i)
    just_list.pop()
    
print(time.clock()- start_time, "seconds")
    

21.544106 seconds
30.653202000000007 seconds


# OrderedDict
- Dict와 달리 데이터를 입력한 순서대로 dict를 반환함
- Dict type의 값을 value, 또는 key 값으로 정렬 할 때 사용 가능

In [16]:
from collections import OrderedDict
d= {}
d["x"]=100
d["y"]=200
d["z"]=300
d["l"]=400
for k ,v in d.items() :
  print(k,v)
  
d= OrderedDict()
d["x"]=100
d["y"]=200
d["z"]=300
d["l"]=400
for k,v in d.items():
  print(k,v)

x 100
y 200
z 300
l 400
x 100
y 200
z 300
l 400


In [19]:
# orderdict 하면 sorting 편하게 가능
for k, v in OrderedDict(sorted(d.items(), key= lambda t:t[0])).items() :
  print(k,v)
  
for k, v in OrderedDict(sorted(d.items(), key= lambda t:t[1])).items() :
  print(k,v)

l 400
x 100
y 200
z 300
x 100
y 200
z 300
l 400


# defaultdict
- Dict type 의 값에 기본 값을 지정, 신규값 생성시 사용하는 방법

In [21]:
# error
d= dict()
print(d["first"])

KeyError: ignored

In [23]:
# 초기값 없을 때 defaultdict 하면 편하다
from collections import defaultdict
d= defaultdict(object) # default dictionary를 생성
d= defaultdict(lambda :0) # Default 값을 0 으로 설정
print(d["first"])

0


In [29]:
from collections import OrderedDict
word_count = defaultdict(object) # default dictionary를 생성
word_count = defaultdict(lambda : 0) # Default 값을 0 으로 설정
text ="i really really hate you you you ho ho ho ho".lower().split()
## orderedDict 사용 안하면
word_count = {}
for word in text :
  if word in word_count.keys():
    word_count[word] +=1
  else : 
    word_count[word] = 1
print(word_count)

################################# orderedDict 사용 하면 ##################
for word in text :
  word_count[word] +=1

# 크기 순 sorting 
for i , v in OrderedDict(sorted(word_count.items(), key= lambda t:t[1] ,
                                reverse=True)).items():
  print(i,v)

{'i': 1, 'really': 2, 'hate': 1, 'you': 3, 'ho': 4}
ho 8
you 6
really 4
i 2
hate 2


# Counter
- Sequence type의 data element 들의 갯수를 dict형태로 반환

In [32]:
from collections import Counter
c= Counter() # a new, empty counter
c = Counter("gallahad") # a new counter from an iterable
print(c)
c= Counter({"red" : 4, "blue":2})
print(c)
print(list(c.elements()))

c= Counter(cats=4, dogs=8)
print(c)
print(list(c.elements()))

Counter({'a': 3, 'l': 2, 'g': 1, 'h': 1, 'd': 1})
Counter({'red': 4, 'blue': 2})
['red', 'red', 'red', 'red', 'blue', 'blue']
Counter({'dogs': 8, 'cats': 4})
['cats', 'cats', 'cats', 'cats', 'dogs', 'dogs', 'dogs', 'dogs', 'dogs', 'dogs', 'dogs', 'dogs']


# nametuple
- Tuple 형태로 Data 구조체를 저장하는 방법
- 저장되는 data의 variable을 사전에 지정해서 저장함

In [35]:
from collections import namedtuple
Point = namedtuple("Point",["x","y"])
p = Point(11, y=22)
print(p[0]+p[1])

x, y = p
print(x,y)
print(p.x+p.y)
print(Point(x=11, y=22))

33
11 22
33
Point(x=11, y=22)
