## (22) Data Structure Modules

## 1. Collections Module 
- <font color = red>__Counter, deque, OrderedDict Class가 있음.__<br>
- <font color = white>파이썬의 기본 데이터형식 기초 위에 추가 데이터 형식 제공.
- Object들의 저장소를 보다 더 다양하고 편하게 제공함

***
#### 1) Counter class : 동일한 value들이 몇개 있는지 알려줌 

In [2]:
import collections
c = collections.Counter() # empty counter만들어짐
c = collections.Counter('gallahad') #iterable한 'gallahad'가 담긴다. 
# 각 character들이 몇개씩 들어있는지 알려줌.

# <키값 혹은 parameter가 얼마의 값을 갖고있는지도 collections.Counter로 보여줄 수 있따.>
# c = collections.Counter({'red' : 4, 'blue' : 2})
# c = collections.Counter(cats=4, dogs = 8)
print(c)

Counter({'dogs': 8, 'cats': 4})


In [2]:
# Counter Class 쓰지 않은 예제
c = {}
def addCounter(obj):
    if obj not in c:
        c[obj] = 1
    else:
        c[obj] += 1

addCounter('eggs')
addCounter('ham')
addCounter('ham')
addCounter('soy')
print(c['eggs'])
print(c['ham'])
print(c)

1
2
{'eggs': 1, 'ham': 2, 'soy': 1}


In [3]:
# collections 모듈의 Counter class의 장점을 보여줌
# 요소들의 갯수를 쉽게 Count해줌
import collections
c = collections.Counter(['eggs', 'ham', 'ham', 'soy'])
print(c['eggs'])
print(c['ham'])

1
2


***
#### 2) deque class : que 양쪽 끝에서 요소들을 넣고 뺄 수 있음
 - .leftappend() / .popleft() / .rotate() 등이 있음

In [5]:
import collections
d = collections.deque('abcdefg')
print('Deque : ', d)
print('Length : ', len(d))
print('Left end : ', d[0])
print('Right end : ', d[-1])

d.remove('c')
print('remove(c) : ', d)

d.append('h')
print('append(h) : ', d)

#appendleft 매우 특이!!
d.appendleft('X')
print('appendleft(X) : ', d)

Deque :  deque(['a', 'b', 'c', 'd', 'e', 'f', 'g'])
Length :  7
Left end :  a
Right end :  g
remove(c) :  deque(['a', 'b', 'd', 'e', 'f', 'g'])
append(h) :  deque(['a', 'b', 'd', 'e', 'f', 'g', 'h'])
appendleft(X) :  deque(['X', 'a', 'b', 'd', 'e', 'f', 'g', 'h'])


In [4]:
import collections
d = collections.deque('abcdefg')
print('Deque : ', d)
print('Length : ', len(d))
print('Left end : ', d[0])
print('Right end : ', d[-1])

print(d.pop())
print(d)

print(d.popleft())
print(d)

Deque :  deque(['a', 'b', 'c', 'd', 'e', 'f', 'g'])
Length :  7
Left end :  a
Right end :  g
g
deque(['a', 'b', 'c', 'd', 'e', 'f'])
a
deque(['b', 'c', 'd', 'e', 'f'])


In [7]:
import collections

d = collections.deque('abcdefg')
print('Deque : ', d)
print('Length : ', len(d))
print('Left end : ', d[0])
print('Right end : ', d[-1])

d.rotate(2)
print(d)

d.rotate(-2)
print(d)

Deque :  deque(['a', 'b', 'c', 'd', 'e', 'f', 'g'])
Length :  7
Left end :  a
Right end :  g
deque(['f', 'g', 'a', 'b', 'c', 'd', 'e'])
deque(['a', 'b', 'c', 'd', 'e', 'f', 'g'])


***
#### 4) OrderedDict class : items들이 insert된 순서를 기억한다.
##### <font color = red>__ - .leftappend() / .popleft()는 특이한 것이니 잘 알아두자__

In [8]:
from collections import OrderedDict
# 보통 딕셔너리는 다음과 같다.
d = {'abc' : 3, 'a' : 4, 'b': 1, 'cd': 2}
d2 = {'abc' : 'a', 'a' : 'b', 'b': 'c', 'cd': 'd'}

#OrderedDict 사용한 경우
print(OrderedDict(sorted(d.items(), key = lambda t : t[0]))) # key를 기준으로 sort한 ordereddict를 보여준다
print(OrderedDict(sorted(d.items(), key = lambda t : t[1]))) # value를 기준으로 sort한 ordereddict를 보여준다
print(OrderedDict(sorted(d.items(), key = lambda t : len(t[0])))) # key의 길이를 기준으로 sort한 ordereddict를 보여준다
print(OrderedDict(sorted(d2.items(), key = lambda t : len(t[1]))))
# 같은길이일땐 사전 순서에 앞에 있는게 먼저 나온다.
# print(OrderedDict(sorted(d.items(), key = lambda t : len(t[1]))))
# 질문! len(t[1])하면 오류가 나는 이유는???? : int인 경우는 error난다

OrderedDict([('a', 4), ('abc', 3), ('b', 1), ('cd', 2)])
OrderedDict([('b', 1), ('cd', 2), ('abc', 3), ('a', 4)])
OrderedDict([('a', 4), ('b', 1), ('cd', 2), ('abc', 3)])
OrderedDict([('abc', 'a'), ('a', 'b'), ('b', 'c'), ('cd', 'd')])


## 2. Array Module
- 1차원, 2차원, 3차원 수치형 데이터를 표현할 수 있는 고정된 형식이다.
- list보다 속도가 빠르다. 그렇기때문에 여러 데이터타입을 함께 저장 할 수 없다. only single type만 가능

In [19]:
import array
s = 'This is the array.'
a = array.array('u', s)

print('As string : ', s)
print('As array : ', a)

As string :  This is the array.
As array :  array('u', 'This is the array.')


In [20]:
from array import array
a = array('i', [10, 20, 30])
for value in a :
    print(value)

10
20
30


***
##### array.itemsize

In [23]:
import array

s = 'This is the array'
a = array.array('u', s)
print(a)

b = a.itemsize
print('size is', b) # size를 사용자가 직접 계산할 수 있는 방법도 있나?

array('u', 'This is the array')
size is 2


***
##### array.append : array끝에 붙여줌 ★array.append는 'u'에만 쓰임★

In [11]:
import array

s1 = 'This is the array.'
s2 = [1,2,3,4,5,6,7,8,3,4,5,6,7,7,8,1,2,3,4,6,7,78,1,2,3]
a = array.array('u', s1)
a2 = array.array('i', s2)
#a3 = array.array([1])

print(a)

for i in range(100):
    a.append('k') # append해도 size는 여전히 2 이다
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
# a.append('k')
b=a.itemsize
b2=a.itemsize
print('New array is ', a)
print('size is', b)
print(b2)


array('u', 'This is the array.')
New array is  array('u', 'This is the array.kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk')
size is 2
2


***
##### array.extend : array.append와 유사한데, 다른 type의 array들이 결합할때도 쓰인다 
##### but! 결합하는 array들은 같은 타입이어야함

In [26]:
import array

s1 = 'This is  the array.'
s2 = 'Hello world'

a = array.array('u', s1)
b = array.array('u', s2)

print(a)
print(b)

a.extend(b)

print('extend : ', a)

array('u', 'This is  the array.')
array('u', 'Hello world')
extend :  array('u', 'This is  the array.Hello world')


***
##### array.count : array내에서  elemets가 몇번있는지 return해줌
##### (예) a.count('i') : a array에서 'i'가 몇번있는지 알려줌

In [27]:
import array

s1 = 'This is the array. Apple'
a = array.array('u', s1)

icount = a.count('i')
Acount = a.count('A')

print('We have ', icount, ' i in s1')
print('We have ', Acount, ' A in s1')

We have  2  i in s1
We have  1  A in s1


***
##### array.remove : 앞에서부터 봤을때 처음으로 나오는 element를 지워줌

In [29]:
import array

s1 = 'This is the array. haha'
a = array.array('u', s1)

print('Original array : ', a)

a.remove('h')

print('New array : ', a) #This에서 h가 없어짐

Original array :  array('u', 'This is the array. haha')
New array :  array('u', 'Tis is the array. haha')


***
##### array.index : elemet를 입력하면 index중에서 가장 작은 index를 return해줌

In [30]:
import array

s1 = 'This is the array. haha'
a = array.array('u', s1)

print('Array : ', a)

print(a.index('h'))
print(a.index('a'))

Array :  array('u', 'This is the array. haha')
1
12


***
##### array.insert(i,x) : i위치에 x element를 insert함<br>i가 negative value이면 맨뒤첫글쨰 기준으로 몇번쨰 떨어져있는지임 -1은 맨 뒤에글자에서 1칸 떨어진것임

In [4]:
import array

s1 = 'This is the array. haha'
a = array.array('u', s1)

print('Array : ', a)

a.insert(0, 'W')
print(a)

a.insert(-0, 'X')
print(a)

a.insert(-1, 'H')
print(a)

#질문! 맨뒤에다가 넣을 수 있는 방법은 없을까? /append나 extend말고
a.insert( len(a), 'j')
print(a)



Array :  array('u', 'This is the array. haha')
array('u', 'WThis is the array. haha')
array('u', 'XWThis is the array. haha')
array('u', 'XWThis is the array. hahHa')
array('u', 'XWThis is the array. hahHaj')


In [15]:
import array
# array 종합
# New int array
a = array.array('i')

a.append(100)
a.append(200)
a.append(300)
print(a.itemsize)
print('Original : ', a)

a.insert(1, 900)
print('Insert(1, 900) :', a)

a.remove(200)
print('Remove(200) : ', a)

print(a.count(900))

4
Original :  array('i', [100, 200, 300, 400])
Insert(1, 900) : array('i', [100, 900, 200, 300, 400])
Remove(200) :  array('i', [100, 900, 300, 400])
1


## 3. Queue Module
- collections module의 deque랑 구별해서 알아두자 / deque는 que 양쪽 끝에서 요소들을 넣고 뺄 수 있음
- Queue Module의 장점은 세가지 대표 queue종류를 한번에 지원한다

In [39]:
import queue

a = queue.Queue(5)
b = queue.LifoQueue(5)
c = queue.PriorityQueue(5)

print('Suceessfully created 3 queues')

Suceessfully created 3 queues


***
#### 1) Queue() Class
##### queue.Queue() : FIFO Queue이다 <br> ※Queue안에 Queue 형식을 집어 넣어 줄 수 있다.

In [40]:
import queue

a = queue.Queue(5)
b = queue.Queue(5)

a.put(1)
a.put('python')
a.put(b)

b.put(3)

print(a.get())
print(a.get())
print(a.get().get())

1
python
3


***
##### queue Module의 Functions
- queueu.qsize() : queue가 몇개의 elements들이 현재 담겨져있는지 return함.
- queueu.empty() : queue가 비었으면 True 아니면 False return
- queueu.full() : queue가 full이면 True 아니면 False retrun

In [41]:
import queue
a = queue.Queue(3)
b = queue.Queue() # 이렇게 size를 입력안해주면 size는 무한이다.

a.put(1)
a.put(2)
a.put(3)

print('qsize?')
print('a : ', a.qsize())
print('b : ', b.qsize())
print()

print('Empty?')
print('a : ', a.empty())
print('b : ', b.empty())
print()

print('Full?')
print('a : ', a.full())
print('b : ', b.full())

qsize?
a :  3
b :  0

Empty?
a :  False
b :  True

Full?
a :  True
b :  False


***
#### 2) LifoQueue() Class
##### queue.LifoQueue() : LIFO Queue이다 

In [43]:
import queue
a = queue.LifoQueue(3)
a.put('Kim')
a.put(55)
a.put('SNU')
print(a.qsize())
print(a.get()) # Last in인 SNU가 나온다.
print(a.qsize())

3
SNU
2


***
#### 3) PriorityQueue() Class
##### queue.PriorityQueue() : 오름차순 순으로 정렬되서 queue를 생성한다.

In [45]:
import queue
a = queue.PriorityQueue(3)
a.put(20)
a.put(1)
a.put(9)
print(a.qsize())
print(a.get()) #제일 작은 숫자인 1이 return된다
print(a.qsize()) 

3
1
2


## 4. heapq Module
- min Heap or Priority Queue라고도 불림
- Heap은 Complete binary tree이다.(parent는 child보다 같거나 작다.)
- 가장작은 값이 root이다.

***
##### heapq module의 Fuctions_1
##### - heapq.push(heap, item) : heap에 item이라는 value를 넣는다.
##### - heapq.pop(heap) : heap에서 가장 작은 item을 return한다.
##### - heapq.pushpop(heap, item) : heap에 item을 넣고(heap형식에 맞게 들어감) 가장 작은 item을 return 한다

In [46]:
from heapq import *
h = []
heappush(h, (5, 'write code')) # (5, 'write code')라는 tuple을 push한 것.
heappush(h, (7, 'release product'))
heappush(h, (1, 'write sepc'))
heappush(h, (3, 'create tests'))

print(heappop(h)) # h에서 제일 작은 (1, 'write sepc) 튜플이 return됨
print(heappushpop(h, (11, 'push pop'))) # h에 (11, 'push pop') 튜플이 들어가고 제일 작은 튜플이 return됨

print(h)

(1, 'write sepc')
(3, 'create tests')
[(5, 'write code'), (7, 'release product'), (11, 'push pop')]


***
##### heapq module의 Fuctions_2
##### - heapq.heapify(x) : list x를 heap형식에 맞게 변형해준다
##### - heapq.heapreplace(heap, item) : heappushpop()은 push를 먼저해주고 pop()을해주는데 <br> heapreplace는 pop하고 push해줌

In [15]:
from heapq import *
# 질문! heapify는 언제 쓰는거지? :google
# 적용방식이 잘못됐었음 이렇게 되면 됨.
a = [3,5,7,1,3]
heapify(a)
print(a)# -> 이렇게 하면 heapify됨 [1,3,3,5,7]
heappop(a) # 질문! 이건 왜 return값이 5지?

[1, 3, 7, 5, 3]


In [59]:
#heappushpop()
from heapq import *

h = []

heappush(h, (5, 'write code')) # (5, 'write code')라는 tuple을 push한 것.
heappush(h, (7, 'release product'))
heappush(h, (1, 'write sepc'))
heappush(h, (3, 'create tests'))

print(heappushpop(h, (0, 'heap'))) # h에 (11, 'push pop') 튜플이 들어가고 제일 작은 튜플이 return됨
print(h)

(0, 'heap')
[(1, 'write sepc'), (3, 'create tests'), (5, 'write code'), (7, 'release product')]


In [61]:
#heapreplace()
from heapq import *

h = []

heappush(h, (5, 'write code')) # (5, 'write code')라는 tuple을 push한 것.
heappush(h, (7, 'release product'))
heappush(h, (1, 'write sepc'))
heappush(h, (3, 'create tests'))

print(heapreplace(h, (0, 'heap'))) # h에 (11, 'push pop') 튜플이 들어가고 제일 작은 튜플이 return됨
print(h)

(1, 'write sepc')
[(0, 'heap'), (3, 'create tests'), (5, 'write code'), (7, 'release product')]


***
##### heapq module의 Fuctions_3
##### - heapq.nlargest(n, iterable, key = None) : n개만큼 h에서 가장 큰 요소들을 return 
##### - heapq.nsmallest(n, iterable, key = None) : n개만큼 h에서 가장 작은 요소들을 return  

In [62]:
from heapq import *
h = []
heappush(h, (5, 'write code')) # (5, 'write code')라는 tuple을 push한 것.
heappush(h, (7, 'release product'))
heappush(h, (1, 'write sepc'))
heappush(h, (3, 'create tests'))

print(nlargest(3, h))
print()
print(nsmallest(3, h))

[(7, 'release product'), (5, 'write code'), (3, 'create tests')]

[(1, 'write sepc'), (3, 'create tests'), (5, 'write code')]


## 5. bisect Module
- 정렬된 리스트를 관리위한 함수로 항목 추가를 위한 insort와 검색을 위한 bisect 함수를 제공하여 별도의 정렬이 필요없도록 한다.
- 
- 

In [70]:
from bisect import bisect
grades = 'FEDCBA'
breakpoints = [30, 44, 66, 75, 85]
def grade(total):
    return grades[bisect(breakpoints, total)]
print(grade(74))
print(grade(66))
print(grade(65))
print(grade(44))
print(grade(29))

grade_map = map(grade, [33, 99 ,77, 33, 12 ,88])
grade_map
list(grade_map) # [33, 99 ,77, 33, 12 ,88]가 grade함수에 적용된 모습을 list형식으로 return해서 보여준다.

C
C
D
D
F


['E', 'A', 'B', 'E', 'F', 'A']

***
##### bisect module의 Fuctions_1<br>
##### - bisect.bisect(a, x, lo=0, hi=len(a) : x는 어디 group(partition)에 속하냐? <br>    bisect는 a의 element가 시작점이 되어 구역을 나눈다<br>
##### - bisect.bisect_left(a, x, lo=0, hi=len(a)) : x는 어디 group(partition)에 속하냐? <br>   bisect_left는 a의 element가 끝점이 되어 구역을 나눈다<br>

In [76]:
\from bisect import bisect, bisect_left

lst = [10, 20, 30, 40, 50]

print(lst)
print('20 bisect_left group # : ', bisect_left(lst, 20))
print('20 bisect group # : ', bisect(lst, 20))
print('10 bisect_left group # : ', bisect_left(lst, 10))
print('10 bisect group # : ', bisect(lst, 10))

[10, 20, 30, 40, 50]
20 bisect_left group # :  1
20 bisect group # :  2
10 bisect_left group # :  0
10 bisect group # :  1


***
# 질문!!!!!!!! bisect insort
##### bisect module의 Fuctions_2<br>
##### - bisect.insort_left(a, x, lo=0, hi=len(a)) <br>    bisect는 a의 element가 시작점이 되어 구역을 나눈다<br>
##### - bisect.bisect_left(a, x, lo=0, hi=len(a)) : x는 어디 group(partition)에 속하냐? <br>   bisect_left는 a의 element가 끝점이 되어 구역을 나눈다<br>

In [20]:
import bisect
import random
random.seed(2)

l = []
r = [4,6,6,6,24,11]
for i in range(5) :
    pos = bisect.bisect(l, r[i])
    bisect.insort(l,r[i])
    print('%2d %2d' % (r[i], pos), l)

 4  0 [4]
 6  1 [4, 6]
 6  2 [4, 6, 6]
 6  3 [4, 6, 6, 6]
24  4 [4, 6, 6, 6, 24]


In [18]:
import bisect
import random
random.seed(2)

l = []
for i in range(5) :
    r = random.randint(1, 50)
    pos = bisect.bisect_left(l, r)
    bisect.insort_left(l,r)
    print('%2d %2d' % (r, pos), l)

 4  0 [4]
 6  1 [4, 6]
 6  1 [4, 6, 6]
24  3 [4, 6, 6, 24]
11  3 [4, 6, 6, 11, 24]


In [24]:
import bisect
import random
random.seed(2)

l = []
r = [4,6,6,6,6,24,11]
for i in range(7) :
    pos = bisect.bisect(l, r[i])
    bisect.insort(l,r[i])
    print('%2d %2d' % (r[i], pos), l)

 4  0 [4]
 6  1 [4, 6]
 6  2 [4, 6, 6]
 6  3 [4, 6, 6, 6]
 6  4 [4, 6, 6, 6, 6]
24  5 [4, 6, 6, 6, 6, 24]
11  5 [4, 6, 6, 6, 6, 11, 24]


In [25]:
import bisect
import random
random.seed(2)

l = []
r = [4,6,6,6,6,24,11]
for i in range(7) :
    pos = bisect.bisect_left(l, r[i])
    bisect.insort_left(l,r[i])
    print('%2d %2d' % (r[i], pos), l)

 4  0 [4]
 6  1 [4, 6]
 6  1 [4, 6, 6]
 6  1 [4, 6, 6, 6]
 6  1 [4, 6, 6, 6, 6]
24  5 [4, 6, 6, 6, 6, 24]
11  5 [4, 6, 6, 6, 6, 11, 24]
