# 파이썬 기본 데이터구조
- 스택과 큐(stack & queue with list)
- 튜플과 집합(tuple & set)
- 사전(dictionary)
- Collection 모듈

## 1. 스택과 큐(stack & queue with list)

## stack
- 나중에 넣은 데이터를 먼저 반환
- LIFO

- pop()
    - 리턴이 있다.
    - sorted()도 리턴이 있음



In [3]:
a = [3,56,1,7,5]
a.append(555)
a

[3, 56, 1, 7, 5, 555]

In [4]:
a.pop()
a

[3, 56, 1, 7, 5]

In [5]:
for _ in range(len(a)):
    print(a.pop())

5
7
1
56
3


## pop
- 먼저 넣은 데이터를 먼저 반환
- FIFO
- a.pop(0)
    - 맨앞 데이터가 빠짐

In [7]:
a = [1,5,7,89,9,3,32,4,2]

## 2. 튜플과 집합(tuple & set)
- 값의 변경이 불가능한 리스트
- 선언시 '(' 를 이용
- t = (1)  # 일반 정수로 인식
- t = (1,) #값이 하나인 Tuple은 반드시 ","를 붙여야 함

In [13]:
t = (1,2,3)
print(type(t))
print(t+t)
print(t*2)

<class 'tuple'>
(1, 2, 3, 1, 2, 3)
(1, 2, 3, 1, 2, 3)


In [15]:
t[3] = 2 # Error발생

TypeError: 'tuple' object does not support item assignment

### set
- 값을 순서없이 저장, 중복 불허 하는 자료형
- set객체를 이용하여 생성
    - add
    - remove 
    - update
    - discard 해당값만삭제
    - clear
- 합집합
    - union, |
- 교집합
    - intersection, &
- 차집합
    - defference, -

In [19]:
s = set([1,2,3,1,2,3])
print(s)
type(s)

{1, 2, 3}


set

In [28]:
s1 = set([1,2,3])
s2 = set([3,4,5])
print("합집합",s1 | s2)
print("교집합",s1 & s2)
print("차집합",s1 - s2)


합집합 {1, 2, 3, 4, 5}
교집합 {3}
차집합 {1, 2}


## 3. 사전(dictionary)
- 구분할 수 있는 값을 함께 저장
- 구분을 위한 데이터 고유 값을 Identifier 또는 Key라고 한다.
- Key값을 활용하여, 데이터 값(Value)를 관리함
- items()
    - 반환타입 tuple. 읽기만가능하다 변환x
- 

In [31]:
student_info = {
    "America":1
    ,"Korea":2
}
student_info["America"]

1

vscode rainbow csv 라는거 설치

## 4. Collection 모듈
- List, Tuple, Dict에 대한 Python Built-in 확장 자료 구조(모듈)
- 편의성, 실행 효율 등을 사용자에게 제공함
- 아래 모듈이 존재함
    - from collections import deque
    - from collections import Counter
    - from collections import OrderedDict
    - from collections import defaultdict
    - from collections import namedtuple

## deque
- from collections import deque
- Stack과 Queue를 지원하는 모듈
- List에 비해 효율적인=빠른 자료 저장 방식을 지원한다
- rotate, reverse등 Linked List의 특성을 지원한다.

In [34]:
from collections import deque
deque_list = deque()
for i in range(5):
    deque_list.append(i)
print(deque_list)
deque_list.appendleft(10)
print(deque_list)
deque_list.append(1055)
print(deque_list)
# extend, extendleft 도 제공

deque([0, 1, 2, 3, 4])
deque([10, 0, 1, 2, 3, 4])
deque([10, 0, 1, 2, 3, 4, 1055])


#### deque

In [39]:
from collections import deque
import time
start_time = time.clock()
deque_list = deque()

for i in range(10000):
    for i in range(10000):
        deque_list.append(i)
        deque_list.pop()
print(time.clock() - start_time, "seconds")

# jupter notebook에서 속도를 재는 모듈
# %timeit general_list()

13.135664799999972 seconds


#### general list

In [40]:
import time
start_time = time.clock()
just_list = []

for i in range(10000):
    for i in range(10000):
        just_list.append(i)
        just_list.pop()
print(time.clock() - start_time, "seconds")
# %timeit general_list()

32.47680049999997 seconds


In [43]:
def general_list():
    just_list = []
    for i in range(10000):
        for i in range(10000):
            just_list.append(i)
            just_list.pop()
%timeit general_list()


27.5 s ± 347 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [42]:
def deque_list():
    deque_list = deque()

    for i in range(10000):
        for i in range(10000):
            deque_list.append(i)
            deque_list.pop()
%timeit deque_list()

9.13 s ± 48.3 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


## defaultdict
- from collections import defaultdict
- dict type의 값에 기본값을 지정, 신규값 생성시 사용하는 방법

In [44]:
d = dict()
print(d["first"])

KeyError: 'first'

In [45]:
from collections import defaultdict
d = defaultdict(object) # default dictionary를 생성
d = defaultdict(lambda:0) # default 값을 0 으로 설정함. 함수형태로 넣어줘야해서 람다 사용
print(d["first"])

0


In [46]:
test = "ajwenkjn fwnkjenk ncakdn ckansaiwe wi riw riw rowa rwkmakmlasm clzm c.zmxvmiani wnfnwkafn wj fiowmklem rlkwm riowm rmwklm wlka mflk wm aifom sw  csklmci smc oiawmico wmoi cmwcm woi mowim iowm oaw"
from collections import defaultdict

d = defaultdict(lambda:0)
for word in test.split():
    d[word] += 1
d

defaultdict(<function __main__.<lambda>()>,
            {'ajwenkjn': 1,
             'fwnkjenk': 1,
             'ncakdn': 1,
             'ckansaiwe': 1,
             'wi': 1,
             'riw': 2,
             'rowa': 1,
             'rwkmakmlasm': 1,
             'clzm': 1,
             'c.zmxvmiani': 1,
             'wnfnwkafn': 1,
             'wj': 1,
             'fiowmklem': 1,
             'rlkwm': 1,
             'riowm': 1,
             'rmwklm': 1,
             'wlka': 1,
             'mflk': 1,
             'wm': 1,
             'aifom': 1,
             'sw': 1,
             'csklmci': 1,
             'smc': 1,
             'oiawmico': 1,
             'wmoi': 1,
             'cmwcm': 1,
             'woi': 1,
             'mowim': 1,
             'iowm': 1,
             'oaw': 1})

## OrderedDict
- from collections import OrderedDict
- dict와 달리, 데이터를 입력한 순서대로 dict를 반환함    
- 그러나 dict도 python 3.6부터 입력한 순서를 보장하여 출력함

In [51]:
from collections import OrderedDict
sorted_dict = OrderedDict()
def get_key(x):
    return x[1]
for i, v in sorted(d.items(), key=get_key, reverse=True):
    sorted_dict[i] = v
print(sorted_dict)

OrderedDict([('riw', 2), ('ajwenkjn', 1), ('fwnkjenk', 1), ('ncakdn', 1), ('ckansaiwe', 1), ('wi', 1), ('rowa', 1), ('rwkmakmlasm', 1), ('clzm', 1), ('c.zmxvmiani', 1), ('wnfnwkafn', 1), ('wj', 1), ('fiowmklem', 1), ('rlkwm', 1), ('riowm', 1), ('rmwklm', 1), ('wlka', 1), ('mflk', 1), ('wm', 1), ('aifom', 1), ('sw', 1), ('csklmci', 1), ('smc', 1), ('oiawmico', 1), ('wmoi', 1), ('cmwcm', 1), ('woi', 1), ('mowim', 1), ('iowm', 1), ('oaw', 1)])


## Counter
- from collections import Counter
- sequence type의 data element들의 갯수를 dict형태로 반환

In [56]:
from collections import Counter
c = Counter()
c = Counter('gallahad')
print(c)
print(c.elements())
print(list(c.elements()))
d1 = Counter(a= 3, b=5, c=1, d=7)
d2 = Counter(a= 1, b=1, c=1, d=1)
d1 + d2

Counter({'a': 3, 'l': 2, 'g': 1, 'h': 1, 'd': 1})
<itertools.chain object at 0x00000267EA271780>
['g', 'a', 'a', 'a', 'l', 'l', 'h', 'd']


Counter({'a': 4, 'b': 6, 'c': 2, 'd': 8})

## namedtuple
- from collections import namedtuple
- tuple형태로 data구조체를 저장하는 방법
- 저장되는 data의 variable을 사전에 지정해서 저장함

In [59]:
from collections import namedtuple
Point = namedtuple('Point', ['x','y'])
p = Point(11, y=22)
print(p[0] + p[1])
print(p.x, p.y)

33
11 22
