# 데이터 구조 생각해보기

***
- 스택과 큐(Stack & queue with list)

- 튜플과 집합(tuple & set)

- 사전(dictionary)

- collection 모듈

***
## Stack

- 나중에 넣은 데이터를 먼저 반환하도록 설계된 메모리 구조

- Last in First Out(LIFO)

- 리스트를 사용하여 스택 구조를 구현 가능
- **push를 append()**, **pop을 pop()**를 사용

In [46]:
a = [1,2,3,4,5]
print(f'before {a}')
a.append(10)
a.append(20)
print(f'append after {a}')
print(a.pop()) # 20 pop : 출력 return이 존재하면서 a가 변환
print(a.pop()) 
print(f'after {a}')

before [1, 2, 3, 4, 5]
append after [1, 2, 3, 4, 5, 10, 20]
20
10
after [1, 2, 3, 4, 5]


#### # stack example
- 스택 구조를 활용, 입력된 글자를 역순으로 출력

In [50]:
word = input("Input a word : ")

word_list = list(word)
for _ in range(len(word_list)) :
    print(word_list.pop())
    print(word_list)

Input a word : naver
r
['n', 'a', 'v', 'e']
e
['n', 'a', 'v']
v
['n', 'a']
a
['n']
n
[]


***
## 큐(Queue)

- 먼저 넣은 데이터를 먼저 반환하도록 설계된 메모리 구조

- First In First Out(FIFO)

- Stack과 반대되는 개념

- 파이썬은 리스트를 사용하여 큐 구조를 활용

- **put를 append(), get을 pop(0)**을 사용


In [51]:
a = [1,2,3,4,5]
print(f'before {a}')
a.append(10)
a.append(20)
print(f'append after {a}')
a.pop(0) # 1 출력
a.pop(0) # 2 출력
print(f'pop after {a}')

before [1, 2, 3, 4, 5]
append after [1, 2, 3, 4, 5, 10, 20]
pop after [3, 4, 5, 10, 20]


## 튜플(Tuple)

- 값의 변경이 불가능한 리스트
- 선언 시 '[]'가 아닌 '()'를 사용
- 리스트의 연산, 인덱싱, 슬라이싱 등을 동일하게 사용

In [53]:
t = (1,2,3)
type(t)

tuple

In [56]:
t

(1, 2, 3)

In [55]:
# 연산은 가능하다.
print(t+t, t*2)

(1, 2, 3, 1, 2, 3) (1, 2, 3, 1, 2, 3)


In [57]:
len(t)

3

#### 값을 변경할 수 없다.

In [58]:
t[1] = 5

TypeError: 'tuple' object does not support item assignment

### 튜플 왜쓸까?

- 프로그램을 작동하는 동안 변경되지 않은 데이터의 저장
Ex) 학번, 이름, 우편번호 등등
- 함수의 반환 값등 사용자의 실수에 의한 에러를 사전에 방지

In [64]:
t = (1) # 일반 정수로 인식
t = (1,) # 값이 하나인 tuple은 반드시 ','를 붙여야 함
t

(1,)

## 집합 (set)

- 값을 순서없이 저장, 중복 불허 하는 자료형
- set 객체 선언을 이용하여 객체 생성

In [66]:
s = set([1,2,3,1,2,3]) # set 함수를 사용 1,2,3을 집합 객체 생성, a = {1,2,3,4,5}도 가능
print(s)
s.add(1) # 한 원소 1만 추가, -> 중복 불허로 추가 x
print(s)
s.remove(1) # 1 삭제
print(s)

{1, 2, 3}
{1, 2, 3}
{2, 3}


In [68]:
s.update([1,4,5,6,7]) # [1,4,5,6,7] 추가
print(s)
s.discard(3) # 3삭제
print(s)
s.clear() # s 원소 제거
print(s)

{1, 2, 4, 5, 6, 7}
{1, 2, 4, 5, 6, 7}
set()


### 집합의 연산

In [69]:
# 합집합
s1 = set([1,2,3,4,5])
s2 = set([3,4,5,6,7])
s1.union(s2)

{1, 2, 3, 4, 5, 6, 7}

In [70]:
# 합집합
s1|s2

{1, 2, 3, 4, 5, 6, 7}

In [71]:
# 교집합
s1.intersection(s2)

{3, 4, 5}

In [72]:
s1 & s2 # 교집합

{3, 4, 5}

In [73]:
s1.difference(s2) # s1과 s2의 차집합

{1, 2}

In [74]:
s1 - s2

{1, 2}

## 사전(Dictionary)

- **데이터를 저장 할 때는 구분 지을 수 있는 값을 함께 저장**<br>
ex) 주민등록 번호, 제품 모델 번호

- 구분을 위한 데이터 고유 값을 **Identifier** 또는 **Key**라고함

- Key 값을 활용하여, **데이터 값(Value)**를 관리함

***
- key와 value를 매칭하여 key로 value를 검색
- 다른 언어에서는 Hash Table이라는 용어를 사용
- {key1 : value1, key2: value2, key3 : value3. ..} 형태

In [76]:
student_info = {201552043 : '태양', 
               201552001 : '승우'}
student_info

{201552043: '태양', 201552001: '승우'}

In [77]:
student_info.items() # dict 데이터 출력

dict_items([(201552043, '태양'), (201552001, '승우')])

In [78]:
student_info.keys() # dict 키만 출력

dict_keys([201552043, 201552001])

In [79]:
student_info.values() # value만 출력

dict_values(['태양', '승우'])

In [81]:
# 새로운 키값
student_info['201422222'] = '다른 학번 학생'
student_info

{201552043: '태양', 201552001: '승우', '201422222': '다른 학번 학생'}

In [82]:
for k,v in student_info.items() :
    print("key :", k)
    print("value :",v)

key : 201552043
value : 태양
key : 201552001
value : 승우
key : 201422222
value : 다른 학번 학생


In [83]:
# 특정값이 key값에 있는지 확인
201552043 in student_info.keys()

True

## Lab - Dict

In [84]:
import csv

def getKey(item) : # 정렬을 위한 함수
    return item[1]

command_data = [] # 파일 읽어오기
with open('D:\Portfolio\Python Exercise\Python Basic\command_data.csv','r', encoding = 'utf8') as csvfile :
    spamreader = csv.reader(csvfile, delimiter = ',', quotechar = '"')
    for row in spamreader :
        command_data.append(row)

command_counter = {} # dict 생성
for data in command_data : # list 데이터를 dict로 변경
    if data[1] in command_counter.keys() :
        command_counter[data[1]] += 1 # 기존 출현한 아이디
    else :
        command_counter[data[1]] = 1 # 처음 출현한 아이디

dictlist = [] # dict를 리스트로 변경
for key, value in command_counter.items() :
    temp = [key, value]
    dictlist.append(temp)

print(dictlist)
sorted_dict = sorted(dictlist, key = getKey, reverse = True) # 위에서 정의한 getkey 함수를 사용 # list를 입력 줄 수로 정렬
print(sorted_dict[:100]) # list의 상위 100개의 값만 출력

[['id', 1], ['source', 1], ['tiana', 167], ['white_rabbit', 237], ['flo', 324], ['chum', 311], ['rocket_raccoon', 473], ['faline', 3115], ['kristoff', 4934], ['tinker_bell', 696], ['crush', 231], ['flik', 424], ['claire_wheeler', 2777], ['meg', 3098], ['fillmore', 7394], ['tarzan', 4193], ['bomb_voyage', 337], ['prince_naveen', 425], ['disgust', 305], ['bo_peep', 407], ['francis', 5978], ['aladdin', 402], ['eve', 239], ['bookworm', 8500], ['cheshire_cat', 200], ['anna', 304], ['emperor_zurg', 4470], ['the_dodo', 1364], ['finn_mcmissile', 319], ['barricade', 5], ['fear', 2968], ['marlon_the_alligator', 3203], ['don_carlton', 2773], ['alice', 123], ['carrie_williams', 223], ['boo', 304], ['bing_bong', 311], ['charlie', 363], ['snow_white', 115], ['elsa', 7500], ['emile', 168], ['django', 371], ['fred', 244], ['bambi', 275], ['fa_zhou', 299], ['fritz', 94], ['duke_of_weselton', 264], ['nani_pelekai', 319], ['the_magic_mirror', 116], ['mulan', 188], ['thor', 98], ['flynn_rider', 1996], ['l

***
# Collections

- List, Tuple, Dict에 대한 Python Built-in 확장 자료 구조

- 편의성, 실행 효율 등을 사용자에게 제공


## deque

- Stack과 Queue를 지원하는 모듈

- List에 비해 효율적인 = 빠른 자료 저장 방식을 지원

In [92]:
from collections import deque

deque_list = deque()
for i in range(5) :
    deque_list.append(i)
print(deque_list)
deque_list.appendleft(10) # 리스트 왼쪽에 10 append
print(deque_list)

deque([0, 1, 2, 3, 4])
deque([10, 0, 1, 2, 3, 4])


- rotate, reverse 등 Linked List의 특성을 지원함

In [93]:
deque_list.extend([5,6,7])
deque_list

deque([10, 0, 1, 2, 3, 4, 5, 6, 7])

In [95]:
# rotate
deque_list.rotate(2)
deque_list

deque([5, 6, 7, 10, 0, 1, 2, 3, 4])

#### deque의 속도가 더 빠름

In [96]:
def general_list() :
    just_list= []
    for i in range(100) :
        for j in range(100) :
            just_list.append(i)
            just_list.pop()
            
%timeit general_list()

3.81 ms ± 197 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [97]:
def deque_list() :
    deque_list = deque()
    
    for i in range(100) :
        for i in range(100) :
            deque_list.append(i)
            deque_list.pop()
%timeit deque_list()

1.47 ms ± 167 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


## defaultdict

- Dict type의 값에 기본 값을 지정, 신규값 생성시 사용하는 방법

In [98]:
# 키 에러 발생
d = dict()
print(d['first'])

KeyError: 'first'

In [99]:
# default dict에 들어갈 value
def default_value() :
    return 10

In [102]:
from collections import defaultdict
d = defaultdict(object) # defaultdict 생성
d = defaultdict(default_value) # 초기값 입력

# 아무 키나 입력해도 값이 나온다!
d['first']

10

defaultdict는 단어 개수를 셀 때 유용하게 쓸 수 있다.

In [107]:
text = """Yesterday, all my troubles seemed so far away
Now it looks as though they're here to stay
Oh, I believe in yesterday
Suddenly I'm not half the man I used to be
There's a shadow hanging over me
Oh, yesterday came suddenly
Why she had to go
I don't know, she wouldn't say
I said something wrong
Now I long for yesterday
Yesterday love was such an easy game to play
Now I need a place to hide away
Oh, I believe in yesterday
Why? d she have to go?
I don't know, she wouldn't say
I said something wrong
Now I long for yesterday
Yesterday love was such an easy game to play
Now I need a place to hide away
Oh, I believe in yesterday"""

In [108]:
# 텍스트 분리하여 count
for word in text.split() :
    d[word] += 1

In [109]:
d

defaultdict(<function __main__.default_value()>,
            {'first': 10,
             'Yesterday,': 11,
             'all': 11,
             'my': 11,
             'troubles': 11,
             'seemed': 11,
             'so': 11,
             'far': 11,
             'away': 13,
             'Now': 15,
             'it': 11,
             'looks': 11,
             'as': 11,
             'though': 11,
             "they're": 11,
             'here': 11,
             'to': 18,
             'stay': 11,
             'Oh,': 14,
             'I': 22,
             'believe': 13,
             'in': 13,
             'yesterday': 16,
             'Suddenly': 11,
             "I'm": 11,
             'not': 11,
             'half': 11,
             'the': 11,
             'man': 11,
             'used': 11,
             'be': 11,
             "There's": 11,
             'a': 13,
             'shadow': 11,
             'hanging': 11,
             'over': 11,
             'me': 11,
             'cam

## Counter

- sequence type의 data element들의 갯수를 dict 형태로 반환

In [112]:
from collections import Counter

ball_or_strike = ['b','b','s','s','b','s']
c = Counter() # 빈 카운터
c = Counter(ball_or_strike) # 개수 세기
print(c)

Counter({'b': 3, 's': 3})


#### set의 연산을 지원함

In [118]:
c = Counter(a = 4, b= 2 ,c = 0, d = -2)
d = Counter(a = 1, b = 2, c= 3, d= 4)
print(c)
print(d)

Counter({'a': 4, 'b': 2, 'c': 0, 'd': -2})
Counter({'d': 4, 'c': 3, 'b': 2, 'a': 1})


In [119]:
print(c + d)
print(c & d)
print(c | d)

Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2})
Counter({'b': 2, 'a': 1})
Counter({'a': 4, 'd': 4, 'c': 3, 'b': 2})
