# 내장 자료구조, 함수, 파일

### 내장 자료구조

#### 1. Tuple

In [8]:
# tuple : 1차원의 고정된 크기를 갖는 변경 불가능한 순차 자료형 

# tuple 선언 
tup = (1,2,3)
tup = 1,2,3
tup = tuple([1,2,3])

# tuple은 다양한 자료형이 저장 가능하다. 
tup = ('foo',[1,2],True)

# id() : 파이썬이 객체를 구별하기 위해 부여하는 일련번호를 호출하는 함수 
print(id(tup))

# tuple은 변하는 자료형이 아님으로 tuple 객체에 변화가 생긴다면 id가 달라진다. 즉 다른 객체인 것이다. 
tup += (3,4)
print(tup)
print(id(tup))


# unpacking 
# tuple은 unpacking(값 분리하기)이 가능하다.
tup = (1,2,3)
a,b,c = tup
print(f"a : {a}, b : {b}, c : {c}")

# 반복문을 활용한 unpacking 
seq = [(1,2,3),(4,5,6),(7,8,9)]
for a,b,c in seq : 
    print(a,b,c)

# 특정 변수만 unpacking 
values  = 1,2,3,4,5

# 특정 변수와 그 외의 변수를 따로 묶고 싶은 경우 *를 사용
# 남은 변수는 리스트로 묶어 반환함 
a,b, *rest = values
# 특정 변수만 취하고 나머지는 필요 없는 경우 *_ 사용
a,b, *_  = values 


2716557523968
('foo', [1, 2], True, 3, 4)
2716524389616
a : 1, b : 2, c : 3
1 2 3
4 5 6
7 8 9


#### 2. List

In [22]:
# list : 리스트는 크기나 내용이 변경 가능한 순차 자료형이다. 

# list 선언
a_list = [1,2,3,None]
tup = 1,2,3,None
b_list = list(tup)
gen = range(3)
c_list = list(gen)

print(a_list,b_list,c_list)


[1, 2, 3, None] [1, 2, 3, None] [0, 1, 2]


In [24]:

# list의 여러가지 method : append, insert, remove, pop, extend, sort, in, not in 


# extend 와 "+"의 차이 
list_1 = [1,2,3]
print(id(list_1))
list_2 = [4,5,6]

# extend : 기존 리스트에 더해서 반환 
list_1.extend(list_2)
print(id(list_1))

# + : 새로운 리스트를 만들어 반환
print(id(list_1+list_2))

2716557790912
2716557790912
2716557858240


In [None]:
# list는 slicing이 가능하다. 
# list slicing : [start : stop]

In [26]:
# enumerate() : list의 요소를 순서대로 반복하며 index 유지가 가능하다.
some_list = ['a','b','c']
for index,value in enumerate(some_list):
    print(index,value)

0 a
1 b
2 c


In [25]:
# sorted() : 정렬된 새로운 list를 반환함 
sorted([6,4,3,2,4,1])

[1, 2, 3, 4, 4, 6]

In [50]:
# zip : 여러개의 튜플, 리스트 등의 순차 자료형을 짝지어 튜플을 생선한다. 
from itertools import zip_longest


seq1 = ['a','b','c']
seq2 = [1,2,3]

# zip 만들기
zipped = zip(seq1,seq2)
print(list(zipped))


# zip을 만들 때, 입력된 순차 자료형의 길이가 다른 경우 가장 짧은 것을 기준으로 만든다. 
seq3 = [True,False]
zipped = zip(seq1,seq3)
zipped = list(zipped)
print(zipped)

# zip을 만들 때, 입력된 순차 자료형의 길이가 다른 경우 가장 긴 것을 기준으로 만드는 방법 : zip_longest 
# zip_longest는 짝이 맞지 않는 부분은 None으로 채운다. 
zipped_long = zip_longest(seq1,seq3)
zippeed_long_list = list(zipped_long)
print(zippeed_long_list)

# unzip : zip(*변수)

print("\n unpacking")
first, second = zip(*zippeed_long_list)
print(first)
print(second)

[('a', 1), ('b', 2), ('c', 3)]
[('a', True), ('b', False)]
[('a', True), ('b', False), ('c', None)]

 unpacking
('a', 'b', 'c')
(True, False, None)


#### 3. Dict

내장 구조 중 가장 중요한 자료구조  
일반적으로 해시맵, 연관배열이라고 불린다.  
유연한 key - value 의 쌍이며 key,value 모두 객체다. 


In [62]:
# dict 선언 

# {}로 나타내고, : 로 key,value를 구분한다. 
# dict의 key값으로는 단일 값을 담는 스칼라 자료형 혹은 값이 바뀌지 않는 tuple과 같은 객체만 가능함
d1 = {'a':1,'b':2}

# 새로운 값 dict에 넣기 dict[key] = value
d1['c'] = 3
print(d1)

# del d[key] :  값 삭제하기 
del d1['c']
print(d1)

# pop() : key값에 해당하는 value 반환, key값이 없다면 예외 발생
ret = d1.pop('b')
print(ret)
print(d1)

# get() : key값이 있다면 value 반환, key값이 없다면 None반환, 삭제하지는 않음
print(d1.get('a'))
d1



{'a': 1, 'b': 2, 'c': 3}
{'a': 1, 'b': 2}
2
{'a': 1}
1


{'a': 1}

In [63]:
# keys, values method는 iterator를 반환, 정렬되어 있지는 않다. 
# keys, values method가 반환하는 리스트의 순서는 서로 같다. 
d2 = {'a':1,'b':2,'d':4,'c':3}
print(list(d2.keys()))
print(list(d2.values()))

['a', 'b', 'd', 'c']
[1, 2, 4, 3]


In [72]:
# dict 기본값 처리 : key값이 없는 경우 처리방법 
words  = ['apple','bat','bar','atom','book']
by_letter = {}

# sol 1
for word in words:
    letter = word[0]
    # key값이 없다면 key : value 추가
    if letter not in by_letter:
        by_letter[letter] = [word]
    # 해당 key 값이 있다면 
    else : by_letter[letter].append(word)
by_letter


{'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']}

In [69]:
# sol 2 : setdefault(key,default value)    
words  = ['apple','bat','bar','atom','book']
by_letter = {}
for word in words : 
    letter = word[0]
    by_letter.setdefault(letter,[]).append(word)
by_letter

{'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']}

In [76]:
# sol 3 : defaultdict(function) : 입력된 key값이 없는 경우 function을 불러와 value를 만듬
from collections import defaultdict
by_letter = defaultdict(list)
for word in words:
    by_letter[word[0]].append(word)
by_letter

defaultdict(list, {'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']})

In [None]:
# 아\