# Chapter 3 내장 자료구조, 함수, 파일

## 3.1 자료구조와 순차 자료형

### 3.1.1 튜플

#### 튜플 정의하기

- 튜플은 1차원의 고정된 크기를 가지는 `변경 불가능`한 순차 자료형

In [3]:
# 튜플을 정의하는 방법들 
tup = 4, 5, 6
nested_tup = (4,5,6), (7,8)
tup2 = tuple([4,5,6])
tup_string = tuple('string')

In [4]:
print('''
tup : {0}
nested_tup : {1}
tup2 : {2}
tup_string {3}'''.format(tup \
                        , nested_tup \
                        , tup2 \
                        , tup_string))


tup : (4, 5, 6)
nested_tup : ((4, 5, 6), (7, 8))
tup2 : (4, 5, 6)
tup_string ('s', 't', 'r', 'i', 'n', 'g')


- 튜플은 변경 불가능하다.

In [8]:
tup = tuple(['foo',[1,2],True])
tup[2] = False

TypeError: 'tuple' object does not support item assignment

- 튜플 내 저장된 객체는 그 위치에서 바로 변경이 가능하다

In [9]:
tup[1].append(3)
print(tup)

('foo', [1, 2, 3], True)


#### 튜플에서 값 분리하기

- 튜플과 같은 표현의 변수에 튜플을 `대입`하면 파이썬은 등호(=) 오른쪽에 있는 변수에서 값을 `분리`한다.

In [14]:
tup = 4,5,(6,7)
a,b,(c,d) = tup

print('''
a : {0}
b : {1}
c : {2}
d : {3}
'''.format(a,b,c,d))


a : 4
b : 5
c : 6
d : 7



- 튜플이나 리스트를 순회할 때도 흔히 이 기능을 활용한다.

In [15]:
seq = [(1,2,3),(4,5,6),(7,8,9)]

for a, b, c in seq:
        print('a = {0}, b = {1}, c = {2}'.format(a,b,c))

a = 1, b = 2, c = 3
a = 4, b = 5, c = 6
a = 7, b = 8, c = 9


- *rest, *_ : 처음 몇몇 값만 '끄집어내야' 하는 상황에서 사용

In [17]:
values = 1,2,3,4,5

a, b, *rest = values
d, e, *_ = values

print('''
a = {0}, b = {1}, rest = {2}
d = {3}, e = {4}, _ = {5}'''.format(a,b,rest,d,e,_))


a = 1, b = 2, rest = [3, 4, 5]
d = 1, e = 2, _ = [3, 4, 5]


#### 튜플 메서드

- 튜플은 크기와 내용이 변경 불가능하므로 인스턴스 메서드가 많지 않음
- tuple.count(value) : 주어진 value가 몇 개 있는 지 반환하는 메서드

In [20]:
a = (1,2,2,2,3,4,2)
a.count(2)

4

### 3.1.2 리스트

- 튜플과는 대조적으로 리스트는 크기나 내용의 변경이 가능하다. 
- 리스트는 대괄호 [ ]나 list 함수를 사용해서 생성할 수 있다.

In [52]:
a_list = [2,3,7,None]
print(a_list)

tup = ('foo','bar','baz')
b_list = list(tup)
print(b_list)

b_list[1] = 'peekaboo'
print(b_list)

[2, 3, 7, None]
['foo', 'bar', 'baz']
['foo', 'peekaboo', 'baz']


#### 원소 추가하고 삭제하기

* list에 원소 추가
    * list.append() : 리스트 `끝`에 새로운 값을 추가할 수 있다.
    * list.insert() : 리스트의 `특정 위치`에 값을 추가할 수 있다.

In [53]:
### list.append()
b_list.append('dwarf')
print('add dwarf in list b using list.append() : {0}'.format(b_list))

### list.insert()
b_list.insert(1, "red")
print('add red in list b at 1 using list.insert() : {0}'.format(b_list))

add dwarf in list b using list.append() : ['foo', 'peekaboo', 'baz', 'dwarf']
add red in list b at 1 using list.insert() : ['foo', 'red', 'peekaboo', 'baz', 'dwarf']


- list에 원소 삭제
    - list.pop() : 리스트의 `특정 위치`의 값을 반환하고 해당 값을 리스트에서 삭제한다.
    - list.remove() : 중복되는 값이 있는 경우 리스트에서 `제일 앞`에 위치한 값부터 삭제가 이뤄진다.

In [54]:
### list.pop()
print(b_list.pop(2))
print("remove the value in index 2 : {0}".format(b_list))

### list.remove()
b_list.append('foo')
print('add another foo in list b : {0}'.format(b_list))

b_list.remove('foo')
print("remove the value which is foo in list b : {0}".format(b_list))

peekaboo
remove the value in index 2 : ['foo', 'red', 'baz', 'dwarf']
add another foo in list b : ['foo', 'red', 'baz', 'dwarf', 'foo']
remove the value which is foo in list b : ['red', 'baz', 'dwarf', 'foo']


#### in, not in 예약어

In [56]:
print("dwarf in b_list : {0}".format('dwarf' in b_list))
print("dwarf not in b_list : {0}".format('dwarf' not in b_list))

dwarf in b_list : True
dwarf not in b_list : False


#### 리스트 이어붙이기

- \+ : + 연산자를 이용하면 두 개의 리스트를 합칠 수 있다
- list.extend() : 미리 리스트를 정의해 두었다면 extend 메서드를 사용해 여러 개의 값을 추가할 수 있다.

In [59]:
[4,None,'foo'] + [7,8,(2,3)]

[4, None, 'foo', 7, 8, (2, 3)]

In [61]:
x = [4, None, 'foo']
x.extend([7,8,(2,3)])
print(x)

[4, None, 'foo', 7, 8, (2, 3)]


### 3.1.3 내장 순차 자료형 함수

#### enumerate 

- 이 함수는 순차 자료형에서 현재 아이템의 색인을 함께 처리하고자 할 때 흔히 사용한다.

In [71]:
some_list = ['foo', 'bar', 'baz']

mapping = {}

for i, v in enumerate(some_list) : 
    mapping[v] = i
    print(mapping)

{'foo': 0}
{'foo': 0, 'bar': 1}
{'foo': 0, 'bar': 1, 'baz': 2}


#### sorted

- sorted 함수는 정렬된 `새로운 순차 자료형`을 반환한다.

In [72]:
a = [7,1,2,6,0,3,2]
b = sorted(a)

print('''
a = {0}
b = {1}'''.format(a, b))


a = [7, 1, 2, 6, 0, 3, 2]
b = [0, 1, 2, 2, 3, 6, 7]


#### zip

- zip 함수는 여러 개의 리스트나 튜플 또는 다른 순차 자료형을 서로 짝지어서 튜플의 리스트를 생성한다.

In [80]:
seq1 = ['foo','bar','baz']
seq2 = ['one','two','three']

zipped = zip(seq1,seq2)
list(zipped)

[('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

- zip 함수는 여러 개의 순차 자료형을 받을 수 있으며 반환되는 리스트의 크기는 넘겨받은 순차 자료형 중 `가장 짧은` 크기로 정해진다.


In [83]:
seq3 = [False, True]

list(zip(seq1,seq2,seq3))

[('foo', 'one', False), ('bar', 'two', True)]

- zip 함수는 enumerate와 함께 사용되기도 한다.

In [84]:
for i, (a,b) in enumerate(zip(seq1,seq2)) : 
    print('''
    i = {0}
    a = {1}
    b = {2}'''.format(i,a,b))


    i = 0
    a = foo
    b = one

    i = 1
    a = bar
    b = two

    i = 2
    a = baz
    b = three


- zip 함수를 사용해서 짝지어진 순차 자료형을 다시 풀어낼 수도 있다. 
- 이를 이용해서 리스트의 `로우`를 리스트의 `컬럼`으로 변환하는 것도 가능하다.

In [87]:
pitchers = [('Nolan','Ryan'), ('Roger','Clemens'), ('Schilling', 'Curt')]

first_names, last_names = zip(*pitchers)

print('''
first_names : {0}
last_names : {1}'''.format(first_names,last_names))


first_names : ('Nolan', 'Roger', 'Schilling')
last_names : ('Ryan', 'Clemens', 'Curt')


### 3.1.4 사전

- dict(사전)은 파이썬 내장 자료구조 중에서 가장 중요하다.
- 일반적으로는 `해시맵` 또는 `연관 배열`이라고 널리 알려져 있다.
- 사전은 유연한 크기를 가지는 `키-값` 쌍으로, `키`와 `값`은 모두 파이썬 객체다.

In [90]:
d1 = {'a' : 'some value', 'b' : [1,2,3,4]}
print(d1)

{'a': 'some value', 'b': [1, 2, 3, 4]}


In [94]:
d1[7] = 'an integer'
d1

{'a': 'some value', 'b': [1, 2, 3, 4], 7: 'an integer'}

In [96]:
print('''
d1['a'] : {0}
d1[7] : {1}'''.format(d1['a'] \
                     , d1[7]))


d1['a'] : some value
d1[7] : an integer


In [99]:
'b' in d1

True