## 3장 내장 자료구조, 함수, 파일

#### 튜플
튜플은 한 번 할당되면 변경할 수 없는, 고정 길이를 갖는 파이썬의 순차 자료형이다.
튜플을 생성하는 가장 쉬운 방법은 쉼표로 구분되는 일련의 값을 괄호로 감싸는 것이다.

In [12]:
tup = (1, 2, 3)
tup

(1, 2, 3)

다음과 같이 괄호를 생략하는 경우도 있다.

In [13]:
tup2 = 4, 5, 6
tup2

(4, 5, 6)

모든 순차 자료형이나 이터레이터는 tuple 매서드를 통해 튜플로 변환할 수 있다.

In [14]:
print(tuple([4, 0, 2]))
print('\n')
print(tuple("string"))

(4, 0, 2)


('s', 't', 'r', 'i', 'n', 'g')


튜플의 튜플을 생성하는 경우, 괄호로 값을 묶어준다.

In [15]:
nested_tup = (4, 5, 6), (1, 2)
print(nested_tup)
print(nested_tup[1])

((4, 5, 6), (1, 2))
(1, 2)


튜플에 저장된 객체 자체는 변경이 가능하지만, 한 번 생성되면 각 슬롯에 저장된 객체를 변경하는 것은 불가능하다.

In [16]:
tup = tuple(['foo', [1, 2], True, 4])
tup[2] = False

TypeError: 'tuple' object does not support item assignment

In [17]:
tup[1].append(3)
tup

('foo', [1, 2, 3], True, 4)

#### 리스트
리스트는 튜플과 다르게 크기나 내용을 변경할 수 있다.
리스트는 대괄호([])나 list 함수를 사용하여 생성한다.

In [18]:
a_list = [2, 3, 5, False]
tup = ('foo', 'bar', 'baz')
b_list = list(tup)
print(b_list)

b_list[1] = 'peekaboo'
print(b_list)

tup = tuple(b_list)
print(tup)

['foo', 'bar', 'baz']
['foo', 'peekaboo', 'baz']
('foo', 'peekaboo', 'baz')


sort 함수를 이용하여 새로운 리스트를 생성하지 않고 있는 그대로 리스트를 정렬할 수 있다.

In [19]:
a = [1, 5, 2, 7, 10, 3, 6]
a.sort()
print(a)

[1, 2, 3, 5, 6, 7, 10]


---

#### 딕셔너리
딕셔너리(dict)는 파이썬 내장 자료구조 중에서 가장 중요한 자료구조다.
다른 프로그래밍 언어에서는 해시 맵 또는 연관 배열이라고 알려져 있다.
딕셔너리는 키-값 쌍을 저장하며 키와 값은 모두 파이썬 객체다.
각 키는 값과 연관되어 특정 키가 주어지면 값을 편리하게 검색, 삽입, 수정 또는 삭제할 수 있따.
중괄호({})를 사용해 콜론으로 구분된 키와 값을 둘러싸면 딕셔너리가 생성된다.

In [20]:
empty_dict = {}
d1 = {"a" : "some value", "b" : [1, 2, 3, 4], "c" : 1}
d1

{'a': 'some value', 'b': [1, 2, 3, 4], 'c': 1}

In [21]:
d1[7] = "an integer"
d1

{'a': 'some value', 'b': [1, 2, 3, 4], 'c': 1, 7: 'an integer'}

In [22]:
d1["b"]

[1, 2, 3, 4]

del 예약어나 pop 매서드(값을 반환함과 동시에 키를 삭제)를 통해 딕셔너리의 값을 삭제할 수 있다.

In [23]:
d1["f"] = "some value"
d1["dummy"] = "another value"
del d1["f"]
d1

{'a': 'some value',
 'b': [1, 2, 3, 4],
 'c': 1,
 7: 'an integer',
 'dummy': 'another value'}

In [24]:
ret = d1.pop("dummy")
print("ret : \t", ret)
print("d1 : \t", d1)

ret : 	 another value
d1 : 	 {'a': 'some value', 'b': [1, 2, 3, 4], 'c': 1, 7: 'an integer'}


---

#### 내장 순차 자료형 함수
* enumerate : 순차 자료형에서 현재 아이템의 색인을 함께 추정할 때 흔히 사용된다.
* sorted : 정렬된 새로운 순차 자료형을 반환한다.
* zip : 여러 개의 리스트나 튜플 또는 다른 순차 자료형을 서로 짝지어서 튜플 리스트를 생성한다.
* reversed : 순차 자료형을 역순으로 순회한다.

In [25]:
# enumerate
collection = ['a', 'b', 'c']

for index, value in enumerate(collection):
    print((index, value))

(0, 'a')
(1, 'b')
(2, 'c')


In [29]:
# sorted
print(sorted([7, 1, 2, 5, 3, 9, 4, 8]))

print(sorted('horse race'))

[1, 2, 3, 4, 5, 7, 8, 9]
[' ', 'a', 'c', 'e', 'e', 'h', 'o', 'r', 'r', 's']


In [1]:
# zip
seq1 = ['foo', 'bar', 'baz']
seq2 = ['one', 'two', 'three']
zipped = zip(seq1, seq2)
print(list(zipped))

seq3 = [True, False]
zipped2 = zip(seq1, seq2, seq3)
print(list(zipped2))

for index, (a, b) in enumerate(zip(seq1, seq2)):
    print(f"{index} : {a}, {b}")

[('foo', 'one'), ('bar', 'two'), ('baz', 'three')]
[('foo', 'one', True), ('bar', 'two', False)]
0 : foo, one
1 : bar, two
2 : baz, three


In [3]:
# reversed
print(list(reversed(range(20))))

[19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0]


---

#### 리스트, 집합, 딕셔너리 표기법

In [16]:
# 리스트
# [expr for value in collection if condition]
# => result = []
#    for value in collection:
#       if condition:
#          result.append(expr)

strings = ['a', 'ab', 'abc', 'abcd', 'abcde', 'fg']
list1 = [len(x) for x in strings if len(x)>2]
list2 = [x.upper() for x in strings if len(x)>2]

for index, (a, b) in enumerate(zip(list1, list2)):
    print(f"{index} : {a}, {b}")

0 : 3, ABC
1 : 4, ABCD
2 : 5, ABCDE


In [24]:
# 집합
# 리스트 표기법에서 대괄호 대신 중괄호를 사용한다.
# set_comp = {expr for value in collection if condition}

unique_lengths = {len(x) for x in strings}
print(unique_lengths)

set(map(len, strings))

{1, 2, 3, 4, 5}


{1, 2, 3, 4, 5}

In [26]:
# 딕셔너리
# dict_comp = {key-expr : value-expr for value in collection if condition}
# 문자열의 위치를 담고 있는 딕셔너리 생성

loc_mapping = {value : index for index, value in enumerate(strings)}
loc_mapping

{'a': 0, 'ab': 1, 'abc': 2, 'abcd': 3, 'abcde': 4, 'fg': 5}

In [32]:
# 중첩된 리스트

all_data = [['john', 'emily', 'michael', 'mary', 'steven'],
            ['maria', 'juan', 'javier', 'natalia', 'pilar']]

result = [name for names in all_data for name in names if name.count('a') >= 2]
print(result)

some_tuples = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
flattened = [x for tup in some_tuples for x in tup]
print(flattened)

# 위의 표기법은 아래와 같다.
flattened2 = []
for tup in some_tuples:
    for x in tup:
        flattened2.append(x)
print(flattened2)

['maria', 'natalia']
[1, 2, 3, 4, 5, 6, 7, 8, 9]
[1, 2, 3, 4, 5, 6, 7, 8, 9]


---

#### 함수
* 함수는 def 예약어로 정의한다. 함수에는 선택적으로 return 예약어를 사용하는 코드 블록이 포함된다.
* return 문이 몇 개가 되든 상관 없다.
* 함수 블록이 끝날 때까지 return 문이 없다면 자동으로 None이 반환된다.
* 키워드 인수 : 기본값이나 선택적인 인수 ex) ```function(x, y, z=1.5)```
    * 키워드 인수는 선택 사항이지만 함수를 호출할 때 위치 인수는 반드시 지정해야 한다.
    * 키워드 인수의 이름을 사용하지 않고 z 인수에 값을 넘길 수는 있지만, 이름을 사용하는 것이 헷갈리지 않고 좋다.
    * 키워드 인수는 항상 위치 인수 다음에 와야 한다는 규칙이 있다.
        * 키워드 인수의 순서에는 제약이 없으므로 키워드 인수의 이름만 기억하고 있다면 순서를 기억할 필요는 없다.

In [39]:
def my_function(x, y):
    return x+y
print(my_function(2, 3))

def function_without_return(x):
    print(x)
result = function_without_return('hello')
print(result)

def my_function2(x, y, z=1.5):
    if z>1:
        return z*(x+y)
    else:
        return z/(x+y)

print(my_function2(1, 2))
print(my_function2(1, 3, 5))
print(my_function2(3, 5, z=0.1))

5
hello
None
4.5
20
0.0125


---

#### 람다 함수

In [46]:
def short_function(x):
    return x+2

# 위의 함수를 람다 함수로 표현하면 다음과 같다.
equiv_anon = lambda x : x+2


def apply_to_list(some_list, f):
    return [f(x) for x in some_list]

ints=[5, 1, 0, 9, 8]
apply_to_list(ints, lambda x : x**3)

strings = ['foo', 'card', 'baz', 'aaaa', 'bbaa']
strings.sort(key=lambda x : len(set(x))) # x를 집합(set)으로 만듦으로써 중복된 문자를 하나로 셀 수 있게 되었다.

strings

['aaaa', 'foo', 'bbaa', 'baz', 'card']