# 파이썬 프로그래밍 기초 3부

## 주요 내용

* 모음 자료형 1편: 튜플, 리스트
* `range()` 함수

## 모음 자료형 1편

[파이썬 프로그래밍 기초 2부](https://codingalzi.github.io/python-data-analysis/notebooks/pydata03-python-basics-2.html)에서 단일값 객체의 자료형인 스칼라 자료형을 살펴보았다.
여기서는 여러 개의 값으로 이루어진 객체의 자료형을 살펴본다.

여러 개의 값을 항목(item)으로 갖는 객체는 항목들을 다루는 방식에 따라 구분되며,
그런 객체의 자료형을 통틀어 모음(collection) 자료형이라 한다.
파이썬에서 기본으로 제공하는 아래 모음 자료형이 기본으로 제공된다.

* 튜플(`tuple`)
* 리스트(`list`)
* 사전(`dict`)
* 집합(`set`)

이 중에 튜플과 리스트는 항목의 순서가 중요하다는 의미에서 __순차 자료형__(sequence)라 불리기도 한다.

__참고:__ 
* 문자열(`str`)도 모음 자료형처럼 취급한다.
    더 나아가 튜플, 리스트처럼 살펴볼 인덱스, 인덱싱, 슬라이싱 등을 문자열 또한 지원하기에 
    문자열을 순차 자료형에 포함시킨다.
* 여기서는 튜플과, 사전에 대해 설명하며, 파이썬 프로그래밍 기초 4부에서 사전과 집합에 대해 설명한다.

## 튜플

튜플(tuple)은 여러 개의 값을 항목으로 가지며 소괄호로 감싼다.

In [1]:
tup = (4, 5, 6)
tup

(4, 5, 6)

굳이 소괄호를 사용하지 않아도 된다.

__참고:__ 웬만하면 괄호를 사용하는 것이 혼동을 줄인다.

In [2]:
tup = 4, 5, 6
tup

(4, 5, 6)

하나의 항목을 괄호를 감싼다 해도 그냥 튜플로 간주하지 않는다.

In [3]:
singleton1 = (3)
singleton1

3

In [4]:
singleton2 = ("abc")
type(singleton2)

str

한 개의 항목으로 이루어진 튜플을 생성하려면 쉼표를 사용해야 한다.
하지만 이런 튜플은 굳이 사용할 필요가 없다.

In [5]:
tup3 = ("abc",)
tup3

('abc',)

In [6]:
type(tup3)

tuple

`tuple()` 함수는 다른 모음 자료형을 튜플로 변환한다.

In [7]:
tuple([4, 0, 2])

(4, 0, 2)

In [8]:
tup= tuple('string')
tup

('s', 't', 'r', 'i', 'n', 'g')

### 중첩 튜플

튜플의 항목은 임의의 파이썬 객체가 사용될 수 있다.
즉, 튜플의 항목으로 튜플이 사용될 수 있다.

In [9]:
nested_tup = (4, 5, 6), (7, 8)
nested_tup

((4, 5, 6), (7, 8))

물론 항목으로 문자열, 리스트, 사전 등 임의의 값이 사용될 수 있다. 

In [10]:
nested_tup2 = (3, (4, 5, 6), [1, 2], "파이썬")
nested_tup2

(3, (4, 5, 6), [1, 2], '파이썬')

### 인덱스와 인덱싱

튜플에 맨 왼편에 위치한 항목부터 차례대로  0, 1, 2, ... 로 시작하는 __인덱스__(index)를 갖는다.
인덱스를 이용하여 해당 위치의 항목을 확인할 수 있으며, 이를 __인덱싱__(indexing)이라 한다.

예를 들어 `tup` 변수가 가리키는 튜플의 첫째 항목의 인덱스는 0이며,
이를 아래와 같이 인덱싱으로 확인할 수 있다.

In [11]:
tup[0]

's'

인덱스가 0부터 시작하기에 예를 들어 전체 항목의 수가 3이면 마지막 항목의 인덱스는 2이다.

In [12]:
tup = ('foo', [1, 2], True)
tup[2]

True

튜플은 불변(immutable) 자료형이다.
예를 들어, 위 튜플의 마지막 항목을 인덱싱으로 이용하여 `False`로 대체하고자 시도하면 오류가 발생한다.

__참고:__ 아래 코드를 실행하면 `TypeError` 라는 오류가 발생하며, `tuple` 자료형은 항목 변경을 지원하지 않기 때문이라는 설명도 함께 보여진다.

In [13]:
tup[2] = False

TypeError: 'tuple' object does not support item assignment

튜플은 불변 자료형이라고 해서 모든 항목이 불변 자료형인 것은 아니다.
예를 들어 `tup`의 둘째 항목은 리스트 `[1, 2]` 인데, 리스트는 가변(mutable) 자료형이다.
따라서 아래와 같이 둘째 항목 자체는 변경이 가능하다.

In [14]:
tup[1].append(3)

tup

('foo', [1, 2, 3], True)

이런 성질이 가능한 이유를 아래 두 그림이 잘 설명한다.

> `tup`은 `('foo', [1, 2], True)`를 참조한다.
> 그리고 둘째 항목인 `[1, 2]` 또한 참조 형태로 다른 메모리에 저장된다.
> 즉 `tup`의 둘째 항목은 `[1, 2]`가 저장된 위치의 주소이다.
> 그런데 `[1, 2]`가 변경되어도 주소 자체는 변하지 않는다.
> 따라서 `tup` 입장에서는 변한 게 하나도 없게 된다.
> 참고로, 리스트의 주소는 첫째 항목이 저장된 위치의 주소를 사용한다.

<변경 전>

<img src="./images/tuple10.png" style="width:400px;">

<변경 후>

<img src="./images/tuple11.png" style="width:400px;">

### 튜플 연산자

#### `+` 연산자

두 개의 튜플을 이어붙인다. 

In [15]:
(4, None, 'foo') + (6, 0)

(4, None, 'foo', 6, 0)

여러 개를 이어붙일 수도 있다.

In [16]:
(4, None, 'foo') + (6, 0) + ('bar',)

(4, None, 'foo', 6, 0, 'bar')

#### `*` 연산자

지정된 정수만큼 튜플을 복사해서 이어붙인다.

In [17]:
('foo', 'bar') * 4

('foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar')

### 튜플 해체

튜플 항목 각각에 대해 변수를 지정하고자 할 때 튜플을 해체하는 기법을 사용한다.
단, 사용되는 변수의 수는 항목의 수와 일치해야 한다.
예를 들어, 세 개의 항목을 갖는 항목을 해체하려면 세 개의 변수가 필요하다.

In [18]:
tup = (4, 5, 6)
a, b, c = tup

변수 `b`와 `c`는 각각 둘째, 셋재 항목을 가리킨다.

In [19]:
b + c

11

굳이 이름을 주지 않아도 되는 항목이 있다면
변수 대신에 밑줄(underscore) 기호 `_`를 사용한다.
예를 들어 변수 `a`가 필요없다면 아래와 같이 튜플 해체를 해도 된다.

In [20]:
tup = (4, 5, 6)
_, b, c = tup

In [21]:
b + c

11

하지만 밑줄을 빼면 오류가 발생한다.

In [22]:
tup = (4, 5, 6)
b, c = tup

ValueError: too many values to unpack (expected 2)

반면에 앞에 몇 개만 이름을 지정하고 나머지는 하나의 리스트로 묶을 수 있다.
이를 위해 별표 기호(asterisk) `*` 하나의 변수이름과 함께 사용한다.

In [23]:
values = (1, 2, 3, 4, 5)
a, b, *rest = values

In [24]:
a

1

In [25]:
b

2

In [26]:
rest

[3, 4, 5]

나머지 항목들을 무시하고 싶다면 밑줄과 별표를 함께 사용하면 된다.

In [27]:
a, b, *_ = values

In [28]:
print(a, b, sep=', ')

1, 2


중첩 튜플을 해체할 때는 중첩 모양을 본따야 한다.

In [29]:
tup = (4, 5, (6, 7))
a, b, (c, d) = tup
d

7

__활용 1__

튜플 해체 방식을 활용하면, 여러 변수가 가리키는 값을 쉽게 바꿀 수 있다.
예를 들어, 변수 `a`, `b`가 가리키는 값을 서로 바꾸는 방법은 다음과 같다.

In [30]:
a, b = 1, 2

print(f"a={a}, b={b}")

a=1, b=2


아래와 같이 하면 `a`, `b`가 가리키는 값을 서로 바꾼다.

In [31]:
b, a = a, b

print(f"a={a}, b={b}")

a=2, b=1


__활용 2__

튜플 해체는 `for` 반복문에서 유용하게 사용된다.
즉, 리스트의 항목이 일정한 크기의 튜플일 때 각각의 튜플을 해체하여 각각의 항목을 활용할 수 있다. 

In [32]:
seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]

for a, b, c in seq:
    print('a={0}, b={1}, c={2}'.format(a, b, c))

a=1, b=2, c=3
a=4, b=5, c=6
a=7, b=8, c=9


### 튜플 메서드

튜플은 변경이 불가능한 자료형이기에 메서드를 많이 제공하지 않는다.
가장 유용한 메서드는 특정 값이 항목으로 사용되었는가르 세어주는 `count()` 메서드이다.

예를 들어, 아래 리스트에서 숫자 2는 4번 사용되었다.

In [33]:
a = (1, 2, 2, 2, 3, 4, 2)
a.count(2)

4

## 리스트

리스트 사용법은 튜플과 유사하다. 

In [34]:
a_list = [2, 3, 7, None]

`list()` 함수는 튜플, 문자열 등의 모음 자료형을 리스트로 변환한다.

In [35]:
tup = ('foo', 'bar', 'baz')
b_list = list(tup)

In [36]:
b_list

['foo', 'bar', 'baz']

### 항목 변경, 추가, 삭제

튜플과는 달리 리스트에 항목을 추가하거나, 특정 항목을 다른 항목으로 변경할 수 있으며,
많은 메서드를 지원한다.

In [37]:
b_list[1] = 'peekaboo'
b_list

['foo', 'peekaboo', 'baz']

`append()` 메서드는 새로운 항목을 가장 오른편에 추가한다.

In [38]:
b_list.append('dwarf')
b_list

['foo', 'peekaboo', 'baz', 'dwarf']

`insert()` 메서드는 지정된 인덱스 위치에 새로운 항목을 추가한다.

In [39]:
b_list.insert(1, 'red')
b_list

['foo', 'red', 'peekaboo', 'baz', 'dwarf']

`pop()` 메서드는 지정된 인덱스 위치의 항목을 삭제한다.
그런데 단순히 삭제만 하는 것이 아니라 삭제되는 값을 반환한다.

In [40]:
b_list.pop(2)

'peekaboo'

In [41]:
b_list

['foo', 'red', 'baz', 'dwarf']

인자를 지정하지 않으면 마지막 항목을 삭제한다.

In [42]:
b_list.pop()

'dwarf'

In [43]:
b_list

['foo', 'red', 'baz']

`remove()` 메서드는 지정된 항목을 삭제한다.
지정된 항목이 여러 번 사용되었을 경우 가장 작은 인덱스의 값을 삭제한다. 

In [44]:
b_list.insert(1, 'foo')
b_list

['foo', 'foo', 'red', 'baz']

In [45]:
b_list.remove('foo')
b_list

['foo', 'red', 'baz']

`in()` 연산자는 특정 항목이 리스트에 포함되어 있는지 여부를 판단해준다. 

In [46]:
'baz' in b_list

True

In [47]:
'dwarf' in b_list

False

In [48]:
'dwarf' not in b_list

True

### 리스트 이어붙이기

#### `+` 연산자

두 개의 리스트를 이어붙여서 새로운 리스틀 생성한다.

In [49]:
[4, None, 'foo'] + [7, 8, (2, 3)]

[4, None, 'foo', 7, 8, (2, 3)]

#### `extend()` 메서드

주어진 리스트에 다른 지정된 리스트를 이어붙이는 방식으로 항목을 추가한다.

__참고__ 원래의 리스트를 수정하는 메서드이다. 
항상 새로운 리스트를 생성하는 `+` 연산자보다 좀 더 빠르게 작동하며,
따라서 매우 긴 리스트를 이어붙일 때 기본적으로 선호된다.

In [50]:
x = [4, None, 'foo']
x.extend([7, 8, (2, 3)])

In [51]:
x

[4, None, 'foo', 7, 8, (2, 3)]

### 리스트 정렬

`sort()` 메서드는 항목을 크기 순으로 정렬한다.

__주의사항:__ `sort()` 메서드의 반환값은 `None`이다. 
즉, 주어진 리스트의 항목을 크기 순으로 정렬하여 변경하지만 함수 자체의 반환값은 없다.

In [52]:
a = [7, 2, 5, 1, 3]
a.sort()

In [53]:
a

[1, 2, 3, 5, 7]

정렬할 때 사용되는 크기의 기준을 지정할 수 있다.
예를 들어, 문자열들을 기본값인 사전식 순서가 아니라 문자열들의 길이 기준으로 정렬하려면
항목의 크기를 계산하는 함수를 인자로 갖는 `key` 키워드의 인자를 `len()` 함수의 
이름인 `len`으로 지정하면 된다.

In [54]:
b = ['saw', 'small', 'He', 'foxes', 'six']
b.sort(key=len)
b

['He', 'saw', 'six', 'small', 'foxes']

참고로 `key` 키워드 인자를 지정하지 않은 알파벳 순서를 기준으로 삼는 사전식 순서로 정렬된다.

__주의사항:__ 대문자가 소문자보다 작은 것으로 간주된다.

In [55]:
b.sort()
b

['He', 'foxes', 'saw', 'six', 'small']

#### `bisect()` 함수

`bisect` 모듈의 `bisect()` 함수는 
정렬된 리스트에 새 항목을 추가할 때 정렬을 유지하면서 항목을 추가할 수 있는 위치의 인덱스를 반환한다.

In [56]:
import bisect

예를 들어, 아래 정렬된 리스트 `c`에 2를 추가해도 정렬이 유지되는 위치는 4번 인덱스이다. 

In [57]:
c = [1, 2, 2, 2, 3, 4, 7]
bisect.bisect(c, 2)

4

5를 추가하려면 6번 인덱스에 넣어야 한다.

In [58]:
bisect.bisect(c, 5)

6

`insort()` 메소드는 지정된 값을 정렬이 유지되는 위치에 실제로 추가한다.

In [59]:
bisect.insort(c, 5)

c

[1, 2, 2, 2, 3, 4, 5, 7]

`bisect()`와 `insort()` 함수는 정렬된 리스트에 대해서만 제대로 작동한다.
정렬되지 않은 리스트에 대해서 오류가 발생하지는 않지만 제대로 작동하지 않을 수 있다.

In [60]:
c = [5, 3, 2, 2, 7]
bisect.bisect(c, 4)

4

In [61]:
c = [5, 3, 2, 2, 7]
bisect.insort(c, 4)

c

[5, 3, 2, 2, 4, 7]

### 슬라이싱

슬라이싱 용법은 문자열, 튜플 등의 경우와 동일하다. 
단, 문자열 슬라이싱, 튜플 슬라이싱, 리스트 슬라이싱의 결과는 각각의 자료형에 따라 결정된다.

아래 코드는 1번부터 4번 인덱스의 값으로 이루어진 리스트를 생성한다.

In [62]:
seq = [7, 2, 3, 7, 5, 6, 0, 1]
sub_seq = seq[1:5]

sub_seq

[2, 3, 7, 5]

<img src="./images/list_slicing10.png" style="width:420px;">

위 그림에서 볼 수 있듯이 슬라이싱의 기존 리스트를 수정하지 않고, 
다만 주어진 구간의 정보를 활용하여 새로운 리스트를 생성한다.

In [63]:
seq

[7, 2, 3, 7, 5, 6, 0, 1]

슬라이싱 기능을 이용하여 특정 위치부터 여러 개의 항목을 추가할 수도 있다.
아래 코드는 3번, 4번 인덱스 위치의 값 대신에 4개의 원소를 추가 입력하는 것이다. 

__주의사항:__ 기존에 5번 이상의 인덱스에 위치한 값들은 더 추가되는 값들의 수 만큰 오른편으로 
밀린다.

In [64]:
seq[3:5] = [6, 3, 8, 4]
seq

[7, 2, 3, 6, 3, 8, 4, 6, 0, 1]

<변경 전>

<img src="./images/list_slicing11.png" style="width:420px;">

<변경 후>

<img src="./images/list_slicing12.png" style="width:470px;">

슬라이싱 구간의 시작과 끝 모두 생략 가능하다.
생략된 값은 각각 리스트의 처음과 끝을 가리키는 값으로 처리된다.
아래 코드는 0번 인덱스부터 4번 인덱스까지 구간을 대상으로 한다.

In [65]:
seq[:5]

[7, 2, 3, 6, 3]

아래 코드는 3번 인덱스부터 리스트 오른편 끝가지를 대상으로 한다.

In [66]:
seq[3:]

[6, 3, 8, 4, 6, 0, 1]

음수 인데스는 리스트 오른편 부터 -1, -2, -3, 등으로 왼편으로 이동하면서 지정된다.
아래 코드는 끝에서 4번째부터 마지막까지 구간을 대상으로 한다.

In [67]:
seq[-4:]

[4, 6, 0, 1]

아래 코드는 끝에서 6번째부터 끝에서 두번째 이전, 즉, 끝에서 세번째까지 슬라이싱한다.

In [68]:
seq[-6:-2]

[3, 8, 4, 6]

구간의 처음과 끝이 모두 생략되면 리스트 전체를 대상으로 한다.
아래 코드는 리스트 전체를 대상으로 하지만 2 스텝씩 건너 뛰며 항목을 슬라이싱한다.
즉, 0, 2, 4, ... 등의 인덱스를 대상으로 한다.

In [69]:
seq[::2]

[7, 3, 3, 4, 0]

음수의 스텝이 사용되면 역순으로 슬라이싱된다.
아래 코드는 리스트의 오른편 끝에서 왼편으로 역순으로 슬라이싱한다.
즉, 기존의 리스트의 항목을 뒤집어서 새로운 리스트를 생성한다.

In [70]:
seq[::-1]

[1, 0, 6, 4, 8, 3, 6, 3, 2, 7]

구간의 마지막 항목의 인덱스는 아래 두 가지 방식으로 표현한다.

* 방법 1: 리스트의 길이에서 1을 뺀 값
* 방법 2: -1

따라서 위 코드는 아래 코드와 동일하다.

In [71]:
seq[-1::-1]

[1, 0, 6, 4, 8, 3, 6, 3, 2, 7]

아래 코드도 같다. 이유는 리스트의 길이가 10이기 때문이다.

In [72]:
seq[9::-1]

[1, 0, 6, 4, 8, 3, 6, 3, 2, 7]

역순으로 두 개에 하나씩 가져올 수도 있다.

In [73]:
seq[::-2]

[1, 6, 8, 6, 2]

## `range()` 함수

규칙성을 가진 정수들의 모음(collection)을 반환한다.
반환된 값은 이터러블 객체이며, 
리스트와 유사하게 작동한다.

예를 들어, 0부터 9까지의 정수들로 이루어진 `range` 객체는 다음과 같이 생성한다.

In [74]:
range(10)

range(0, 10)

__주의사항:__ 첫째 인자는 구간의 시작을, 둘째 인자는 구간의 끝보다 하나 큰 값을 가리킨다.
따라서 위에서 9가 아닌 그보다 1이 큰 10을 사용했음에 주의하라.

반환된 값의 자료형은 `range` 이다.

In [75]:
type(range(10))

range

`range(0, 10)` 안에 포함된 항목을 `for` 반복문을 이용하여 확인할 수 있다.

In [76]:
for item in range(0, 10):
    print(item)

0
1
2
3
4
5
6
7
8
9


리스트로 형변환을 하면 보다 명확하게 확인된다.

In [77]:
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

0에서 19까지의 정수중에서 짝수만으로 이루어진 `range` 객체는 다음과 같이 
스텝(step) 크기 2를 셋째 인자로 지정하여 생성한다.

In [78]:
list(range(0, 20, 2))

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]

스텝 크기를 음수로 지정하면 크기 역순으로 이루어진 `range` 객체를 생성한다.

__주의사항:__ 음수 스텝을 사용할 경우 둘째 인자는 원하는 구간보다 1이 작은 값을 사용해야 한다.

In [79]:
list(range(5, 0, -1))

[5, 4, 3, 2, 1]

In [80]:
list(range(5, 0, -2))

[5, 3, 1]

### __`range()` 함수 주요 활용법 1__

리스트 또는 튜플의 길이 정보를 이용하여 인덱싱을 활용하는 방식이 많이 사용된다.

In [81]:
seq = [1, 2, 3, 4]
for i in range(len(seq)):
    val = seq[i]

### __`range()` 함수 주요 활용법 2__

매우 많은 항목을 담은 리스트 대신에 `range` 객체를 `for` 반복문과 함께 사용한다.
이유는 `range` 객체가 리스트보다 훨씬 적은 메모리를 사용하기 때문이다.
(이에 대한 근거는 여기서는 다루지 않는다.)

예를 들어, 아래 코드는 0부터 99,999 까지의 정수 중에서 3 또는 5의 배수를 모두 더한다.

In [82]:
sum = 0

for i in range(100000):
    # %는 나머지 연산자
    if i % 3 == 0 or i % 5 == 0:
        sum += i
        
print(sum)

2333316668


### __`range()` 함수 주요 활용법 3__

`range()` 함수와 `list()`는 서로 함께 잘 활용된다.
먼저, `range()` 함수를 이용하여 이터레이터를 생성한 다음에 리스트로 변환하면
리스트를 간단하게 구현할 수 있다.

__참고:__ `range()` 함수는 `for` 반복문 등에서 순환용으로 사용될 수 있는 
이터러블 자료형의 값을 생성하지만 리스트와는 근복적으로 다르다. 
보다 자세히 이해하려면 이터러블(iterable), 이터레이터(iterator), 제너레이터(generator)를
이해 해야 하는데 여기서는 다루지 않는다. 
관심있는 경우 아래 두 사이트를 참고할 수 있다.

* [위키독스: 이터러블과 이터레이터](https://wikidocs.net/16068)
* [위키독스: 제너레이터](https://wikidocs.net/16069)

In [83]:
gen = range(10)
gen

range(0, 10)

In [84]:
list(gen)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

### 순차 자료형에 유용한 함수

문자열, 튜플, 리스트처럼 항목들의 순서가 중요한 순차 자료형과 함께 
유용하게 사용되는 네 개의 함수를 소개한다.

#### `enumerate()` 함수

튜플과 리스트의 인덱스를 튜플과 리스트 자체에서 눈으로 확인할 수 없다.
하지만 항목과 해당 항목의 인덱스 정보를 함께 활용해야 할 때가 있는데
이때 `enumerate()` 함수가 매우 유용하다.

In [85]:
some_list = ['foo', 'bar', 'baz', 'pyt', 'thon']

`enumerate()` 함수는 리스트를 받아서
리스트의 항목과 인덱스를 쌍으로 갖는 모음 자료형의 객체를 준비시킨다.
이렇게 준비된 객체를 직접 확인할 수는 없다.

In [86]:
enumerate(some_list)

<enumerate at 0x7f84b8915500>

하지만 `for` 반복문을 이용하여 그 내용을 확인하고 활용할 수 있다.
예를 들어, 아래 코드는 짝수 인덱스의 값들만 출력하도록 한다.

__주의사항:__ `i`와 `v` 두 변수를 활용하는 방식은 튜플 해체 방식이다.

In [87]:
for i, v in enumerate(some_list):
    if i % 2 == 0:
        print(v)

foo
baz
thon


아래 코드는 리스트의 항목을 키(key)로, 인덱스는 키값(value)으로 하는 항목들로 이루어진 사전 자료형 객체를 
생성한다.

In [88]:
mapping = {}

for i, v in enumerate(some_list):
    mapping[v] = i

mapping

{'foo': 0, 'bar': 1, 'baz': 2, 'pyt': 3, 'thon': 4}

#### `sorted()` 함수

`sorted()` 함수는 문자열, 튜플, 리스트의 항목을 크기 순으로 정렬시킨 리스트를 반환한다.

In [89]:
sorted('horse race')

[' ', 'a', 'c', 'e', 'e', 'h', 'o', 'r', 'r', 's']

In [90]:
sorted((7, 1, 2, 6, 0, 3, 2))

[0, 1, 2, 2, 3, 6, 7]

In [91]:
sorted([7, 1, 2, 6, 0, 3, 2])

[0, 1, 2, 2, 3, 6, 7]

#### `zip()` 함수

문자열, 튜플, 리스트 여러 개의 항목을 순서대로 짝지어서 튜플의 리스트 형식의 객체를 생성한다.
단, `zip()` 함수의 반환값은 `enumerate()`, `range()` 함수처럼 구체적으로 명시해주지는 않는다.

In [92]:
zip("abc", "efg")

<zip at 0x7f84b8924d00>

하지만 리스트로 변환하면 쉽게 내용을 확인할 수 있다.

In [93]:
list(zip("abc", "efg"))

[('a', 'e'), ('b', 'f'), ('c', 'g')]

자료형이 달라도 되며, 각 자료형의 길이가 다르면 짧은 길이에 맞춰서 짝을 짓는다.

In [94]:
list(zip("abc", [1, 2]))

[('a', 1), ('b', 2)]

In [95]:
seq1 = ['foo', 'bar', 'baz']
seq2 = ['one', 'two', 'three']
zipped = zip(seq1, seq2)
list(zipped)

[('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

자료형이 달라도 되며, 각 자료형의 길이가 다르면 짧은 길이에 맞춰서 짝을 짓는다.

In [96]:
list(zip("abc", [1, 2]))

[('a', 1), ('b', 2)]

세 개 이상의 짝짓기도 가능하다.

In [97]:
seq3 = [False, True]

list(zip(seq1, seq2, seq3))

[('foo', 'one', False), ('bar', 'two', True)]

__활용법:__ `enumerate()` 처럼 `for` 반복문에 잘 활용된다.
아래 코드는 두 개의 리스트으 항목을 짝을 지은 후 인덱스와 함께 출력해준다.

In [98]:
for i, (a, b) in enumerate(zip(seq1, seq2)):
    print('{0}: {1}, {2}'.format(i, a, b))

0: foo, one
1: bar, two
2: baz, three


__고급 활용법:__ 동일한 인덱스에 위치한 항목들끼리 따로따로 모을 수 있다.

In [99]:
pitchers = [('Nolan', 'Ryan'), ('Roger', 'Clemens'), ('Schilling', 'Curt')]

first_names, last_names = zip(*pitchers)

In [100]:
first_names

('Nolan', 'Roger', 'Schilling')

In [101]:
last_names

('Ryan', 'Clemens', 'Curt')

위 코드에서 사용된 별표(asterisk) 기호는 리스트를 해체하는 기능을 수행한다.

즉, `pitchers`가 아래 리스트를 가리킬 때

```python
[('Nolan', 'Ryan'), ('Roger', 'Clemens'), ('Schilling', 'Curt')]
```

`*pitchers`는 다음 세 개의 튜플을 가리킨다.

```python
('Nolan', 'Ryan'), ('Roger', 'Clemens'), ('Schilling', 'Curt')
```

따라서 `zip(*pitchers)`는 다음과 같은 함수의 호출이 된다.

In [102]:
first_names, last_names = zip(('Nolan', 'Ryan'), ('Roger', 'Clemens'), ('Schilling', 'Curt'))

In [103]:
first_names

('Nolan', 'Roger', 'Schilling')

In [104]:
last_names

('Ryan', 'Clemens', 'Curt')

#### `reversed()` 함수

순차 자료형의 항목을 역순으로 갖는 순차 자료형을 생성한다.

In [105]:
list(reversed(range(10)))

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

In [106]:
list(reversed([3, 2, 5, 7]))

[7, 5, 2, 3]

In [107]:
list(reversed("abc"))

['c', 'b', 'a']

In [108]:
list(reversed((1, 2, 3)))

[3, 2, 1]