# 파이썬 특강 3부

## 정렬(sorting)

리스트의 소트(`sort`) 메서드를 이용하여 항목을 크기 순으로 정렬할 수 있다.

In [1]:
x = [4, 1, 2, 3]
x.sort()
print(x)

[1, 2, 3, 4]


기존의 리스트를 건드리지 않으면서 항목을 정렬하여 활용하고 싶으면 소티드(`sorted`) 함수를 활용한다.

**주의:** `sorted` 함수는 리스트 메서드가 아니라 일반 함수이다.
따라서 메서드와 일반 함수와의 적용법 차이를 확인해야 한다.

In [2]:
x = [4, 1, 2, 3]
y = sorted(x)
print(f"x = {x}", f"y = {y}", sep='\n')

x = [4, 1, 2, 3]
y = [1, 2, 3, 4]


`sort` 메서드와 `sorted` 함수 모두 오름차순 정렬을 기본으로 한다. 
내림차순으로 정렬하려면 `reverse` 매개변수의 키워드 인자값을 `True`로 지정하면 된다.

In [3]:
x = [4, 1, 2, 3]
x.sort(reverse=True)
print(x)

[4, 3, 2, 1]


In [4]:
x = [4, 1, 2, 3]
y = sorted(x, reverse=True)
print(y)

[4, 3, 2, 1]


### 정렬 기준

**정렬 기준**은 기본적으로 알려진 크기이다.

* 정수형, 실수형: 숫자들의 크기
* 문자열: 알파벳 순서 (일반 사전식 정렬)

In [5]:
x = ['dabc', 'cdabe', 'badc', 'ba', 'abc']
x.sort()

print(x)

['abc', 'ba', 'badc', 'cdabe', 'dabc']


#### 정렬 기준 변경: `key` 옵션변수 활용

하지만 `key` 옵션변수에 대한 인자를 지정하여 정렬 기준을 변경할 수 있다.
`key` 옵션변수의 인자로 하나의 인자를 받는 함수가 사용된다.

예를 들어, 숫자들의 절댓값을 계산하는 `abs` 함수는 숫자 하나를 입력받는다.

In [8]:
abs(-3.2)

3.2

따라서 숫자들의 절대닶의 크기를 기준으로 정렬하려면 `abs` 함수를 `key` 옵션변수의
인자로 사용하면 된다.

In [6]:
x = sorted([-4, 1, -2, 3], key=abs)

print(x)

[1, -2, 3, -4]


물론 절대값을 기준으로 내림차순 정렬도 가능하다.

In [7]:
x = sorted([-4, 1, -2, 3], key=abs, reverse=True)

#### 예제: 빈도수 기준 정렬

1부에서 살펴보았던 `word_counts` 변수에 저장된 단어 빈도수 목록을 살펴보자.

In [8]:
from collections import defaultdict, Counter

document = ["data", "science", "from", "scratch", "data", "from"]

word_counts = defaultdict(int)
for word in document:
    word_counts[word] += 1
    
word_counts

defaultdict(int, {'data': 2, 'science': 1, 'from': 2, 'scratch': 1})

`word_counts`의 항목들을 빈도수 기준 내림차순으로 정렬하고자 한다면 어떻게 해야 하는가?
가장 단순한 방법은 `Counter` 자료형의 `most_common` 메서드를 활용하면되다.

즉, 먼저 `word_counts`를 `Counter` 자료형으로 변환시킨 후 `most_common` 메서드를 적용한다.

In [9]:
Counter(word_counts).most_common()

[('data', 2), ('from', 2), ('science', 1), ('scratch', 1)]

하지만 `Counter` 자료형을 사용하지 않고도 가능하다. 
`sorted` 함수와 `sort` 메서드의 매개변수인 `key`의 키원드 인자값을 아래와 같이 지정하면 
동일한 결과를 얻는다.

`key` 매개변수의 키원드 인자로는 다음 함수를 사용한다.

In [10]:
word_counts_to_counts = lambda word_and_count: word_and_count[1]

즉, `key`의 키워드 인자값은 정렬해야할 대상들을 입력 받아 무엇을 기준으로 정렬할지를
반환값으로 알려주는 함수가 되어야 한다.

여기서는 `word_counts.items()` 항목이 길이가 2인 튜플이며, 1번 인덱스 값, 즉, 둘째 항목인 빈도수를 기준으로 
정렬하라고 알려주는 함수가 바로 `word_counts_to_counts`이다.

In [11]:
word_counts.items()

dict_items([('data', 2), ('science', 1), ('from', 2), ('scratch', 1)])

In [12]:
wc = sorted(word_counts.items(),
            key=word_counts_to_counts,
            reverse=True)
print(wc)

[('data', 2), ('from', 2), ('science', 1), ('scratch', 1)]


**주의:** `wc` 는 보통 워드 카운트(word count, 단어 빈도수)의 줄임말이다.

### 조건제시법(list comprehension)

집합을 정의하기 위해 사용하는 조건제시법을 리스트, 집합, 사전(`dict`)에도 적용할 수 있다.

예를 들어 0 ~ 4 까지의 정수 중에서 짝수만으로 이루어진 집합을 다음과 같이 
조건제시법으로 정의할 수 있다.

$$\{x \mid 0 \le x < 5, \text{단 } x는 짝수\}$$

동일한 조건으로 리스트를 생성하려면 다음과 같이 `for ... in ... if ...`문을 활용한다.
형식은 다음과 같다. 

```python
[x for x in range(5) if x % 2 == 0]
```
* `for`: 파이프($|$, 일명 짝대기) 기호에 대응.
* `x in range(5)`: '$0 \le x < 5$ 이며, $x$'는 정수를 표현.
* `if` : '단', 즉, 조건부에 대응.
* `x % 2 == 0`: `x`를 2로 나눈 나머지가 0과 같아야 한다는 조건, 즉, 짝수 조건 표현.

In [13]:
even_numbers = [x for x in range(5) if x % 2 == 0]
print(even_numbers)

[0, 2, 4]


집합에 대한 조건제시법 적용은 다음과 같다.

In [14]:
even_numbers_set = {x for x in range(5) if x % 2 == 0}
print(even_numbers_set)

{0, 2, 4}


아래 `squares`는 다음 집합에 대응한다.

$$\{x^2 \mid 0 \le x < 5 \text{ 이고 } x \text{ 는 정수}\} = \{0, 1, 4, 9, 16\}$$


In [15]:
squares = [x * x for x in range(5)]
print(squares)

[0, 1, 4, 9, 16]


아래 `even_squares`는 다음 집합에 대응한다.

$$\{x^2 \mid x \in \text{even_numbers}\} = \{0, 4,16\}$$


In [16]:
even_squares = [x * x for x in even_numbers]
print(even_squares)

[0, 4, 16]


사전(`dict`) 자료형에 대해서도 조건제시법을 적용할 수 있다.

In [17]:
square_dict = {x: x * x for x in range(5)}
print(square_dict)

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16}


* 키: `range(5)`의 항목들, 즉, 0, 1, 2, 3, 4
* 키값: 키의 제곱, 즉, 각각 0, 1, 4, 9, 16

조건제시법에서 불필요한 것은 밑줄(`_`)로 처리한다.

예를 들어, 동일한 항복을 반복 생성하고자 할 때 아래와 같이 할 수 있다.

In [18]:
zeros = [0 for _ in even_numbers]
print(zeros)

[0, 0, 0]


**주의:** 위와 같이 하면 `even_numbers`와 동일한 길이의 리스트가 생성되며, 
모든 항목은 0으로 동일하다. 따라서 `for ... in ...`에 사용되어야 하는 변수가
아무런 역할도 수행하지 않는다. 따라서 밑줄로 처리하는 것이다.

실제로 아래와 같이 해도 동일한 결과를 얻는다.
이유는 `x`가 리스트의 항목을 생성하는데 아무런 역할도 수행하지 않기 때문이다.

In [19]:
zeros = [0 for x in even_numbers]
print(zeros)

[0, 0, 0]


조건제십법에 여러 개의 `for ... in ...` 문을 사용할 수 있다.

In [20]:
pairs = [(x, y)
         for x in range(10)
         for y in range(10)]

`pairs`는 아래 집합에 대응한다.

$$\{(x, y) \mid 0 \le x, y < 10 \text{ 이고 } x, y \text{는 정수} \}$$

따라서 `pairs`에는 총 100개의 순서쌍이 들어 있다. 
첫 10개의 항목을 확인해보자.

In [21]:
pairs[:10]

[(0, 0),
 (0, 1),
 (0, 2),
 (0, 3),
 (0, 4),
 (0, 5),
 (0, 6),
 (0, 7),
 (0, 8),
 (0, 9)]

그 다음 10개를 아래와 같다.

In [22]:
pairs[10:20]

[(1, 0),
 (1, 1),
 (1, 2),
 (1, 3),
 (1, 4),
 (1, 5),
 (1, 6),
 (1, 7),
 (1, 8),
 (1, 9)]

마지막 10개를 확인해보자.

In [23]:
pairs[-10:]

[(9, 0),
 (9, 1),
 (9, 2),
 (9, 3),
 (9, 4),
 (9, 5),
 (9, 6),
 (9, 7),
 (9, 8),
 (9, 9)]

두 개의 `for ... in ...` 문이 어떻게 움직이는지 감잡았을 것이다.

* `x`를 0부터 시작하여 1씩 증가시켜 9까지 변경할 때마다
    `y`를 0부터 9까지 변화시킨다.

다음 예제는 조금 다르게 작동한다.

* `x`를 0부터 시작하여 1씩 증가시켜 9까지 변경할 때마다
    `y`를 `x`+1부터 9까지 변화시킨다.

In [24]:
increasing_pairs = [(x, y)                       
                    for x in range(10)           
                    for y in range(x + 1, 10)]   

In [25]:
increasing_pairs[:9]

[(0, 1), (0, 2), (0, 3), (0, 4), (0, 5), (0, 6), (0, 7), (0, 8), (0, 9)]

In [26]:
increasing_pairs[10:17]

[(1, 3), (1, 4), (1, 5), (1, 6), (1, 7), (1, 8), (1, 9)]

In [27]:
increasing_pairs[-2:]

[(7, 9), (8, 9)]

`increasing_pairs`의 길이는 9 + 8 + 7 + 6 + 5 + 4 + 3 + 2 + 1, 즉, 45이다.

In [28]:
len(increasing_pairs)

45

또한 만약 (`x`, `y`) $\in$ `increasing_pairs` 이면  `x`가 `y` 보다 작다.

In [29]:
all(x < y for x, y in increasing_pairs)

True

### 자동 테스팅: `assert` 활용

작성된 코드가 의도한 대로 작동하는지를 확인하는 여러 방법이 있다.
이 강좌에서는 가장 단순한 `assert` 테스팅 기법만 사용한다.

어서트(`assert`, 주장) 이후에 나오는 문장의 참/거짓을 판단하여 
참이면 그냥 넘어가고, 거짓이면 오류를 발생시킨다.

In [30]:
assert 1 + 1 == 2

In [31]:
assert 1 + 1 == 3

AssertionError: 

예외처리 기능을 활용할 수도 있다.

In [32]:
assert 1 + 1 == 3, "1 + 1 should equal 2 but didn't"

AssertionError: 1 + 1 should equal 2 but didn't

`assert` 테스팅은 주로 함수의 구현을 테스팅할 때 활용한다.

예를 들어, 숫자들의 리스트를 인자로 받아 최소값을 반환하는 함수를 아래와 같이 구현했다고 하자.

In [33]:
def smallest_item(xs):
    return min(xs)

이제 위 구현이 제대로 작동하는지 아래처럼 테스팅할 수 있다.

In [34]:
assert smallest_item([10, 20, 5, 40]) == 5
assert smallest_item([1, 0, -1, 2]) == -1

오류가 발생하지 않기에 위 구현이 테스팅을 통과한 것으로 간주할 수 있다.

**주의:** 테스팅을 통과했다고 해서 구현이 제대로 되었다고 보장할 수는 없다.
테스팅은 몇 가지 경우에서 확인하니 잘 된다는 의미일 뿐이며, 모든 경우에 올바르게 작동한다는 
보장은 하지 못한다. 
그래도 이런 테스팅을 통해 구현된 코드에 대한 신뢰도를 많이 높일 수 있다. 

함수의 인자로 제대로된 값들이 입력되는지 여부를 확인하기 위해서도 `assert`가 활용될 수 있다.

In [35]:
def smallest_item_assert(xs):
    assert xs, "빈 리스트엔 최소값이 없어요!"
    return min(xs)

이제 빈 리스트(`[]`)를 인자로 사용하면 오류가 발생하는 대신에 바로 예외처리가 진행되어
`AssertionError`가 발생하고 발생 이유를 설명한다.

In [36]:
smallest_item_assert([])

AssertionError: 빈 리스트엔 최소값이 없어요!

반면에 `smallest_item` 함수의 경우 빈 리스트의 최소값이 존재하지 않는다는 `ValueError`가 
발생한다.

In [37]:
smallest_item([])

ValueError: min() arg is an empty sequence

### 객체 지향 프로그래밍

파이썬은 소위 **객체 지향 프로그래밍**을 지원하는 언어이다.
이 강좌에서는 객체 지행 프로그래밍의 정체를 논하지 않는다.
다만, 객체 지향 프로그래밍의 핵심 요소인 클래스(class)와 인스턴스(instance)를 
어떻게 정의하고 활용하는지 예제 두 개를 이용하여 보여준다.

앞으로 클래스와 인스턴스를 수 없이 보고 사용할 것이다.
사실, 지금까지도 많은 클래스와 인스턴스를 살펴 보았다.

* `str`: 문자열 클래스
    * 인스턴스: `"abc"`, `"홍길동"` 등


* `list`: 리스트 클래스
    * 인스턴스: `[1, 2, 3]`, `['ab', 1, [0, 1]]` 등


* `set`: 집합 클래스
    * 인스턴스: `set(), {1, 2, 3}`, `{'ab', 1, [0, 1]}` 등


* `dict`: 사전 클래스
    * 인스턴스: `{"이름":"홍길동", "출신":"한양"}` 등


* `defaultdict`: 디폴트딕트 클래스
    * 인스턴스: `defaultdict(int)`, `defaultdict(list)` 등


* `Counter`: 카운터 클래스
    * 인스턴스: `Counter([1, 2, 1, 3, 0])` 등

#### 클래스의 활용

클래스는 크게 세 가지 방식으로 사용된다.

1. 자료형 및 메서드 정의
    * 여기에서 주로 사용되는 방식이며, 앞서 언급한 클래스들이 여기에 해당한다.
    * 아래 첫째 예제가 자료형 및 메서드를 정의하는 과정을 잘 보여준다.
1. 서로 관련된 기능을 갖는 변수와 함수들의 모둠, 일종의 도구 상자
    * 아래 둘째 예제가 여기에 해당함.
1. 동일한 기능을 갖는 객체를 쉽고 다양한 방식으로 생성할 수 있도록 도와주는 기계틀 역할을 수행하는 도구
    * 게임 프로그래밍 등에서 게임 캐릭터, 배경, 도구 등을 쉽게 생성할 때 기본적으로 사용되는 방식임.
    * 여기서는 거의 다루지 않음.

#### 첫째 예제: 집합 클래스 구현하기

집합 자료형인 `set`이 없다고 가정하고 직접 집합 자료형을 `MySet` 클래스를 이용하여 정의해보자.

In [38]:
class MySet: 

    # 메서드 정의:
    # 모든 메서드의 첫째 매개변수는 관습적으로 "self"라 부른다.
    # "self"에는 어떤 "MySet" 객체가 인자로 입력되어야 한다.

    def __init__(self, values=None):
        """이 메서드는 생성자이다. 모든 클래스의 생성자는 이 이름을 사용한다.
        클래스의 인스턴스를 생성할 때 눈에 보이지 않지만 이 메서드가 호출되어 실행된다.
        아래 형식으로 활용된다.
        s1 = MySet()          # 공집합 생성
        s2 = MySet([1,2,2,3]) # 원소를 지정하면서 집합 생성"""

        self.dict = {}  # "self"에 입력된 MySet 클래스의 객체에 빈 사전을 기본으로 포함시킴.
                        # self.dict 에 원소를 추가할 것임.
            
        if values is not None:    # values에 포함된 항목을 모두 self.dict에 추가
            for value in values:
                self.add(value)   # add 메서드 정의는 아래에 있음.

    def __repr__(self):
        """MySet 자료형의 값을 화면에 출력할 때, 즉, print 함수를 실행할 때
        보여주는 방식을 지정함.
        print 또는 str 함수의 인자로 사용할 때 지정된 값으로 출력/변환된다.
        모든 클래스에는 이 메서드가 동일한 이름으로 포함된다."""
        return "MySet: " + str(self.dict.keys())
    
    # 키에 사용된 값들만 MySet의 원소로 인정한다. 
    # 즉, 키값은 중요하지 않으며, 여기서는 True를 사용한다.
    # 따라서 새로운 값을 원소로 추가할 때 '값:True' 형식으로 self.dict 에 추가한다.
    def add(self, value): 
        self.dict[value] = True
        
    # 원소 포함여부는 in 연산자를 활용한다.
    def contains(self, value): 
        return value in self.dict
    
    # 원소를 제거하는 메서드도 있다.
    def remove(self, value): 
        del self.dict[value]

#### 매직 메서드

이닛(`__init__`), 레퍼(`__repr__`) 메서드처럼 두 개의 밑줄(underscores)로 감싸인 메서드를
**매직 메서드**(magic methods)라 부르며, 모든 파이썬 클래스에 동일한 이름으로 포함되어 있다.
기타 많은 매직 메서드가 존재하며 명시적으로 선언되지 않은 매직 메서드는 모든 클래스에서 
동일하게 사용되는 기본 함수가 자동으로 지정된다. (대부분은 아무 것도 하지 않는 함수로 지정됨.)

#### 클래스와 인스턴스

1, 2, 3을 원소로 갖는 `MySet`을 다음처럼 생성한다.

In [39]:
s = MySet([1,2,3]) 

여기서 변수 `s`에 할당된 값을 `MySet` 클래스의 인스턴스라 부르며,
이 경우에는 특별히 `MySet` 자료형이라 부를 수 있다.
`set` 클래스의 인스턴스를 집합 자료형이라 부르는 것과 동일하다.

**주의:** 
* 위와 같이 실행하면 실제로는 `MySet`의 `__init__` 메서드가 호출된다.
    그런데 `__init__` 메서드의 첫째 매개변수인 `self`에 대한 인자는 입력하지 않으며
    `Values`의 인자만 사용한 것에 주의하라. 
* 기타 모든 메서드에 대해서도 마찬가지이다.
* `self`의 용도는 아래에서 상속을 설명할 때 알아본다.

이제 `MySet` 자료형인 `s`에 원소를 추가/삭제하는 방법과 결과를 확인해보자.

In [40]:
print(s)

s.add(4)
print(s.contains(4))
print(s)

s.remove(3)
print(s.contains(3))
print(s)

MySet: dict_keys([1, 2, 3])
True
MySet: dict_keys([1, 2, 3, 4])
False
MySet: dict_keys([1, 2, 4])


#### 둘째 예제: 클릭수 세기

웹페이지의 방문자 수를 확인하는 앱을 구현하고자 할 때 아래 도구들이 필요하다.

* 클릭수를 저장할 변수
* 클릭수를 1씩 키워주는 도구
* 현재 클릭수를 읽어주는 도구
* 클릭수를 초기화하는 도구

언급한 변수 한 개와 네 개의 도구를 포함한 일종의 도구상자를
아래 `CountingClicker` 클래스로 구현한다.

In [41]:
class CountingClicker:
    """함수의 경우처럼 문서화 문자열을 사용할 수 있다.
    클래스 정보를 확인할 때 보여지는 내용을 여기에 작성한다."""

    # 클래스 변수: 인스턴스 생성 횟수를 기억함.
    total_count = 0

    # 생성자
    # 클릭수 초기값을 0으로 지정
    def __init__(self, count = 0):
        self.count = count
        CountingClicker.total_count += 1

    # 출력 메서드
    def __repr__(self):
        return f"CountingClicker(count={self.count})"
    
    # 클릭 이벤트가 발생하면 클릭수를 1씩 키워주는 도구 역할 함수
    def click(self, num_times = 1):
        """Click the clicker some number of times."""
        self.count += num_times

    # 현재 클릭수를 읽어주는 도구 역할 함수
    def read(self):
        return self.count
    
    # 클릭수를 초기화하는 도구 역할 함수
    def reset(self):
        self.count = 0

아래 코드를 실행하면 `CountingClass`의 인스턴스를 하나 생성하면 앞서 언급한 변수 한 개와 네 개의 도구를 
포함한 하나의 도구상자를 얻게 되며, 도구상자의 이름은 `clicker`이다.

In [42]:
clicker = CountingClicker()

`clicker` 도구상자의 도구를 이용하려면 아래와 같이 실행한다.

```python
clicker.도구역할함수이름(인자,....)
```

먼저 클릭수가 0으로 초기화되어 있음을 확인하자.
이유는 아무도 클릭하지 않았기 때문이다.
실제로 `clicker` 도구상자를 생성할 때 호출되는 `__init__` 메서드의 인자가 지정되지 않아서
`count` 매개변수의 키워드 인자로 기본값인 0이 사용되어, `self.count` 변수에 할당되었다.

In [43]:
assert clicker.read() == 0, "클릭수는 0부터 시작해야 합니다."

#### 인스턴스 변수

* `self.count`와 같은 변수를 **인스턴스 변수**라 부른다.
* 이유는 인스턴스가 생성되어야만 존재의미를 갖는 변수이기 때문이다.
* 인스턴스 변수 이외에 **클래스 변수**가 클래스를 선언할 때 사용될 수 있다.
    클래스 변수는 인스턴스가 생성되지 않아도 존재의미를 갖는다.
    이에 대해서는 나중에 기회 있을 때 자세히 설명한다.

이제 클릭을 두 번 했다가 가정하자. 
즉, `click` 메서드를 두 번 호출되어야 한다.

In [44]:
clicker.click()
clicker.click()

그러면 클릭수가 2가 되어 있어야 한다.

In [45]:
assert clicker.read() == 2, "두 번 클릭했으니 클릭수는 2이어야 함."

이제 클릭수를 초기화하자.

In [46]:
clicker.reset()

그러면 클릭수가 다시 0이 되어야 한다.

In [47]:
assert clicker.read() == 0, "클릭수를 초기화하면 0이 된다."

클릭수를 지정하면서 `CountingClicker`의 인스턴스를 생성할 수 있다.

In [48]:
clicker50 = CountingClicker(50)

클릭수가 50으로 설정되었음을 확인할 수 있다.

In [49]:
clicker50.read()

50

지금까지 `CountingClicker`의 인스턴스는 두 번 생성되었음을 아래 결과가 보여준다.

In [50]:
CountingClicker.total_count

2

#### 클래스 상속

부모 클래스로부터 많은 기능을 물려받을 수 있는 자식 클래스를 상속을 이용하여 선언할 수 있다.

예를 들어, 클릭수를 초기화할 수 없는 자식 클래스 `NoResetClicker`를 아래와 같이 선언한다.
클릭수 초기화 기능을 없애기 위해서는 `reset` 메서드를 재정의(overriding)해야 한다.

In [51]:
class NoResetClicker(CountingClicker):
    # 부모 클래스인 CountingClicker의 모든 메서드를 물려 받는다.
    # 다만, read 함수와 reset 함수를 오버라이딩(재정의) 한다.
    # 재정의하지 않는 메서드는 부모 클래스에서 정의된 그대로 물려 받는다.
    
    # 부모 클래스의 read 함수의 반환값을 두 배해서 반환한다.
    # 부모 클래스를 가리키는 super()의 용법에 주의한다.
    def read(self):
        return 2 * (super().read())

    # reset 함수의 초기화 기능을 없앤다.
    def reset(self):
        pass
    

이제 `NoResetClicker`의 인스턴스를 생성한 후 클릭수 초기화가 이루어지지 않을 확인할 수 있다.

In [52]:
clicker2 = NoResetClicker()
clicker2.click()
clicker2.click()
print(clicker2.read())

4


리셋이 작동하지 않습니다.

In [53]:
clicker2.reset()
print(clicker2.read())

4


자식 클래스의 인스턴스가 만들어져도 부모 클래스의 인스턴스 카운트가 올라간다.

In [54]:
CountingClicker.total_count

3

### 이터러블(iterable) 자료형와 제너레이터(generator)

`for ... in ...` 반복문과 리스트 자료형은 서로 찰떡궁합 관계이다. 
특정 명령을 지정한 횟수만큼 쉽게 반복적으로 처리할 수 있도록 만들 수 있기 때문이다. 

In [55]:
type(range(10))

range

In [56]:
for i in [0, 1, 2, 3, 4]:
    print(i)

0
1
2
3
4


In [57]:
for i in range(5):
    print(i)

0
1
2
3
4


리스트처럼 `for ... in ...` 등의 반복문에서 항목을 차례대로 읽어 활용하는 것을 가능하게 해주는 자료형을 이터러블 자료형이다.

하지만 리스트의 항목은 엄청 많으면 리스트를 저장하는 데에 막대한 메모리가 요구된다.
게다가 한 번만 사용하고 말 리스트라는 문제가 더욱 심각하다.
따라서 필요한 만큼만 항목을 생성해주는 도구가 필요하며, 그런 도구를 제너레이터(generator)라 부른다.

#### `range` 함수

실제로 앞서 다루었던 `range` 함수가 제너레이터의 일종이다. 

예를 들어, `range(5)`는 `for ... in ...` 반복문에서 리스트 `[0, 1, 2, 3, 4]`와 동일한 기능을 수행한다. 

하지만 리스트의 항목은 엄청 많으면 리스트를 저장하는 데에 막대한 메모리가 요구된다.
따라서 필요한만큼만 항목을 생성하는

In [58]:
for i in range(5):
    print(i)

0
1
2
3
4


#### 제너레이터 구현

제너레이터 구현은 함수를 정의하는 방식과 거의 동일하다.
반환값을 지정하는 `return` 키워드 대신에 요청될 때 값을 생성하는 일드(`yield`) 키워드가 사용될 뿐이다.

예를 들어, `range(n)`과 동일한 기능을 수행하는 `generate_range` 제너레이터를 아래와 같이 정의할 수 있다.

In [59]:
def generate_range(n):
    i = 0
    while i < n:
        yield i       # yield 가 호출될 때마다 제너레이터의 값을 생성한다.
        i += 1

아래 반복문을 실행한다고 해서 `generate_range(10)`이 0부터 9까지의 정수를 한꺼번에 생성하지는 않는다.
대신에 `for` 반복문이 한 번씩 반복해서 실행될 때마다 차례대로 0, 1, 2, ... 등을 생성해서 변수 `i`에 할당한다.

In [60]:
for i in generate_range(10):
    print(f"i = {i}")

i = 0
i = 1
i = 2
i = 3
i = 4
i = 5
i = 6
i = 7
i = 8
i = 9


#### 소극적(lazy) 계산과 적극적(eager) 계산

`range`, `generate_range` 등 처럼 모든 값을 미리 생성해서 준비해 놓는 대신에 필요할 때 필요한 항목을 생성하는 함수를 
소극적 함수(lazy function)이라 부른다.

**주의:** 파이썬에서 정의되는 함수는 실행될 때 기본적으로 적극적으로 값을 생성하며 계산한다.


#### 무한 수열 생성

제너레이터를 이용하면 무한 수열도 생성할 수 있다.
이유는 제너레이터는 항상 요구되는 만큼만 생성하고,
따라서 절대로 무한히 많은 값들을 생성하려고 하지 않기 때문이다.

예를 들어, 아래 `natural_numbers` 함수는 모든 자연수를 생성할 준비가 된 제너레이터이다.

In [61]:
def natural_numbers():
    """returns 1, 2, 3, ..."""
    n = 1
    while True:
        yield n
        n += 1

물론 위와 같이 무한 수열을 생성하는 제너레이터는 매우 조심스럽게 사용해야 한다. 
예를 들어 아래와 같이 사용하면 무한 반복(loop)이 발생한다. 

```python
for i in natural_number():
    print(i)
```

무한 수열을 생성하는 제너레이터는 `break` 명령문과 함께 적절하게 사용할 수는 있다.

In [62]:
for i in natural_numbers():
    if i > 5:
        break
    print(i)

1
2
3
4
5


#### 이터레이터 재활용

생성된 이터레이터는 한 번 사용하면 다시 사용할 수 없으며,
필요할 때마다 다시 이터레이터를 생성해야 한다. 

예를 들어, 아래와 같이 이터레이터를 생성하여 변수에 저장하자.

In [63]:
iterator_once = generate_range(5)

그러고 나서 변수를 이용하여 반복문을 돌리자.

In [64]:
for i in iterator_once:
    print(i)

0
1
2
3
4


이제 다시 동일한 변수를 이용하여 반복문을 돌리면 아무 것도 하지 않을 것이다.
이유는 지정된 이터레이터가 이미 모든 값을 생성하였기 때문이다.

In [65]:
for i in iterator_once:
    print(i)

해결책은 해당 이터레이터를 다시 생성하는 것 뿐이다. 

In [66]:
iterator_once = generate_range(5)

for i in iterator_once:
    print(i)

0
1
2
3
4


따라서 이터레이터가 반복적으로 사용되어야 한다면 차라리 리스트로 정의해서 활용하는 것이 나을 수 있다.

#### 제너레이터 조건제시법

리스트와 사전 자료형의 경우에서처럼 조건제시법으로 제너레이터를 생성할 수 있다.
사용하는 기호는 소괄호(`()`)이며, 마치 조건제시법으로 튜플을 생성하는 것처럼 보인다.

In [67]:
evens_below_20 = (i for i in generate_range(20) if i % 2 == 0)

화면에 출력하고 싶어도 할 수 없다.
제너레이터는 정의만 되어 있을 뿐이며, 아무 것도 생성하지 않았기 때문이다.
즉, 소극적 계산을 지원한다.

In [68]:
print(evens_below_20)

<generator object <genexpr> at 0x7f5b043a7468>


하지만 `for ... in ...` 반복문을 이용하여 원소들을 확인할 수 있다.

In [69]:
for x in evens_below_20:
    print(x)

0
2
4
6
8
10
12
14
16
18


동일한 이유로 아래 정의들은 무한 수열을 정의하지만 전혀 문제가 없다.
이유는 반복문을 실행하기 전까지 아무런 계산도 하지 않기 때문이다.

In [70]:
data = natural_numbers()
evens = (x for x in data if x % 2 == 0)
even_squares = (x ** 2 for x in evens)
even_squares_ending_in_six = (x for x in even_squares if x % 10 == 6)
# 등등

#### `next` 함수

넥스트(`next`) 함수는 이터레이터에서 아직 생성되지 않는 다음 항목을 계산해내는 함수이다.

In [71]:
next(even_squares_ending_in_six)

16

In [72]:
next(even_squares_ending_in_six)

36

In [73]:
next(even_squares_ending_in_six)

196

#### `enumerate` 함수

리스트 또는 제너레이터를 대상으로 반복문을 실행할 때
각 항목고 함께 해당 항목의 인덱스를 함께 사용해야 할 때가 있다.
이럴 때 이뉴머레이트(`enumerate`) 함수가 유용하다.

In [74]:
names = ["Alice", "Bob", "Charlie", "Debbie"]

In [75]:
for i, name in enumerate(names):
    print(f"{i}번 이름은 {name}입니다.")

0번 이름은 Alice입니다.
1번 이름은 Bob입니다.
2번 이름은 Charlie입니다.
3번 이름은 Debbie입니다.


아래 두 방식도 가능하지만 `enumerate` 함수를 사용하는 것에 비하면
별로 좋아 보이지 않는다.

In [76]:
for i in range(len(names)):
    print(f"{i}번 이름은 {name}입니다.")

0번 이름은 Debbie입니다.
1번 이름은 Debbie입니다.
2번 이름은 Debbie입니다.
3번 이름은 Debbie입니다.


In [77]:
i = 0
for name in names:
    print(f"{i}번 이름은 {name}입니다.")
    i += 1

0번 이름은 Alice입니다.
1번 이름은 Bob입니다.
2번 이름은 Charlie입니다.
3번 이름은 Debbie입니다.
