In [27]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

코딩도장 내용 정리

## 이터레이터(Iterator)

iter는 반복 가능한 객체에서 이터레이터를 반환하고, next는 이터레이터에서 값을 차례대로 꺼낸다.

In [1]:
it = iter(range(3))

In [2]:
next(it)

0

In [3]:
next(it)

1

In [4]:
next(it)

2

In [5]:
next(it)

StopIteration: 

iter는 반복을 끝낼 값을 지정하면 특정 값이 나올 때 반복을 끝냄..  
이 경우엔 반복 가능한 객체 대신 호출 가능한 객체(callable)를 넣어준다.  
반복을 끝낼 값은 sentinel이라고 부른다.  
iter(호출가능한객체, 반복을 끝낼 값)

In [6]:
import random
it = iter(lambda : random.randint(0, 5), 2)

In [7]:
next(it)

5

In [8]:
next(it)

1

In [9]:
next(it)

3

In [10]:
next(it)

4

In [11]:
next(it)

5

In [12]:
next(it)

1

In [13]:
next(it)

1

In [14]:
next(it)

1

In [15]:
next(it)

0

In [16]:
next(it)

4

In [17]:
next(it)

3

In [18]:
next(it)

0

In [19]:
next(it)

1

In [20]:
next(it)

1

In [21]:
next(it)

0

In [22]:
next(it)

StopIteration: 

이런식으로 iter를 활용하면 반복문에서 if 조건문으로 매번 숫자가 2인지 검사하지 않아도 되므로 코드가 좀 더 간단해진다.

In [23]:
## 원래의 방식
import random

while True:
    i = random.randint(0, 5)
    if i == 2:
        break
    print(i, end=' ')

1 0 5 3 0 4 4 

In [25]:
## iter 활용
for i in iter(lambda: random.randint(0, 5), 2):
    print(i, end=' ')

3 1 

next()는 기본값을 지정할 수 있어서 반복이 끝나더라도 StopIteration이 발생하지 않고 기본값을 출력한다.

In [28]:
it = iter(range(3))
next(it, 10)
next(it, 10)
next(it, 10)
next(it, 10)
next(it, 10)
next(it, 10)


0

1

2

10

10

10

```python
class 이터레이터이름:
    def __iter__(self):
        코드
 
    def __next__(self):
        코드
        ```

위 매직 메서드를 추가하면 이터레이터를 만들 수 있다.

In [29]:
class Counter:
    def __init__(self, stop):
        self.current = 0    # 현재 숫자 유지, 0부터 지정된 숫자 직전까지 반복
        self.stop = stop    # 반복을 끝낼 숫자
 
    def __iter__(self):
        return self         # 현재 인스턴스를 반환
 
    def __next__(self):
        if self.current < self.stop:    # 현재 숫자가 반복을 끝낼 숫자보다 작을 때
            r = self.current            # 반환할 숫자를 변수에 저장
            self.current += 1           # 현재 숫자를 1 증가시킴
            return r                    # 숫자를 반환
        else:                           # 현재 숫자가 반복을 끝낼 숫자보다 크거나 같을 때
            raise StopIteration         # 예외 발생

for i in Counter(3):
    print(i, end=' ')

0 1 2 

```python
class 이터레이터이름:
    def __getitem__(self, 인덱스):
        코드
```
`__getitem__` 메서드를 추가하면 인덱스로 접근 가능해진다. 또한 위에서 설명한 `__iter__`, `__next__`를 생략해도 이터레이터가 된다.

In [30]:
class Counter:
    def __init__(self, stop):
        self.stop = stop
 
    def __getitem__(self, index):
        if index < self.stop:
            return index
        else:
            raise IndexError

print(Counter(3)[0], Counter(3)[1], Counter(3)[2])
 
for i in Counter(3):
    print(i, end=' ')

0 1 2
0 1 2 

#### 연습문제: 배수 이터레이터 만들기

In [31]:
class MultipleIterator:
    def __init__(self, stop, multiple):
        self.stop = stop
        self.multiple = multiple
        self.current = 0
                         
    def __iter__(self):
        return self
 
    def __next__(self):
        self.current += 1
        if self.current * self.multiple < self.stop:
            return self.current * self.multiple
        else:
            raise StopIteration
            
for i in MultipleIterator(20, 3):
    print(i, end=' ')

print()
for i in MultipleIterator(30, 5):
    print(i, end=' ')

3 6 9 12 15 18 
5 10 15 20 25 

## 2. 제너레이터(Generator)
이터레이터를 생성해주는 함수.  
이터레이터를 만들기 위해 클래스에 `__iter__`과 `__next__` 또는 `__getitem__`메서드를 구현해야 했지만, 제너레이터는 함수 안에서 yield라는 키워드만 사용하면 된다. 발생자라고 부르기도 한다.

함수 안에 yield를 사용하면 함수는 제너레이터가 되며 yield에는 값(변수)을 지정한다.

In [32]:
def number_generator():
    yield 0
    yield 1
    yield 2
    
for i in number_generator():
    print(i)   

0
1
2


In [34]:
g = number_generator()
next(g)
next(g)
next(g)
next(g)


0

1

2

StopIteration: 

이터레이터와 동작이 똑같다.  
이터레이터는 `__next__`안에서 직접 return으로 값을 반환했지만 제너레이터는 yield에 지정한 값이 `__next__`메서드(next 함수)의 반환값으로 나온다.  
또한 이터레이터는 raise로 StopIteration 예외를 직접 발생시켰지만 제너레이터는 함수의 끝까지 도달하면 StopIteration 예외가 자동으로 발생한다.  
yield를 사용하면 값을 함수 바깥으로 전달하면서 코드 실행을 함수 바깥에 양보한다.  
따라서 yield는 현재 함수를 잠시 중단하고 함수 바깥의 코드가 실행되도록 만든다!!

이렇게 제너레이터는 함수를 끝내지 않은 상태에서 yield를 사용하여 값을 바깥으로 전달할 수 있다.  
return은 반환 즉시 함수가 끝나지만, yield는 잠시 함수 바깥의 코드가 실행되도록 양보하여 값을 가져가게 한 뒤 다시 제너레이터 안의 코드를 계속 실행하는 방식.  
제너레이터는 함수 끝까지 도달하면 StopIteration 예외가 발생하는데, 마찬가지로 return도 함수를 끝내므로 return을 사용하여 함수 중간에 빠져나오면 StopIteration 예외가 발생한다.  
특시 제너레이터 안에서 return에 반환값을 지정하면 StopIteration 예외의 에러 메시지로 들어간다. 

In [35]:
def one_generator():
    yield 1
    return 'return에 지정한 값'

try:
    g = one_generator()
    next(g)
    next(g)
except StopIteration as e:
    print(e)

1

return에 지정한 값


### 제너레이터 만들기

In [38]:
def number_generator(stop):
    n = 0              # 숫자는 0부터 시작
    while n < stop:    # 현재 숫자가 반복을 끝낼 숫자보다 작을 때 반복
        yield n        # 현재 숫자를 바깥으로 전달
        n += 1         # 현재 숫자를 증가시킴

for i in number_generator(3):
    print(i)

0
1
2


#### yield에서 함수 호출하기

In [39]:
def upper_generator(x):
    for i in x:
        yield i.upper()   # 함수의 반환값을 바깥으로 전달
        
fruits = ['apple', 'pear', 'grape', 'pineapple', 'orange']
for i in upper_generator(fruits):
    print(i)

APPLE
PEAR
GRAPE
PINEAPPLE
ORANGE


### yield from 사용하기

In [40]:
def number_generator():
    x = [1, 2, 3]
    for i in x:
        yield i

for i in number_generator():
    print(i)

1
2
3


위와 같은 경우 매번 반복문을 사용하지 않고, yield from을 이용하여 사용할 수 있다. (python 3.3 이상부터 사용 가능)  
- yield from 반복가능한 객체 / 이터레이터 / 제너레이터객체

In [41]:
def number_generator():
    x = [1, 2, 3]
    yield from x
    
for i in number_generator():
    print(i)

1
2
3


#### yield from에 제너레이터 객체 지정

In [43]:
def number_generator(stop):
    n = 0
    while n < stop:
        yield n
        n += 1
        
def three_generator():
    yield from number_generator(3)

for i in three_generator():
    print(i)

0
1
2


#### List Comprehension과 Generator Comprehension

리스트 표현식은 처음부터 리스트의 요소를 만들어내지만 제너레이터 표현식은 필요할 때 요소를 만들어내므로 메모리를 절약할 수 있다.

#### 파일 읽기 제너레이터 만들기
```
words.txt

compatibility
experience
photography
spotlight
```

In [45]:
def file_read():
    with open('words.txt') as file:
        while True:
            line = file.readline()
            if line == '':
                break
            yield line.strip('\n')

for i in file_read():
    print(i)

compatibility
experience
photography
spotlight


용량이 매우 큰 파일은 메모리에 한꺼번에 읽어서 처리하기 힘들기 때문에 대용량 데이터를 부분부분 처리해야 할 때 이렇게 제너레이터를 활용한다.