# iterator와 generator 
---
All rights reserved, 2021-2023 By Youn-Sik Hong. 수업 목적으로만 활용 가능.

### 이 2가지가 왜 필요한가요?
- **iterator**
    - 모든 루프 sequence에 대해 자원(resource)을 할당하지 않고 
    - 현재 실행 중인 루프 index에 대해서만 자원을 할당.     
    - 자원을 절약. 깔끔한(?) 코드.
- **generator**
    - 한 번에 하나만 처리. 메모리는 더 필요하지만, CPU는 효과적으로 활용. 
    - 코드 길이가 짧고 이해하기 쉬움. 

## iterator 와 generator 의 차이점
- 클래스 구현 
    - iterator - **__iter__** 메소드와 **__next__** 메소드를 모두 구현. 
    - generator - **yield** 문을 반드시 포함(*return* 문은 없음)
- 값 반환 형태
    - iterator - **__next__** 메소드 안의 *return* 문에서 값을 반환. 
    - generator - **yield** 문에서 값을 반환.
- 예외(exception) 발생
    - iterator - **raise** 문에서 *StopIteration* 예외 발생. 
    - generator - 함수의 끝에 도달하면 *StopIteration* 예외가 자동 발생.

## 반복 실행(**iterable**) 객체와 iterator
- tupe, list, dictionary, set, 문자열(str) 등 여러 개 원소를 갖는 객체가 **iterable** 객체. 
    - 루프를 반복할 때마다 여러 원소 중에서 순서대로 하나를 선택해 뭔가를 실행할 수 있기 때문.
- *iterator* 객체로 쉽게 변환 가능.
    - **__iter__()** 와 **__next__()** 메소드를 갖고 있음. 

In [1]:
a_set = {1, 2, 3} #set 객체 --> iterable 객체
print(type(a_set))

b_iterator = a_set.__iter__() #iterator 객체로 변환
#b_iterator = iter(a_set) 
print(type(b_iterator))

<class 'set'>
<class 'set_iterator'>


In [2]:
for i in range(len(a_set)):
    print(b_iterator.__next__(), end=' ')

1 2 3 

b_iterator 객체가 마지막 원소까지 루프를 돌았기 때문에 재실행을 위해서는 초기화가 필요.

In [3]:
b_iterator = iter(a_set) 
for i in range(len(a_set)):
    print(next(b_iterator), end=' ')

1 2 3 

반복 실행이 가능한 객체인지 여부는 dir() 메소드를 사용해 확인할 수 있다.
- dir() : 해당 객체의 속성(attribute) 리스트를 리턴.
    - *iterator* 객체는 **__iter__** 와 **__next__** 를 모두 구현.
        - 속성 리스트에 '__iter__'가 포함되어 있으면,
        - 해당 객체는 반복 실행 가능한 객체.

In [4]:
print('__iter__' in dir(b_iterator))
print('__next__' in dir(b_iterator))

True
True


In [5]:
lis = ['a', 'b', 'c']
'__iter__' in dir(lis)

True

### 직접 iterator 객체를 만들어 보자!
- iterator 객체를 반환하는 __iter__() 메소드와 
- 호출할 때마다 다음 원소를 전달하는 __next__() 메소드를 구현해야 함.

In [6]:
class MyIterator:
    def __init__(self, begin, end):
        self.current = 0 #0부터 시작
        self.end = end    
 
    def __iter__(self):
        return self         
    
    def __next__(self):
        if self.current+1 > self.end: # end 미포함
            raise StopIteration  #exception 발생
        else:
            self.current += 1
            return self.current - 1                        

In [7]:
for i in MyIterator(0, 10):
    print(i, end=' ')

0 1 2 3 4 5 6 7 8 9 

## 2. generator   

### generator 메소드
- **yield** 문을 포함. $\to$ 키워드 *yield* 뒤에 값은 반환할 값.
- *yield* 는 실행을 양보하고 (*next* 메소드를 호출할 때까지) 기다린다는 뜻.

In [8]:
def my_generator(cur, end):
    while cur < end: #end 미포함
        yield cur
        cur += 1

In [9]:
for num in my_generator(1,10):
    print(num, end=' ')

1 2 3 4 5 6 7 8 9 

- **generator** 객체의 **next** 메소드를 호출하면 
    - *yield* 문까지 코드를 실행한 후 값을 생성(generate). 
    - 생성한 값을 **generator** 메소드 바깥으로 전달함과 동시에 실행을 잠시 멈춤. 

In [10]:
g = my_generator(1,10)
print(type(g))
g.__next__()

<class 'generator'>


1

In [11]:
print(next(g))
#print(g.__next__())

2


### generator 표현식(expression)
- **generator 표현식** 은 리스트를 생성하는 코딩 스타일의 형태. 
    - ( )(소괄호, parenthesis)로 묶은 형태. 
- **generator 표현식** 도 *generator 객체* 를 반환. 

In [12]:
squares = [x * x for x in range(1,10)] #리스트
print(type(squares), squares)

<class 'list'> [1, 4, 9, 16, 25, 36, 49, 64, 81]


In [13]:
squares_g = (x * x for x in range(1,10)) #generator 표현식
print(type(squares_g), squares_g)
print(list(squares_g))

<class 'generator'> <generator object <genexpr> at 0x000001E179F812F0>
[1, 4, 9, 16, 25, 36, 49, 64, 81]


**itertools** 모듈: 파이썬에 내장되어 있는 **iterator 객체**를 생성하는 라이브러리

In [14]:
from itertools import count

odd_number = count(start=1, step=2) # 1, 3, 5, ...
#even_number = count(start=0, step=2) # 0, 2, 4, ...

k = next(odd_number)
while (k <= 10):
    print(k, end=' ')
    k = next(odd_number)

1 3 5 7 9 

- **itertools** 라이브러리에 **cycle** 모듈을 사용하여 간단한 응용 코드를 만들어보자. 
    - *cycle*은 단어 뜻 그대로 끝까지 가면 다시 처음으로 되돌아오는 **iterator 객체** 를 말함 
    - 2023년도 프로야구 정규시즌 1위팀을 예측해 보자.
        - 실행할 때마다 1위팀이 바뀜!
        - 몇 개 팀이 빠졌지만 간단한 응용 예제일 뿐!!

In [15]:
from itertools import cycle
import random

teams = cycle(['SSG Landers', 'LG Twins', 'Doosan Bears', 'Kiwoom Heroes'])
lim = random.randint(0, 4)
for i in range(lim):
    tn = next(teams)
    
print('Q. Which team will win the KBO series? A: ' + tn)

Q. Which team will win the KBO series? A: SSG Landers
