Jump to python
==

이터레이터와 제너레이터
--

* 이터레이터(iterator)
>  - next 함수 호출 시, 계속 그 다음 값을 리턴

>  - 리스트는 반복 가능
>>  - 리스트는 이터레이터일까?
>>  - 반복 가능하다고 이터레이터는 아님
>>  - 반복 가능 하면, iter 함수 이용해 이터레이터 만들 수 있음

In [22]:
a = [1, 2, 3]
next(a)

TypeError: 'list' object is not an iterator

In [None]:
a = [1,2,3]
ia = iter(a)
type(ia)

list_iterator

In [None]:
next(ia)

1

In [None]:
next(ia)

2

In [None]:
next(ia)

3

In [None]:
next(ia)

# 더 리턴할 값이 없을 때

StopIteration: 

In [None]:
a = [1, 2, 3]
ia = iter(a)
for i in ia:
    print(i)

1
2
3


In [None]:
a = [1, 2, 3]
ia = iter(a)
for i in ia:
    print(i)

for i in ia:
    print(i)

1
2
3


* 이터레이터 만들기
>  - 클래스로 이터레이터 만들기

In [None]:
# iterator.py

class MyItertor:
    def __init__(self, data):
        self.data = data
        self.position = 0

    def __iter__(self):
        return self

    def __next__(self):
        if self.position >= len(self.data):
            raise StopIteration
        result = self.data[self.position]
        self.position += 1
        return result

if __name__ == "__main__":
    i = MyItertor([1,2,3])
    for item in i:
        print(item)

# 이터레이터 객체를 생성하기 위해 __iter__ 메서드와 __next__ 메서드를 구현

# __iter__ 메서드를 구현 -> 해당 클래스로 생성한 객체는 반복 가능한 객체
# __iter__는 반복 가능한 객체 리턴, 클래스의 객체 의미하는 self를 리턴, 반드시 __next__ 함수를 구현

# __next__는 반복 가능한 객체의 값을 차례대로 반환
# MyIterator 객체 생성 시 전달한 data를 하나씩 리턴, 리턴값이 없을 때 StopIteration 예외를 발생

1
2
3


In [None]:
# reviterator.py

class ReverseItertor:
    def __init__(self, data):
        self.data = data
        self.position = len(self.data) -1

    def __iter__(self):
        return self

    def __next__(self):
        if self.position < 0:
            raise StopIteration
        result = self.data[self.position]
        self.position -= 1
        return result

if __name__ == "__main__":
    i = ReverseItertor([1,2,3])
    for item in i:
        print(item)

# 데이터 역순 출력

3
2
1


* 제너레이터(generator)
>  - 이터레이터를 생성해주는 함수
>  - next 함수 호출 시, 그 값을 차례대로 얻을 수 있음
>  - 차례대로 결과를 반환하고자 return 대신 yield 키워드를 사용

In [24]:
def mygen():
    yield 'a'
    yield 'b'
    yield 'c'
 
g = mygen()

# 제너레이터 객체는 g = mygen()과 같이 제너레이터 함수를 호출해 만듦

In [25]:
type(g)

generator

In [26]:
next(g)

# 제너레이터 객체 g가 yield 만나면, 그 값을 리턴하되('a') 현재 상태를 그대로 기억

'a'

In [27]:
next(g)

'b'

In [28]:
next(g)

'c'

In [29]:
next(g)

StopIteration: 

* 제너레이터의 표현식

In [30]:
# generator.py

def mygen():
    for i in range(1, 1000):
        result = i * i
        yield result

gen = mygen()

print(next(gen))
print(next(gen))
print(next(gen))

# 1부터 1,000까지 각각의 숫자를 제곱한 값을 순서대로 리턴하는 제너레이터
# 총 3번의 next를 호출

1
4
9


In [31]:
gen = (i * i for i in range(1, 1000))

* 제너레이터와 이터레이터
>  - 제너레이터를 이용하면 간단하게 이터레이터를 만들 수 있음
>  - 이터레이터의 성격에 따라 클래스로 만들 것인지, 제너레이터로 만들 것인지를 선택
>  - 간단한 경우라면 제너레이터를 사용하는 것이 가독성이나 유지 보수 측면에서 유리

In [33]:
gen = (i * i for i in range(1, 1000))

In [34]:
(i * i for i in range(1, 1000))

<generator object <genexpr> at 0x7fb3f28c2430>

In [35]:
class MyIterator:
    def __init__(self):
        self.data = 1

    def __iter__(self):
        return self

    def __next__(self):
        result = self.data * self.data
        self.data += 1
        if self.data >= 1000:
            raise StopIteration
        return result

* 제너레이터 활용

In [36]:
# generator2.py

import time

def longtime_job():
    print("job start")
    time.sleep(1)      # 1초 지연
    return "done"

list_job = [longtime_job() for i in range(5)]
print(list_job[0])

# longtime_job 함수는 총 실행 시간이 1초
# longtime_job 함수를 5번 실행, 리스트에 그 결괏값을 담고 그 첫 번째 결괏값을 호출
# 리스트를 만들 때 이미 5개의 함수를 모두 실행하므로 5초의 시간이 소요

job start
job start
job start
job start
job start
done


In [37]:
# generator2.py

import time

def longtime_job():
    print("job start")
    time.sleep(1)
    return "done"

list_job = (longtime_job() for i in range(5))
print(next(list_job))

# [longtime_job() for i in range(5)] -> 제너레이터 표현식(longtime_job() for i in range(5))으로
# 실행 시 1초 소요, 출력 결과 다름
# 제너레이터 표현식 때문에, longtime_job() 함수가 5회가 아닌 1회만 호출
# 느긋한 계산법(lazy evaluation)
# 시간이 오래 걸리는 작업을 한꺼번에 처리하기보다는 필요한 경우에만 호출하여 사용할 때 유용

job start
done
