# Generator

## 학습목표
 - iterator, iterable의 이해 및 실습
 - generator 이해 및 실습

* generator
 - 파이썬 시퀀스(순회 가능한 객체)를 생성하는 object
 - list와 다르게 한꺼번에 생성되어 메모리를 차지하지 않음
 - list comprehension과 유사하나 ()를 사용하여 생성
   - gen = (i for i in range(5)) gen -> generator object
   - lst = [i for i in range(5)] lst -> list object
   

In [1]:
# list comprehension example
lst = [i ** 2 for i in range(5)]

print type(lst)
print lst
for num in lst:
    print num,

<type 'list'>
[0, 1, 4, 9, 16]
0 1 4 9 16


* generator example

In [2]:
# generator example
gen = (i ** 2 for i in range(5))
print type(gen) 
print gen # generator 객체
for num in gen:
    print num,

<type 'generator'>
<generator object <genexpr> at 0x03A35FD0>
0 1 4 9 16


*  iterator & iterable
  - iterable
     - 순회 가능한 객체를 의미
     - list, dictionary, string, file 등
 - iterator
     - 순회 자체를 추상화된 객체
     - iter 함수
       - python 내장 함수
       - iterator객체 생성
       - https://docs.python.org/2/library/functions.html#iter
       
     - next 함수
       - python 내장 함수
       - iterator의 다음 값, 즉 순환하는 값을 반환함
       - 순환하고자 하는 값이 없을 경우 StopIteration 에러 발생
       - https://docs.python.org/2/library/functions.html#next

In [3]:
it = iter(range(5)) # 순환 객체 반환

print type(it)
print it

<type 'listiterator'>
<listiterator object at 0x03A26DF0>


In [4]:
it = iter(range(5)) # 순환 객체 반환

# next 함수를 호출하여 하나씩 값을 순회
print next(it)
print next(it)
print next(it)
print next(it)
print next(it)

# 더이상 순회할 아이템에 없을 때, StopIteration 발생
print next(it)

0
1
2
3
4


StopIteration: 

In [7]:
# iterator 객체의 next 멤버함수도 이용가능

it = iter(range(5))

print it.next()
print it.next()
print it.next()
print it.next()
print it.next()

# 더이상 순회할 아이템에 없을 때, StopIteration 발생
print it.next()

0
1
2
3
4


StopIteration: 

* for문
 - 내부적으로 iterator와 next를 사용한 코드로 구성
 - StopIteration이 발생하기 전까지 next를 호출

In [8]:
it = iter(range(5))
for num in it:
    print num,

0 1 2 3 4


* 연습문제) 
1. while을 사용하여 iterator 객체를 순회 해보세요.

In [18]:
it = iter(range(5))
while it:
    try:
        print it.next()
    except Exception as err:
        break

0
1
2
3
4


* Custom iterable object
  -  __iter__ 함수를 구현하여 iterable 객체 생성 가능
  - iterator객체를 생성하여 next함수를 구현

In [43]:
class zrange(object):
    def __init__(self, n):
        self.n = n
    
    # iterable 객체로 만듦.
    # 즉, 순회가 가능하게 됨
    
    def __iter__(self):
        return zrange_iter(self.n)

class zrange_iter(object):
    def __init__(self, n):
        self.i = 0
        self.n = n
        
    def next(self):
        if self.i < self.n:
            val = self.i
            self.i += 1
            return val
        else:
            raise StopIteration()

In [44]:
it = iter(zrange(5))

print it.next()
print it.next()
print it.next()
print it.next()
print it.next()

print it.next()

0
1
2
3
4


StopIteration: 

In [None]:
# for문을 사용하여 바로 순회 가능
for num in zrange(5):
    print num,
    
    
it = iter(zrange(5))

* iterable과 iterator를 하나의 객체로 구현

In [None]:
class zrange(object):
    def __init__(self, n):
        self.i = 0
        self.n = n
        
    # zrange 객체를 iterable 하게 만듦
    def __iter__(self):
        return self
    
    def next(self):
        if self.i < self.n:
            val = self.i
            self.i += 1
            return val
        else:
            raise StopIteration()

In [None]:
z = zrange(5)
print z.next()
print z.next()
print z.next()
print z.next()
print z.next()

# StopIteration예외 발생
print z.next()

In [None]:
z = zrange(5)

for num in z:
    print num,

* 연습문제) 거꾸로 값을 순회하는 reverse_range 클래스를 생성하세요

In [50]:
class zrange_inv(object):
    def __init__(self, n):
        self.i = 0
        self.n = n
        
    # zrange 객체를 iterable 하게 만듦
    def __iter__(self):
        return self
    
    def next(self):
        if self.i < self.n:
            val = self.n
            self.n -= 1
            return val
        else:
            raise StopIteration()

In [51]:
z = zrange_inv(5)

for num in z:
    print num,

5 4 3 2 1


* generator iteration
 - iterator를 쉽게 생성 가능

In [54]:
# list comprehension과 전부 동일하나 ()를 사용한다는 것만 다름
gen = (i ** 2 for i in range(5))

print next(gen)
print next(gen)
print next(gen)
print next(gen)
print next(gen)
print next(gen) # -> StopIteration 예외 발생

# generator의 경우 한번만 소비(순회) 가능


0
1
4
9
16


StopIteration: 

In [53]:
gen = (i ** 2 for i in range(5))

for num in gen:
    print num,
    
print 
print '-' * 30

# 이미 순회하였기 때문에 출력되지 않음
for num in gen:
    print num,

0 1 4 9 16
------------------------------


In [55]:
gen = (i ** 2 for i in range(5))

for num in gen:
    print num,
    
print 
print '-' * 30

# 다시 순회하기 위해, 다시 generator 객체 생성
gen = (i ** 2 for i in range(5))
for num in gen:
    print num,

0 1 4 9 16
------------------------------
0 1 4 9 16


* generator function
 - 시퀀스를 생성하여 반환하는 함수
 - yield 키워드를 사용하여 값을 생성 (not 반환)
 - 호출 결과는 generator 객체 반환
 - 함수 호출은, 순회가 시작되어야 수행됨

In [60]:
def genrate_org(n):
    i = 0
    1st =[]
    

def generate(n):
    i = 0
    while i < n:
        # 함수가 yield를 포함하면 generator function
        # 호출한 곳으로 새로운 값 generate
        # 함수가 종료되는 것이 아닌 다시 다음 라인부터 실행됨
        yield i 
        i += 1


In [61]:
# 함수가 실행되지 않음, 단순히 generator 객체 반환
# next 함수가 호출될 때 함수가 실행 됨

gen = generate(5)
print type(gen)
print gen

<type 'generator'>
<generator object generate at 0x03B02DF0>


In [62]:
print gen.next()

0


In [63]:
print gen.next()
print gen.next()
print gen.next()
print gen.next() # StopIteration

1
2
3
4


In [65]:
def generate2(n):
    print 'started'
    
    i = 0
    while i < n:
        print 'before yield', i
        yield i
        i += 1
        print 'after yield', i
    
    print 'ended'
    

In [66]:
# 함수 수행되지 않음
gen2 = generate2(3)
print gen2

<generator object generate2 at 0x03B026E8>


In [67]:
# 처음 next 가 불린 시점에 수행 됨
gen2.next()

started
before yield 0


0

In [68]:
gen2.next()
gen2.next()
gen2.next() 
gen2.next() # StopIteration

after yield 1
before yield 1
after yield 2
before yield 2
after yield 3
ended


StopIteration: 

* generator expressions
 - 한번에 값을 생성하지 않아 메모리에 효율적
 - iterable을 처리하는 함수에 모두 사용 가능 e.g) sum

In [69]:
gen = (x * 2 for x in range(5))
print sum(gen)

20


* xrange
 - range와 비슷하나, 전체 값을 생성하여 반환하지 않고 그때그때 생성하여 순회 가능하도록 함
 - python3에서는 range가 xrange와 동일하게 구현됨
 - https://docs.python.org/2/library/functions.html#xrange

In [70]:
%timeit range(int(1e7))

1 loop, best of 3: 271 ms per loop


In [71]:
%timeit xrange(int(1e7))

The slowest run took 5.05 times longer than the fastest. This could mean that an intermediate result is being cached.
1000000 loops, best of 3: 1.02 µs per loop


In [72]:
# 순회에 사용 가능
for i in xrange(100):
    print i,

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
