# Generator

In [8]:
[i for i in 1e5]

TypeError: 'float' object is not iterable

In [6]:
(i for i in 1e4)

TypeError: 'float' object is not iterable

## 학습목표
 - iterator, iterable의 이해 및 실습
 - generator 이해 및 실습

* generator
 - 파이썬 시퀀스(순회 가능한 객체)를 생성하는 object
 - list와 다르게 한꺼번에 생성되어 메모리를 차지하지 않음
 - list comprehension과 유사하나 ()를 사용하여 생성
   - gen = (i for i in range(5)) gen -> generator object
   - lst = [i for i in range(5)] lst -> list object
   

In [None]:
# list comprehension example
lst = [i ** 2 for i in range(5)]

print type(lst)
print lst
for num in lst:
    print num,

* generator example

In [None]:
# generator example
gen = (i ** 2 for i in range(5))
print type(gen) 
print gen # generator 객체
for num in gen:
    print num,

#generator는 출력 불가능하고 소비만 가능

*  iterator & iterable
  - iterable
     - 순회 가능한 객체를 의미
     - list, dictionary, string, file 등
 - iterator
     - 순회 자체를 추상화된 객체
     - iter 함수
       - python 내장 함수
       - iterator객체 생성
       - https://docs.python.org/2/library/functions.html#iter
       
     - next 함수
       - python 내장 함수
       - iterator의 다음 값, 즉 순환하는 값을 반환함
       - 순환하고자 하는 값이 없을 경우 StopIteration 에러 발생
       - https://docs.python.org/2/library/functions.html#next

In [None]:
it = iter(range(5)) # 순환 객체 반환

print type(it)
print it

In [None]:
it = iter(range(5)) # 순환 객체 반환

# next 함수를 호출하여 하나씩 값을 순회
print next(it)
print next(it)
print next(it)
print next(it)
print next(it)

# 더이상 순회할 아이템에 없을 때, StopIteration 발생
print next(it)

In [None]:
# iterator 객체의 next 멤버함수도 이용가능
print it.next()
print it.next()
print it.next()
print it.next()
print it.next()

# 더이상 순회할 아이템에 없을 때, StopIteration 발생
print it.next()

* for문
 - 내부적으로 iterator와 next를 사용한 코드로 구성
 - StopIteration이 발생하기 전까지 next를 호출

In [None]:
it = iter(range(5))
for num in it:
    print num,

* 연습문제) 
1. while을 사용하여 iterator 객체를 순회 해보세요.

In [9]:
it = iter(range(5))

while True:
    try:
        val = it.next()
        print val, 
        
    except StopIteration:
        print("No more")
        break

0 1 2 3 4 No more


* Custom iterable object
  -  __iter__ 함수를 구현하여 iterable 객체 생성 가능
  - iterator객체를 생성하여 next함수를 구현

In [11]:
class Zrange(object):
    def __init__(self, n):
        self.n = n
    
    # iterable 객체로 만듦.
    # 즉, 순회가 가능하게 됨
    def __iter__(self):
        return Zrange_iter(self.n)

class Zrange_iter(object):
    def __init__(self, n):
        self.i = 0
        self.n = n
        
    def next(self): #next를 써줬기 때문에 ieration이 가능한 것.
        if self.i < self.n:
            val = self.i
            self.i += 1
            return val
        
        else:
            raise StopIteration()

In [12]:
it = iter(Zrange(5)) #내가 custom하게 만든 class를 순회!

print it.next()
print it.next()
print it.next()
print it.next()
print it.next()

print it.next()

0
1
2
3
4


StopIteration: 

In [22]:
# for문을 사용하여 바로 순회 가능
for num in Zrange(5):
    print num,
    
    
it = iter(Zrange(5))
it

0 1 2 3 4

<__main__.Zrange_iter at 0x337a610>




* iterable과 iterator를 구분하지 않고 하나의 객체로 구현

In [23]:
class Zrange(object):
    def __init__(self, n):
        self.i = 0
        self.n = n
        
    # zrange 객체를 iterable 하게 만듦
    def __iter__(self):
        return self
    
    def next(self): #__next__ 가 아니라 next임
        if self.i < self.n:
            val = self.i
            self.i += 1
            return val
        else:
            raise StopIteration()

In [24]:
z = Zrange(5)
print z.next()
print z.next()
print z.next()
print z.next()
print z.next()

# StopIteration예외 발생
print z.next()

0
1
2
3
4


StopIteration: 

In [26]:
z = Zrange(5)

for num in z:
    print num,

0 1 2 3 4


* 연습문제) 거꾸로 값을 순회하는 reverse_range 클래스를 생성하세요

In [30]:
class reverse_range(object):
    def __init__(self, n):
        self.i = 0
        self.n = n
        
    def __iter__(self):
        return self
    
    def next(self):
        if self.i < self.n:
            val = self.n
            self.n -= 1
            return val
        
        else:
            raise StopIteration()
   

#test
it = reverse_range(10)

for i in it:
    print i,

10 9 8 7 6 5 4 3 2 1


* generator iteration
 - iterator를 쉽게 생성 가능
 - generator 역시 iterator이다.

In [31]:
# list comprehension과 전부 동일하나 ()를 사용한다는 것만 다름
gen = (i ** 2 for i in range(5))

print next(gen)
print next(gen)
print next(gen)
print next(gen)
print next(gen)
print next(gen) # -> StopIteration 예외 발생

# generator의 경우 한번만 소비(순회) 가능


0
1
4
9
16


StopIteration: 

In [33]:
gen = (i ** 2 for i in range(5))

for num in gen:
    print num,
    
print 
print '-' * 30

# 이미 순회하였기 때문에 출력되지 않음. 순회하면서 소비되었음.
for num in gen:
    print num,
print("Already consumed")

0 1 4 9 16
------------------------------
Already consumed


In [34]:
gen = (i ** 2 for i in range(5))

for num in gen:
    print num,
    
print 
print '-' * 30

# 다시 순회하기 위해, 다시 generator 객체 생성
gen = (i ** 2 for i in range(5))
for num in gen:
    print num,

0 1 4 9 16
------------------------------
0 1 4 9 16


* generator function
 - 시퀀스를 생성하여 반환하는 함수
 - yield 키워드를 사용하여 값을 생성 (not 반환)
 - 호출 결과는 generator 객체 반환
 - 함수 호출은, 순회가 시작되어야 수행됨

In [47]:
def generate_lst(n): #우리가 지금까지 익숙했던 구조.
    i = 0
    lst = []
    
    while i < n:
        lst.append(i)
        i += 1
        
    return lst

print(generate_lst(5))
    

[0, 1, 2, 3, 4]


In [48]:
def generate(n):
    i = 0
    while i < n:
        # 함수가 yield를 포함하면 generator function
        # 호출한 곳으로 새로운 값 generate
        # 함수가 종료되는 것이 아닌 다시 다음 라인부터 실행됨
        yield i  #yield가 있으면 무조건 generator. generate함수가 호출된다고 실행되는 것이 아니다.
        i += 1
        
        
# 함수는 원래 1번 실행되면 끝나는데 이건 계속 반복 실행

In [49]:
# 함수가 실행되지 않음, 단순히 generator 객체 반환
# next 함수가 호출될 때 함수가 실행 됨

gen = generate(5)
print type(gen)
print gen

<type 'generator'>
<generator object generate at 0x03394DF0>


In [50]:
print gen.next() #generate함수가 호출된다고 실행되는 것이 아니다.
#next를 만나야 실행됨

0


In [51]:
print gen.next() #또 다음 next를 만나야지 generate 함수 실행됨. 굉장히 메모리 효율적
print gen.next()
print gen.next()
print gen.next()
print gen.next() # StopIteration

1
2
3
4


StopIteration: 

In [52]:
def generate2(n):
    print 'started'
    
    i = 0
    while i < n:
        print 'before yield', i
        yield i
        i += 1
        print 'after yield', i
    
    print 'ended'
    

In [53]:
# 함수 수행되지 않음
gen2 = generate2(3)
print gen2

<generator object generate2 at 0x03394C60>


In [54]:
# 처음 next 가 불린 시점에 수행 됨
gen2.next()

started
before yield 0


0

In [55]:
gen2.next()
gen2.next()
gen2.next() 
gen2.next() # StopIteration

after yield 1
before yield 1
after yield 2
before yield 2
after yield 3
ended


StopIteration: 

* generator expressions
 - 한번에 값을 생성하지 않아 메모리에 효율적
 - iterable을 처리하는 함수에 모두 사용 가능 e.g) sum

In [57]:
gen = (x * 2 for x in range(5))
print gen
print sum(gen)

<generator object <genexpr> at 0x0328C3A0>
20


* xrange
 - range와 비슷하나, 전체 값을 생성하여 반환하지 않고 그때그때 생성하여 순회 가능하도록 함
 - python3에서는 range가 xrange와 동일하게 구현됨
 - https://docs.python.org/2/library/functions.html#xrange

In [68]:
%timeit range(int(1e7))

1 loop, best of 3: 386 ms per loop


In [69]:
%timeit xrange(int(1e7))

The slowest run took 8.03 times longer than the fastest. This could mean that an intermediate result is being cached.
1000000 loops, best of 3: 639 ns per loop


In [70]:
# 순회에 사용 가능
for i in xrange(100):
    print i,

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
