# 제너레이터 (Generator)
----
제너레이터 ?

제너레이터는 반복자(Iterator)와 같은 루프의 작용을 컨트롤하기 위해 쓰여지는 특별한 함수 또는 루틴. 모든 제너레이터는 반복자이며, 제너레이터는 배열이나 리스트를 리턴하는 함수와 비슷하며, 호출을 할 수 있는 파라미터를 가지고 있다. 그리고 연속적인 값들을 만들어낸다.

한번에 모든 값을 포함한 배열을 만들어서 리턴하는 대신 yield 구문을 이용해 한 번 호출될 때마다 하나의 값만을 리턴하고, 이런 이유로 일반 반복자에 비해 __아주 작은 메모리__를 필요로 한다.

제너레이터를 사용하면, 일반 함수보다 훨씬 더 좋은 퍼포먼스와 함께 메모리 리소스를 절약이 가능하다.

In [1]:
def square_numbers(nums):
    result = []
    
    for i in nums:
        result.append(i * i)
    return result

my_nums = square_numbers([1, 2, 3, 4, 5])

print(my_nums)

[1, 4, 9, 16, 25]


위의 코드를 제너레이터로 형성해본다.

In [2]:
def square_numbers(nums):   
    for i in nums:
        yield i * i

my_nums = square_numbers([1, 2, 3, 4, 5])

print(my_nums)

<generator object square_numbers at 0x000002187066B5C8>


제너레이터 오브젝트가 리턴되었다. 

제너레이터는 자신이 리턴할 모든 값을 메모리에 저장하지 않기 때문에, 일반함수와 같이 결과값을 보이지 않는다. 제너레이터는 한 번 호출될 때마다 하나의 값만을 전달(yield)한다. 즉, 아직 아무런 계산을 하지 않고 다음 값에 대해서 물어보기를 기다리고 있는 상태이다.

In [3]:
def square_numbers(nums):
    for i in nums:
        yield i * i

my_nums = square_numbers([1, 2, 3, 4, 5])

print(next(my_nums))
print(next(my_nums))
print(next(my_nums))
print(next(my_nums))
print(next(my_nums))

1
4
9
16
25


next() 함수를 통해서 다음 값이 무엇인지 물어보고 해당 리스트 요소 개수만큼 print() 구문을 이용하였다. 
> 제너레이터가 일반 함수보다 좋은 점은 복잡함을 단순화 시킨다는 것에 있다. 

In [4]:
my_nums = [x*x for x in [1, 2, 3, 4, 5]]

print(my_nums)

for num in my_nums:
    print(num)

[1, 4, 9, 16, 25]
1
4
9
16
25


In [5]:
my_nums = (x*x for x in [1, 2, 3, 4, 5])

print(my_nums)

for num in my_nums:
    print(num)

<generator object <genexpr> at 0x000002187066B6D0>
1
4
9
16
25


두 코드의 차이를 살펴보면, 하나는 '[]' 를 이용했고, 밑에는 '()' 을 이용했다. 여기서 for 구문을 이용하지 않고  제너레이터의 데이터를 보고 싶은 경우에는 제너레이터를 리스트로 변환한다.

In [6]:
my_nums = (x*x for x in [1, 2, 3, 4, 5])

print(my_nums)
print(list(my_nums))

<generator object <genexpr> at 0x000002187063FEB8>
[1, 4, 9, 16, 25]


여기서 한가지 주의할 사항은 한번 리스트로 변경을 하게되면, 기존의 제너레이터가 가지고 있는 장점이 사라진다는 것이다. 제너레이터의 주요 장점은 앞서 말했다시피 퍼포먼스의 향상과 메모리 절약에 있다. 제너레이터는 모든 결과값을 메모리에 저장하지 않기 때문이다.

In [7]:
from __future__ import division
import os
import psutil
import random
import time

names = ['이소룡', '홍길동', '고길동', '나루토', '백윤식', '고창석']
majors = ['컴퓨터 공학', '국문학', '영문학', '수학', '정치']

process = psutil.Process(os.getpid())
mem_before = process.memory_info().rss / 1024 / 1024

def people_list(num_people):
    result = []
    
    for i in range(num_people):
        person = {
            'id' : i,
            'name' : random.choice(names),
            'major' : random.choice(majors)
        }
        
        result.append(person)
    return result

def people_generator(num_people):
    for i in range(num_people):
        person = {
            'id' : i,
            'name' : random.choice(names),
            'major' : random.choice(majors)
        }
        yield person
        
t1 = time.clock()
people = people_list(1000000) # 백만번 호출
t2 = time.clock()
mem_after = process.memory_info().rss / 1024 / 1024
total_time = t2 - t1

print('시작 전 메모리 사용량: {} MB'.format(mem_before))
print('종료 후 메모리 사용량: {} MB'.format(mem_after))
print('총 소요된 시간: {:.6f} 초'.format(total_time))

시작 전 메모리 사용량: 49.859375 MB
종료 후 메모리 사용량: 380.74609375 MB
총 소요된 시간: 2.369555 초


메모리 사용량이 51 MB >> 383 MB 로 늘어났다. 시간은 2.4초 정도 걸렸는데, <BR>
people_list()가 아닌 people_generator()로 변경해서 테스트해보자.

In [1]:
from __future__ import division
import os
import psutil
import random
import time

names = ['이소룡', '홍길동', '고길동', '나루토', '백윤식', '고창석']
majors = ['컴퓨터 공학', '국문학', '영문학', '수학', '정치']

process = psutil.Process(os.getpid())
mem_before = process.memory_info().rss / 1024 / 1024

def people_list(num_people):
    result = []
    
    for i in range(num_people):
        person = {
            'id' : i,
            'name' : random.choice(names),
            'major' : random.choice(majors)
        }
        
        result.append(person)
    return result

def people_generator(num_people):
    for i in range(num_people):
        person = {
            'id' : i,
            'name' : random.choice(names),
            'major' : random.choice(majors)
        }
        yield person
        
t1 = time.clock()
people = people_generator(1000000) # 백만번 호출
t2 = time.clock()
mem_after = process.memory_info().rss / 1024 / 1024
total_time = t2 - t1

print('시작 전 메모리 사용량: {} MB'.format(mem_before))
print('종료 후 메모리 사용량: {} MB'.format(mem_after))
print('총 소요된 시간: {:.6f} 초'.format(total_time))

시작 전 메모리 사용량: 50.11328125 MB
종료 후 메모리 사용량: 50.12109375 MB
총 소요된 시간: 0.000040 초


### 제너레이터
제너레이터를 사용하니 메모리 사용량이 전후과 동일하며, <BR>
프로그램 실행 시간이 1초 미만으로 아주 적게 나온다. 

이로 인해 제너레이터를 사용하면, 메모리 절감이나 시간 소요의 감소로 퍼포먼스가 향상됨을 알 수 있었다.