# Generators 

[Generators - How to use them and the benefits you receive by Corey Schafer](https://www.youtube.com/watch?v=bD05uGo_sVI&list=PL-osiE80TeTt2d9bfVyTiXJA-UTHn6WwU&index=28)

<a href="#제너레이터">제너레이터</a>

<a href="#제너레이터는-한번에-하나씩-제너레이트한다">제너레이터는 한번에 하나씩 제너레이트한다</a>

<a href="#리스트-컴프리헨션과-제너레이터-컴프리헨션">리스트 컴프리헨션과 제너레이터 컴프리헨션</a>

<a href="#리스트나-제너레이터는-이터러블하다">리스트나 제너레이터는 이터러블하다</a>

<a href="#제너레이터를-리스트로-변환하기">제너레이터를 리스트로 변환하기</a>

<a href="#제너레이터는-메모리를-적게-사용한다">제너레이터는 메모리를 적게 사용한다</a>

<a href="#넘파이는-메모리와-컴퓨팅시간에-옵티마이즈가-잘되어-있군요">넘파이는 메모리와 컴퓨팅시간에 옵티마이즈가 잘되어 있군요</a>

<a href="#range-is-an-iterator">range is an iterator</a>

In [1]:
import numpy as np

# 제너레이터

다음 코드는 리스트 [1, 2, 3, 4, 5]을 받아 각각의 컴포넌트를 제곱하여 새로운 리스트를 만는다.

In [2]:
def square_numbers(nums):
    result = []
    for i in nums:
        result.append(i*i)
    return result

In [3]:
my_nums = square_numbers([1,2,3,4,5])
my_nums

[1, 4, 9, 16, 25]

이 코드를 제너레이터를 만드는 코드로 수정해 보자.

In [4]:
def square_numbers_generator(nums):
    for i in nums:
        yield i*i

In [5]:
my_nums = square_numbers_generator([1,2,3,4,5])
my_nums

<generator object square_numbers_generator at 0x106751ba0>

[<a href="#Generators">Back to top</a>]

# 제너레이터는 한번에 하나씩 제너레이트한다

리스트를 이용한 계산에서는 요구하는 계산을 다 해서 메모리에 저장한다.
이에 반해
제너레이터는 
코드가 요구할 때마다 요구하는 계산을 해서 쏘아준다.
요구하는 계산을 다 해서 한꺼번에 몽땅 메모리에 저장하지 않는다.

In [6]:
my_nums = square_numbers_generator([1,2,3,4,5])

next함수를 이용하면 다음 항목을 제너레이트하도록 요구할 수 있다.

In [7]:
print(next(my_nums))

1


In [8]:
print(next(my_nums))
print(next(my_nums))

4
9


요구한 항목들을 차례대로 다 제너레이트한 후에,
next함수가 또 새로운 항목을 요구하면 StopIteration 에러를 발생시킨다. 

In [9]:
try:
    print(next(my_nums))
    print(next(my_nums))
    print(next(my_nums))
except Exception as e:
    print(e)

16
25



[<a href="#Generators">Back to top</a>]

# 리스트 컴프리헨션과 제너레이터 컴프리헨션

리스트 컴프리헨션을 보자.
다음 코드는 리스트 [1, 2, 3, 4, 5]을 받아 각각의 컴포넌트를 제곱하여 새로운 리스트를 만는다.

In [10]:
my_nums = [x*x for x in [1,2,3,4,5]]
my_nums

[1, 4, 9, 16, 25]

이 코드를 제너레이터를 만드는 코드로 수정해 보자.

In [11]:
my_nums = (i*i for i in [1,2,3,4,5])
my_nums

<generator object <genexpr> at 0x106751678>

[<a href="#Generators">Back to top</a>]

# 리스트나 제너레이터는 이터러블하다

이렀게 만든 리스트나 제너레이터는 이터러블하다.
사실 아래 코드와 같이 제너레이터는 for loop를 돌릴 때 많이 쓴다.

In [12]:
my_nums = square_numbers([1,2,3,4,5])
for num in my_nums:
    print(num)

1
4
9
16
25


In [13]:
my_nums = square_numbers_generator([1,2,3,4,5])
for num in my_nums:
    print(num)

1
4
9
16
25


In [14]:
my_nums = [x*x for x in [1,2,3,4,5]]
for num in my_nums:
    print(num)

1
4
9
16
25


In [15]:
my_nums = (x*x for x in [1,2,3,4,5])
for num in my_nums:
    print(num)

1
4
9
16
25


[<a href="#Generators">Back to top</a>]

# 제너레이터를 리스트로 변환하기

제너레이터를 리스트로 다음과 같이 변환할 수 있다.
하지만 이렀게 하면
제너레이터가 가져오는 코드의 성능향상을 포기하는 것이다.

In [16]:
my_nums = list(square_numbers_generator([1,2,3,4,5]))
my_nums

[1, 4, 9, 16, 25]

In [17]:
my_nums = list((x*x for x in [1,2,3,4,5]))
my_nums

[1, 4, 9, 16, 25]

[<a href="#Generators">Back to top</a>]

# 제너레이터는 메모리와 컴퓨팅시간을 절약한다

데이타가 작으면 두 방법의 차이를 느끼지 못하지만,
데이타가 큰 경우 제너레이터를 사용하면 메모리와 컴퓨팅시간을 절약할 수 있다.

먼저 메모리를 측정하는 모듈을 인스톨하자.

```
$ pip install memory_profiler
$ pip install memory_profiler --upgrade
```

메모리를 측정하는 모듈을 로드하자.

In [18]:
%load_ext memory_profiler

많은 양의 데이타를 생성하는 함수를 만드는데,
하나는 리스트로 다른 하나는 제너레이터로 만들었다.

In [19]:
names = ['John', 'Corey', 'Adam', 'Steve', 'Rick', 'Thomas']
majors = ['Math', 'Engineering', 'CompSci', 'Arts', 'Business']

In [20]:
def people_list(num_people):
    result = []
    for i in range(num_people):
        person = {
                    'id'   : i,
                    'name' : np.random.choice(names),
                    'major': np.random.choice(majors)
                }
        result.append(person)
    return result

In [21]:
def people_generator(num_people):
    for i in range(num_people):
        person = {
                    'id'   : i,
                    'name' : np.random.choice(names),
                    'major': np.random.choice(majors)
                }
        yield person

In [22]:
people_list(5)

[{'id': 0, 'major': 'CompSci', 'name': 'Adam'},
 {'id': 1, 'major': 'Business', 'name': 'Corey'},
 {'id': 2, 'major': 'Business', 'name': 'Adam'},
 {'id': 3, 'major': 'CompSci', 'name': 'Rick'},
 {'id': 4, 'major': 'Engineering', 'name': 'Adam'}]

In [23]:
people_generator(5)

<generator object people_generator at 0x1067d9d58>

In [24]:
%timeit people_list(1000000)

1 loop, best of 3: 12 s per loop


In [25]:
%timeit people_generator(1000000)

The slowest run took 9.16 times longer than the fastest. This could mean that an intermediate result is being cached.
1000000 loops, best of 3: 290 ns per loop


In [26]:
%memit people_list(1000000)

peak memory: 530.08 MiB, increment: 451.42 MiB


In [27]:
%memit people_generator(1000000)

peak memory: 83.19 MiB, increment: 0.00 MiB


[<a href="#Generators">Back to top</a>]

# range is an iterator

In [28]:
def my_range(start, stop, step=1):
    while start < stop:
        yield start
        start += step

In [29]:
range(10)

range(0, 10)

In [30]:
my_range(0, 10)

<generator object my_range at 0x1067d9888>

In [31]:
my_range(start=0, stop=10)

<generator object my_range at 0x1068035c8>

In [32]:
for i in range(10):
    print(i)

0
1
2
3
4
5
6
7
8
9


In [33]:
for i in my_range(0, 10):
    print(i)

0
1
2
3
4
5
6
7
8
9


In [34]:
for i in range(1, 11):
    print(i)

1
2
3
4
5
6
7
8
9
10


In [35]:
for i in my_range(1, 11):
    print(i)

1
2
3
4
5
6
7
8
9
10


[<a href="#Generators">Back to top</a>]