# Generator

-  http://stackoverflow.com/questions/231767/what-does-the-yield-keyword-do-in-python
- https://wikidocs.net/22802 
- python document 참조 : https://docs.python.org/ko/3/

*generator* 는 *iterables* 를 이해애햐 한다.

## Iterables

*list*를 작성할 때, 리스트 항목을 하나씩 읽을 수 있다. 이렇게 하나씩 읽는 것을 **반복iteration** 이라고 한다.

```python
>>> mylist = [1,2,3,4]
>>> for i in mylist:
>>>     print(i)
```

여기서 mylist는 *iterable* 이다. *list* 연습을 사용할 때, 리스트를 생성하면 반복적iterable이 된다.

```python
>>> mylist = [x*x for x in range(3)]
>>> for i in mylist:
>>>     print(i)
```

"**for...in...**" 에서 iterable로 사용할 수 있다: lists, strings, files...

이렇게 iterable은 원하는 만큼 손쉽게 사용할 수 있지만, 모든 변수를 메모리에 저장해야 하고 대량의 변수를 사용할 때 항상 원하는 결과를 얻지 못할 수 있다.


### Iterable 개체

iterable 객체 - 반복 가능한 객체로, 

대표적으로 iterable한 타입 - list, dict, set, str, bytes, tuple, range

Comprehension `[v for...in...]` 으로 반복적인 iterable 리스트 개체를 만들 수 있다.


ex:

```python
mylist = [x*x for x in range(10)]
print(mylist)
```

#### Iterator

iterator 객체 - 값을 차례대로 꺼낼 수 있는 객체입니다.
iterator는 iterable한 객체를 내장함수 또는 iterable객체의 메소드로 객체를 생성할 수 있습니다.
파이썬 내장함수 iter()를 사용해 iterator 객체를 만들어봅니다. 


ex:

```python
a = [1, 2, 3]
a_iter = iter(a)
type(a_iter)
```

### 리스트 대신 제너레이터를 고려하자

다음 리스트를 제너레이터로 구현

In [1]:
""" 16 리스트를 반환하는 대신 제너레이터를 고려하자
https://github.com/gilbutITbook/006764/blob/master/item_16.py
"""
import sys

def index_words(text):
    result = []
    if text:
        result.append(0)
    for index, letter in enumerate(text):
        if letter == ' ':
            result.append(index + 1)
    print(sys.getsizeof(result))
    return result

#address = 'Four score and seven years ago...'
address = 'Four score and seven years ago our fathers brought forth on this continent a new nation, conceived in liberty, and dedicated to the proposition that all men are created equal.'
result = index_words(address)
print(result)
print(sys.getsizeof(result))

344
[0, 5, 11, 15, 21, 27, 31, 35, 43, 51, 57, 60, 65, 75, 77, 81, 89, 99, 102, 111, 115, 125, 128, 132, 144, 149, 153, 157, 161, 169]
344


Ex Generator:

```python
def index_words(text):
    return ((index+1) for index, letter in enumerate(text) if letter == ' ')

result = list(index_words(address))
print(result)
print(sys.getsizeof(result))
```

그리고 yield 이용

```python
# yield generator 이용
def index_words(text):
    if text:
        yield 0
    for index, letter in enumerate(text):
        if letter == ' ':
            yield index + 1

result = list(index_words(address))
print(result)
print(sys.getsizeof(result))
```

In [2]:
def index_words(text):
    return ((index+1) for index, letter in enumerate(text) if letter == ' ')

result = list(index_words(address))
print(result)
print(sys.getsizeof(result))

# for문에서는 344회나 했는데 
# generator를 이용하니 296회만.

[5, 11, 15, 21, 27, 31, 35, 43, 51, 57, 60, 65, 75, 77, 81, 89, 99, 102, 111, 115, 125, 128, 132, 144, 149, 153, 157, 161, 169]
296


In [3]:
result = index_words(address)
type(result)

generator

In [4]:
# yield generator 이용
def index_words(text):
    if text:
        yield 0
    for index, letter in enumerate(text):
        if letter == ' ':
            yield index + 1

result = list(index_words(address))
print(result)
print(sys.getsizeof(result))

# list같은 곳에 담는 코드가 없는데도
# 담겨진 결과가 나옴
# yield가 반복되는 동안 어디에 담지는 않는 데 generator로 반환해줌
# append하는 시간 줄어들음

# 데이터 10만개 발생해서 해보고 시간 재보고 하면 차이 큼.

# return이 필요하면 yield 사용

[0, 5, 11, 15, 21, 27, 31, 35, 43, 51, 57, 60, 65, 75, 77, 81, 89, 99, 102, 111, 115, 125, 128, 132, 144, 149, 153, 157, 161, 169]
376


## Generator 이해

*Generators*는 반복형 이다, 그렇지만 *반복 목록을 단 한번만 순환한다*. 제너레이터는 변수를 메모리에 저장하지 않기 때문이고, 실행중에만 변수를 발생한다.

```python
>>> mygenerator = (x*x for x in range(3))
>>> for i in mygenerator:
>>>     print(i)
```

컴프리헨션과 다르게 **[]** 대신 **()** 를 사용했다, 그리고 **for i in mygenerator**를 두번다시 활용 할 수 없다; 0번째 계산하고 잊어 버리고,...



이런 반복적 개체는 list, string, file 등등 에서 사용이 가능하다. 반복적 개체들은 변수를 메모리에 저장하게 된다.


**generator** 객체는 반복형 개체로 반복 목록을 단 한번만 순환하고, 변수를 메모리에 저장하지 않고 실행중에만 변수를 발생시킨다. 제너레이터는 두 가지 방법으로 생성해서 사용할 수 있다.

1. `( x for... in..)` 구문으로 리스트를 생성 
    그러나 `for..in` 구문을 한번만 사용 할 수 있다.
2. 함수에서 `return`에서 `yield` 로 반환

Ex:

```python
mygenerator = (x*x for x in range(10))
print(mygenerator)
```

Ex:

```
for i in mygenerator:
    print(i)
````

## Yield

함수를 사용해서 제너레이터 객체를 반환할 수 있다. 제너레이터를 반환하려면 `return` 으로 조건/반복문에서 `yield` 변수를 반환한다. `()` 표현식으로 생성한 예를 yield로 만들면 다음 같다.

처음에 *for* 호출에서 함수에서 생성한 generator object를 호출하는데, 이것은 함수의 코드를 시작부터 *yield*를 만나는 끝까지 실행하고, 반복문에서 첫번째 변수를 반환한다.

그리고 나서 다음 반복을 실행하고, 이어서 변수가 없을때 까지 다음 값을 반환하게 된다.
generator가 함수 실행중 비었다고 느끼면, yield에 다다르지 못한다. 
반복이 끝나는 조검으로 변수를 다 사용하거나, 조건문에 다다르기 때문이다....


#### Yield keyword

**yield** 키워드는 **return** 키워드를 사용하는 것과 같다, 다만 함수가 *generator*를 반환한다는 점이다.

```python
>>> def creategenerator():
>>>     mylist = range(3)
>>>     for i in mylist:
>>>         yield i*i
...

>>> mygenerator = creategenerator()
>>> print(mygenerator)    # object
<generator object createGenerator at 0x....>
>>> for i in mygenerator:
>>>     print(i)
```






*yield* 를 정복하려면 **언제 함수를 호출하고, 함수 본문 코드가 실행하지 않는지**를 이해해야 한다. 이 함수는 generator object 를 반환하고 이것이 좀 까다롭다.

그리고 나서 코도는 *for*에서 매번 generator를 사용하게 된다.

이제 어려운 부분인데:

처음에 *for* 호출에서 함수에서 생성한 generator object를 호출하는데, 이것은 함수의 코드를 시작부터 *yield*를 만나는 끝까지 실행하고, 반복문에서 첫번째 변수를 반환한다. 그리고 나서 다음 반복을 실행하고, 이어서 변수가 없을때 까지 다음 값을 반환하게 된다.

generator가 함수 실행중 비었다고 느끼면, yield에 다다르지 못한다. 반복이 끝나는 조검으로 변수를 다 사용하거나, 조건문에 다다르기 때문이다....





### Usages


http://stackoverflow.com/questions/323750/how-to-access-previous-next-element-while-for-looping


```python
def neighborhood(iterable):
    iterator = iter(iterable)
    prev_item = None
    current_item = next(iterator)  # throws StopIteration if empty.
    for next_item in iterator:
        yield (prev_item, current_item, next_item)
        prev_item = current_item
        current_item = next_item
    yield (prev_item, current_item, None)
```


Usage:

```python
for prev,curr,nextitem in neighborhood(l):
    print(prev, item, nextitem)
```

In [5]:
def create_generator():
    mylist = range(10)
    for i in mylist:
        yield i*i

In [6]:
mygenerator = create_generator()
print(mygenerator)

<generator object create_generator at 0x000001D857744748>


In [7]:
for i in mygenerator:
    print(i)

0
1
4
9
16
25
36
49
64
81


제너레이터를 매개 변수 전달시 `*` 이용

In [8]:
# generator
def my_generator():
    for i in range(10):
        yield i

def my_func(*args):
    print(args)

it = my_generator()
#my_func(it)         #(<generator object my_generator at 0x7236f580>,)
my_func(*it)

(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)


In [9]:
# 다른 예

def neighborhood(iterable):
    iterator = iter(iterable)
    prev_item = None
    current_item = next(iterator)  # throws StopIteration if empty.
    for next_item in iterator:
        yield (prev_item, current_item, next_item)
        prev_item = current_item
        current_item = next_item
    yield (prev_item, current_item, None)

    
mylist = [x*x for x in range(100)]


for prev,curr,nextitem in neighborhood(mylist):
    print(prev, curr, nextitem)

None 0 1
0 1 4
1 4 9
4 9 16
9 16 25
16 25 36
25 36 49
36 49 64
49 64 81
64 81 100
81 100 121
100 121 144
121 144 169
144 169 196
169 196 225
196 225 256
225 256 289
256 289 324
289 324 361
324 361 400
361 400 441
400 441 484
441 484 529
484 529 576
529 576 625
576 625 676
625 676 729
676 729 784
729 784 841
784 841 900
841 900 961
900 961 1024
961 1024 1089
1024 1089 1156
1089 1156 1225
1156 1225 1296
1225 1296 1369
1296 1369 1444
1369 1444 1521
1444 1521 1600
1521 1600 1681
1600 1681 1764
1681 1764 1849
1764 1849 1936
1849 1936 2025
1936 2025 2116
2025 2116 2209
2116 2209 2304
2209 2304 2401
2304 2401 2500
2401 2500 2601
2500 2601 2704
2601 2704 2809
2704 2809 2916
2809 2916 3025
2916 3025 3136
3025 3136 3249
3136 3249 3364
3249 3364 3481
3364 3481 3600
3481 3600 3721
3600 3721 3844
3721 3844 3969
3844 3969 4096
3969 4096 4225
4096 4225 4356
4225 4356 4489
4356 4489 4624
4489 4624 4761
4624 4761 4900
4761 4900 5041
4900 5041 5184
5041 5184 5329
5184 5329 5476
5329 5476 5625
5476 5625 