# 16. 리스트를 반환하는 대신 제너레이터를 고려하자.

* 문자열에 있는 단어의 인덱스를 출력하는 코드

In [4]:
address = 'four score and seven years ago'

+ append 메서드를 활용하여 결과를 리스트에 누적해서 반환하는 방법

In [3]:
def index_words(text):
    result = []
    if text:
        result.append(0)
    for index, letter in enumerate(text):
        if letter == ' ':
            result.append(index+1)
    return result

In [5]:
result = index_words(address)

In [6]:
print(result)

[0, 5, 11, 15, 21, 27]


#### 리스트 사용의 문제
1. 코드가 복잡하고 깔끔하지 않다.
2. 반환하기 전에 모든 결과를 리스트에 저장해야 한다.(메모리부하)

##### 첫번째 문제 해결 : 제너레이터 사용
* 제너레이터는 yield 표현식을 사용하는 함수
* 제너레이터는 호출되면 실제로 실행하지 않고 바로 이터레이터(iterator)를 반환한다.
* 내장함수 next를 호출할 때마다 이터레이터는 제너레이터가 다음 yield표현식으로 진행하게 한다.
* 제너레이터에서 yield에 전달한 값을 이터레이터가 호출하는 쪽에 반환한다.

In [9]:
def index_words_iter(text):
    if text:
        yield 0
    for index, letter in enumerate(text):
        if letter == ' ':
            yield index+1

* 결과가 리스트가 아닌 yield표현식으로 전달.
* 제너레이터 호출로 반환되는 이터레이터를 내장함수 list에 전달하면 손쉽게 리스트로 변환가능

In [11]:
result = list(index_words_iter(address))

In [12]:
print(result)

[0, 5, 11, 15, 21, 27]


##### 두번째 문제 해결 : 제너레이터 사용
* 리스트를 사용할 경우 입력량이 많아질 경우 메모리 고갈 문제가 발생할 수 있다.
* 반면 제너레이터를 사용하면 다양한 길이에도 쉽게 이용할 수 있다.

In [None]:
#### 파일에서 입력을 한줄씩 읽어서 한번에 한 단어씩 출력을 내 주는 제너레이터

In [15]:
def index_file(handle):
    off_set = 0
    for line in handle:
        if line:
            yield off_set
        for letter in line:
            off_set += 1
            if letter == ' ':
                yield offset        

## 핵심정리
* 제너레이터를 사용하는 방법이 누적된 결과의 리스트를 반환하는 방법보다 이해하기 명확하다.
* 제너레이터에서 반환한 이터레이터는 제너레이터 함수의 본문에 있는 yield 표현식에 전달된 값들의 집합이다.
* 제너레이터는 모든 입력과 출력을 메모리에 저장하지 않으므로 입력값의 양을 알기 어려울 때도 연속된 출력을 만들 수 있다.