### BETTER WAY 30 <br/> 리스트를 반환하기 보다는 제너레이터를 사용하자.

In [1]:
def index_words(text):
    result = []
    if text:
        result.append(0)
    for index, letter in enumerate(text):
        if letter == ' ':
            result.append(index + 1) # 문장의 각 단어가 시작되는 인덱스를 지정
    return result

In [2]:
address = '컴퓨터(영어: Computer, 문화어: 콤퓨터, 순화어:전산기)는 진공관'

In [9]:
result = index_words(address)
print(result[:10])

[0, 8, 18, 23, 28, 38]


 핵심은 문자열의 인덱스를 뽑아주는건데 문제점이 있다.
- 코드에 잡음이 많고 핵심을 알아보기 어렵다. <br/> → 함수의 핵심기능과 별 관련 없는 것에 많은 바이트를 소모 (result list 선언, 원소 추가, 반환)
- 해결책은 제너레이터를 사용한다.

> **Generator?** <br/>
iterator를 생성해주는 함수, 함수안에 yield 키워드를 사용한다.
<br/> 제너레이터는 각각의 yield에서 한번 실행 시킨 후 대기 상태에 들어가 결과를 반환 
<br/> 이후 다음 코드를 진행하여 또다시 yield를 만날 경우 대기 상태에 들어가 결과를 반환하는 방식
- iterable한 순서가 지정된다.(모든 generator는 iterator)
- 함수의 내부 로컬 변수를 통해 내부상태가 유지된다.
- 무한한 순서가 있는 객체를 모델링할 수 있다.

> **Iterator?** <br/>


In [4]:
address = '컴퓨터(영어: Computer, 문화어: 콤퓨터, 순화어:전산기)는 진공관'

def index_words_iter(text):
    if text:
        yield 0
    for index, letter in enumerate(text):
        if letter == ' ':
            yield index + 1
            
result = list(index_words_iter(address))
print(result[:10])            

[0, 8, 18, 23, 28, 38]


In [7]:
def index_file(handle):
    offset = 0
    for line in handle:
        if line:
            yield offset
        for letter in line:
            offset += 1
            if letter == ' ':
                yield offset

In [8]:
import itertools
with open('address.txt', 'r', encoding='utf-8') as f:
    it = index_file(f)
    results = itertools.islice(it, 0, 10)
    print(list(results))

FileNotFoundError: [Errno 2] No such file or directory: 'address.txt'

### 기억하자
- 제너레이터를 사용하면 결과를 리스트에 합쳐서 반환하는 것보다 더 깔끔하다.
- 제너레이터가 반환하는 이터레이터는 제너레이터 함수의 본문에서 yield가 반환하는 값들로 이뤄진 집합을 만들어 낸다.
- 제너레이터를 사용하면 작업 메모리에 모든 입력과 출력을 저장할 필요가 없으므로 입력이 아주 커도 출력 시퀀스를 만들 수 있다.