## Better Way 30
### 리스트를 반환하기 보다는 제너레이터를 사용하라

### 시퀀스를 결과로 만들어 내는 함수를 만드는 가장 간단한 선택: 리스트반환

In [1]:
def index_words(text):
    result = []
    if text:
        result.append(0)
    for index, letter in enumerate(text):
        if letter == ' ':
            result.append(index + 1)
    return result

In [3]:
address = '컴퓨터(영어: Computer, 문화어: 콤퓨터, 순화어: 전산기)는 진공관'
result = index_words(address)
print(result[:10])

[0, 8, 18, 23, 28, 33, 39]


### inex_words 함수의 문제점 2가지
### 문제 1. 코드에 잡음이 많고 핵심을 알아보기 어렵다.

#### 위와 같은 결과를 만들어 내는 제너레이터 코드

In [4]:
def index_words_iter(text):
    if text:
        yield 0                         # 첫번째 값 출력
    for index, letter in enumerate(text):
        if letter == ' ':
            yield index + 1

In [5]:
it = index_words_iter(address)
print(next(it))
print(next(it))

0
8


#### 반환하는 리스트와 상호작용하는 코드가 사라져 index_words_iter함수가 훨씬 읽기 쉬워짐
* 대신 결과는 yield 식에 의해 전달됨.
* 제너레이터가 반환하는 이터레이터를 쉽게 리스트로 형변환 가능

#### 제너레이터가 반환한 이터레이터의 리스트 형변환

In [6]:
result = list(index_words_iter(address)) # 리스트 형변환
print(result[:10])

[0, 8, 18, 23, 28, 33, 39]


### 문제 2. 반환하기 전에 리스트에 모든 결과를 다 저장해야 한다.
= 입력이 매우 크면 프로그램이 메모리를 소진해서 중단될 수 있다. 

#### 같은 함수를 제너레이터 버전으로 만들면 사용하는 메모리크기를 일정수준으로 제한가능
= 입력이 매우 커져도 쉽게 처리가능

In [7]:
def index_file(handle):
    offset = 0
    for line in handle:
        if line:
            yield offset
        for letter in line:
            offset += 1
            if letter == '':
                yield offset

#### 이 함수의 작업 메모리는 입력 중 가장 긴 줄의 길이로 제한됨

In [8]:
# 파일에 유니코드 문자가 들어간 경우
# 파일을 읽을 때 utf-8로 디코딩하도록 open에 인코딩을 지정해야 한다.
with open('address.txt', 'r', encoding='utf-8') as f:
    it = index_file(f)
    results = itertools.islice(it, 0 ,10)
    print(list(results))

FileNotFoundError: [Errno 2] No such file or directory: 'address.txt'

#### 제너레이터 정의할 때 유의점
제너레이터가 반환하는 이터레이터에 상태가 있기 때문에 호출하는 쪽에서 재사용이 불가능하다.
### 요약
* 제너레이터를 사용하면 결과를 리스트에 합쳐서 반환하는 것보다 더 깔끔하다.
* 제너레이터가 반환하는 이터레이터는 제너레이터 함수의 본문에서 yield가 반환하는 값들로 이뤄진 집합을 만들어낸다.
* 제너레이터를 사용하면 작업 메모리에 모든 입력과 출력을 저장할 필요가 없으므로 입력이 아주 커도 출력 시퀀스를 만들 수 있다.