## Python 제너레이터


### 제너레이터(Generator)란?

제너레이터는 모든 결과값을 한꺼번에 메모리에 올리지 않고, **필요할 때마다 값을 하나씩 생성**하여 반환하는 특별한 도구입니다.

* **일반 함수 (`return`):** 계산이 끝나면 모든 결과를 한 번에 반환하고 종료됩니다. (양동이에 물을 가득 채워 배달)
* **제너레이터 (`yield`):** 값을 하나씩 바깥으로 보내고 그 자리에 일시 정지합니다. (수도꼭지에서 물을 조금씩 계속 틀어줌)

In [3]:
def simple_generator():
    print("첫 번째 값을 생성합니다.")
    yield "A"
    
    print("두 번째 값을 생성합니다.")
    yield "B"
    
    print("세 번째 값을 생성합니다.")
    yield "C"

gen = simple_generator()

# next()를 호출할 때마다 다음 yield까지 실행됩니다.
print(f"받은 값: {next(gen)}")
print(f"받은 값: {next(gen)}")
print(f"받은 값: {next(gen)}")


첫 번째 값을 생성합니다.
받은 값: A
두 번째 값을 생성합니다.
받은 값: B
세 번째 값을 생성합니다.
받은 값: C


In [4]:
gen = simple_generator()

# for loop은 내부적으로 next()를 호출한다.
for text in gen:
    print(text)

첫 번째 값을 생성합니다.
A
두 번째 값을 생성합니다.
B
세 번째 값을 생성합니다.
C


### Stream API에서 제너레이터를 활용하는 이유
- 메모리 효율성  
  AI가 2,000단어의 긴 답변을 생성할 때, 이를 다 만들 때까지 기다렸다가 한 번에 받으면 메모리 점유율이 높아진다.  
  제너레이터 방식을 쓰면 생성되는 즉시 소비하고 버릴 수 있어 서버 자원을 아낄 수 있다.

- 실시간성  
  사용자는 AI가 답변을 다 작성할 때까지 빈 화면을 보는 것이 아니라, 첫 글자가 생성되는 즉시 화면에서 확인할 수 있다.

In [1]:
import sys

# 10,000개의 정수를 가진 리스트의 메모리 크기 확인
large_list = [i for i in range(10000)]
print(sys.getsizeof(large_list))  # 리스트 객체가 점유하는 메모리 출력

# 10,000개의 정수를 생성할 제너레이터의 메모리 크기 확인
large_gen = (i for i in range(10000))
print(sys.getsizeof(large_gen))  # 생성기 객체 자체의 고정된 메모리 크기 출력

85176
200
