제너레이터의 개념

제너레이터는 이터레이터를 생성하는 함수입니다.
일반 함수와는 달리 yield 키워드를 사용하여 값을 하나씩 반환합니다.
yield 를 사용하면 함수의 상태를 '기억'하고 다음 호출 시 중단된 위치에서 다시
시작할 수 있습니다.
제너레이터는 모든 값을 한 번에 메모리에 저장하지 않고, 필요할 때마다 값을 생성합니
다.


예를 들어, 책을 읽을 때 우리는 모든 페이지를 한 번에 읽지 않고 한 페이지씩 읽습니다.
제너레이터는 이와 비슷한 방식으로 작동합니다.

제너레이터 생성

제너레이터 함수는 yield 키워드를 사용하여 정의합니다.

In [None]:
def simple_generator():
yield 1
yield 2
yield 3

In [None]:
# 제너레이터 사용
gen = simple_generator()
next(gen) # 출력: 1

In [None]:
next(gen) # 출력: 2

In [None]:
next(gen) # 출력: 3

이 예제에서 simple_generator 함수는 1, 2, 3을 순서대로 생성합니다.
next() 함수를 호출할 때마다 다음 yield 문까지 실행되고 값을 반환합니다.


제너레이터와 for 루프

제너레이터는 for 루프와 함께 사용하기 편리합니다

In [None]:
def countdown(n):
  for i in range(n,0,-1):
    yield i

In [None]:
for num in countdown(5):
    print(num)

이 예제에서 countdown 제너레이터는 주어진 숫자부터 1까지 카운트다운합니다.

제너레이터의 장점

메모리 효율성: 모든 값을 한 번에 생성하지 않아 메모리를 절약합니다.
2. 지연 평가(Lazy Evaluation): 필요할 때만 값을 생성합니다.
3. 무한 시퀀스 표현 가능: 이론적으로 무한한 데이터 스트림을 표현할 수 있습니다.


In [None]:
def even_numbers():
  n = 0
  while True:
      yield n
      n += 2

In [None]:
evens = even_numbers()
for _ in range(5):
      print(next(evens))

이 제너레이터는 이론적으로 무한한 짝수를 생성할 수 있습니다.


제너레이터 표현식
리스트 컴프리헨션과 유사하게, 제너레이터 표현식을 사용할 수 있습니다.
예) 리스트 컴프리헨션

In [None]:
squares_list = [x ** 2 for x in range(5)]
squares_list

예) 제너레이터 표현식

In [None]:
squares_gen = (x ** 2 for x in range(5))
squares_gen # 출력: <generator object <genexpr> at 0x...>

In [None]:
for square in squares_gen:
print(square) # 0, 1, 4, 9, 16 순서대로 출력

제너레이터 표현식은 소괄호 () 를 사용하며, 리스트 컴프리헨션과 달리 즉시 모든 값
을 생성하지 않습니다.

메모리 효율성 비교

In [None]:
gen = ( x for x in range(100000) )
lst = list(range(100000))

In [None]:
import sys
sys.getsizeof(gen) , sys.getsizeof(lst)


실제 활용 예제: 대용량 파일 처리
제너레이터는 대용량 데이터를 처리할 때 특히 유용합니다

In [None]:
def read_large_file(file_path):
    with open(file_path, 'r') as file:
        for line in file:
          yield line.strip()
def count_words(file_path):
    total_words = 0
      for line in read_large_file(file_path):
        words = line.split()
        total_words += len(words)
      return total_words
# 사용 예
file_path = 'very_large_file.txt'
word_count = count_words(file_path)
print(f'총 단어 수: {word_count}')

이 예제에서 read_large_file 제너레이터는 대용량 파일을 한 번에 한 줄씩 읽습니
다.
이를 통해 파일 크기에 관계없이 효율적으로 단어 수를 계산할 수 있습니다.
데이터 분석과 인공지능에서의 활용
제너레이터는 데이터 분석 과정에서 대용량 데이터를 처리하거나 데이터 스트림을 다룰
때 매우 유용합니다.
예) 센서 데이터 시뮬레이션 및 분석
이 예제는 센서에서 지속적으로 데이터를 받아 분석하는 상황을 시뮬레이션합니다.
sensor_data 제너레이터는 무한히 데이터를 생성할 수 있지만,
analyze_sensor_data 함수에서 필요한 만큼만 데이터를 사용합니다.

In [None]:
import random
import time

In [None]:
def sensor_data():
    while True:
        yield {
          'temperature': random.uniform(20.0, 30.0),
            'humidity': random.uniform(40.0, 60.0),
          'pressure': random.uniform(990.0, 1010.0)
      }
      time.sleep(1) # 1초마다 데이터 생성
def analyze_sensor_data(data_stream, num_samples):
    temp_sum = humid_sum = press_sum = 0
    for _ in range(num_samples):
          data = next(data_stream)
          temp_sum += data['temperature']
          humid_sum += data['humidity']
          press_sum += data['pressure']
          print(f"현재 측정값: {data}")
    return {
        'avg_temperature': temp_sum / num_samples,
        'avg_humidity': humid_sum / num_samples,
        'avg_pressure': press_sum / num_samples
        }

In [None]:
# 사용 예
sensor_stream = sensor_data()
results = analyze_sensor_data(sensor_stream, 5)
for key, value in results.items():
    print(f'{key}: {value:.2f}'