# 🟩 python function 'Generator'

- Generator (개념만 알아두기)
  - 우리가 막 만들어 써야 하는 것은 아니고, 용어 자체가 중요함
  - 값을 하나씩 생성해서 순회할 수 있는 함수나 객체, range나 filter가 해당된다.

- 이쯤에서 알아두는 iterator 종류들

| 구분               | iterator 여부                                 | 예시                                      |
|--------------------|-----------------------------------------------|-------------------------------------------|
| list, tuple, dict, set | ❌ iterable (반복은 되지만 next 안됨)         | `iter()` 필요                             |
| generator          | ✅                                            | `yield`, generator 표현식                  |
| map, filter, zip   | ✅                                            | `map(str, [1,2])`, `zip(a, b)`             |
| enumerate, reversed| ✅                                            | `enumerate(['a'])`                         |
| file object        | ✅                                            | `open('file.txt')`                         |
| 사용자 정의 클래스    | ✅                                            | `__iter__`, `__next__` 구현                 |


- 왜 generator가 필요할까?
  - 메모리에 한꺼번에 큰 리스트를 올리면 부담이 큼
  - 처리해야 할 데이터가 매우 크거나 무한할 수 있음
  - 제너레이터는 필요할 때만 값을 생성해서 메모리를 거의 사용하지 않음

- 제너레이터 함수의 경우 값을 반환하려면 yield(얄드)를 사용합니다.
  - return 은 값을 반환하면서 함수를 바로 종료시켜버림.
  - 🔥 yield 는 값을 반환하는데 함수를 종료하지 않고 대기상태에 들어감.
  


In [None]:
# 🟢 일반 함수

def get_numbers():
    return [1, 2, 3]

print(get_numbers())  # [1, 2, 3]


In [None]:
# 🟢 제너레이터 함수

def get_numbers():
    yield 1
    yield 2
    yield 3

g = get_numbers()
print(next(g))  # 1  이렇게 하나하고 멈추고,
print(next(g))  # 2  이렇게 하나하고 멈추고,
print(next(g))  # 3  


In [None]:
# 

# 1. range() 내장 함수가 이렇게 만들어 진 것입니다.
  # 직접 range() 를 만들어보면서 generator yield를 이해해보겠습니다.

def myrange(start=1, end=5):
  i = start
  while i <= end:
    yield i     # 이 구문을 만나는 순간 값을 하나 반환하고 멈춘다. (대기 상태) 
                # 즉, while문에 끝날 때 끝나게 되는 존재
    i = i + 1


gen = myrange()   # 함수를 호출해서 저장해놓고, 
                  # gen은 myrange() 함수 호출에 의해 생성된 제너레이터 객체의 메모리 주소를 참조합니다. 
                  # 이 객체는 값을 직접 저장하지 않고, yield를 통해 값을 하나씩 생성할 수 있는 itorator입니다.

# 실행은 next나 for문으로 실행해야 합니다.
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
# = 이것이 바로 generator라고 합니다.


In [None]:
# 직접 만든 myrange 함수를 사용해보겠습니다.

for i in myrange(1, 10):
  print(i)

- 사용성
  1. 데이터가 너무 커서 한방에 생성할 수 없을 때
  1. 무한한 작업이 필요할 때
  1. 파일을 계속 읽어서 처리하고자 할 때


---
## 🟢 유용한 예제
파일 한 줄씩 읽기

In [None]:
def read_lines(filename):
    with open(filename, 'r') as f:
        for line in f:
            yield line.strip()

for line in read_lines('bigfile.txt'):
    print(line)
