#**Generator**

##**Iterable Object**

###Sequence형 자료(리스트, 튜플, 문자열)에서 데이터를 순서대로 추출하는 Object.
###Sequence형 자료를 iter과 next로 순서대로 접근 가능.

In [37]:
cities = ['seoul', 'busan', 'jeju']

iter_cities = iter(cities)
print(iter_cities)

print(next(iter_cities))

<list_iterator object at 0x7b865e017880>
seoul


In [38]:
print(next(iter_cities))
print(next(iter_cities))

busan
jeju


In [39]:
print(next(iter_cities))
# 더이상 다음 값이 없기 때문에 에러 발생

StopIteration: ignored

In [24]:
# 또다른 iterator 생성 방법
# iters_cities = iter(cities)

cities = ['seoul', 'busan', 'jeju']
iters_cities = cities.__iter__()

In [25]:
print(iters_cities.__next__())
print(iters_cities.__next__())
print(next(iters_cities))

seoul
busan
jeju


In [40]:
# 메모리 효율 특징
from sys import getsizeof

print('type: ', type(iter_cities))
print('type: ', type(cities))
print(getsizeof(iter_cities)) # iterator
print(getsizeof(cities)) # 리스트

type:  <class 'list_iterator'>
type:  <class 'list'>
48
88


In [41]:
from sys import getsizeof
ll = [n for n in range(100000)] # 데이터가 100,000개 일 때
it = iter(ll)
print(getsizeof(ll))
print(getsizeof(it))
print(getsizeof(list(it)))

800984
48
800056


In [42]:
# iterator 클래스 뜯어보기
class MyIterator:
    def __init__(self, data):
        self.data = data
        self.position = 0

    def __iter__(self): # __붙이는 것은 매직 매소드라는 것인데 개발할 것 아니니까 패스.
        return self

    def __next__(self):
        if self.position >= len(self.data):
            raise StopIteration
        result = self.data[self.position]
        self.position += 1
        return result


if __name__ == "__main__":
    i = MyIterator([1,2,3])
    for item in i:
        print(item)

1
2
3


##Generator란?

generator도 iterator의 한 종류로 iter과 next를 포함하고 있음.

yield가 포함된 함수.


yield가 포함되면 def는 함수가 아닌 generator로 인식.

In [47]:
def generator_func():
  print('1번 실행')
  yield 1
  print('2번 실행')
  yield 2
  print('3번 실행')
  yield 3

gen = generator_func()
print('객체 생성 -> 객체 주소 : ', gen) # generator 객체 생성 = 실행 준비
print('hasattr - iter :', hasattr(gen, '__iter__')) # True
print('hasattr - next :',hasattr(gen, '__next__')) # True
print(gen.__next__()) # 1
print('stop')
print(next(gen))
print('stop')
print(next(gen))
print('type : ', type(gen))

객체 생성 -> 객체 주소 :  <generator object generator_func at 0x7b864999b610>
hasattr - iter : True
hasattr - next : True
1번 실행
1
stop
2번 실행
2
stop
3번 실행
3
type :  <class 'generator'>


In [60]:
print(next(gen)) # -> 한번 더 호출하면 에러

StopIteration: ignored

generator 함수를 호출하면 generator 객체가 생성.

In [65]:
def ret(num): # return을 사용하는 함수
  for i in range(num):
    print('return')
    return i

def yie(num) : # yield를 사용하는 generator
  for i in range(num):
    print('yield') # yield를 사용하기 전이라 출력이 될 것 같지만 출력 X -> 일반적인 함수 로직 X
    yield i # yield 사용하면 메인에 순서 양보

re = ret(9) # return을 사용하면 함수가 종료되며 반환
print(re)
yi = yie(9) # yield를 사용하면 일단 Iterator를 실행할 준비 완료된 상태.
print(yi) # generator 객체 생성

return
0
<generator object yie at 0x7b864999b8b0>


###return을 사용한 함수는 return이 사용되면서 동시에 함수 종료.
### 다시 함수를 사용하려면 처음부터 다시 시작해야 함.

###.
### 하지만 generator는 순서를 기억해서 다시 호출하면 이어서 다음 순서 진행

In [66]:
def yie(num) : # yield를 사용하는 generator
  for i in range(num):
    print('yield') # yield를 사용하기 전이라 출력이 될 것 같지만 출력 X -> 일반적인 함수 로직 X
    yield i

for j in yi:
  print('for문')
  print(j)

# print(next()) # 한번 반복을 다 돌았기 때문에 에러 발생

yield
for문
0
yield
for문
1
yield
for문
2
yield
for문
3
yield
for문
4
yield
for문
5
yield
for문
6
yield
for문
7
yield
for문
8


In [32]:
yi = yie(9) # 처음을 다시 사용하려면 다시 생성해야 함 = 뒤로가기 없음.
print(next(yi))

yield
0


##generator의 단점

##1. 속도가 느리다(=시간이 오래 걸린다)
## 2. 자주 사용하는 용도와는 맞지 않다 (데이터 분석에서 잘 사용 안하는 이유 같음)
##(한번 지나가면 다시 사용 X)

In [67]:
import time
def sum_with_generator(iterable):
  start = time.perf_counter()
  sum((i for i in iterable))
  return time.perf_counter()-start

def sum_with_list(iterable):
  start = time.perf_counter()
  sum(iterable)
  return time.perf_counter()-start

print('제너레이터 합계 계산 시간 :', sum_with_generator(range(1000000)), 'sec')
print('리스트 합계 계산 시간 :', sum_with_list(list(range(1000000))), 'sec')

제너레이터 합계 계산 시간 : 0.03610018799736281 sec
리스트 합계 계산 시간 : 0.0035702700006368104 sec


## generator comprehension
## generator 사용 예시

In [29]:
# list comprehension

x = [n for n in range(50)]
print(x)
print(type(x))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49]
<class 'list'>


In [57]:
# generator comprehension

gen_ex = (n for n in range(50))
print(gen_ex)
print(type(gen_ex))
print(next(gen_ex))
print(list(gen_ex)) # next했기 때문에 1부터 시작

<generator object <genexpr> at 0x7b864999bae0>
<class 'generator'>
0
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49]


In [58]:
print(next(gen_ex))
print(next(gen_ex))
print(next(gen_ex))

StopIteration: ignored

##generator 사용 예시

In [15]:
# 무한히 나온는 숫자

def genn():
  i = 0
  while True: # while = True 잘 사용 안하지만 generator는 가능!
    yield i
    i+=1

gen_itn = genn()
print(gen_itn)
print(next(gen_itn))

<generator object genn at 0x7b864999a650>
0


In [17]:
print(next(gen_itn))
print(next(gen_itn))
print(next(gen_itn))
print(next(gen_itn))

# 무한히 숫자 반환해주는 generator

1
2
3
4


#generator와 iterator의 차이 : yield의 사용 차이