 for 문과 같은 반복 구문에 적용할 수 있는 리스트와 같은 객체를 ‘반복 가능(iterable) 객체’라고 한다.

 # 이터레이터

 이터레이터는 next 함수 호출 시 계속 그다음 값을 리턴하는 객체이다.

In [1]:
a=[1,2,3]
next(a)             

TypeError: 'list' object is not an iterator

리스트는 이터레이터가 아니다. 반복 가능하다고 해서 이터레이터는 아니다. 하지만 반복 가능하다면 다음과 같이 iter 함수를 이용해 이터레이터로 만들 수 있다.

In [8]:
a=[1,2,3]
ia=iter(a)
type(ia)

list_iterator

In [9]:
# 이제 리스트를 이터레이터로 변경했으니 next함수로 호출해보자.
print(next(ia))
print(next(ia))
print(next(ia))
next(ia)

1
2
3


StopIteration: 

next 함수를 호출할 때마다 이터레이터 객체의 요소를 차례대로 리턴하는 것을 확인할 수 있다. 하지만 더는 리턴할 값이 없다면 StopIteration 예외가 발생한다.

이터레이터의 값을 가져오는 가장 일반적인 방법은 다음과 같이 for 문을 이용하는 것이다.

In [12]:
a=[1,2,3]
ia=iter(a)

for i in ia:
    print(i)



1
2
3


for 문을 이용하면 자동으로 값을 호출하므로 next 함수를 따로 쓸 필요도 없고 StopIteration 예외에 신경 쓸 필요도 없다


다음을 한번 보자.

In [13]:
a=[1,2,3]
ia=iter(a)

for i in ia:
    print(i)


for i in ia:
    print(i)


1
2
3


이터레이터는 for 문을 이용하여 반복하고 난 후에는 다시 반복하더라도 더는 그 값을 가져오지 못한다. 즉, for문이나 next로 그 값을 한 번 읽으면 그 값을 다시는 읽을 수 없다는 특징이 있다.

## 이터레이터 만들기

iter 함수를 이용하면 리스트를 이터레이터로 만들 수 있었다. 이번에는 iter 함수 대신 클래스로 이터레이터를 만들어 보자.

이터레이터 클래스는 __iter__와 __name__의 두개의 메서드를 구현하여 만들 수 있다.

In [14]:
# iterator.py
class MyIterator:
    def __init__(self,data):
        self.data=data
        self.position=0
    
    def __iter__(self):
        return self
    
    def __next__(self):
        if self.position>=len(self.data):
            raise StopIteration
        
        else:
            result=self.data[self.position]
            self.position+=1
            return result
        
if __name__=="__main__":
    i=MyIterator([1,2,3])
    for item in i:
        print(item)

1
2
3


MyIterator 클래스는 이터레이터 객체를 생성하기 위해 \_\_iter\_\_ 메서드와 \_\_next\_\_ 메서드를 구현했다. \_\_iter\_\_ 메서드와 \_\_next\_\_ 메서드는 생성자 \_\_iter\_\_ 메서드와 마찬가지로 클래스에서 특별한 의미를 갖는 메서드이다.

클래스에 \_\_iter\_\_ 메서드를 구현하면 해당 클래스로 생성한 객체는 반복 가능한 객체가 된다. \_\_iter\_\_ 메서드는 반복 가능한 객체를 리턴해야 하며 보통 클래스의 객체를 의미하는 self를 리턴한다. 그리고 클래스에 \_\_iter\_\_ 메서드를 구현할 경우 반드시 \_\_next\_\_ 함수를 구현해야 한다.

\_\_next\_\_ 메서드는 반복 가능한 객체의 값을 차례대로 반환하는 역할을 한다. \_\_next\_\_ 메서드는 for 문을 수행하거나 next 함수 호출 시 수행되므로 MyIterator 객체를 생성할 때 전달한 data를 하나씩 리턴하고 더는 리턴할 값이 없으면 StopIteration 예외를 발생시키도록 구현했다.

이번에는 입력받은 데이터를 역순으로 출력하는 ReverseIterator 클래스를 만들어 보자

In [19]:
# iterator.py
class R_MyIterator:
    def __init__(self,data):
        self.data=data
        self.position=len(self.data)-1
    
    def __iter__(self):
        return self
    
    def __next__(self):
        if self.position<0:
            raise StopIteration
        
        else:
            result=self.data[self.position]
            self.position-=1
            return result
        
if __name__=="__main__":
    i=R_MyIterator([1,2,3])
    for item in i:
        print(item)

3
2
1


# 제너레이터

제너레이터(generator)는 이터레이터를 생성해 주는 함수이다. 제너레이터로 생성한 객체는 이터레이터와 마찬가지로 next 함수 호출 시 그 값을 차례대로 얻을 수 있다. 이때 제너레이터에서는 차례대로 결과를 반환하고자 return 대신 yield 키워드를 사용한다.

다음은 예시다

In [22]:
def mygen():                #mygen 함수는 yield 구문을 포함하므로 제너레이터이다.
    yield 'a'
    yield 'b'
    yield 'c'

g=mygen()                                       # g는 제너레이터 객체는 g = mygen()과 같이 제너레이터 함수를 호출하여 만들 수 있다. 
                                                # type 명령어로 확인하면 g 객체는 제너레이터 타입의 객체라는 것을 알 수 있다.
type(g)


generator

In [23]:
print(next(g))
print(next(g))
print(next(g))


a
b
c


In [24]:
next(g)                     #가지고 있는 요소 개수보다 많이 next를 하면 오류가 뜬다.

StopIteration: 

## 제너레이터 표현식

다음 예시를 봐라.

In [32]:
# generator.py
def mygen():
    for i in range(1, 1000):
        result = i * i
        yield result

gen = mygen()

print(next(gen))
print(next(gen))
print(next(gen))

type(gen)


1
4
9


generator

In [35]:
#제너레이터는 def를 이용한 함수로 만들 수 있지만, 다음과 같이 튜플 표현식으로 좀 더 간단하게 만들 수도 있다.

gen=(i*i for i in range(1,1000))
print(next(gen))
print(next(gen))

# 이 표현식은 mygen 함수로 만든 제너레이터와 완전히 똑같이 기능한다. 
# 여기서 사용한 표현식은 리스트 컴프리헨션(list comprehension) 구문과 비슷하다. 
# 다만 리스트 대신 튜플을 이용한 점이 다르다. 
# 이와 같은 표현식을 ‘제너레이터 표현식(generator expression)’이라고 부른다.

type(gen)

# (i * i for i in range(1, 1000))은 제너레이터 표현식입니다.
# 제너레이터 표현식은 괄호(()) 안에 for 루프를 사용하여 제너레이터 객체를 만듭니다.

# 참고로, 그냥 gen=(i*i for i in range(1,1000)) 만 했을 때 type(gen)을 하면 tuple이 나오는게 아니라 generator가 나온다.

1
4


generator

In [2]:
#위의 제너레이터를 이터레이터로 구현

class MyIterator:
    def __init__(self):
        self.data=1
    
    def __iter__(self):
        return self
    
    def __next__(self):
        result=self.data*self.data
        self.data+=1
        if self.data>=1000:
            raise StopIteration
        return result
    


In [3]:
import time

def long_time_job():
    print("job start")
    time.sleep(1)
    return "done"

list_job=[long_time_job() for i in range(5)]
list_job[0]                     #index 가 0인 것을 봐라. 한꺼번에 long_time_job가 5번 실행되기 때문에 job start가 다섯번 나온다.

job start
job start
job start
job start
job start


'done'

In [4]:
import time

def long_time_job():
    print("job start")
    time.sleep(1)
    return "done"

generatorjob=(long_time_job() for i in range(5))
print(next(generatorjob))                               #next가 한번만 실행되었기 때문에 job start가 한개만 나온다.

job start
done


왜냐하면 제너레이터 표현식으로 인해 longtime_job() 함수가 5회가 아닌 1회만 호출되기 때문이다. 이러한 방식을 느긋한 계산법(lazy evaluation)이라고 부른다. 시간이 오래 걸리는 작업을 한꺼번에 처리하기보다는 필요한 경우에만 호출하여 사용할 때 제너레이터는 매우 유용하다.