# iterator


- 이터레이터(iterator)는 값을 차례대로 꺼낼 수 있는 객체(object)입니다.

지금까지 for 반복문을 사용할 때 range를 사용했습니다. 

만약 100번을 반복한다면 `for i in range(100):`처럼 만들었습니다.

이 for 반복문을 설명할 때 `for i in range(100):`은 0부터 99까지 연속된 숫자를 만들어낸다고 했는데, 사실은 숫자를 모두 만들어 내는 것이 아니라 

- **0부터 99까지 값을 차례대로 꺼낼 수 있는 이터레이터를 하나만 만들어냅니다** 

이후 반복할 때마다 이터레이터에서 숫자를 하나씩 꺼내서 반복합니다.

In [1]:
N = 3
M = 5

for i in range(min(N,M)):
    print('min')

min
min
min


---

## 지연 평가(lazy evaluation)

만약 연속된 숫자를 미리 만들면, 숫자가 적을 때는 상관없지만 숫자가 아주 많을 때는 메모리를 많이 사용하게 되므로 성능에도 불리합니다. 


- 그래서 파이썬에서는 이터레이터만 생성하고, 값이 필요한 시점이 되었을 때, 값을 만드는 방식을 사용합니다. 


- 즉, 데이터 생성을 뒤로 미루는 것인데 이런 방식을 지연 평가(lazy evaluation)라고 합니다.

참고로 이터레이터는 반복자라고 부르기도 합니다. 

---

## 반복 가능한 객체(iterable)


이터레이터를 만들기 전에 먼저 반복 가능한 객체(iterable)에 대해 알아보겠습니다. 

반복 가능한 객체는 말 그대로 반복할 수 있는 객체인데 

- 우리가 흔히 사용하는 문자열, 리스트, 딕셔너리, 세트가 반복 가능한 객체입니다. 

- 즉, 요소가 여러 개 들어있고, 한 번에 하나씩 꺼낼 수 있는 객체입니다.


---

## `.__iter__()`

객체가 반복 가능한 객체인지 알아보는 방법은 객체에 __iter__ 메서드가 들어있는지 확인해보면 됩니다. 

다음과 같이 dir 함수를 사용하면 객체의 메서드를 확인할 수 있습니다.

In [2]:
dir([1, 2, 3])

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__rmul__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'append',
 'clear',
 'copy',
 'count',
 'extend',
 'index',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort']

In [24]:
[1, 2, 3].__iter__()

<list_iterator at 0x7fe9d047aaf0>

In [25]:
it = [1, 2, 3].__iter__()

In [26]:
it.__next__()

1

In [27]:
it.__next__()

2

In [28]:
it.__next__()

3

In [29]:
#  꺼낼 요소가 없으면 StopIteration 예외를 발생시켜서 반복을 끝냅니다.

it.__next__()

StopIteration: 

---


리스트, 문자열, 딕셔너리, 세트는 요소가 눈에 보이는 반복 가능한 객체입니다. 

이번에는 요소가 눈에 보이지 않는 range를 살펴보겠습니다. 

다음과 같이 range(3)에서 __iter__로 이터레이터를 얻어낸 뒤 __next__ 메서드를 호출해봅니다.


In [9]:
it = range(3).__iter__()

In [10]:
it.__next__()

0

In [11]:
it.__next__()

1

In [12]:
it.__next__()

2

In [13]:
it.__next__()

StopIteration: 

---

#  for와 반복 가능한 객체

이제 for에 반복 가능한 객체를 사용했을 때 동작 과정을 알아보겠습니다. 

다음과 같이 for에 range(3)을 사용했다면 먼저 range - 반복 가능한 객체(iterable) 에서 __iter__로 이터레이터(iterator)를 얻습니다. 

그리고 한 번 반복할 때마다 이터레이터(iterator)에서 __next__로 숫자를 꺼내서 i에 저장하고, 지정된 숫자 3이 되면 StopIteration을 발생시켜서 반복을 끝냅니다.

<img src = "for에서 range의 동작 과정.png" />

---

이처럼 반복 가능한 객체(iterable)는 __iter__ 메서드로 이터레이터(iterator)를 얻고, 이터레이터의 __next__ 메서드로 반복합니다. 


여기서는 반복 가능한 객체와 이터레이터가 분리되어 있지만 클래스에 __iter__와 __next__ 메서드를 모두 구현하면 이터레이터를 만들 수 있습니다.


특히 __iter__, __next__를 가진 객체를 이터레이터 프로토콜(iterator protocol)을 지원한다고 말합니다.



정리하자면 반복 가능한 객체(iterable)는 요소를 한 번에 하나씩 가져올 수 있는 객체이고, 이터레이터는 __next__ 메서드를 사용해서 차례대로 값을 꺼낼 수 있는 객체입니다.


반복 가능한 객체(iterable)와 이터레이터(iterator)는 별개의 객체이므로 둘은 구분해야 합니다. 


즉, 반복 가능한 객체(iterable)에서 __iter__ 메서드로 이터레이터(iterator)를 얻습니다.

---

# 시퀀스 객체와 반복 가능한 객체의 차이

리스트, 튜플, range, 문자열은 시퀀스 객체라고 했는데, 이 유닛에서는 반복 가능한 객체라고 했습니다. 

시퀀스 객체와 반복 가능한 객체의 차이점은 무엇일까요?


다음 그림과 같이 반복 가능한 객체는 시퀀스 객체를 포함합니다.

리스트, 튜플, range, 문자열은 반복 가능한 객체이면서 시퀀스 객체입니다. 

하지만, 딕셔너리와 세트는 반복 가능한 객체이지만 시퀀스 객체는 아닙니다. 

- 왜냐하면 시퀀스 객체는 요소의 순서가 정해져 있고 연속적(sequence)으로 이어져 있어야 하는데, 

- 딕셔너리와 세트는 요소(키)의 순서가 정해져 있지 않기 때문입니다. 

따라서 시퀀스 객체가 반복 가능한 객체보다 좁은 개념입니다.

즉, 요소의 순서가 정해져 있고 연속적으로 이어져 있으면 시퀀스 객체, 요소의 순서와는 상관없이 요소를 한 번에 하나씩 꺼낼 수 있으면 반복 가능한 객체입니다.

<img src = "iterable sequence.png" />

---

# iterator 생성

```
class 이터레이터이름:
    def __iter__(self):
        코드
 
    def __next__(self):
        코드
```

__iter__, __next__ 메서드를 구현해서 직접 이터레이터를 만들어보겠습니다. 

간단하게 range(횟수)처럼 동작하는 이터레이터입니다.



In [24]:
# 0부터 지정된 숫자 직전까지 반복하는 이터레이터 Counter를 정의

class Counter:
    
    def __init__(self, stop):  # 초기화, size = stop
        self.current = 0       # 현재 숫자 유지, 0부터 지정된 숫자 직전까지 반복
        self.stop = stop       # 반복을 끝낼 숫자
 
    def __iter__(self): 
        return self            # 현재 인스턴스를 반환
 
    def __next__(self):
        
        if self.current < self.stop:    # 현재 숫자가 반복을 끝낼 숫자보다 작을 때
            r = self.current            # 반환할 숫자를 변수에 저장
            self.current += 1           # 현재 숫자를 1 증가시킴
            return r                    # 숫자를 반환
        
        else:                           # 현재 숫자가 반복을 끝낼 숫자보다 크거나 같을 때
            raise StopIteration         # 예외 발생


In [22]:
for i in Counter(3):
    print(i, end=' ')

0 1 2 

---

이터레이터를 작성하려면 __init__ 메서드를 만듭니다. 

여기서는 Counter(3)처럼 반복을 끝낼 숫자를 받았으므로 self.stop에 stop을 넣어줍니다. 

그리고 반복할 때마다 현재 숫자를 유지해야 하므로 속성 self.current에 0을 넣어줍니다(0부터 지정된 숫자 직전까지 반복하므로 0을 넣습니다).

---

_iter__ 메서드를 만드는데 여기서는 self만 반환하면 끝입니다. 

이 객체는 리스트, 문자열, 딕셔너리, 세트, range처럼 __iter__를 호출해줄 반복 가능한 객체(iterable)가 없으므로, 현재 인스턴스를 반환하면 됩니다. 

즉, 이 객체는 반복 가능한 객체이면서 이터레이터입니다.

---

__next__ 메서드를 만듭니다.

__next__에서는 조건에 따라 숫자를 만들어내거나 StopIteration 예외를 발생시킵니다. 


현재 숫자 self.current가 반복을 끝낼 숫자 self.stop보다 작을 때는 self.current를 1 증가시키고 현재 숫자를 반환합니다. 


이때 1 증가한 숫자를 반환하지 않도록 숫자를 증가시키기 전에 r = self.current처럼 반환할 숫자를 변수에 저장해 놓습니다. 


그다음에 self.current가 self.stop보다 크거나 같아질 때는 raise StopIteration으로 예외를 발생시킵니다.



---

# iterator 언패킹

이터레이터는 언패킹(unpacking)이 가능합니다. 

즉, 다음과 같이 Counter()의 결과를 변수 여러 개에 할당할 수 있습니다.

물론 이터레이터가 반복하는 횟수와 변수의 개수는 같아야 합니다.

In [25]:
a, b, c = Counter(3)
print(a,b,c)

a, b, c, d, e = Counter(5)
print(a,b,c,d,e)



0 1 2
0 1 2 3 4


---

# iterator 생성 - index로 접근할 수 있는 


__getitem__ 메서드를 구현하여 인덱스로 접근할 수 있는 이터레이터

In [3]:
class Counter:
    
    def __init__(self, stop):        # 초기화, size = stop 
        self.stop = stop             # 반복을 끝낼 숫자
 

    def __getitem__(self, index):    # 인덱스를 받음
        if index < self.stop:        # 인덱스가 반복을 끝낼 숫자보다 작을 때
            return index             # 인덱스를 반환
        else:                        # 인덱스가 반복을 끝낼 숫자보다 크거나 같을 때
            raise IndexError         # 예외 발생
 


In [4]:
print(Counter(3)[0], Counter(3)[1], Counter(3)[2])
 
for i in Counter(3):
    print(i, end=' ')

0 1 2
0 1 2 

---

# iter - 파이썬 내장 함수


iter는 반복을 끝낼 값을 지정하면 특정 값이 나올 때 반복을 끝냅니다. 


이 경우에는 반복 가능한 객체 대신 ≈를 넣어줍니다. 


참고로 반복을 끝낼 값은 sentinel이라고 부르는데 감시병이라는 뜻입니다. 


즉, 반복을 감시하다가 특정 값이 나오면 반복을 끝낸다고 해서 sentinel입니다.


`iter(호출가능한객체, 반복을끝낼값)`


예를 들어 random.randint(0, 5)와 같이 0부터 5까지 무작위로 숫자를 생성할 때 2가 나오면 반복을 끝내도록 만들 수 있습니다. 

이때 호출 가능한 객체(callable) 를 넣어야 하므로, 매개변수가 없는 함수 또는 람다 표현식으로 만들어줍니다.


In [13]:
import random

it = iter(lambda : random.randint(0, 5), 2)

In [14]:
next(it)

1

In [15]:
next(it)

0

next(it)로 숫자를 계속 만들다가 2가 나오면 StopIteration이 발생합니다. 

물론 숫자가 무작위로 생성되므로 next(it)를 호출하는 횟수도 매번 달라집니다. 

물론 다음과 같이 for 반복문에 넣어서 사용할 수도 있습니다.

In [17]:
for i in iter(lambda : random.randint(0, 5), 2):
    print(i, end=' ')

5 0 1 1 

---

#  next - 파이썬 내장 함수



next는 기본값을 지정할 수 있습니다. 

기본값을 지정하면 반복이 끝나더라도 StopIteration이 발생하지 않고 기본값을 출력합니다. 

즉, 반복할 수 있을 때는 해당 값을 출력하고, 반복이 끝났을 때는 기본값을 출력합니다. 


- `next(반복가능한객체, 기본값)`


In [35]:
# range(3)으로 0, 1, 2 세 번 반복하는데 next에 기본값으로 10을 지정했습니다.

it = iter(range(3))

In [36]:
# 반복할 수 있을 때는 해당 값을 출력하고, 
# 반복이 끝났을 때는 예외를 출력하지 않고 기본값을 출력

next(it,10)

0

In [37]:
next(it,10)

1

In [38]:
next(it,10)

2

In [39]:
next(it,10)

10

---

- 이터레이터를 만들 때 __iter__, __next__ 메서드 또는 __getitem__ 메서드를 구현해야 한다