# 14. 반복형(Iterables), 반복자(Iterators), Generator

- Python의 collection은 모두 반복형. 다음 연산들을 지원하기 위해 내부적으로 반복자를 사용
    - for loop
    - collection형 생성과 확장
    - text file을 1줄씩 반복
    - list comprehension / dict comprehension / set comprehension
    - tuple unpacking
    - 함수를 호출할 때, 실제 parameter들을 unpacking (*args)
- 다음과 같은 내용들을 다룬다.
    - 반복형 object를 처리하기 위해, 내부적으로 iter() 내장 함수를 사용하는 방법
    - Python에서 고전적인 반복자 패턴을 구현하는 방법
    - Generator가 작동하는 방법
    - 고전적인 반복자를 generator 함수나 generator 표현으로 바꾸는 방법
    - 표준 library에서 범용 generator 함수의 활용
    - generator를 결합하기 위해 새로 추가된 yield from 을 사용하는 방법
    - Generator vs coroutine: 다른점 그리고 혼용하면 안되는 이유
    - 사례연구

## 14.1 Sentence ver.1: word sequence

In [3]:
# Example 14.1: 단어 sequence으로서의 Sentence Class
import re
import reprlib

RE_WORD = re.compile('\w+')

class Sentence:
    def __init__(self, text):
        self.text = text
        self.words = RE_WORD.findall(text)
        
    def __getitem__(self, index): # index를 받아서 단어를 반환
        return self.words[index]
    
    def __len__(self):
        return len(self.words)
    
    def __repr__(self):
        return 'Sentence(%s)' %reprlib.repr(self.text) # reprlib.repr()은 생성할 문자열을 30자로 제한

In [10]:
s = Sentence('"The time has come, " the Walrus said,')
print(s)
for word in s:
    print(word)
print(list(s))
print("s[0]: {}, s[5]: {}, s[-1]: {}".format(s[0], s[5], s[-1]))

Sentence('"The time ha... Walrus said,')
The
time
has
come
the
Walrus
said
['The', 'time', 'has', 'come', 'the', 'Walrus', 'said']
s[0]: The, s[5]: Walrus, s[-1]: said


### 14.1.1 Sequence가 반복 가능한 이유: iter()함수
- Python Interpreter가 x 객체를 반복해야 할 떄는 언제나 iter(x)를 자동으로 호출
- iter() 내장 함수가 수행하는 과정
    - 객체가 __iter__() method가 구현되었는지 확인, 이 method를 호출해서 반복자를 가져옴
    - __iter__() method가 실제로 구현되어 있지 않아도, __getitem__()이 구현되어 있다면, 
       python은 index=0 에서 시작해서 항목을 순서대로 가져오는 반복자 생성
    - 위의 과정들이 모두 실패하면 TypeError발생.
- 거의 모든 python sequence는 특히 __getitem__()이 있기 때문에, 대부분의 python sequence는 반복할 수 있음.
    - (사실은, 모든 표준 sequence는 __iter__() method도 구현하고 있으므로, 직접 정의한 sequence도 이 method를 구현해야 함)
- 여기서, __iter__()뿐만 아니라 __getitem__() method를 구현하는 object를 반복형으로 간주하는 것은 duck typing의 극단적인 형태
- goose typing(???)을 사용하면 반복형에 대한 정의가 단순해지지만, 융통성이 떨어짐 --> __Iter__() method를 구현하는 object만 반복형으로 간주


In [15]:
from collections import abc
class Foo:
    def __iter__(self):
        pass
f = Foo()
    
print("class Foo is a subclass of abc.Iterable = '{}'".format(issubclass(Foo, abc.Iterable)))
print("object f is a subclass of abc.Iterable = '{}'".format(isinstance(f, abc.Iterable)))
print("class Sentence is a subclass of abc.Iterable = '{}'".format(issubclass(Sentence, abc.Iterable))) # Sentence는 __iter__() method가 없어 반복형으로 인지 x
print("obtect s is a subclass of abc.Iterable = '{}'".format(isinstance(s, abc.Iterable)))

class Foo is a subclass of abc.Iterable = 'True'
object f is a subclass of abc.Iterable = 'True'
class Sentence is a subclass of abc.Iterable = 'False'
obtect s is a subclass of abc.Iterable = 'False'


## 14.2 반복형과 반복자 (Iterables and Iterators)
- 반복형(Iterables)의 정의
    - iter() 내장 함수가 반복자를 가져올수 잇는 모든 object
    - 반복자를 반환하는 __iter__() method를 구현하는 개체는 반복형
    - 0에서 시작하는 index를 받는 __getitem__() method를 구현하는 객체인 seq도 마찬가지
- 반복자(Iterators)의 정의
    - 다음 항목을 반환하거나, 다음 항목이 없을 때, StopIteration 예외를 발생시키는, 인수를 받지 않는 __next__() method를 구현하는 객체
    - Python Iterator는 __iter__() method도 구현하므로, Iterable이기도 함

- 반복형 vs 반복자??


In [16]:
s = 'ABC' # 'ABC"문자열은 반복형
for ch in s:
    print(ch)

A
B
C


In [19]:
# 위와 동일한 코드를 while문을 사용하여 작성
s = 'ABC'
it = iter(s) # 반복형에서 반복자 it을 생성
while True:
    try:
        print(next(it)) # 반복자에서 next를 계속 호출해서 다음 항목을 가져옴
    except StopIteration: # 더 이상 항목이 없으면 반복자 it이 StopIteration 예외를 발생
        del it # it에 대한 참조를 해제 --> 반복자 객체를 제거
        break # loop을 빠져나옴

A
B
C


- Iterators에 대한 표준 interface는 다음 2개의 method를 정의
    - __next__(): 다음에 사용할 항목을 반환. 더 이상 항목이 남은게 없다면, StopIteration발생
    - __iter__(): self를 반환. for loop등 iterables이 필요한 곳에 iterator를 사용할 수 있게 해줌
- Iterators에서 주의해야 할 점
    - Iterator가 필수로 구현되어 있어야 하는 method는 __next__()와 __iter__()뿐임. --> next()를 호출하고 Stop Iteration 예외를 잡는 방법 외에는 항목 소진이 되었는지 확인 불가
    - Iterator는 '재설정'아 불가능 --> 다시 반복해야 하면 처음 반복자를 생성했떤 반복형에 iter()를 호출해야 함. Iterators 자체에 iter()를 거는 것은 소용 없음
        - Why? Iterators.__iter__()는 단지 self를 반환하도록 구현되었을 뿐. 소진된 반복자를 재설정할 수 없음
- Lib/types.py 모듈 소스코드의 주석 내용
    - Python의 iterators는 자료형이 아닌 프로토콜
    - 상당히 많은 유동적인 수의 내장 자료형이 반복자의 ""일부""를 구현함
    - 자료형을 검사하지 말고, hasattr()를 사용하여 __iter__와 __next__ 속성이 있는지 검사

In [28]:
print(s.__iter__())
print(it.__iter__())

<str_iterator object at 0x7f2f73741518>
<str_iterator object at 0x7f2f737a4780>


In [32]:
seq = 'Pig and Pepper'
s = Sentence(seq)
it = iter(s)
print(s)
print(it)
print(next(it))
print(it.__next__())
print(next(it))
# print(next(it)) # Stop Iteration Error

print(list(iter(s)))
print(list(it)) # it은 iter(s)인데  윗줄은 되고, 얘는 왜 안될까?? 이미 다 소진이 되었기 때문. 만약 아래와 같이, 다시 선언하면 됨
it=iter(s)
print(list(it))

Sentence('Pig and Pepper')
<iterator object at 0x7f2f73752198>
Pig
and
Pepper
['Pig', 'and', 'Pepper']
[]
['Pig', 'and', 'Pepper']


## 14.3 Sentence ver.2: 고전적인 Iterator

### 14.3.1 Sentence class를 Iterator로 만들기 --> Terrible Idea!!!!!!
- 흔히 발생하는 오류 : Iterable과 Iterator를 혼동하기 때문에 발생
    - Iterable: 호출될 떄마다 Iterator를 새로 생성하는 __iter__() method를 가짐
    - Iterator: 개별 항목 반환하는 __next__(), self를 반환하는 __iter__() method를 가짐
    - 즉, Iterator는 Iterable이지만, Iterable은 Iterator가 아님
- Sentence에 __iter__()뿐만 아니라, __next__()도 구현해서 Sentence의 object를 iterable하면서 iterator로 만들고 싶지???
    - Absoultely Wrong!!!!
- Iterator는 다음과 같은 용도에 사용
    - 집합 object의 내부 표현을 노출시키지 않고 내용에 접근하는 경우
    - 집합 object의 다중 반복을 지원하는 경우
        - 다중 반복을 지원하려면 동일한 iteratable object로부터 여러 독립적인 iterator를 가질 수 있어야 함. 각 iterator는 고유한 내부 상태를 유지해야 함
        - 위 패턴을 구현하기 위해서, iter(my_iterable)을 호출할 때마다 독립적인 iterator가 새로 만들어저야 함
        - 이 예제에 SentenceIterator가 따로 필요한 이유!!!
    - 다양한 집합 구조체를 반복하기 위한 통일된 interface를 제공하는 경우
- Iterable는 자기 자신을 반복하는 iterator가 되면 안됨! 즉, __iter__()를 구현하되, __next()__는 구현하면 안됨
- 반면, Iterator는 편의를 위해 iterator가 되어야 함. 이 떄, Iterator의 __iter__()는 self를 반환해야 함

In [33]:
import re
import reprlib

RE_WORD = re.compile('\w+')

class Sentence: # Iterable
    def __init__(self, text):
        self.text = text
        self.words = RE_WORD.findall(text)
    def __repr__(self):
        return 'Sentence(%s)' % reprlib.repr(self.text)
    def __iter__(self): # __iter__() method가 구현되어 있음 --> Sentence는 Iterable
        return SentenceIterator(self.words) # Iterators object를 생성하여 반환 --> 반복형 protocol을 완벽히 구현
    
class SentenceIterator: # Iterator
    def __init__(self, words):
        self.words = words # 단어 list에 대한 참조를 갖는다
        self.idx = 0 # 다음에 들어올 단어를 결정하기 위해 self.idx 사용
    def __next__(self):
        try:
            word = self.words[self.idx] # self.words의 self.idx에 있는 단어를 가져옴
        except IndexError:
            raise StopIteration() # self.idx에 단어가 없으면 StopIteration 예외발생
        self.idx += 1 # self.idx를 1 증가시킴
        return word # 단어를 반환
    def __iter__(self):
        return self

## 14.4 Sentence ver.3: Generator Function

### 14.4.1 Generator함수의 작동 방식
- 본체 안에 yield 키워드를 가진 함수는 모두 generator 함수
- Generator 함수는 호출되면 generator object를 반환함. 즉, generator 함수는 generator factory라고 할 수 있음
- Generator 함수는 함수 본체를 포함하는 generator object를 생성.
    - next()를 generator object에 호출하면 함수 본체에 있는 다음 yield로 진행. next()는 함수 본체가 중단된 곳에서 생성된 값을 평가
    - Iterator 프로토콜에 따라 StopIteration 예외를 발생시키기도 함
- Tip - Generator에서 가져온 결과
    - Generator는 값을 'generate'한다고 일컫는다! 'return'한다고 일컫지 않는다.
    - Function, Generator Function and Generator
        - Function은 값을 return한다.
        - Generator Function은 generator object를 return한다.
        - Generator object는 값을 generate한다. 즉, 일반적인 방식으로 값을 'return'하지 않는다.
        - Generator Function안의 return문은 generator object가 StopIteation 예외를 발생하도록 함

In [36]:
def gen_123(): # yield 키워드를 갖고 있는 함수는 모두 generator
    yield 1
    yield 2
    yield 3
print(gen_123) # gen_123()자체는 함수 객체
print(gen_123()) # 그러나 호출하면 generator 객체를 반환
for i in gen_123(): # Generator는 yield에 전달된 표현식의 값을 생성하는 반복자
    print(i)
g = gen_123() # Generator 객체인 gen_123()을 g에 할당함
print(next(g)) # g는 iterator이기도 함. next(g)로 호출하면 yield가 생성한 다음 항목을 가져옴
print(next(g))
print(next(g))
print(next(g)) # 함수 실행이 완료되면 generator 객체는 StopIteration 발생시킴!

<function gen_123 at 0x7f2f73736c80>
<generator object gen_123 at 0x7f2f73715f68>
1
2
3
1
2
3


StopIteration: 

In [38]:
def gen_AB():
    print('Start!')
    yield 'A'
    print('Continue')
    yield 'B'
    print('End')
for i, c in enumerate(gen_AB()): # 이 for loop에서 gen_AB.next()를 암묵적으로 호출하는 역할. 마지막에는 'End'를 출력하고, StopIteration 예외를 발생시킴
    print('{} --> {}'.format(i,c))

Start!
0 --> A
Continue
1 --> B
End


## 14.5. Sentence ver.4: Lazy Expression
- Iterator 인터페이스는 느긋하게 처리하도록 설계되어 있음. next(my_iterator)는 한번에 한 항목만 생성
- 지금까지는 느긋한 버전이 아니었음. 
    - __init__()에서 text안에 있는 단어들의 list를 '조급하게' 생성하여, self.words에 바인딩하기 때문
    - 위의 list는 거의 text와 맞먹는 양의 메모리를 소비. 사용자가 처음 몇 단어만 반복하면, 이 연산은 대부분 불필요
    - re.finditer()는 re.findall()의 느긋한 version. 
        - re.MatchObject object를 생성하는 generator를 반환함.
        - Matching되는 항목이 많을 경우, 필요할 때만 다음 단어를 생성하기 때문에, re.finditer()가 메모리를 많이 절약해줌

In [39]:
import re
import reprlib
RE_WORD = re.compile('w+')

class Sentence:
    def __init__(self, text):
        self.text = text
    def __repr__(self):
        return 'Sentence(%s)' % reprlib.repr(self.text)
    def __iter__(self):
        for match in RE_WORD.finditer(self.text):
            yield match.group() # match.group() method는 MatchObject 객체에서 matching 되는 text를 추출함

## 14.6 & 14.7 Sentence ver.5 : Generator Expression and When to use it?
- Generator expression은 List comprehension의 lazy version이다.
    - Eagerly list를 생성하는 대신, 필요에 따라 항목을 lazy하게 생성하는 generator를 반환하기 때문
    - 즉, List comprehension이 list factory라면, Generator expression은 Generator factory와 같음
- Generator Expression vs Generator function
    - Generator Expression: 함수를 정의하고 호출할 필요 없이 generator를 생성하는 편리 구문
    - Generator function: 융통성이 훨씬 더 높음. 여러 문장으로 구성된 복잡한 논리를 구현할 수 있음
    - When to use?
        - Generator expression이 여러줄에 걸쳐 있을 경우 --> 가독성을 위해 generator function을 사용
- Tip
    - Generator expression을 함수나 생성자에 단일 인수로 전달시, 함수로 호출하는 괄호 안에서 generator expression을 괄호로 에워쌀 필요가 없음
    - 그러나, generator expression 다음에 parameter가 더 있따면, generator expression을 괄호로 에워싸야 한다.
    - example)
            a = Vector(n*scalar for n in self)            -> (o)
            a = Vector((n*scalar for n in self), cc, dd)  -> (o)

            

In [68]:
def gen_AB():
    print('Start!')
    yield 'A'
    print('Continue')
    yield 'B'
    print('End')

# List Comprehension: gen_AB()를 바로 eagerly 호출하여 생성된 generator object가 생성한 A, B를 조급하게 반복함. 그 증거로, start, continue, end가 출력
print('>>>gen_AB() with list comprehension')
res1 = [x*3 for x in gen_AB()] 

# List comprehension이 생성한 list인 res1을 출력
print()
print('>>>print out the list which is generated by list comprehension')
print(res1)

# for loop으로 list comprehension이 생성한 list인 res1의 원소를 출력
print()
print('>>>print out every component of list which is generated by list comprehension')
for i in res1:
    print('{}'.format(i))

# Generator Expression: res2를 반환. gen_AB()를 호출은 하지만, gen_AB()가 반환한 generator를 소비하지 않음
print()
print('>>>Generator Expression and its type')
res2 = (x*3 for x in gen_AB())
print(res2)
print(type(res2))

# for loop이 res2를 반복해야 gen_AB()의 본체가 비로소 실행됨.
# for loop이 반복될 때마다 암묵적으로 next(res2)를 호출해서 gen_AB()안에서 다음 yield로 진행하게 만듦
print()
print('>>>print out every value which is generated by generator expression of gen_AB()')
for i in res2: 
    print('>>> {}'.format(i))
    print('--------------')

>>>gen_AB() with list comprehension
Start!
Continue
End

>>>print out the list which is generated by list comprehension
['AAA', 'BBB']

>>>print out every component of list which is generated by list comprehension
AAA
BBB

>>>Generator Expression and its type
<generator object <genexpr> at 0x7f2f73715f10>
<class 'generator'>

>>>print out every value which is generated by generator expression of gen_AB()
Start!
>>> AAA
--------------
Continue
>>> BBB
--------------
End


In [71]:
import re
import reprlib

RE_WORD = re.compile('\w+')

class Sentence:
    def __init__(self, text):
        self.text = text
    def __repr__(self):
        return 'Sentence(%s) ' % reprlib.repr(self.text)
    def __iter__(self):
        return (match.group() for match in RE_WORD.finditer(self.text))

## 14.8 Another Example: Arithmetic Progression generator(등차수열)
- 전통적이 반복자 패턴은 모두 data 구조체를 탐색하여 항목들을 나열하기 위한 것
- 수열에서 다음 항목을 가져오는 method에 기반한 표준 인터페이스는 collection에서 항목을 가져오는 대신 실행 도중, 항목을 생성하는데도 유용하게 사용 가능
    - range(): 유한 등차수열 생성, itertools.count() 무한 등차수열 생성

In [72]:
class ArithmeticProgression:
    def __init__(self, begin, step, end=None):
        self.begin = begin
        self.step = step
        self.end = end
    def __iter__(self):
        result = type(self.begin + self.step)(self.begin) # self.begin 과 동일하지만, 자료형을 강제로 변환
        forever = self.end is None
        idx = 0
        while forever or result < self.end:
            yield result
            idx += 1
            result = self.begin + self.step * idx

In [80]:
from fractions import Fraction
from decimal import Decimal
aa = ArithmeticProgression(3, 0.5, 10)
print(list(aa))
aa = ArithmeticProgression(1, 1/3, 5)
print(list(aa))
aa = ArithmeticProgression(0, Fraction(1,3), 2)
print(list(aa))
aa = ArithmeticProgression(0, Decimal('.1'), .3)
print(list(aa))

[3.0, 3.5, 4.0, 4.5, 5.0, 5.5, 6.0, 6.5, 7.0, 7.5, 8.0, 8.5, 9.0, 9.5]
[1.0, 1.3333333333333333, 1.6666666666666665, 2.0, 2.333333333333333, 2.6666666666666665, 3.0, 3.333333333333333, 3.6666666666666665, 4.0, 4.333333333333333, 4.666666666666666]
[Fraction(0, 1), Fraction(1, 3), Fraction(2, 3), Fraction(1, 1), Fraction(4, 3), Fraction(5, 3)]
[Decimal('0'), Decimal('0.1'), Decimal('0.2')]


- ArithmeticProgression class의 목적이 __iter__()를 구현함으로써, generator를 생성하는것
    - 클래스를 단지 하나의 generator function으로 만들 수도 있었을 것.
    - Generator function도 일종의 generator factory이기 때문

In [85]:
# ArithmeticProgression과 동일한 역할을 하는 함수
def aritprog_gen(begin, step, end=None):
    result = type(begin + step)(begin)
    forever = end is None
    idx = 0
    while forever or result < end:
        yield result
        idx += 1
        result = begin + step * idx
for i in aritprog_gen(1, 3, 11):
    print(i)

1
4
7
10


### 14.8.1 Arithmetic Progression with itertools module
- itertools.count()    : 숫자를 생성하는 generator를 반환. 그러나 endless -> list(count())를 실행하면, Python Interpreter는 메모리보다 큰 list를 만드려고 하다가 실패함
- itertools.takewhile(): 다른 generator를 소비하면서 주어진 조건식이 False가 되면 중단되는 generator를 생성.

In [89]:
import itertools
gen = itertools.count(1, 0.5)
print(next(gen))
print(next(gen))
print(next(gen))
gen = itertools.takewhile(lambda n: n<3, itertools.count(1,0.5))
list(gen)

1
1.5
2.0


[1, 1.5, 2.0, 2.5]

- 아래 예제는, takewhile()과 count()를 활용하여 aritprog_gen2를 구현
- 본체 내에 yield문이 없음 --> generator function이 아님. 그러나, generator를 반환하므로, 일종의 generator factory처럼 작동

In [94]:
def aritprog_gen2(begin, step, end=None):
    first = type(begin + step)(begin)
    ap_gen = itertools.count(first, step)
    if end is not None:
        ap_gen = itertools.takewhile(lambda n: n<end, ap_gen)
    return ap_gen

gen = aritprog_gen2(3, 0.5, 10)
list(gen)

[3.0, 3.5, 4.0, 4.5, 5.0, 5.5, 6.0, 6.5, 7.0, 7.5, 8.0, 8.5, 9.0, 9.5]

## 14.9 Generator functions in standard library

- Filtering Generator functions: 입력된 반복형을 그대로 사용해서 생성된 항목들의 일부를 생성
    - itertools.compress(), itertools.dropwhile(), filter(), itertools.filterfalse(), itertools.islice(), itertools.takewhile()
- Mapping Generator functions: 입력된 반복형에 들어있는 각 항목에 연산을 수행한 결과를 생성
    - itertools.accumulate(), enumerate(), map(), starmap()
    - map(), starmap()의 경우, 하나 이상의 반복형
    - 입력된 반복형 안의 항목 하나마다 값 하나를 생성
    - 두 개 이상의 반복형을 입력받는 경우, 반복형 중 하나라도 소진되면 바로 출력을 중단
- 병합 Generator functions: 여러 반복형을 입력받아서 항목을 생성
    - itertools.chain(), itertools.chain.from_iterable(), itertools.product(), zip(), itertools.zip_longest()
    - 입력받은 반복형을 순차적으로 소비하는 경우: chain(), chain.from_iterable()
    - 입력받은 반복형을 병렬로 소비하는 경우: product(), zip(), zip_longest()
- 입력된 항목 하나마다 하나 이상의 값을 생성하는 generator functions
    - itertools.combinations(), itertools.combiinations_with_replacement(), itertools.count(), itertools.cycle(), itertools.permutations(), itertools.repeat()
    - 이중, combinations(), combinations_with_replacement(), permutations() generator함수는 product()와 함께 combinatoric(순열조합) generator라고 불림
- 재배치 Generator Functions: 입력받은 반복형 안의 항목의 순서를 변경해서 모든 항목을 생성
    - itertools.groupby(), reversed(), itertools.tee()

#### Filtering Generator

In [103]:
import itertools
def vowel(c):
    return c.lower() in 'aeiou'
print(list(filter(vowel, 'Aardvark')))
print(list(itertools.filterfalse(vowel, 'Aardvark')))
print(list(itertools.dropwhile(vowel, 'Aardvark')))
print(list(itertools.takewhile(vowel, 'Aardvark')))
print(list(itertools.compress('Aardvark', (1,0,1,1,0,1))))
print(list(itertools.islice('Aardvark', 4)))
print(list(itertools.islice('Aardvark', 4, 7)))
print(list(itertools.islice('Aardvark', 1, 7, 2)))

['A', 'a', 'a']
['r', 'd', 'v', 'r', 'k']
['r', 'd', 'v', 'a', 'r', 'k']
['A', 'a']
['A', 'r', 'd', 'a']
['A', 'a', 'r', 'd']
['v', 'a', 'r']
['a', 'd', 'a']


#### itertools.accumulate() example

In [105]:
import itertools
import operator
sample = [1,2,3,4,5,6,7,9,8,0]
print(list(itertools.accumulate(sample)))
print(list(itertools.accumulate(sample, min)))
print(list(itertools.accumulate(sample, max)))
print(list(itertools.accumulate(sample, operator.mul)))
print(list(itertools.accumulate(range(1, 11), operator.mul)))

[1, 3, 6, 10, 15, 21, 28, 37, 45, 45]
[1, 1, 1, 1, 1, 1, 1, 1, 1, 0]
[1, 2, 3, 4, 5, 6, 7, 9, 9, 9]
[1, 2, 6, 24, 120, 720, 5040, 45360, 362880, 0]
[1, 2, 6, 24, 120, 720, 5040, 40320, 362880, 3628800]


In [107]:
import itertools
import operator
print(list(enumerate('albatroz', 1)))
print(list(map(operator.mul, range(11), range(11))))
print(list(map(operator.mul, range(11), [2,4,8])))
print(list(map(lambda a,b : (a,b), range(11), [2,4,8])))
print(list(itertools.starmap(operator.mul, enumerate('albatroz', 1))))
sample = [1,2,3,4,5,6,7,9,8,0]
print(list(itertools.starmap(lambda a,b: b/a, enumerate(itertools.accumulate(sample), 1))))

[(1, 'a'), (2, 'l'), (3, 'b'), (4, 'a'), (5, 't'), (6, 'r'), (7, 'o'), (8, 'z')]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
[0, 4, 16]
[(0, 2), (1, 4), (2, 8)]
['a', 'll', 'bbb', 'aaaa', 'ttttt', 'rrrrrr', 'ooooooo', 'zzzzzzzz']
[1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.625, 5.0, 4.5]


In [108]:
import itertools
print(list(itertools.chain('ABC', range(2))))
print(list(itertools.chain(enumerate('ABC'))))
print(list(itertools.chain.from_iterable(enumerate('ABC'))))
print(list(zip('ABC', range(5))))
print(list(zip('ABC', range(5), [10,20,30,40])))
print(list(itertools.zip_longest('ABC', range(5))))
print(list(itertools.zip_longest('ABC', range(5), fillvalue='?')))

['A', 'B', 'C', 0, 1]
[(0, 'A'), (1, 'B'), (2, 'C')]
[0, 'A', 1, 'B', 2, 'C']
[('A', 0), ('B', 1), ('C', 2)]
[('A', 0, 10), ('B', 1, 20), ('C', 2, 30)]
[('A', 0), ('B', 1), ('C', 2), (None, 3), (None, 4)]
[('A', 0), ('B', 1), ('C', 2), ('?', 3), ('?', 4)]


In [109]:
print(list(itertools.product('ABC', range(2))))
suits = 'spades hearts diamonds clubs'.split()
print(list(itertools.product('AK', suits)))
print(list(itertools.product('ABC')))
print(list(itertools.product('ABC', repeat=2)))
print(list(itertools.product(range(2), repeat=3)))
rows = itertools.product('AB', range(2), repeat=2)
for row in rows:
    print(row)

[('A', 0), ('A', 1), ('B', 0), ('B', 1), ('C', 0), ('C', 1)]
[('A', 'spades'), ('A', 'hearts'), ('A', 'diamonds'), ('A', 'clubs'), ('K', 'spades'), ('K', 'hearts'), ('K', 'diamonds'), ('K', 'clubs')]
[('A',), ('B',), ('C',)]
[('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'A'), ('B', 'B'), ('B', 'C'), ('C', 'A'), ('C', 'B'), ('C', 'C')]
[(0, 0, 0), (0, 0, 1), (0, 1, 0), (0, 1, 1), (1, 0, 0), (1, 0, 1), (1, 1, 0), (1, 1, 1)]
('A', 0, 'A', 0)
('A', 0, 'A', 1)
('A', 0, 'B', 0)
('A', 0, 'B', 1)
('A', 1, 'A', 0)
('A', 1, 'A', 1)
('A', 1, 'B', 0)
('A', 1, 'B', 1)
('B', 0, 'A', 0)
('B', 0, 'A', 1)
('B', 0, 'B', 0)
('B', 0, 'B', 1)
('B', 1, 'A', 0)
('B', 1, 'A', 1)
('B', 1, 'B', 0)
('B', 1, 'B', 1)


In [110]:
ct = itertools.count()
print(next(ct))
print(next(ct), next(ct), next(ct))
print(list(itertools.islice(itertools.count(1, 0.3), 3)))
cy = itertools.cycle('ABC')
print(next(cy))
print(list(itertools.islice(cy, 7)))
rp = itertools.repeat(7)
print(next(rp), next(rp))
print(list(itertools.repeat(8,4)))
print(list(map(operator.mul, range(11), itertools.repeat(5))))

0
1 2 3
[1, 1.3, 1.6]
A
['B', 'C', 'A', 'B', 'C', 'A', 'B']
7 7
[8, 8, 8, 8]
[0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50]


In [111]:
print(list(itertools.combinations('ABC', 2)))
print(list(itertools.combinations_with_replacement('ABC', 2)))
print(list(itertools.permutations('ABC',2)))
print(list(itertools.product('ABC', repeat=2)))

[('A', 'B'), ('A', 'C'), ('B', 'C')]
[('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'B'), ('B', 'C'), ('C', 'C')]
[('A', 'B'), ('A', 'C'), ('B', 'A'), ('B', 'C'), ('C', 'A'), ('C', 'B')]
[('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'A'), ('B', 'B'), ('B', 'C'), ('C', 'A'), ('C', 'B'), ('C', 'C')]


In [115]:
print(list(itertools.groupby('LLLLAAGGG')))
for ch, group in itertools.groupby('LLLLAAGGG'):
    print('{} -> {}'.format(ch, list(group)))
print('------------------------------------')    
animals = ['aaaa', 'bb', 'ccc', 'dddd', 'eeeeeee', 'fff']
animals.sort(key=len)
print(animals)
print('------------------------------------')
for length, group in itertools.groupby(animals, len):
    print('{} -> {}'.format(length, list(group)))
print('------------------------------------')
for length, group in itertools.groupby(reversed(animals), len):
    print('{} -> {}'.format(length, list(group)))

[('L', <itertools._grouper object at 0x7f2f736c9198>), ('A', <itertools._grouper object at 0x7f2f736c9e10>), ('G', <itertools._grouper object at 0x7f2f736c9710>)]
L -> ['L', 'L', 'L', 'L']
A -> ['A', 'A']
G -> ['G', 'G', 'G']
------------------------------------
['bb', 'ccc', 'fff', 'aaaa', 'dddd', 'eeeeeee']
------------------------------------
2 -> ['bb']
3 -> ['ccc', 'fff']
4 -> ['aaaa', 'dddd']
7 -> ['eeeeeee']
------------------------------------
7 -> ['eeeeeee']
4 -> ['dddd', 'aaaa']
3 -> ['fff', 'ccc']
2 -> ['bb']


In [117]:
print(list(itertools.tee('ABC')))
g1, g2 = itertools.tee('ABC')
print(next(g1))
print(next(g2))
print(next(g2))
print(next(g2))
print(list(g1))
print(list(g2))
print(list(zip(*itertools.tee('ABC'))))

[<itertools._tee object at 0x7f2f880e1508>, <itertools._tee object at 0x7f2f880e1748>]
A
A
B
C
['B', 'C']
[]
[('A', 'A'), ('B', 'B'), ('C', 'C')]


## 14.10 yield from
- 보통, 다른 generator에서 생성된 값을 상위 generator function이 생성해야 할 때는 중첩된 for loop을 사용함
- 이를 yield from 으로 대체!!
    - 가독성도 좋지만, 단순한 편리 구문처럼 보임
    - for loop을 대체할 뿐만 아니라, 외부 generator의 호출자와 내부 generator를 연결하는 통로를 만ㄷ름
        - Generatorfmf coroutine으로 사용하여, 호출자 코드에 값을 생성해줄 뿐만 아니라, 호출자 코드에서 가져온 값을 소비하는 경우, 이게 더욱 중요해짐
        - Chapter16의 coroutine에서 더 자세히 다룸

In [95]:
def chain(*iterables):
    for it in iterables:
        for i in it:
            yield i
            
def chain2(*iterables):
    for i in iterables:
        yield from i
        
s = 'ABC'
t = tuple(range(3))
print(list(chain(s,t)))
print(list(chain2(s,t)))

['A', 'B', 'C', 0, 1, 2]
['A', 'B', 'C', 0, 1, 2]


## 14.11 Iterables를 reduce하는 functions
- 반복형을 입력받아 하나의 값을 반환하는 함수
- 'reduce', 'folding', 'accumulate' function으로 불림
- all(), any(), max(), min(), functools.reduce(), sum()

In [96]:
print(all([1,2,3]))
print(all([1,0,3]))
print(all([]))
print(any([1,2,3]))
print(all([1,0,3]))
print(all([0, 0.0]))
print(all([]))
g = (n for n in [0, 0.0, 7, 8])
print(any(g))
print(next(g))

True
False
True
True
False
False
True
True
8


## 14.12 iter() functions
- Python은 어떤 object x를 반복해야 할 때, iter(x)를 호출함
- 그러나 이 함수는 일반 함수나 callable object로부터 iterator를 생성하기 위해 두 개의 parameters를 전달해서 호출할 수도 있음
    - 이를 위해서는, 첫번째 parameter는 값을 생성하기 위해 parameter없이 반복적으로 호출되는 callable이어야 함
    - 두 번째 인수는 구분표시(sentinel)로서 callable에서 이 값이 반환되면 iterator가 StopIteration 예외를 발생시키도록 만듦
    - 아래 예제는 1이 나올때 까지 육며체 구사위를 굴리기 위해 iter()함수를 사용하는 방법을 나타냄

In [101]:
import random
def d6():
    return random.randint(1,6)

d6_iter = iter(d6, 1)
print(d6_iter)
for i, roll in enumerate(d6_iter):
    print("{}-th roll: {}".format(i, roll))

<callable_iterator object at 0x7f2f737b83c8>
0-th roll: 2
1-th roll: 4
