### accumulate

누적 합계나 다른 함수(func 인자를 통해 지정된)의 누적 결과를 반환하는 이터레이터를 만든다.<br>

func가 제공되면, 두 인자를 취하는 함수여야 하고 iterable한 요소를 지원해야 한다. 즉, 연산을 할 수 있는 함수여야 하는 것이다. 그리고 출력되는 요소는 입력의 길이와 누적되고, 초기값으로 부터 시작해서 누적 연산 된 값을 반환다.

이 함수는 functools에 있는 reduce와 유사하다.

In [6]:
from itertools import accumulate
import operator
data = [3, 4, 6, 2, 1, 9, 0, 7, 5, 8]
print("누적 합", list(accumulate(data)))
print("누적 곱", list(accumulate(data,operator.mul)))
print("누적 최대", list(accumulate(data,max)))

누적 합 [3, 7, 13, 15, 16, 25, 25, 32, 37, 45]
누적 곱 [3, 12, 72, 144, 144, 1296, 0, 0, 0, 0]
누적 최대 [3, 4, 6, 6, 6, 9, 9, 9, 9, 9]


### chain
여러 iterable을 하나의 iterable처럼 처리할 수 있도록 한다.

In [10]:
from itertools import chain

c = chain('ABC','DEF','GHI')
list(c)

['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I']

#### from_iterable
chain()의 클래스 메서드. chain과 다른 점은 chain은 입력값으로 여러개를 받을 수 있지만, from_iterable은 단일 iteable 안에 인자로 부여해야 한다.

In [12]:
c = chain.from_iterable(['ABC','DEF','GHI'])
list(c)

['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I']

### combinations
입력 iterable에서 요소의 길이 r에 해당하는 서브 시퀀스들을 생성한다.

조합은 입력 iterable의 순서에 따라 사전식으로 반환한다. 따라서 입력 iterable이 정렬되어 있으면, combinations도 정렬된 순서로 생성한다.

요소는 값이 아니라 위치로 고유성을 다루기 때문에, 같은 값을 가지고 있어도 조합식을 생성한다.

In [14]:
from itertools import combinations

c = list(combinations(['A','B','B','C','D'],2))
c

[('A', 'B'),
 ('A', 'B'),
 ('A', 'C'),
 ('A', 'D'),
 ('B', 'B'),
 ('B', 'C'),
 ('B', 'D'),
 ('B', 'C'),
 ('B', 'D'),
 ('C', 'D')]

### combinations_with_replacement
입력 iterable에서 요소의 길이 r에 해당하는 서브 시퀀스들을 생성하는데, 요소를 두 번 이상 반복할 수 있다. 즉, 본인 값도 포함하여 조합을 생성한다.

조합은 입력 iterable의 순서에 따라 사전식으로 반환한다. 따라서 입력 iterable이 정렬되어 있으면, combinations도 정렬된 순서로 생성한다.

요소는 값이 아니라 위치로 고유성을 다루기 때문에, 같은 값을 가지고 있어도 조합식을 생성한다.

In [15]:
from itertools import combinations_with_replacement

c = list(combinations_with_replacement(['A','B','B','C','D'],2))
c

[('A', 'A'),
 ('A', 'B'),
 ('A', 'B'),
 ('A', 'C'),
 ('A', 'D'),
 ('B', 'B'),
 ('B', 'B'),
 ('B', 'C'),
 ('B', 'D'),
 ('B', 'B'),
 ('B', 'C'),
 ('B', 'D'),
 ('C', 'C'),
 ('C', 'D'),
 ('D', 'D')]

### compress

data에서 selector에서 True로 선택된 요소들만 반환하는 이터레이터를 만든다. data나 selectors iterable이 모두 소진되면 중지한다.

In [4]:
from itertools import compress

print(list(compress('ABCDEF',[1,0,1,0,1,1])))
#selector가 먼저 끝남
print(list(compress('ABCDEF',[1,0,1,0,1])))
#data가 먼저 끝남
print(list(compress('ABCDE',[1,0,1,0,1,1])))

['A', 'C', 'E', 'F']
['A', 'C', 'E']
['A', 'C', 'E']


### count

숫자 start로 시작해서 균등 간격의 값을 반환하는 이터레이터를 만든다.(무한히 증가한다.)

In [11]:
from itertools import count

for i in count(10):
    if not i%10:
        print(i)
    if i==100:
        print("fin")
        break

10
20
30
40
50
60
70
80
90
100
fin


In [10]:
from itertools import count

for i in count(2.5,0.5):
    if i==int(i):
        print(i)
    if i==10:
        print("fin")
        break

3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
fin


### cycle

iterable에서 요소를 반환하고 각 사본을 저장하는 이터레이터를 만든다. iterable이 소진되면, 저장된 사본에서 요소를 반환한다. 이는 무한히 반복한다.

In [12]:
from itertools import cycle

for i,v in enumerate(cycle('ABCD')):
    print(v)
    if i==10:
        break

A
B
C
D
A
B
C
D
A
B
C


### dropwhile

predicate가 참인 iterable에서 요소를 걸러내는 이터레이터를 만든다. 그 후에 모든 요소를 반환한다. 즉 조건이 거짓인 시점 이후로 모든 값을 반환한다.

In [14]:
from itertools import dropwhile

print(list(dropwhile(lambda x: x< 5, [1,4,6,4,1])))

[6, 4, 1]


### filterfalse

iterable에서 요소를 걸러내어 predicate가 False인 요소만 반환하는 iterable을 만든다.

In [15]:
from itertools import filterfalse

print(list(filterfalse(lambda x: x%2==1, range(10))))

[0, 2, 4, 6, 8]


### groupby

iterable을 key값으로 분류한 결과를 리턴하는 함수다. key는 분류의 기준이 되는 함수다. key 값을 부여하지 않으면 identity function이고 요소를 변경하지 않고 반환한다. groupby를 사용하기 전에 key를 기준으로 정렬을 진행해야 한다.

In [16]:
data = [
    {'name': '김경훈', 'grade': 'A'},
    {'name': '김휘군', 'grade': 'B'},
    {'name': '박진욱', 'grade': 'A'},
    {'name': '이지은', 'grade': 'C'},
    {'name': '서주연', 'grade': 'A'},
    {'name': '조준흠', 'grade': 'D'},
    {'name': '홍정수', 'grade': 'C'},
    {'name': '박성민', 'grade': 'B'}
]

In [18]:
data = sorted(data,key=lambda x: x['grade'])
data

[{'name': '김경훈', 'grade': 'A'},
 {'name': '박진욱', 'grade': 'A'},
 {'name': '서주연', 'grade': 'A'},
 {'name': '김휘군', 'grade': 'B'},
 {'name': '박성민', 'grade': 'B'},
 {'name': '이지은', 'grade': 'C'},
 {'name': '홍정수', 'grade': 'C'},
 {'name': '조준흠', 'grade': 'D'}]

In [20]:
from itertools import groupby

grouped_data = groupby(data,key=lambda x: x['grade'])
result = {}
for key, group_data in grouped_data:
    result[key] = list(group_data)
    
from pprint import pprint
pprint(result)

{'A': [{'grade': 'A', 'name': '김경훈'},
       {'grade': 'A', 'name': '박진욱'},
       {'grade': 'A', 'name': '서주연'}],
 'B': [{'grade': 'B', 'name': '김휘군'}, {'grade': 'B', 'name': '박성민'}],
 'C': [{'grade': 'C', 'name': '이지은'}, {'grade': 'C', 'name': '홍정수'}],
 'D': [{'grade': 'D', 'name': '조준흠'}]}


### islice

iterable에서 선택된 요소를 반환하는 이터레이터를 만든다. start, stop, step을 지정할 수 있다. stop이 None일 경우 start로부터 끝까지 계속된다. start, stop, step에 음수 값을 지원하지 않는다.

In [25]:
from itertools import islice

print(list(islice('ABCDEFGH',2)))
print(list(islice('ABCDEFGH',2,5)))
print(list(islice('ABCDEFGH',2,None)))
print(list(islice('ABCDEFGH',2,None,2)))

['A', 'B']
['C', 'D', 'E']
['C', 'D', 'E', 'F', 'G', 'H']
['C', 'E', 'G']


### permutations

combinations가 조합을 생성했던것처럼 r 길이의 순열을 반환한다.
조합과 비슷하게 순열 튜플도 입력 iterable에 순서에 따라 사전식 순서로 반환한다.

In [1]:
from itertools import permutations

print(list(permutations('ABCDE',2)))

[('A', 'B'), ('A', 'C'), ('A', 'D'), ('A', 'E'), ('B', 'A'), ('B', 'C'), ('B', 'D'), ('B', 'E'), ('C', 'A'), ('C', 'B'), ('C', 'D'), ('C', 'E'), ('D', 'A'), ('D', 'B'), ('D', 'C'), ('D', 'E'), ('E', 'A'), ('E', 'B'), ('E', 'C'), ('E', 'D')]


### product

iterable들의 곱집합을 의미한다.<br> 
[x*y for x in A for y in B]와 같은 동작을 수행한다. <br>
repeat 인자를 사용하면 자신 iterable을 repeat만큼 복사한 후 곱집합을 구한다.

In [4]:
from itertools import product

print(list(product('ABCD','xy')))
print(list(product(range(2),repeat=3)))

[('A', 'x'), ('A', 'y'), ('B', 'x'), ('B', 'y'), ('C', 'x'), ('C', 'y'), ('D', 'x'), ('D', 'y')]
[(0, 0, 0), (0, 0, 1), (0, 1, 0), (0, 1, 1), (1, 0, 0), (1, 0, 1), (1, 1, 0), (1, 1, 1)]


### repeat

주어진 값을 times 만큼 반복한다. times가 주어지지 않으면 무한히 반복한다.

In [6]:
from itertools import repeat
print(list(repeat("Hello World!",4)))

['Hello World!', 'Hello World!', 'Hello World!', 'Hello World!']


### starmap

map의 \*map의 버젼. 즉, 기존 map은 iterable의 안의 item에 대해서 함수를 수행했지만, starmap은 iterable안의 iterable에 대해서 함수를 수행할 수 있도록 함

In [7]:
from itertools import starmap
print(list(starmap(pow, [(2,5),(3,2),(10,3)])))

[32, 9, 1000]


### takewhile

dropwhile의 반대버젼, iterable의 첫 거짓이 나오는 순간 멈추며 그 전까지의 iterable만 반환함

In [8]:
from itertools import takewhile
print(list(takewhile(lambda x: x<5, [1,4,6,4,1])))

[1, 4]


### tee
iterable과 복사본 갯수(n)를 입력으로 받는다. iterable을 n번 반복하여 생성한다.
다만, 해당 값을 한번 참조하고 난 뒤에는 더 이상 값에 접근할 수 없다.

In [14]:
from itertools import tee
t1,t2,t3 = tee('1234',3)
print(list(t1))
print(list(t1))
print(list(t2))
print(list(t2))
print(list(t3))
print(list(t3))

['1', '2', '3', '4']
[]
['1', '2', '3', '4']
[]
['1', '2', '3', '4']
[]


### zip_longest

기존 zip은 더 짧은 객체를 기준으로 수행되었지만, 더 긴 객체를 기준으로 zip을 수행하도록 한다.