## itertools

- Python 에서 제공하는 자신만의 반복자를 만드는 훌륭한 모듈 
- 모듈은 APL, Haskell 및 SML의 구성 요소에서 영감을 받은 반복기 빌딩 블록을 구현하며 각각은 파이썬에 적합한 형태로 재 작성



In [1]:
import itertools

### chain

- iterator(list, tuple, iterables)를 쭉 연결

In [3]:
letters = ['a', 'b', 'c', 'd', 'e', 'f']
booleans = [1, 0, 1, 0, 0, 1]
decimals = [0.1, 0.7, 0.4, 0.4, 0.5]

print(list(itertools.chain(letters, booleans, decimals)))

['a', 'b', 'c', 'd', 'e', 'f', 1, 0, 1, 0, 0, 1, 0.1, 0.7, 0.4, 0.4, 0.5]


In [4]:
letters = ['a', 'b', 'c', 'd', 'e', 'f']
booleans = (1, 0, 1, 0, 0, 1)
decimals = [0.1, 0.7, 0.4, 0.4, 0.5]

print(list(itertools.chain(letters, booleans, decimals)))

['a', 'b', 'c', 'd', 'e', 'f', 1, 0, 1, 0, 0, 1, 0.1, 0.7, 0.4, 0.4, 0.5]


### groupby

- iterable에서 연속적인 키와 그룹을 반환하는 이터레이터를 만듬
- key는 각 요소의 키값을 계산하는 함수
- 지정되지 않거나 None이면, key의 기본값은 항등함수(identity function)이고 요소를 변경하지 않고 반환
- 일반적으로, iterable은 같은 키 함수로 이미 정렬되어 있어야 함

- groupby()의 작동은 유닉스의 uniq 필터와 유사 
- 키 함수의 값이 변경될 때마다 중단(break)이나 새 그룹을 생성(이것이 일반적으로 같은 키 함수를 사용하여 데이터를 정렬해야 하는 이유입니다)
- iterable을 key값으로 분류한 결과를 리턴하는 함수

- https://wikidocs.net/108940

In [7]:
from operator import itemgetter
from itertools import groupby

attempts = [
    ('dan', 87),
    ('erik', 95),
    ('jason', 79),
    ('erik', 97),
    ('dan', 100)
]

# Sort the list by name for groupby
attempts.sort(key=itemgetter(0))

# Create a dictionary such that name: scores_list
print({key: sorted(map(itemgetter(1), value)) for key, value in groupby(attempts, key=itemgetter(0))})
# {'dan': [87, 100], 'jason': [79], 'erik': [95, 97]}


{'dan': [87, 100], 'erik': [95, 97], 'jason': [79]}


In [14]:
[k for k, g in groupby('AAAABBBCCDAABBB')] #--> A B C D A B

['A', 'B', 'C', 'D', 'A', 'B']

In [15]:
[list(g) for k, g in groupby('AAAABBBCCD')]  #--> AAAA BBB CC D

[['A', 'A', 'A', 'A'], ['B', 'B', 'B'], ['C', 'C'], ['D']]

In [16]:
data = [
    {'name': '이민서', 'blood': 'O'},
    {'name': '이영순', 'blood': 'B'},
    {'name': '이상호', 'blood': 'AB'},
    {'name': '김지민', 'blood': 'B'},
    {'name': '최상현', 'blood': 'AB'},
    {'name': '김지아', 'blood': 'A'},
    {'name': '손우진', 'blood': 'A'},
    {'name': '박은주', 'blood': 'A'}
]

In [17]:
import operator
data = sorted(data, key=operator.itemgetter('blood'))

In [20]:
import pprint
pprint.pprint(data)

[{'blood': 'A', 'name': '김지아'},
 {'blood': 'A', 'name': '손우진'},
 {'blood': 'A', 'name': '박은주'},
 {'blood': 'AB', 'name': '이상호'},
 {'blood': 'AB', 'name': '최상현'},
 {'blood': 'B', 'name': '이영순'},
 {'blood': 'B', 'name': '김지민'},
 {'blood': 'O', 'name': '이민서'}]


In [21]:
import itertools
grouped_data = itertools.groupby(data, key=operator.itemgetter('blood'))

In [22]:
grouped_data

<itertools.groupby at 0x7f8fe00a8810>