## [함수형 프로그래밍 HOWTO (3)](https://docs.python.org/ko/3/howto/functional.html)

<목차>
- 내장함수 : **map**(f, iterA, iterB, ...), **filter**(predicate, iter), **enumerate**(iter, start=0), **sorted**(iterable, key=None, reverse=False) , **all**(iter), **any**(iter), **zip**(iterA, iterB, ...)
- itertools 모듈
  - 새로운 이터레이터 만들기 : .**count**(start, stop), .**cycle**(iter), .**repeat**(elem, n), .**chain**(iterA, iterB, ...), .**islice**(iter, [start], stop, [step]), .**tee**(iter, n), .**accumulate**(iter, func=operator.add)
  - 요소에 대한 함수 호출 : .**starmap**(func, iter)
  - 요소 선택하기 : .**filterfalse**(pred, iter), .**takewhile**(pred, iter), .**dropwhile**(pred, iter), .**compress**(data, selectors)
  - 요소 분류 : .**groupby**(iter, key_func=None)
  - 조합함수 : .**combinations**(iter, r), .**permutations**(iter, r=None), .**combinations_with_replacement**(iter, r) 

<총평>
- 잘 기억해 뒀다가, 필요할 때마다 다양하게 사용해 보는 것이 좋은 것 같다.
- map, filter는 이터레이터 객체이므로, 자료형으로 반환하려면 list()로 감싼다. 
- sorted는 자료형을 그대로 반환한다.
- any, all은 boolean을 반환하므로 슬라이싱을 위한 인덱스로 자주 사용하도록 한다.
- itertools.filterfalse(predicate, iter)는 filter()와 반대이고, takewhile은 dropwhile의 반대이다. 한쪽만 잘 익힌다면, 굳이 반대의미를 가지는 것을 쓸 이유가 있나 싶다.
- https://docs.python.org/ko/3/library/itertools.html#module-itertools 를 상시 참조한다.

### 내장 함수
- 파이썬의 두 가지 내장 함수인 map() 와 filter() 는 제너레이터 표현식의 기능을 복제한다.  
==> <span style="color:yellowgreen"> f(iterA[0]), f(iterA[1]) 이런식으로 iter의 내부 요소가 함수에 다중으로 적용될 수 있게 복사한다고 공식문서는 표현하였다. </span>

##### map(function, iterA, iterB, ...)
- 다음과 같은 시퀀스에 대한 이터레이터를 반환한다.
- function(iterA[0], iterB[0]), function(iterA[1], iterB[1]), function(iterA[2], iterB[2]), ....

In [9]:
def upper(s):
    return s.upper()
print(map(upper, ['sentence', 'fragment']))
print(list(map(upper, ['sentence', 'fragment']))) # 이터레이터를 데이터 형으로 변환
print([upper(s) for s in (['sentence', 'fragment'])])

<map object at 0x000001F834EC5490>
['SENTENCE', 'FRAGMENT']
['SENTENCE', 'FRAGMENT']


##### filter(predicate, iter)
- 특정 조건을 만족하는 모든 시퀀스 요소에 대한 이터레이터를 반환한다.
- map과 마찬가지로 리스트 컴프리핸션에 의해 복제 된다  
==> <span style="color:yellowgreen"> 함수에 반환 값을 남기는 map과는 달리 Boolean 값이 True인 경우만 남긴다. </span>

In [10]:
def is_even(x):
    return (x % 2) == 0

print(list(filter(is_even, range(10))))
print([x for x in range(10) if is_even(x)])

[0, 2, 4, 6, 8]
[0, 2, 4, 6, 8]


In [None]:
existing_files = filter(os.path.exists, file_list)

##### enumerate(iter, start=0)
- 카운트(start 부터)와 각 요소를 포함하는 2-튜플을 반환하는 이터러블의 요소를 계산

#### sorted(iterable, key=None, reverse=False)
- 이터러블의 모든 요소를 리스트로 모으고, 리스트를 정렬하고, 정렬된 결과를 반환
- key 와 reverse 인자는 생성된 리스트의 sort() 메서드로 전달

#### zip(iterA, iterB, ...)
- 각 이터러블에서 한 요소를 취해 튜플로 반환

In [13]:
z1 = zip(['a', 'b', 'c'], (1, 2, 3))
print(zip)
print(list(z1))

z2 = zip(['a', 'b', 'c', 'd'], (1, 2, 3, 4, 5))
print(list(z2))

<class 'zip'>
[('a', 1), ('b', 2), ('c', 3)]
[('a', 1), ('b', 2), ('c', 3), ('d', 4)]


#### any(iter), all(iter)

In [14]:
print(any([0, 1, 0]))
print(any([0, 0, 0]))
print(any([0, 1, 1]))

print()

print(all([0, 1, 0]))
print(all([0, 0, 0]))
print(all([1, 1, 1]))



True
False
True

False
False
True


#### itertools 모듈
모듈의 기능은 몇가지 광범위한 클래스로 분류 됩니다  
- 새로운 이터레이터를 만드는 함수
- 이터레이터의 요소를 함수의 인자로 처리하는 함수
- 이터레이터의 출력을 선택하는 함수
- 이터레이터의 출력을 분류하는 함수

##### 1) 새로운 이터레이터 만들기

- itertools.count(start, step) 는 균등하게 간격을 둔 값들의 무한한 스트림을 반환

In [14]:
import itertools
it1 = itertools.count() # ==> 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, ...
it2 = itertools.count(10) # ==> 10, 11, 12, 13, 14, 15, 16, ...
it3 = itertools.count(10, 5) # ==> 10, 15, 20, 25, ...
print(next(it1))
print(next(it1))

print()

print(next(it2))
print(next(it2))

print()

print(next(it3))
print(next(it3))

0
1

10
11

10
15


- itertools.cycle(iter) 은 제공된 이터러블의 내용 사본을 저장하고 처음부터 마지막까지 요소를 반환하는 새로운 이터레이터를 반환

In [26]:
it = itertools.cycle([1, 2, 3])
print(next(it))
print(next(it))
print(next(it))
print(next(it))
print(next(it))

1
2
3
1
2


- itertools.repeat(elem, [n]) 는 제공된 요소를 n 번 반환하거나, n 이 제공되지 않으면 끝없이 요소를 반환

In [16]:
it = itertools.repeat('abc', 3)
print(next(it))
print(next(it))
print(next(it))
# print(next(it)) # error

it2 = itertools.repeat('cdf')
print(next(it2))

abc
abc
abc
cdf


##### itertools.chain(iterA, iterB, ...)
- 임의의 수의 이터러블을 입력으로 취하여, 첫 번째 이터러블의 모든 요소를 반환한 다음 두 번째 요소의 모든 요소를 반환
- 모든 이터러블이 다 소모될 때까지 이 동작을 반복

In [19]:
# 리스트와 튜플 모두 이터러블이기 때문에 연결
it = itertools.chain(['a', 'b', 'c'], (1, 2))
print(next(it))
print(next(it))
print(next(it))
print(next(it))
print(next(it))
print(next(it)) # error

a
b
c
1
2


StopIteration: 

##### itertools.islice(iter, [start], stop, [step])
- 이터레이터의 조각 스트림을 반환. 

In [24]:
it = itertools.islice(range(10), 5)
print(next(it))
print(next(it))
print(next(it))

print()

it2 = itertools.islice(range(10), 2, 5)
print(next(it2))
print(next(it2))
print(next(it2))
#print(next(it2))

print()

it3 = itertools.islice(range(10), 2, 5, 2)
print(next(it3))
print(next(it3))
#print(next(it3)) #error


0
1
2

2
3
4

2
4


##### itertools.tee(iter, [n])
-  이터레이터를 복제. 원본 이터레이터의 내용을 모두 반환하는 n개의 독립적인 이터레이터를 반환
n에 대해 값을 제공하지 않으면 디폴트 '2'  

In [27]:
it = itertools.tee(itertools.count(10), 3) # 이터레이터 3개를 반환
print(it)
print(next(it[0]))
print(next(it[1]))
print(next(it[2]))

print()

print(next(it[0]))
print(next(it[1]))
print(next(it[2]))

(<itertools._tee object at 0x000001F834E76380>, <itertools._tee object at 0x000001F834E76600>, <itertools._tee object at 0x000001F834E76040>)
10
10
10

11
11
11


##### itertools.accumulate(iterable, func=operator.add)
- functools.reduce와 차이를 파악하도록 한다. 결과 값을 반환하는 functools.reduce와는 달리 itertools.accumulate는 이터레이터를 반환한다.

In [None]:
import itertools

it = itertools.accumulate([1, 2, 3, 4, 5])
print(next(it))
print(next(it))
print(next(it))
print(next(it))

print()

it = itertools.accumulate([1, 2, 3, 4, 5], func=operator.mul)
print(next(it))
print(next(it))
print(next(it))
print(next(it))

1
3
6
10

1
2
6
24


In [1]:
# 1월에서 12월 동안 그때까지의 최대 월수입을 표시하고 싶다면, 함수 두번째 인자로 max를 전달한다.
import itertools
monthly_income = [1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]
result = list(itertools.accumulate(monthly_income, max))
print(result)

[1161, 1814, 1814, 2256, 2256, 2256, 2256, 2256, 2450, 2823, 2823, 2823]


#### 2) 요소에 대한 함수 호출
- operator 모듈은 파이썬의 연산자에 대응하는 함수 집합을 포함
- 예를 들어 operator.add(a, b) (두 개의 값을 더하기), operator.ne(a, b) (a != b 와 동일) 및 operator.attrgetter('id') (.id 어트리뷰트를 가져오는 콜러블을 반환)와 같은 함수가 있다.

In [29]:
it = itertools.starmap(os.path.join,
                  [('/bin', 'python'), ('/usr', 'bin', 'java'),
                   ('/usr', 'bin', 'perl'), ('/usr', 'bin', 'ruby')])

print(next(it))
print(next(it))
print(next(it))
print(next(it))
#print(next(it))

/bin\python
/usr\bin\java
/usr\bin\perl
/usr\bin\ruby


In [28]:
# 위와 유사하게 아래도 동작할 거라 생각했지만, 동작하지 않는다.
it2 = map(os.path.join, [('/bin', 'python'), ('/usr', 'bin', 'java'),
                   ('/usr', 'bin', 'perl'), ('/usr', 'bin', 'ruby')])
print(next(it2))

TypeError: expected str, bytes or os.PathLike object, not tuple

#### 3) 요소 선택하기

#### itertools.takewhile(predicate, iter)
- predicate가 참을 반환하는 한 요소를 반환. predicate가 거짓을 반환하면 결과 종료

In [35]:
def less_than_5(x):
    return x < 5

def is_even(x):
    return x%2 == 0

it = itertools.takewhile(less_than_5, itertools.count())
print(next(it))
print(next(it))
print(next(it))
print(next(it))
print(next(it))
#print(next(it))

print()

it2 = itertools.takewhile(is_even, itertools.count())
print(next(it2))
print(next(it2)) # error

0
1
2
3
4

0


StopIteration: 

In [36]:
it3 = itertools.dropwhile(less_than_5, itertools.count())
print(next(it3))
print(next(it3))
print(next(it3))
print(next(it3))

5
6
7
8


##### itertools.compress(data, selectors)
- 두 개의 이터레이터를 취하고 selectors 의 해당 요소가 참인 data 의 요소만을 반환하고, 한쪽이 고갈될 때마다 중단

In [38]:
it = itertools.compress([1, 2, 3, 4, 5], [True, True, False, False, True])
print(next(it))
print(next(it))
print(next(it))

1
2
5


#### 4) 요소 분류
- key_func(elem)는 이터러블에 의해 반환된 각 요소에 대한 키 값을 계산할 수 있는 함수
- 키 함수를 제공하지 않으면 키는 단순히 각 요소 자체
- groupby() 는 이터러블 내부에서 키값이 같은 연속된 모든 요소를 수집하여 키값과 해당 키를 가진 요소의 이터러블을 포함하는 2-튜플의 스트림을 반환

In [46]:
city_list = [('Decatur', 'AL'), ('Huntsville', 'AL'), ('Selma', 'AL'),
             ('Anchorage', 'AK'), ('Nome', 'AK'),
             ('Flagstaff', 'AZ'), ('Phoenix', 'AZ'), ('Tucson', 'AZ')
            ]

def get_state(city_state):
    return city_state[1]

print(itertools.groupby(city_list, get_state))
it = itertools.groupby(city_list, get_state)

print(next(it))
print()
print(next(it))
print(next(it))


<itertools.groupby object at 0x000001F8353EB450>
('AL', <itertools._grouper object at 0x000001F8351044F0>)
('AK', <itertools._grouper object at 0x000001F8351041F0>)
('AZ', <itertools._grouper object at 0x000001F8351044F0>)


### 조합함수
- itertools.combinations(iterable, r) 는 iterable 에 포함된 모든 요소의 가능한 r-튜플 조합을 제공하는 이터레이터를 반환
- itertools.combinations_with_replacement(iterable, r) 함수는 다른 제약을 완화. 단일 튜플 내에서 반복될 수 있다

In [4]:
it = itertools.combinations([1, 2, 3, 4, 5], 3)
print(next(it))
print(next(it))
print(next(it))
print(next(it))
print(next(it))

print()

it2 = itertools.combinations_with_replacement([1, 2, 3, 4, 5], 3) 
print(next(it2))
print(next(it2))
print(next(it2))
print(next(it2))
print(next(it2))

(1, 2, 3)
(1, 2, 4)
(1, 2, 5)
(1, 3, 4)
(1, 3, 5)

(1, 1, 1)
(1, 1, 2)
(1, 1, 3)
(1, 1, 4)
(1, 1, 5)


### 순열 함수
- itertools.permutatons(iterable, r=None)은 순열 반환한다

In [37]:
it = itertools.permutations([1, 2, 3, 4, 5], 3)
print(next(it))
print(next(it))
print(next(it))
print(next(it))
print(next(it))
print(next(it))
print(next(it))

(1, 2, 3)
(1, 2, 4)
(1, 2, 5)
(1, 3, 2)
(1, 3, 4)
(1, 3, 5)
(1, 4, 2)
