## map/filter/reduce
*함수형언어를 위한 삼총사*

- map, filter, reduce 함수들은 **함수형 언어**에서 주로 등장합니다.
- 입력값으로 들어온 객체를 변경하지 않습니다.
- <font color="red">**항상 새로운 객체**</font>를 return합니다.
- *분산병렬처리에 유용합니다.*

In [5]:
# map : 전체 집합에 대한 재처리
def pow(x):
    return x*x

(
    list(map(str, range(10))),
    list(map(lambda x:x+1, range(10))),
    list(map(pow, range(10))),
)

(['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'],
 [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
 [0, 1, 4, 9, 16, 25, 36, 49, 64, 81])

In [1]:
# filter: 전체 집합에 대한 filtering
(
    list(filter(lambda n: n%2, range(6)))
)

[1, 3, 5]

In [6]:
# reducer : 전체 집합을 하나의 값으로
from functools import reduce
(
    reduce(lambda x,y: x+y, [0,1,2,3]),
    
)

6

map, filter, reduce와 같은 함수들은 점점 설 자리를 잃어가고 있습니다.
**reduce는 python version이 up되면서 심지어 builtin함수에서 모듈레벨로 밀려났습니다.**

-> 훨씬 표현력이 좋다고 여겨지는 List Comprehension부류가 있기 때문입니다. 그리고 python maintainer들이 lambda를 싫어하기도 하고요.

In [2]:
# 같은 표현, 무엇이 더 보기 좋은가요? 여러분의 선택은?
def pow(x):
    return x*x

m1 = map(pow, filter(lambda n: n%2, range(6)))
m2 = [pow(n) for n in range(6) if n % 2]

(
    list(m1),
    list(m2),
)

([1, 9, 25], [1, 9, 25])

## 그 밖의 reducer, 재처리 함수들
*sorted/reversed/all/any 등등, 알아두면 종종 유용합니다.*

In [3]:
# sorted
import random
lst = list(range(10))
random.shuffle(lst)

rst = sorted(lst)
(
    rst,
    lst
)

[7, 0, 5, 2, 9, 8, 4, 6, 1, 3]


([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], [7, 0, 5, 2, 9, 8, 4, 6, 1, 3])

In [12]:
# sorted는 key와 함께 사용할 수 있습니다. sort도 마찬가지
sorted(range(15, 25), key=lambda x: str(x)[-1])

[20, 21, 22, 23, 24, 15, 16, 17, 18, 19]

In [33]:
list(reversed(lst))

[0, 1, 3, 7, 2, 9, 8, 4, 6, 5]

In [36]:
all([1,2,3]), all([0,1,2])

(True, False)

In [4]:
any([1,0,-1]), any([0,0,0])

(True, False)

새로운 생성 없이 현재의 값을 변경하고자 한다면? 정렬의 두가지 케이스를 분리해서 기억하세요!

In [14]:
# sorted
import random
lst = list(range(10))
random.shuffle(lst)

# sort (in place)
lst.sort()
lst 

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [3]:
lst = [1,2,3,5,4]
lst.sort()
lst.reverse()
lst

[5, 4, 3, 2, 1]

정리하자면, 
- map은 목록의 재처리를 위한 용도로
- filter는 전달된 표현식이 참인것만 필터처리
- reduce는 목록을 하나의 값으로 재처리하기 위한 용도로 (sum을 생각하면 편해요)
- sorted는 정렬
- reversed는 역순

이런 목록성 데이터에 대한 재처리함수유형은 기억하고 있으면 또 만날 수 있습니다.
python에서는 많이 사용되는 builtin함수들(reduce빼고)입니다.

partial - 함수PARAMETER일부를 고정하기

In [8]:
from functools import partial

def multiply(x,y):
    return x * y

# create a new function that multiplies by 2
dbl = partial(multiply,2)
print(dbl(4))

8


In [17]:
# EXERCISE
# Following is the exercise, function provided:
from functools import partial
def func(u,v,w,x):
    return u*4 + v*3 + w*2 + x

# u,v,w를 5,6,7로 고정한 새로운 함수를 만들어보세요.
# f(8) = 60
f = partial(func, 5,6,7)
f(8)

def outer(x):
    return func(5,6,7,x)

outer(8)

60

In [17]:
# EXERCISE
from collections import namedtuple
from datetime import datetime
SampleData = namedtuple('SampleData', 'state,value,time')

s1 = SampleData(state='draft', value=10, time=datetime.now())
s2 = SampleData(state='draft', value=9, time=datetime.now())
s3 = SampleData(state='draft', value=9, time=datetime.now())

# SampleData의 state를 'draft', time을 현재시점으로 고정하는
# 신규객체를 만들어내는 새로운 함수를 만들어보세요.
# DraftSampleData(value=9)
# DraftSampleData(value=10)

In [3]:
# exercise
# 2018년 5월 8일을 기준으로 timedelta를 return해주는 나만의 함수를 만들어보세요

from functools import partial
from datetime import datetime, timedelta

base = datetime.strptime('20180508', '%Y%m%d')
datetime.now() - base

datetime.timedelta(0, 58740, 600025)

## EXERCISE

In [23]:
# 다음문자열을 단어로 쪼개서 리스트로 만듭니다.
lst = "BD BR CD CN DE EG et FR ID IN ir jp KR MX NG PH PK RU TR US VN"

# 문자목록중 소문자는 버리겠습니다. (filter)
# lst = list(filter(lambda x:x.isupper(), lst.split()))

# RU도 버리겠습니다. (filter)
lst = list(filter(lambda x:x.isupper() or x == 'RU', lst.split()))

# 각 단어를 소문자로 재처리합니다. (map)
lst = list(map(str.lower, lst))

# 각 단어의 앞글자만으로 구성된 문장을 만들어주세요. (map)
# lst = ''.join(map(lambda x: x[0], lst))

# 역순으로 정렬 후 (reversed)
lst = ''.join(reversed(list(map(lambda x: x[0], lst))))

# 마지막 문장중에 n이 있나요?
lst.endswith('n')

# list-comprehension으로 바꾸어보세요!
lst

False