참고: https://wikidocs.net/109315


<목차>
- itertools.groupby(iter, key)
- itertools.zip_longest()
- functools.cmp_to_key(func)
- @functools.lru_cache(maxsize=XXX)
- @functools.wraps(wrapped)

#### itertools.groupby(iter, key)
- 키 값 혹은 튜플 특정 인덱스 값으로 그루핑 할 때 유용하다

In [None]:
'''
data = [
    {'name': '이민서', 'blood': 'O'},
    {'name': '이영순', 'blood': 'B'},
    {'name': '이상호', 'blood': 'AB'},
    {'name': '김지민', 'blood': 'B'},
    {'name': '최상현', 'blood': 'AB'},
    {'name': '김지아', 'blood': 'A'},
    {'name': '손우진', 'blood': 'A'},
    {'name': '박은주', 'blood': 'A'}
]

위의 데이터를 아래와 같이 혈액형 별로 분류하고 싶다.

data = {
    'A': [{'name': '김지아', 'blood': 'A'}, {'name': '손우진', 'blood': 'A'}, {'name': '박은주', 'blood': 'A'}], 
    'AB': [{'name': '이상호', 'blood': 'AB'}, {'name': '최상현', 'blood': 'AB'}], 
    'B': [{'name': '이영순', 'blood': 'B'}, {'name': '김지민', 'blood': 'B'}], 
    'O': [{'name': '이민서', 'blood': 'O'}]
}
'''

In [2]:
import operator
from pprint import pprint

data = [
    {'name': '이민서', 'blood': 'O'},
    {'name': '이영순', 'blood': 'B'},
    {'name': '이상호', 'blood': 'AB'},
    {'name': '김지민', 'blood': 'B'},
    {'name': '최상현', 'blood': 'AB'},
    {'name': '김지아', 'blood': 'A'},
    {'name': '손우진', 'blood': 'A'},
    {'name': '박은주', 'blood': 'A'}
]

# 먼저 혈액형 순으로 정렬을 수행한다. 그렇지 않으면 그루핑 출력도 키 값이 순서가 없게 된다.
data = sorted(data, key=operator.itemgetter('blood'))

pprint(data)

[{'blood': 'A', 'name': '김지아'},
 {'blood': 'A', 'name': '손우진'},
 {'blood': 'A', 'name': '박은주'},
 {'blood': 'AB', 'name': '이상호'},
 {'blood': 'AB', 'name': '최상현'},
 {'blood': 'B', 'name': '이영순'},
 {'blood': 'B', 'name': '김지민'},
 {'blood': 'O', 'name': '이민서'}]


In [3]:
import itertools

grouped_data = itertools.groupby(data, key=operator.itemgetter('blood'))

res = {}
for key, grouped_data in grouped_data:
    res[key] = list(grouped_data)
pprint(res)

{'A': [{'blood': 'A', 'name': '김지아'},
       {'blood': 'A', 'name': '손우진'},
       {'blood': 'A', 'name': '박은주'}],
 'AB': [{'blood': 'AB', 'name': '이상호'}, {'blood': 'AB', 'name': '최상현'}],
 'B': [{'blood': 'B', 'name': '이영순'}, {'blood': 'B', 'name': '김지민'}],
 'O': [{'blood': 'O', 'name': '이민서'}]}


#### itertools.zip_longest()
- 내장함수 zip이 짧은 것을 기준으로 묶게 되는데, 긴 것을 기준으로 묶을 때 사용한다.
- None일 경우 fillvalue를 지정한 값으로 채운다.

In [None]:
import itertools

students = ['한민서', '황지민', '이영철', '이광수', '김승민']
rewards = ['사탕', '초컬릿', '젤리']

result = itertools.zip_longest(students, rewards, fillvalue='새우깡')
print(list(result))

#### functools.cmp_to_key(func)

In [7]:
'''
아래와 같은 좌표에서 y 좌표 오름 차순으로 정렬하되,
x=y 일 경우 x 좌표 오름 차순으로 정렬하고자 ㅎ나다.
[(0, 4), (1, 2), (1, -1), (2, 2), (3, 3)]
--> [(1, -1), (1, 2), (2, 2), (3, 3), (0, 4)]
'''

import functools

def xy_compare(n1, n2):
    if n1[1] > n2[1]:         # y 좌표가 크면
        return 1
    elif n1[1] == n2[1]:      # y 좌표가 같으면
        if n1[0] > n2[0]:     # x 좌표가 크면
            return 1
        elif n1[0] == n2[0]:  # x 좌표가 같으면
            return 0
        else:                 # x 좌표가 작으면
            return -1
    else:                     # y 좌표가 작으면
        return -1
    
src = [(0, 4), (1, 2), (1, -1), (2, 2), (3, 3)]
res = sorted(src, key=functools.cmp_to_key(xy_compare))
print(res) # filter, map 과 같은 내장 함수와 달리 sorted는 자료형을 반환

[(1, -1), (1, 2), (2, 2), (3, 3), (0, 4)]


#### @functools.lru_cache(maxsize=128)
- 함수의 반환 결과를 캐시하는 데코레이터. 
- 최초 요청 이후에는 캐시한 결과를 반환한다. maxsize는 캐시할 수 있는 최대 개수를 의미
- 캐시는 저장된 값을 리턴하므로, 원본 데이터의 값이 자주 바뀌는 경우라면 사용을 지양하도록 한다.

In [10]:
import urllib.request
from functools import lru_cache

@lru_cache(maxsize=128)
def get_wikidocs(page):
    print("wikidocs page: {}".format(page))
    resource = 'https://wikidocs.net/{}'.format(page)
    try:
        with urllib.request.urlopen(resource) as ru:
            return ru.read()
    except urllib.error.HTTPError:
        return 'Not Found'
    
first_6 = get_wikidocs(6)
print(first_6)
first_7 = get_wikidocs(7)
print(first_7)

second_6 = get_wikidocs(6)
second_7 = get_wikidocs(7)

assert first_6 == second_6

'''
처음 요청한 6페이지와 7페이지는 웹 요청이 발생하므로 
wikidocs page:6, wikidocs page:7과 같은 로그를 출력했지만,
이후 이를 다시 요청할 때는 함수를 호출하지 않고 캐시에 저장된 데이터를 반환하므로
로그를 출력하지 않은 것을 확인할 수 있다.
'''


wikidocs page: 6
b'\n\n\n\n<!DOCTYPE HTML>\n<html lang="ko">\n<head>\n    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">\n    <meta name="viewport" content="width=device-width, initial-scale=1.0">\n    <meta name="google-site-verification" content="mzkAy71X1qQFWihQN535LoiToXg34MUg9nuor7Og9E8" />\n    <meta name="naver-site-verification" content="d7c116bce998e6961b8db93c8592550f1a82119f"/>\n    <meta name="description" content="\xec\x98\xa8\xeb\x9d\xbc\xec\x9d\xb8 \xec\xb1\x85\xec\x9d\x84 \xec\xa0\x9c\xec\x9e\x91 \xea\xb3\xb5\xec\x9c\xa0\xed\x95\x98\xeb\x8a\x94 \xed\x94\x8c\xeb\x9e\xab\xed\x8f\xbc \xec\x84\x9c\xeb\xb9\x84\xec\x8a\xa4">\n\n    \n<meta property="og:type" content="website">\n<meta property="og:site_name" content="\xec\x9c\x84\xed\x82\xa4\xeb\x8f\x85\xec\x8a\xa4">\n<meta property="og:title" content="01-2 \xed\x8c\x8c\xec\x9d\xb4\xec\x8d\xac\xec\x9d\x98 \xed\x8a\xb9\xec\xa7\x95">\n<meta property="og:description" content="\xeb\xaa\xa8\xeb\x93\xa0 \xed\x94

#### @functools.wraps(wrapped)
- 래퍼 함수를 정의할 때, 함수의 이름이나 설명과 같은 속성을 유지하도록 하는 데코레이터 이다.
- 래퍼 함수란 실제 함수(original function)를 감싼 함수(wrapper function)로, 실제 함수 호출 시 특별한 동작을 하도록 기능을 덧붙인 함수를 말한다. 데코레이터를 만들 때 주로 사용한다.

In [24]:
def add(a, b):
    """ 두 수 a, b를 더한값을 리턴하는 함수 """
    return a + b

print(add.__doc__)
print(help(add))

 두 수 a, b를 더한값을 리턴하는 함수 
Help on function add in module __main__:

add(a, b)
    두 수 a, b를 더한값을 리턴하는 함수

None


In [29]:
import time

def elapsed(original_func):
    def wrapper(*args, **kwargs):
        st = time.time()
        res = original_func(*args, **kwargs)
        print("함수 수행시간: %f 초" % (time.time() - st))
        return res
    return wrapper


@elapsed
def add(a, b):
    """ 두 수 a, b를 더한값을 리턴하는 함수 """
    return a + b

result = add(3, 4)
print(add) # 데코레이터를 사용하는 순간 doc string이 사라졌다.
print()
print(add.__doc__) # None
print()
print(help(add))
'''
Help on function wrapper in module __main__:

wrapper(*args, **kwargs)

None
'''

함수 수행시간: 0.000000 초
<function elapsed.<locals>.wrapper at 0x00000272943334C0>

None

Help on function wrapper in module __main__:

wrapper(*args, **kwargs)

None


'\nHelp on function wrapper in module __main__:\n\nwrapper(*args, **kwargs)\n\nNone\n'

In [28]:
import time, functools

def elapsed(original_func):
    @functools.wraps(original_func)
    def wrapper(*args, **kwargs):
        st = time.time()
        res = original_func(*args, **kwargs)
        print("함수 수행시간: %f 초" % (time.time() - st))
        return res
    return wrapper


@elapsed
def add(a, b):
    """ 두 수 a, b를 더한값을 리턴하는 함수 """
    return a + b

result = add(3, 4)
print(add) # 데코레이터를 사용하는 순간 doc string이 사라졌다.
print()
print(add.__doc__) # None
print()
print(help(add))

함수 수행시간: 0.000000 초
<function add at 0x0000027294333EE0>

 두 수 a, b를 더한값을 리턴하는 함수 

Help on function add in module __main__:

add(a, b)
    두 수 a, b를 더한값을 리턴하는 함수

None
