In [None]:
# 05장 함수형 프로그래밍 다루기
# ---------------------------
# 함수형 프로그래밍(functional programming)은 자료 처리를 수학 함수 계산으로 취급하고 상태와 가변 데이터를 멀리하는 프로그래밍 패러다임의 하나다. 《클린 코드(Clean Code)》의 저자 로버트 C. 마틴은 함수형 프로그래밍을 대입문이 없는 프로그래밍으로 정의하기도 했다. 이번 장에서는 파이썬의 함수형 프로그래밍을 지원하는 모듈을 알아본다.

## 023 상담원을 순서대로 배정하려면? ― itertools.cycle

In [None]:
# 023 상담원을 순서대로 배정하려면? ― itertools.cycle
# -------------------------------------------------
# itertools.cycle(iterable)은 반복 가능한 객체(iterable)를 순서대로 무한히 반복하는 이터레이터를 생성하는 함수이다.

# 이터레이터란 next() 함수 호출 시 계속 그다음 값을 반환하는 객체를 말한다(참고: 부록 03 이터레이터와 제너레이터).

# 문제
# ----
# 어느 고객센터에 다음과 같이 3명이 근무 중이라 할 때 이 3명이 순서대로 고객 상담 전화를 받을 수 있도록 하는 상담 프로그램을 개발해야 한다.

# ['김은경', '이명자', '이성진']
# 상담 전화가 올 때마다 순서대로 상담원을 배정하려면 어떻게 하면 될까?


In [5]:
import itertools

teller = ['김은경', '이명자', '이성진']

cnt = 0
for name in itertools.cycle(teller):
    print(name)
    if cnt > 100:
        break
    cnt += 1




김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진


In [None]:
# 풀이
# ----
# 다음처럼 itertools.cycle() 함수로 무한히 반복하는 이터레이터를 만들고 next()를 호출하여 다음 사람을 계속 요청하면 된다.

# >>> import itertools
# >>> emp_pool = itertools.cycle(['김은경', '이명자', '이성진'])
# >>> next(emp_pool)
# '김은경'
# >>> next(emp_pool)
# '이명자'
# >>> next(emp_pool)
# '이성진'
# >>> next(emp_pool)
# '김은경'
# >>> next(emp_pool)
# '이명자'
# ...
# 그러면 next()로 요청할 때마다 순서대로 3명의 상담원을 무한히 반복하는 것을 확인할 수 있다.

# next() 함수는 파이썬 내장 함수로, 이터레이터의 다음 요소를 반환하는 함수이다.

# 참고
# 부록 03 이터레이터와 제너레이터
# itertools - 효율적인 루핑을 위한 이터레이터를 만드는 함수: https://docs.python.org/ko/3/library/itertools.html#itertools.cycle
# 함수 더 알아보기: https://wikidocs.net/24
# 동영상 - https://youtube.com/shorts/XKULKY5H8YU?feature=share

In [8]:
import itertools

emp_pool = itertools.cycle(['김은경', '이명자', '이성진'])

next(emp_pool)
next(emp_pool)
next(emp_pool)

'이성진'

## 024 연간 매출액을 계산하려면? ― itertools.accumulate

In [None]:
# 024 연간 매출액을 계산하려면? ― itertools.accumulate
# --------------------------------------------------
# itertools.accumulate(iterable)은 반복 가능한 객체(iterable)의 누적합을 계산하여 이터레이터로 반환하는 함수이다.

# 문제
# ----
# 다음은 어떤 회사의 1월부터 12월까지의 매출 데이터이다(단위는 만 원).

# [1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]
# 1월에는 1,161만 원, 2월에는 1,814만 원, …, 12월에는 2,134만 원의 매출이 발생했다. 
# 이에 경영자는 1년간 매출의 월별 누적 합계를 알고자 한다. 
# 즉, 1월에는 1,161만 원, 2월에는 1,161+1,814=2,975만 원, 3월에는 2,975+1,270=4,245만 원, … 식으로 
# 월별 누적 합계를 구하는 프로그램이 필요하다.

# 파이썬으로 월별 누적 합계를 구하는 프로그램을 만들려면 어떻게 해야 할까?

In [16]:
incomes = [1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]

acc_incomes = []
acc_income = 0
for income in incomes:
    acc_income += income
    acc_incomes.append(acc_income)
print(acc_incomes)
print('-'*70)

import itertools

result = []
for acc in itertools.accumulate(incomes):
    result.append(acc)
print(result)
print(list(result))

[1161, 2975, 4245, 6501, 7914, 9756, 11977, 14184, 16634, 19457, 21997, 24131]
----------------------------------------------------------------------
[1161, 2975, 4245, 6501, 7914, 9756, 11977, 14184, 16634, 19457, 21997, 24131]
[1161, 2975, 4245, 6501, 7914, 9756, 11977, 14184, 16634, 19457, 21997, 24131]


In [None]:
# 풀이
# ----
# 누적 합계를 알고 싶을 때는 itertools의 accumulate() 함수를 사용하는 것이 가장 편리하다. 
# 다음은 itertools.accumulate() 함수를 사용하여 1월부터 12월까지의 월별 누적 합계를 구하는 프로그램이다.

# [파일명: itertools_accumulate_sample.py]

# import itertools

# monthly_income = [1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]
# result = list(itertools.accumulate(monthly_income))

# print(result)
# 출력 결과는 다음과 같다.

# c:\projects\pylib>python itertools_accumulate_sample.py
# [1161, 2975, 4245, 6501, 7914, 9756, 11977, 14184, 16634, 19457, 21997, 24131]


# 알아두면 좋아요

# 그때까지의 최댓값(running maximum) 표시하기
# -----------------------------------------
# 1월에서 12월 동안 그때까지의 최대 월수입을 표시하고 싶다면 다음처럼 itertools.accumulate() 함수의 두 번째 인수로 max를 전달하면 된다.

# import itertools

# monthly_income = [1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]
# result = list(itertools.accumulate(monthly_income, max))

# print(result)
# 실행한 결과는 다음과 같다.

# [1161, 1814, 1814, 2256, 2256, 2256, 2256, 2256, 2450, 2823, 2823, 2823]
# 3월까지는 월 최고 수입이 1,814만 원이었고 8월까지는 월 최고 수입이 2,256만 원임을 알 수 있다.

# 참고
# 부록 03 이터레이터와 제너레이터
# itertools - 효율적인 루핑을 위한 이터레이터를 만드는 함수: https://docs.python.org/ko/3/library/itertools.html#itertools.accumulate
# 동영상 - https://youtube.com/shorts/MFabfIeMmdY?feature=share

In [22]:
import itertools

years_incomes = [1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]
print(years_incomes)
print(list(itertools.accumulate(years_incomes)))
list(itertools.accumulate(years_incomes, max))


[1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]
[1161, 2975, 4245, 6501, 7914, 9756, 11977, 14184, 16634, 19457, 21997, 24131]


[1161, 1814, 1814, 2256, 2256, 2256, 2256, 2256, 2450, 2823, 2823, 2823]

## 025 키값으로 데이터를 묶으려면? ― itertools.groupby

In [None]:
# 025 키값으로 데이터를 묶으려면? ― itertools.groupby
# -------------------------------------------------
# itertools.groupby(iterable, key=None)은 반복 가능한 객체를 키값으로 분류하고 그 결과를 반환하는 함수이다.

# 문제
# 다음은 이름과 혈액형으로 구성한 8명의 데이터이다.

# data = [
#     {'name': '이민서', 'blood': 'O'},
#     {'name': '이영순', 'blood': 'B'},
#     {'name': '이상호', 'blood': 'AB'},
#     {'name': '김지민', 'blood': 'B'},
#     {'name': '최상현', 'blood': 'AB'},
#     {'name': '김지아', 'blood': 'A'},
#     {'name': '손우진', 'blood': 'A'},
#     {'name': '박은주', 'blood': 'A'}
# ]
# 이 데이터를 다음처럼 혈액형별로 분류하여 표시하려면 어떻게 해야 할까?

# data = {
#     'A': [{'name': '김지아', 'blood': 'A'}, {'name': '손우진', 'blood': 'A'}, {'name': '박은주', 'blood': 'A'}], 
#     'AB': [{'name': '이상호', 'blood': 'AB'}, {'name': '최상현', 'blood': 'AB'}], 
#     'B': [{'name': '이영순', 'blood': 'B'}, {'name': '김지민', 'blood': 'B'}], 
#     'O': [{'name': '이민서', 'blood': 'O'}]
# }

In [38]:
data = [
    {'name': '이민서', 'blood': 'O'},
    {'name': '이영순', 'blood': 'B'},
    {'name': '이상호', 'blood': 'AB'},
    {'name': '김지민', 'blood': 'B'},
    {'name': '최상현', 'blood': 'AB'},
    {'name': '김지아', 'blood': 'A'},
    {'name': '손우진', 'blood': 'A'},
    {'name': '박은주', 'blood': 'A'}
]

result = {}
for person in data:
    if person['blood'] not in result:
        result[person['blood']] = [person]
    else:
        result[person['blood']].append(person)
result

for value in result.values():
    print(value)

[{'name': '이민서', 'blood': 'O'}]
[{'name': '이영순', 'blood': 'B'}, {'name': '김지민', 'blood': 'B'}]
[{'name': '이상호', 'blood': 'AB'}, {'name': '최상현', 'blood': 'AB'}]
[{'name': '김지아', 'blood': 'A'}, {'name': '손우진', 'blood': 'A'}, {'name': '박은주', 'blood': 'A'}]


In [None]:
# 풀이
# ----
# itertools.groupby() 함수를 사용하면 혈액형별로 묶어 데이터를 분류할 수 있다.

# 먼저 다음과 같이 문제에서 제시한 data부터 선언하자.

# >>> data = [
# ...     {'name': '이민서', 'blood': 'O'},
# ...     {'name': '이영순', 'blood': 'B'},
# ...     {'name': '이상호', 'blood': 'AB'},
# ...     {'name': '김지민', 'blood': 'B'},
# ...     {'name': '최상현', 'blood': 'AB'},
# ...     {'name': '김지아', 'blood': 'A'},
# ...     {'name': '손우진', 'blood': 'A'},
# ...     {'name': '박은주', 'blood': 'A'}
# ... ]
# itertools.groupby() 함수를 사용하기 전에 먼저 분류 기준인 혈액형 순으로 정렬해야 한다.

# 혈액형으로 정렬하지 않고 itertools.groupby()를 사용하면 분류 기준이 바뀔 때마다 
# 그룹이 생성되므로 원하는 결과를 얻을 수 없다. 자세한 내용은 잠시 후 알아보자.

# >>> import operator
# >>> data = sorted(data, key=operator.itemgetter('blood'))
# 혈액형 순으로 정렬하고자 operator.itemgetter ('blood')를 사용했다.

# 참고: 034 다양한 기준으로 정렬하려면? - operator.itemgetter

# 잘 정렬되었는지는 pprint()를 사용하면 확인할 수 있다.

# >>> import pprint
# >>> pprint.pprint(data)
# [{'blood': 'A', 'name': '김지아'},
#  {'blood': 'A', 'name': '손우진'},
#  {'blood': 'A', 'name': '박은주'},
#  {'blood': 'AB', 'name': '이상호'},
#  {'blood': 'AB', 'name': '최상현'},
#  {'blood': 'B', 'name': '이영순'},
#  {'blood': 'B', 'name': '김지민'},
#  {'blood': 'O', 'name': '이민서'}]


In [80]:
import operator
from pprint import pprint

data = [
    {'name': '이민서', 'blood': 'O'},
    {'name': '이영순', 'blood': 'B'},
    {'name': '이상호', 'blood': 'AB'},
    {'name': '김지민', 'blood': 'B'},
    {'name': '최상현', 'blood': 'AB'},
    {'name': '김지아', 'blood': 'A'},
    {'name': '손우진', 'blood': 'A'},
    {'name': '박은주', 'blood': 'A'}
]

pprint(data)
print()
# sorted() 를 통한 정렬
aa = sorted(data, key=lambda x: x['blood'])
pprint(aa)
print()

# groupby()를 이용하고자 할 때 groupby 대상 컬럼을 기준으로 정렬 필요함.
data = sorted(data, key=operator.itemgetter('blood'))
pprint(data)


[{'blood': 'O', 'name': '이민서'},
 {'blood': 'B', 'name': '이영순'},
 {'blood': 'AB', 'name': '이상호'},
 {'blood': 'B', 'name': '김지민'},
 {'blood': 'AB', 'name': '최상현'},
 {'blood': 'A', 'name': '김지아'},
 {'blood': 'A', 'name': '손우진'},
 {'blood': 'A', 'name': '박은주'}]

[{'blood': 'A', 'name': '김지아'},
 {'blood': 'A', 'name': '손우진'},
 {'blood': 'A', 'name': '박은주'},
 {'blood': 'AB', 'name': '이상호'},
 {'blood': 'AB', 'name': '최상현'},
 {'blood': 'B', 'name': '이영순'},
 {'blood': 'B', 'name': '김지민'},
 {'blood': 'O', 'name': '이민서'}]

[{'blood': 'A', 'name': '김지아'},
 {'blood': 'A', 'name': '손우진'},
 {'blood': 'A', 'name': '박은주'},
 {'blood': 'AB', 'name': '이상호'},
 {'blood': 'AB', 'name': '최상현'},
 {'blood': 'B', 'name': '이영순'},
 {'blood': 'B', 'name': '김지민'},
 {'blood': 'O', 'name': '이민서'}]


In [None]:
# 혈액형 순으로 잘 정렬된 것을 확인할 수 있다. 
# 이제 itertools.groupby()로 혈액형별 그룹으로 나누어 보자.

# >>> import itertools
# >>> grouped_data = itertools.groupby(data, key=operator.itemgetter('blood'))
# itertools.groupby() 역시 데이터를 혈액형별로 나누어야 하므로 키 항목을 key=operator.itemgetter('blood')와 같이 사용했다. 
# itertools.groupby()는 (분류 기준, 분류 기준으로 묶은 데이터)와 같은 튜플 형식의 이터레이터를 반환한다. 
# 따라서 문제에서 요구하는 결과를 만들려면 grouped_data를 다음과 같이 변환해야 한다.

# >>> result = {}
# >>> for key, group_data in grouped_data:
# ...     result[key] = list(group_data)
# ...
# group_data 역시 이터레이터이므로 list로 변환했다. 잘 분류되었는지 pprint()로 확인해 보자.

# >>> pprint.pprint(result)
# {'A': [{'blood': 'A', 'name': '김지아'},
#        {'blood': 'A', 'name': '손우진'},
#        {'blood': 'A', 'name': '박은주'}],
#  'AB': [{'blood': 'AB', 'name': '이상호'}, {'blood': 'AB', 'name': '최상현'}],
#  'B': [{'blood': 'B', 'name': '이영순'}, {'blood': 'B', 'name': '김지민'}],
#  'O': [{'blood': 'O', 'name': '이민서'}]}
# 지금까지의 내용을 종합한 풀이는 다음과 같다.

# [파일명: itertools_groupby_sample.py]

# import itertools
# import operator
# import pprint

# data = [
#     {'name': '이민서', 'blood': 'O'},
#     {'name': '이영순', 'blood': 'B'},
#     {'name': '이상호', 'blood': 'AB'},
#     {'name': '김지민', 'blood': 'B'},
#     {'name': '최상현', 'blood': 'AB'},
#     {'name': '김지아', 'blood': 'A'},
#     {'name': '손우진', 'blood': 'A'},
#     {'name': '박은주', 'blood': 'A'}
# ]

# data = sorted(data, key=operator.itemgetter('blood'))  # groupby 전 분류 기준으로 정렬
# grouped_data = itertools.groupby(data, key=operator.itemgetter('blood'))

# result = {}
# for key, group_data in grouped_data:
#     result[key] = list(group_data)  # group_data는 이터레이터이므로 리스트로 변경

# pprint.pprint(result)


In [93]:
import operator
from pprint import pprint
import itertools


data = [
    {'name': '이민서', 'blood': 'O'},
    {'name': '이영순', 'blood': 'B'},
    {'name': '이상호', 'blood': 'AB'},
    {'name': '김지민', 'blood': 'B'},
    {'name': '최상현', 'blood': 'AB'},
    {'name': '김지아', 'blood': 'A'},
    {'name': '손우진', 'blood': 'A'},
    {'name': '박은주', 'blood': 'A'}
]

# groupby()를 이용하고자 할 때 groupby 대상 컬럼을 기준으로 정렬 필요함.
data = sorted(data, key=operator.itemgetter('blood'))
grouped_data = itertools.groupby(data, key=operator.itemgetter('blood'))

result = {}
for key, group_data in grouped_data:
    result[key] = list(group_data)

pprint(result)
print('-'*70)


# sorted()활용
# ------------
data = sorted(data, key=lambda x: x['blood'])

result = {}
grouped_data = itertools.groupby(data, key=lambda x: x['blood'])
for key, group_data in grouped_data:
    result[key] = list(group_data)

pprint(result)    

{'A': [{'blood': 'A', 'name': '김지아'},
       {'blood': 'A', 'name': '손우진'},
       {'blood': 'A', 'name': '박은주'}],
 'AB': [{'blood': 'AB', 'name': '이상호'}, {'blood': 'AB', 'name': '최상현'}],
 'B': [{'blood': 'B', 'name': '이영순'}, {'blood': 'B', 'name': '김지민'}],
 'O': [{'blood': 'O', 'name': '이민서'}]}
----------------------------------------------------------------------
{'A': [{'blood': 'A', 'name': '김지아'},
       {'blood': 'A', 'name': '손우진'},
       {'blood': 'A', 'name': '박은주'}],
 'AB': [{'blood': 'AB', 'name': '이상호'}, {'blood': 'AB', 'name': '최상현'}],
 'B': [{'blood': 'B', 'name': '이영순'}, {'blood': 'B', 'name': '김지민'}],
 'O': [{'blood': 'O', 'name': '이민서'}]}


In [None]:
# 알아두면 좋아요
# 정렬 없이 groupby를 하면 발생하는 문제
# ------------------------------------

# 정렬하지 않고 다음처럼 groupby()만 적용하면 어떻게 될까?

# import itertools
# import operator

# data = [
#     {'name': '이민서', 'blood': 'O'},
#     {'name': '이영순', 'blood': 'B'},
#     {'name': '이상호', 'blood': 'AB'},
#     {'name': '김지민', 'blood': 'B'},
#     {'name': '최상현', 'blood': 'AB'},
#     {'name': '김지아', 'blood': 'A'},
#     {'name': '손우진', 'blood': 'A'},
#     {'name': '박은주', 'blood': 'A'}
# ]

# grouped_data = itertools.groupby(data, key=operator.itemgetter('blood'))

# result = {}
# for key, group_data in grouped_data:
#     print(key, list(group_data))
# 출력 결과는 다음과 같다.

# O [{'name': '이민서', 'blood': 'O'}]
# B [{'name': '이영순', 'blood': 'B'}]
# AB [{'name': '이상호', 'blood': 'AB'}]
# B [{'name': '김지민', 'blood': 'B'}]
# AB [{'name': '최상현', 'blood': 'AB'}]
# A [{'name': '김지아', 'blood': 'A'}, {'name': '손우진', 'blood': 'A'}, {'name': '박은주', 'blood': 'A'}]

# 혈액형이 바뀔 때마다 혈액형 그룹이 생성되어 뒤죽박죽이 된 모습이다.

# 참고
# itertools - 효율적인 루핑을 위한 이터레이터를 만드는 함수: https://docs.python.org/ko/3/library/itertools.html#itertools.groupby
# 동영상 - https://youtube.com/shorts/4V-u_ubFWCk?feature=share

In [8]:
import itertools
import operator
from pprint import pprint

data = [
    {'name': '이민서', 'blood': 'O'},
    {'name': '이영순', 'blood': 'B'},
    {'name': '이상호', 'blood': 'AB'},
    {'name': '김지민', 'blood': 'B'},
    {'name': '최상현', 'blood': 'AB'},
    {'name': '김지아', 'blood': 'A'},
    {'name': '손우진', 'blood': 'A'},
    {'name': '박은주', 'blood': 'A'}
]

grouped_data = itertools.groupby(data, key=operator.itemgetter('blood'))

result = {}
for key, group_data in grouped_data:
    result[key] = list(group_data)

pprint(result)

{'A': [{'blood': 'A', 'name': '김지아'},
       {'blood': 'A', 'name': '손우진'},
       {'blood': 'A', 'name': '박은주'}],
 'AB': [{'blood': 'AB', 'name': '최상현'}],
 'B': [{'blood': 'B', 'name': '김지민'}],
 'O': [{'blood': 'O', 'name': '이민서'}]}


In [69]:
# 참고 : 파이썬 내장함수 sorted()
# ------------------------------
aa = [3,4,2,6,3,4,]
result = sorted(aa, reverse= True)
print(result)

bb = 'adkgiufdnvjdkfd'
result = ''.join(sorted(bb, reverse=True))
print(result)

cc = [3,5,1, None, 5,9,3]
result = sorted([c for c in cc if c ])
print(result)


countries = [
  {'code': 'KR', 'name': 'Korea'},
  {'code': 'CA', 'name': 'Canada'},
  {'code': 'US', 'name': 'United States'},
  {'code': 'GB', 'name': 'United Kingdom'},
  {'code': 'CN', 'name': 'China'}
]
result = sorted(countries, key=lambda country: country['code'])
print(result)

aa = ["2", 1]
result = sorted(aa, key=int)
print(result)

aa = ["cde", 1, 2, 3, 'a']
result = sorted(aa, key=str)
print(result)


# list.sort()
# -----------
nums = [-3, 5, -2, -1, 4]
nums.sort(key=abs, reverse=True)
nums

[6, 4, 4, 3, 3, 2]
vunkkjigffdddda
[1, 3, 3, 5, 5, 9]
[{'code': 'CA', 'name': 'Canada'}, {'code': 'CN', 'name': 'China'}, {'code': 'GB', 'name': 'United Kingdom'}, {'code': 'KR', 'name': 'Korea'}, {'code': 'US', 'name': 'United States'}]
[1, '2']
[1, 2, 3, 'a', 'cde']


[5, 4, -3, -2, -1]

## 026 부족한 것을 채워 묶으려면? ― itertools.zip_longest

In [None]:
# 026 부족한 것을 채워 묶으려면? ― itertools.zip_longest
# ----------------------------------------------------

# itertools.zip_longest(*iterables, fillvalue=None) 함수는 같은 개수의 자료형을 묶는 
# 파이썬 내장 함수인 zip()과 똑같이 동작한다. 
# 하지만, itertools.zip_longest() 함수는 전달한 반복 가능 객체(*iterables)의 길이가 다르다면 
# 긴 것을 기준으로 빠진 값은 fillvalue에 설정한 값으로 채운다.

# 문제
# ----
# 유치원생 5명에게 간식을 나누어 주고자 다음과 같은 파이썬 코드를 작성했다.

# students = ['한민서', '황지민', '이영철', '이광수', '김승민']
# rewards = ['사탕', '초컬릿', '젤리']

# result = zip(students, rewards)
# print(list(result))

# 그러나 간식 개수가 유치원생보다 적으므로 이 파이썬 코드를 실행하면 다음과 같은 결과가 나온다.

# [('한민서', '사탕'), ('황지민', '초컬릿'), ('이영철', '젤리')]

# students와 rewards의 개수가 다르므로 더 적은 rewards의 개수만큼만 zip()으로 묶게 된다. 
# 하지만, students가 rewards보다 많더라도 다음처럼 부족한 rewards는 '새우깡'으로 채워 간식을 나누는 코드를 작성하려면 어떻게 해야 할까?

# [('한민서', '사탕'), ('황지민', '초컬릿'), ('이영철', '젤리'), ('이광수', '새우깡'), ('김승민', '새우깡')]


In [19]:
import itertools

students = ['한민서', '황지민', '이영철', '이광수', '김승민']
rewards = ['사탕', '초컬릿', '젤리']

list(zip(students, rewards))

list(itertools.zip_longest(students, rewards, fillvalue='새우깡'))

[('한민서', '사탕'), ('황지민', '초컬릿'), ('이영철', '젤리'), ('이광수', '새우깡'), ('김승민', '새우깡')]

In [None]:
# 풀이
# ----
# itertools.zip_longest()를 사용하면 개수가 많은 것을 기준으로 묶을 수 있다. 
# 이때 부족한 항목은 None으로 채우는데, 다음처럼 fillvalue로 값을 지정하면 None대신 다른 값으로 채울 수 있다.

# [파일명: itertools_zip_longest_sample.py]

# import itertools

# students = ['한민서', '황지민', '이영철', '이광수', '김승민']
# rewards = ['사탕', '초컬릿', '젤리']

# result = itertools.zip_longest(students, rewards, fillvalue='새우깡')
# print(list(result))
# 실행 결과는 다음과 같다.

# c:\projects\pylib>python itertools_zip_longest_sample.py
# [('한민서', '사탕'), ('황지민', '초콜릿'), ('이영철', '젤리'), ('이광수', '새우깡'), ('김승민', '새우깡')]

# 참고
# itertools - 효율적인 루핑을 위한 이터레이터를 만드는 함수: https://docs.python.org/ko/3/library/itertools.html#itertools.zip_longest
# 내장 함수 zip: https://wikidocs.net/32#zip
# 동영상 - https://youtube.com/shorts/l44fVKGC558?feature=share

## 027 순서를 생각하며 카드를 뽑으려면? ― itertools.permutations

In [None]:
# 027 순서를 생각하며 카드를 뽑으려면? ― itertools.permutations
# -----------------------------------------------------------
# itertools.permutations(iterable, r=None)은 반복 가능 객체 중에서 r개를 선택한 순열을 반환하는 함수이다.

# 문제
# 1, 2, 3 숫자가 적힌 3장의 카드에서 두 장의 카드를 꺼내 만들 수 있는 2자리 숫자를 모두 구하려면 어떻게 해야 할까?

In [21]:
import itertools

number = [1, 2, 3]
[ num for num in itertools.permutations(number, 2) ]



[(1, 2), (1, 3), (2, 1), (2, 3), (3, 1), (3, 2)]

In [None]:
# 풀이
# ----
# [1, 2, 3] 3장의 카드 중 순서에 상관없이 2장을 뽑는 경우의 수는 모두 3가지이다(조합).

# 1, 2
# 2, 3
# 1, 3

# 하지만, 이 문제에서는 2자리 숫자이므로 이 3가지에 순서를 더해 다음처럼 6가지가 된다(순열).

# 1, 2
# 2, 1
# 2, 3
# 3, 2
# 1, 3
# 3, 1

# 이 순열은 itertools.permutations()를 사용하면 간단히 구할 수 있다.

# >>> import itertools
# >>> list(itertools.permutations(['1', '2', '3'], 2))
# [('1', '2'), ('1', '3'), ('2', '1'), ('2', '3'), ('3', '1'), ('3', '2')]
# 따라서 만들 수 있는 2자리 숫자는 다음과 같이 모두 6가지이다.

# >>> for a, b in itertools.permutations(['1', '2', '3'], 2):
# ...     print(a+b)
# ...
# 12
# 13
# 21
# 23
# 31
# 32
# 알아두면 좋아요

# 조합
# ----
# 3장의 카드에서 순서에 상관없이 2장을 고르는 조합은 다음처럼 itertools.combinations()를 사용하면 된다.

# >>> import itertools
# >>> list(itertools.combinations(['1', '2', '3'], 2))
# [('1', '2'), ('1', '3'), ('2', '3')]
# 참고
# itertools - 효율적인 루핑을 위한 이터레이터를 만드는 함수 : https://docs.python.org/ko/3/library/itertools.html#itertools.permutations
# 동영상 - https://youtube.com/shorts/gPGinDj4NSY?feature=share

In [25]:
import itertools

number = [1,2,3]

print('순열: ', [ num for num in itertools.permutations(number, 2) ])
print('조합: ', [ num for num in itertools.combinations(number, 2) ])


순열:  [(1, 2), (1, 3), (2, 1), (2, 3), (3, 1), (3, 2)]
조합:  [(1, 2), (1, 3), (2, 3)]


## 028 로또의 모든 가짓수를 구하려면? ― itertools.combinations

In [None]:
# 028 로또의 모든 가짓수를 구하려면? ― itertools.combinations
# ---------------------------------------------------------
# itertools.combinations(iterable, r)은 반복 가능 객체 중에서 r개를 선택한 조합을 이터레이터로 반환하는 함수이다.

# 문제
# ----
# 1~45 중 서로 다른 숫자 6개를 뽑는 로또 번호의 모든 경우의 수(조합)를 구하고 그 개수를 출력하려면 어떻게 해야 할까?

In [38]:
import itertools

result = [ comb_num for comb_num in itertools.combinations(range(1,46), 6) ]
print(f'{len(result):,} {len(result)*1000:,}')

8,145,060 8,145,060,000


In [None]:

# 풀이
# 다음과 같이 itertools.combinations()를 사용하면 45개의 숫자 중 6개를 선택하는 경우의 수를 구할 수 있다.

# >>> import itertools
# >>> it = itertools.combinations(range(1, 46), 6)
# itertools.combinations(range(1, 46), 6)은 1~45의 숫자 중에서 6개를 뽑는 경우의 수를 이터레이터로 반환한다.

# 반환한 이터레이터를 루프를 이용하여 출력하면 아마 끝도 없이 출력될 것이다. 궁금하다면 직접 실행해 봐도 좋다.

# >>> for num in it:
# ...     print(num)
# ...
# (1, 2, 3, 4, 5, 6)
# (1, 2, 3, 4, 5, 7)
# (1, 2, 3, 4, 5, 8)
# (1, 2, 3, 4, 5, 9)
# (1, 2, 3, 4, 5, 10)
# (1, 2, 3, 4, 5, 11)
# (1, 2, 3, 4, 5, 12)
# (1, 2, 3, 4, 5, 13)
# ...
# 하지만, 순환하여 출력하지 않고 이터레이터의 개수만 세려면 다음과 같이 하면 된다.

# >>> len(list(itertools.combinations(range(1, 46), 6)))
# 8145060
# 선택할 수 있는 로또 번호의 가짓수는 8,145,060이다.

# 여러분이 반드시 로또에 당첨되길 희망한다면 서로 다른 번호로 구성한 8,145,060장의 로또를 사면 된다. 1게임에 천 원이라 할 때 그 금액은 무려 81억 4천5백6만 원이다.

# 알아두면 좋아요
# 중복 조합
# 만약 로또 복권이 숫자 중복을 허용하도록 규칙이 변경된다면 경우의 수는 몇 개가 될까?

# 중복이 허용된다 함은 당첨 번호가 [1, 2, 3, 4, 5, 5]처럼 5가 2번 이상 나와도 되고 [1, 1, 1, 1, 1, 1]처럼 1이 6번 나와도 된다는 의미이다.

# 같은 숫자를 허용하는 중복 조합은 itertools.combinations_with_replacement()를 사용하면 된다.

# >>> len(list(itertools.combinations_with_replacement(range(1, 46), 6)))
# 15890700
# 당연히 중복을 허용하지 않을 때보다 훨씬 많은 경우의 수를 확인할 수 있다.

# 참고
# 부록 - 03 이터레이터와 제너레이터
# itertools - 효율적인 루핑을 위한 이터레이터를 만드는 함수: https://docs.python.org/ko/3/library/itertools.html#itertools.combinations
# 동영상 - https://youtube.com/shorts/SoO75fZGnZQ?feature=share

## 029 순서대로 좌표를 정렬하려면? ― functools.cmp_to_key

In [None]:
# 029 순서대로 좌표를 정렬하려면? ― functools.cmp_to_key
# ----------------------------------------------------
# functools.cmp_to_key(func)는 sorted()와 같은 정렬 함수의 key 매개변수에 함수(func)를 전달할 때 사용하는 함수이다. 
# 단, func() 함수는 두 개의 인수를 입력하여 첫 번째 인수를 기준으로 그 둘을 비교하고 작으면 음수, 같으면 0, 크면 양수를 반환하는 비교 함수이어야 한다.

# 문제
# ----
# 다음과 같이 2차원 평면 위의 점 N개를 (x, y) 좌표로 구성한 리스트가 있다. 
# y 좌표가 증가하는 순으로 정렬하되 y 좌표가 같으면 x 좌표가 증가하는 순으로 좌표를 정렬하고 이를 출력하는 프로그램을 만들려면 어떻게 해야 할까?

# [(0, 4), (1, 2), (1, -1), (2, 2), (3, 3)]

# 즉, 정렬 후에는 다음과 같은 결과를 출력해야 한다.

# [(1, -1), (1, 2), (2, 2), (3, 3), (0, 4)]

In [40]:
aa = [(0, 4), (1, 2), (1, -1), (2, 2), (3, 3)]
sorted(aa, key=lambda x: x[1])

[(1, -1), (1, 2), (2, 2), (3, 3), (0, 4)]

In [None]:
# 풀이
# ----
# 이 문제는 sorted() 함수의 두 번째 key 매개변수에 특별한 방법으로 정렬할 수 있는 함수를 전달하여 해결해야 한다. 
# key에 함수를 전달하려면 다음처럼 functools.cmp_to_key()를 사용한다.

# [파일명:functools_cmp_to_key_sample.py]

# import functools

# def xy_compare(n1, n2):
#     if n1[1] > n2[1]:         # y 좌표가 크면
#         return 1
#     elif n1[1] == n2[1]:      # y 좌표가 같으면
#         if n1[0] > n2[0]:     # x 좌표가 크면
#             return 1
#         elif n1[0] == n2[0]:  # x 좌표가 같으면
#             return 0
#         else:                 # x 좌표가 작으면
#             return -1
#     else:                     # y 좌표가 작으면
#         return -1

# src = [(0, 4), (1, 2), (1, -1), (2, 2), (3, 3)]

# result = sorted(src, key=functools.cmp_to_key(xy_compare))
# print(result)
# 출력결과는 다음과 같다.

# c:\projects\pylib>python functools_cmp_to_key_sample.py
# [(1, -1), (1, 2), (2, 2), (3, 3), (0, 4)]
# y 좌표 순으로 정렬하되 y 좌표가 같다면 x 좌표 순으로 정렬한다.

# xy_compare()와 같이 정렬에 사용하는 함수는 반드시 다음 3가지 중 하나를 반환해야 한다. 이때 첫 번째 인수를 기준으로 비교한다.

# 크다(양수 반환)
# 작다(음수 반환)
# 같다(0 반환)

# 참고
# functools - 고차 함수와 콜러블 객체에 대한 연산: https://docs.python.org/ko/3/library/functools.html

In [44]:
import functools

src = [(0, 4), (3, 2), (1, -1), (2, 2), (3, 3)]

def xy_compare(n1, n2):
    if n1[1] >  n2[1]:
        return 1
    elif n1[1] == n2[1]:
        if n1[0] > n2[0]:
            return 1
        elif n1[0] == n2[0]:
            return 0
        else:
            return -1
    else:
        return -1
    
sorted(src, key=functools.cmp_to_key(xy_compare))

[(1, -1), (2, 2), (3, 2), (3, 3), (0, 4)]

## 030 웹 페이지를 임시로 저장하려면? ― functools.lru_cache

In [None]:
# 030 웹 페이지를 임시로 저장하려면? ― functools.lru_cache
# ------------------------------------------------------
# @functools.lru_cache(maxsize=128)은 함수의 반환 결과를 캐시하는 데코레이터이다. 
# 최초 요청 이후에는 캐시한 결과를 반환한다. 
# maxsize는 캐시할 수 있는 최대 개수를 의미하며 이를 초과할 때는 호출 빈도가 가장 작은 것부터 캐시에서 사라진다.

# LRU는 ‘Least Recently Used’의 약자로, 최근에 참조되지 않은 데이터가 교체 시점에 먼저 나가는 방식이다.

# 문제
# ---
# 다음은 위키독스의 특정 페이지를 가져오는 프로그램이다. 
# 이 프로그램의 성능을 향상하고자 같은 페이지를 다시 요청할 때는 캐시를 사용하도록 하려면 어떻게 해야 할까?

# import urllib.request


# def get_wikidocs(page):
#     print("wikidocs page:{}".format(page))  # 페이지 호출시 출력
#     resource = 'https://wikidocs.net/{}'.format(page)
#     try:
#         with urllib.request.urlopen(resource) as s:
#             return s.read()
#     except urllib.error.HTTPError:
#         return 'Not Found'
# get_wikidocs() 함수는 위키독스의 페이지 번호를 입력 받아 해당 페이지의 내용을 읽어 반환하는 함수이다. 
# 페이지의 내용을 가져오고자 urllib 모듈을 사용했는데, 이 모듈의 자세한 내용은 090절을 참고하도록 하자.

# 참고 : 090 웹 페이지를 저장하려면? - urllib


In [20]:
import urllib.request
import pprint

def get_wikidocs(page):
    print('wikidocs page:{}'.format(page))
    resource = 'http://wikidocs.net/{}'.format(page)
    
    try:
        with urllib.request.urlopen(resource)as s:
            return s.read()
    except urllib.error.HTTPError as e:
        return 'Not Found {e}'.format(e)

aa = get_wikidocs(10)
pprint.pprint(aa)

wikidocs page:10


URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: certificate has expired (_ssl.c:1129)>

In [None]:
# 풀이
# ----
# 다음처럼 functools의 lru_cache를 데코레이터로 사용하면 쉽게 캐시 함수를 만들 수 있다. 
# 캐시의 최대 개수는 32개로 지정했다.

# 참고: 부록 - 02 클로저와 데코레이터

# [파일명: functools_lru_cache_sample.py]

# import urllib.request
# from functools import lru_cache


# @lru_cache(maxsize=32)
# def get_wikidocs(page):
#     print("wikidocs page:{}".format(page))  # 페이지 호출시 출력
#     resource = 'https://wikidocs.net/{}'.format(page)
#     try:
#         with urllib.request.urlopen(resource) as s:
#             return s.read()
#     except urllib.error.HTTPError:
#         return 'Not Found'


# first_6 = get_wikidocs(6)
# first_7 = get_wikidocs(7)

# second_6 = get_wikidocs(6)
# second_7 = get_wikidocs(7)

# assert first_6 == second_6  # 처음 요청한 6페이지와 두 번째 요청한 6페이지의 내용이 같은지 확인
# assert first_7 == second_7


# 알아두면 좋아요
# SSL 오류가 발생한다면?
# --------------------
# 위의 코드 실행 시 다음과 같은 SSL 관련 오류가 발생할 수 있다.

# ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:997)
# 이럴 때는 다음과 같이 조치하자.

# pip uninstall certifi
# pip install certifi
# 그래도 계속 오류가 발생하는 맥 OS 사용자는 다음과 같이 Install Certificates.command 파일을 더블클릭하자.

# 파인더 → Applications(응용프로그램) → Python3.x 폴더 → Install Certificates.command


# 출력 결과는 다음과 같다.

# c:\projects\pylib>python functools_lru_cache_sample.py
# wikidocs page:6
# wikidocs page:7
# 처음 요청한 6페이지와 7페이지는 웹 요청이 발생하므로 wikidocs page:6, wikidocs page:7과 같은 로그를 출력했지만, 
# 이후 이를 다시 요청할 때는 함수를 호출하지 않고 캐시에 저장된 데이터를 반환하므로 로그를 출력하지 않은 것을 확인할 수 있다.

# 그리고 첫 번째 호출했을 때와 두 번째 호출했을 때의 반환값이 같은지를 assert로 비교했다. 
# 이때 반환값이 다르다면 AssertionError 오류가 발생한다.

# assert는 뒤의 표현식이 참이 아닌 경우 AssertionError 오류를 발생시키는 명령어이다.

# 캐시 함수는 주의해서 사용해야 한다. 위와 같은 경우 페이지의 내용이 중간에 바뀌었을때 이미 캐시를 저장하고 있었다면 
# 변경된 내용이 아닌 과거의 캐시값을 계속 리턴하기 때문이다.

# 참고
# functools - 고차 함수와 콜러블 객체에 대한 연산: https://docs.python.org/ko/3/library/functools.html
# 클로저와 데코레이터 더 알아보기: https://wikidocs.net/134789

In [24]:
import urllib.request
import pprint
from functools import lru_cache

@lru_cache(maxsize=32)
def get_wikidocs(page):
    print('wikidocs page:{}'.format(page))
    resource = 'http://wikidocs.net/{}'.format(page)
    
    try:
        with urllib.request.urlopen(resource)as s:
            return s.read()
    except urllib.error.HTTPError as e:
        return 'Not Found {e}'.format(e)


first_6 = get_wikidocs(6)
first_7 = get_wikidocs(7)

wikidocs page:6


URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: certificate has expired (_ssl.c:1129)>

In [22]:
second_6 = get_wikidocs(6)
second_7 = get_wikidocs(7)

wikidocs page:6


URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: certificate has expired (_ssl.c:1129)>

In [23]:
assert first_6 == second_6  # 처음 요청한 6페이지와 두 번째 요청한 6페이지의 내용이 같은지 확인
assert first_7 == second_7


NameError: name 'first_6' is not defined

In [None]:
## 031 기존 함수로 새로운 함수를 만들려면? ― functools.partial

In [None]:
# 031 기존 함수로 새로운 함수를 만들려면? ― functools.partial
# ---------------------------------------------------------

# functools.partial()은 하나 이상의 인수가 이미 채워진 새 버전의 함수를 만들 때 사용하는 함수이다.

# 문제
# ----
# 다음은 입력한 인수의 합과 곱을 choice값에 따라 선택적으로 반환하는 사용자 정의 함수 add_mul()이다.

# def add_mul(choice, *args):
#     if choice == "add":
#         result = 0
#         for i in args:
#             result = result + i
#     elif choice == "mul":
#         result = 1
#         for i in args:
#             result = result * i
#     return result

# 예를 들어 add_mul('add', 1, 2, 3, 4, 5)를 호출하면 1~5의 합인 15를 반환하고 add_mul('mul', 1, 2, 3, 4, 5)를 호출하면 1~5를 모두 곱한 120을 반환한다.

# 그렇다면 add_mul() 함수를 활용하여 다음과 같이 동작하는 add(), mul() 함수를 만들려면 어떻게 해야 할까?

# add(1, 2, 3, 4, 5)  # 15 반환
# mul(1, 2, 3, 4, 5)  # 120 반환

In [57]:
def add_mul(choice, *args):
    if choice == 'add':
        result = 0
        for num in args:
            result += num
    elif choice == 'mul':
        result = 1
        for num in args:
            result *= num
    else:
        print('Please Corect Input data add or mul')
    return result

add_mul('add', 1,2,3,4,5)        
add_mul('mul', 1,2,3,4,5)       

def add(*args):
    return add_mul('add', *args)

def mul(*args):
    return add_mul('mul', *args)

add(1,2,3,4,5,), mul(1,2,3,4,5,), 

(15, 120)

In [None]:
# 풀이
# ----
# 이 문제의 일반적인 풀이는 다음과 같다.

# def add_mul(choice, *args):
#     if choice == "add":
#         result = 0
#         for i in args:
#             result = result + i
#     elif choice == "mul":
#         result = 1
#         for i in args:
#             result = result * i
#     return result

# def add(*args):
#     return add_mul('add', *args)

# def mul(*args):
#     return add_mul('mul', *args)    

# print(add(1,2,3,4,5))  # 15 출력
# print(mul(1,2,3,4,5))  # 120 출력

# 하지만, functools.partial()을 사용하면 다음처럼 더 간결하게 코드를 작성할 수 있다.

# [파일명: functools_partial_sample.py]

# from functools import partial

# def add_mul(choice, *args):
#     if choice == "add":
#         result = 0
#         for i in args:
#             result = result + i
#     elif choice == "mul":
#         result = 1
#         for i in args:
#             result = result * i
#     return result

# add = partial(add_mul, 'add')
# mul = partial(add_mul, 'mul')

# print(add(1,2,3,4,5))  # 15 출력
# print(mul(1,2,3,4,5))  # 120 출력

# add_mul() 함수에 'add'라는 choice 인수를 미리 지정한 함수 add를 add = partial(add_mul, 'add')와 같이 만들었다. 
# partial은 이처럼 하나 이상의 인수를 미리 채운 새 버전의 함수를 만드는 데 유용하다.

# 알아두면 좋아요
# partial()의 활용 예
# -------------------
# add() 함수는 항상 100을 기준으로 시작되어야 한다고 가정한다면 다음처럼 간단하게 정의할 수 있다.

# add = partial(add_mul, 'add', 100)
# 이처럼 add() 함수를 지정하고 add(1)을 호출하면 이미 채워진 100이라는 값에 1을 더해 101을 반환한다. 
# 마찬가지로 mul() 함수도 다음과 같이 기준값을 1000으로 지정할 수 있다.

# mul = partial(add_mul, 'mul', 1000)

# 이렇게 mul() 함수를 지정하고 mul(2, 3)을 호출하면 6000을 반환한다. 
# 그리고 partial()로 만든 함수에는 다음과 같이 func와 args 속성이 있다.

# print(add.func)
# print(add.args)
# 출력 결과는 다음과 같다.

# <function add_mul at 0x7f3a483893a0>
# ('add', 100)
# add가 가리키는 함수(func)는 add_mul() 이고 이 함수에 이미 ('add', 100) 이라는 인수(args)가 채워져 있음을 보여준다.

# 참고
# functools - 고차 함수와 콜러블 객체에 대한 연산: https://docs.python.org/ko/3/library/functools.html
# 동영상 - https://youtube.com/shorts/8HRstD3xwAI?feature=share

In [66]:
import functools

def add_mul(choice, *args):
    if choice == 'add':
        result = 0
        for num in args:
            result += num
    elif choice == 'mul':
        result = 1
        for num in args:
            result *= num
    else:
        print('Please Corect Input data add or mul')
    return result

add = functools.partial(add_mul, 'add', 100)
mul = functools.partial(add_mul, 'mul', 1000)

add(1,2,3,4,5), mul(1,2,3,4,5), 
add.func, add.args

(<function __main__.add_mul(choice, *args)>, ('add', 100))

## 032 함수를 적용하여 하나의 값으로 줄이려면? ― functools.reduce

In [None]:
# 032 함수를 적용하여 하나의 값으로 줄이려면? ― functools.reduce
# -----------------------------------------------------------
# functools.reduce(function, iterable)은 function을 반복 가능한 객체의 요소에 차례대로(왼쪽에서 오른쪽으로) 
# 누적 적용하여 이 객체를 하나의 값으로 줄이는 함수이다.

# 문제
# ----
# 다음은 입력 인수 data의 요소를 모두 더하여 반환하는 add() 함수이다.

# def add(data):
#     result = 0
#     for i in data:
#         result += i
#     return result


# data = [1, 2, 3, 4, 5]
# result = add(data)
# print(result)  # 15 출력

# functools.reduce()를 사용하여 마찬가지로 동작하는 코드를 작성하려면 어떻게 해야 할까?

In [7]:
import functools

data = [1, 2, 3, 4, 5]

def add(data):
    result = 0
    for d in data:
        result += d
    return result

add([1,2,3,4,5])

import functools

print(functools.reduce(lambda x, y: x + y, data))

15


In [None]:
# 풀이
# functools.reduce()를 사용한 코드는 다음과 같다.

# [파일명: functools_reduce_sample.py]

# import functools

# data = [1, 2, 3, 4, 5]
# result = functools.reduce(lambda x, y: x + y, data)
# print(result)  # 15 출력

# functools.reduce()를 사용하면 reduce()에 선언한 람다 함수를 data 요소에 차례대로 누적 적용하여 다음과 같이 계산한다.

# ((((1+2)+3)+4)+5)
# 따라서 앞서 본 add() 함수와 동일한 역할을 하게 된다.

# 알아두면 좋아요

# functools.reduce()로 최댓값 구하기
# ---------------------------------
# num_list = [3, 2, 8, 1, 6, 7]
# max_num = functools.reduce(lambda x, y: x if x > y else y, num_list)
# print(max_num)  # 8 출력

# [3, 2, 8, 1, 6, 7] 요소를 차례대로 reduce()의 람다 함수로 전달하여 두 값 중 큰 값을 선택하고 마지막에 남은 최댓값을 반환한다.

# 최솟값은 functools.reduce(lambda x, y: x if x < y else y, num_list)로 구하면 된다.

# 참고
# functools - 고차 함수와 콜러블 객체에 대한 연산: https://docs.python.org/ko/3/library/functools.html
# 동영상 - https://youtube.com/shorts/QsuHC50wIbU?feature=share

In [72]:
import functools

data = [1, 2, 3, 4, 5]
result = functools.reduce(lambda x, y: x + y, data)
result

# 최댓값
num_list = [3, 2, 8, 1, 6, 7]
result = functools.reduce(lambda x, y: x if x>y else y, num_list)
result

# 최솟값
num_list = [3, 2, 8, 1, 6, 7]
result = functools.reduce(lambda x, y: y if x>y else x, num_list)
result


1

In [19]:
# functools.reduce()로 최댓값 구하기
# ---------------------------------
# num_list = [3, 2, 8, 1, 6, 7]
# max_num = functools.reduce(lambda x, y: x if x > y else y, num_list)
# print(max_num)  # 8 출력

import functools

# num_list = [3, 2, 8, 1, 6, 7]
# cum_sum = functools.reduce(lambda x, y: x+y, num_list)
# print(cum_sum)

# max_num = functools.reduce(lambda x, y: x if x > y else y, num_list)
# print(max_num)

# min_num = functools.reduce(lambda x, y: x if x < y else y, num_list)
# print(min_num)

rem_max_num = functools.reduce(lambda x, y: x if x % 5 > y % 5 else y, num_list)
print(rem_max_num)

[ num % 5 for num in num_list ]

# [3, 2, 8, 1, 6, 7] 요소를 차례대로 reduce()의 람다 함수로 전달하여 두 값 중 큰 값을 선택하고 마지막에 남은 최댓값을 반환한다.

# 최솟값은 functools.reduce(lambda x, y: x if x < y else y, num_list)로 구하면 된다.


3


[3, 2, 3, 1, 1, 2]

## 033 래퍼 함수의 속성을 유지하려면? ― functools.wraps

In [None]:
# 033 래퍼 함수의 속성을 유지하려면? ― functools.wraps
# --------------------------------------------------
# @functools.wraps(wrapped)는 래퍼 함수를 정의할 때 함수의 이름이나 설명문 같은 속성을 유지하도록 하는 데코레이터이다.

# 래퍼 함수란 실제 함수(original function)를 감싼 함수(wrapper function)로, 
# 실제 함수 호출 시 특별한 동작을 하도록 기능을 덧붙인 함수를 말한다. 데코레이터를 만들 때 주로 사용한다.

# 문제
# ----
# 다음은 함수의 수행 시간을 알려 주는 elapsed 데코레이터를 사용하는 예제이다.

# import time


# def elapsed(original_func):
#     def wrapper(*args, **kwargs):
#         start = time.time()
#         result = original_func(*args, **kwargs)
#         end = time.time()
#         print("함수 수행시간: %f 초" % (end - start))
#         return result

#     return wrapper


# @elapsed
# def add(a, b):
#     """ 두 수 a, b를 더한값을 리턴하는 함수 """
#     return a + b


# result = add(3, 4)
# 이 예제처럼 add() 함수에 elpased 데코레이터를 적용하여 실행하면 다음과 같이 add() 함수의 수행 시간이 출력된다.

# 함수 수행시간: 0.000002 초
# 하지만, 다음처럼 add() 함수를 출력해 보면 어떨까?

# print(add)
# 그러면 add() 함수 이름이 출력되지 않고 elapsed에 대한 정보만 출력된다.

# <function elapsed.<locals>.wrapper at 0x7f65dc058af0>
# 마찬가지로 함수의 독스트링(함수의 설명문)을 출력하는 help(add) 명령을 실행해 보면 
# add() 함수의 독스트링인 '두 수 a, b를 더한 값을 반환하는 함수'라는 설명문이 출력되지 않고 다음과 같은 내용이 출력된다.

# help(add)
# Help on function wrapper in module __main__:

# wrapper(*args, **kwargs)

# 독스트링(docstring)이란 documentation strings의 줄임말로, 도움말 등 코드를 설명하고 문서화할 목적으로 사용한다.

# add() 함수에 elapsed 데코레이터를 적용하더라도 함수 이름과 함수 설명문은 그대로 유지하도록 하려면 어떻게 해야 할까?


In [79]:
import time

def elapsed(original_func):
    def wrapper(*args, **kwargs):
        start_time = time.time()
        result = original_func(*args, **kwargs)
        end_time = time.time()
        print("함수 수행시간: %f 초" % (end_time - start_time))
        return result
    return wrapper

@elapsed
def add(a, b):
    """ 두 수 a, b를 더한값을 리턴하는 함수 """
    return a + b

print(add(3, 5))
print('-'*70)
print(add)
print('-'*70)
help(add)        

함수 수행시간: 0.000000 초
8
----------------------------------------------------------------------
<function elapsed.<locals>.wrapper at 0x00000191E4FEA820>
----------------------------------------------------------------------
Help on function wrapper in module __main__:

wrapper(*args, **kwargs)



In [None]:
# 풀이
# ----
# 데코레이터를 사용하더라도 함수 이름과 함수 설명문을 유지하려면 래퍼 함수에 데코레이터로 functools.wraps를 사용해야 한다.

# [파일명: functools_wraps_sample.py]

# import functools
# import time


# def elapsed(original_func):
#     @functools.wraps(original_func)  # 여기에 추가!!
#     def wrapper(*args, **kwargs):
#         start = time.time()
#         result = original_func(*args, **kwargs)
#         end = time.time()
#         print("함수 수행시간: %f 초" % (end - start))
#         return result

#     return wrapper


# @elapsed
# def add(a, b):
#     """ 두 수 a, b를 더한값을 리턴하는 함수 """
#     return a + b


# print(add)  # 함수 이름 출력
# help(add)  # 함수 독스트링 출력

# elapsed() 함수 안에 정의한 wrapper() 함수에 functools.wraps(original_func)이라는 데코레이터를 정의했다. 
# 따라서 이 코드의 실행 결과는 다음과 같다.

# c:\projects\pylib>python functools_wraps_sample.py
# <function add at 0x7f44f004caf0>
# Help on function add in module __main__:

# add(a, b)
#     두 수 a, b를 더한 값을 반환하는 함수

# 함수 이름과 함수 설명문이 정확하게 출력되는 것을 확인할 수 있다.

# 실행해야 하는 실제 함수(original_func)를 인수로 functools.wraps 데코레이터를 적용하면 내부적으로 
# functools.update_wrapper가 실행되어 함수 이름과 함수 설명이 유지된다. 
# 함수에는 함수 이름이나 독스트링 등 여러 속성이 있는데, 이런 속성을 보호하면서 데코레이터 함수를 만들려면 functools.wraps 데코레이터를 사용해야 한다.

# 참고
# 부록 02 클로저와 데코레이터
# functools - 고차 함수와 콜러블 객체에 대한 연산: https://docs.python.org/ko/3/library/functools.html

In [80]:
import functools
import time

def elapsed(original_func):
    @functools.wraps(original_func)  # 여기에 추가!!
    def wrapper(*args, **kwargs):
        start_time = time.time()
        result = original_func(*args, **kwargs)
        end_time = time.time()
        print("함수 수행시간: %f 초" % (end_time - start_time))
        return result
    return wrapper

@elapsed
def add(a, b):
    """ 두 수 a, b를 더한값을 리턴하는 함수 """
    return a + b

print(add(3, 5))
print('-'*70)
print(add)
print('-'*70)
help(add)        

함수 수행시간: 0.000000 초
8
----------------------------------------------------------------------
<function add at 0x0000019181C86940>
----------------------------------------------------------------------
Help on function add in module __main__:

add(a, b)
    두 수 a, b를 더한값을 리턴하는 함수



In [None]:
## 034 다양한 기준으로 정렬하려면? ― operator.itemgetter

In [None]:
# 034 다양한 기준으로 정렬하려면? ― operator.itemgetter
# ---------------------------------------------------
# operator.itemgetter는 주로 sorted와 같은 함수의 key 매개변수에 적용하여 다양한 기준으로 정렬할 수 있도록 하는 모듈이다.

# 문제
# ----
# 학생의 이름, 나이, 성적 등의 정보를 저장한 다음과 같은 students 리스트가 있다고 하자.

# students = [
#     ("jane", 22, 'A'),
#     ("dave", 32, 'B'),
#     ("sally", 17, 'B'),
# ]
# students 리스트에는 3개의 튜플이 있으며 각 튜플은 순서대로 이름, 나이, 성적에 해당하는 데이터로 이루어졌다. 
# 이 리스트를 나이순으로 정렬하려면 어떻게 해야 할까?

In [82]:
import operator

students = [
    ("jane", 22, 'A'),
    ("dave", 32, 'B'),
    ("sally", 17, 'B'),
]

print(sorted(students, key=lambda x: x[1]))

sorted(students, key=operator.itemgetter(1))

[('sally', 17, 'B'), ('jane', 22, 'A'), ('dave', 32, 'B')]


[('sally', 17, 'B'), ('jane', 22, 'A'), ('dave', 32, 'B')]

In [None]:
# 풀이
# ----
# 이 문제는 다음처럼 sorted() 함수의 key 매개변수에 itemgetter()를 적용하면 쉽게 해결할 수 있다.

# [파일명: operator_itemgetter_sample.py]

# from operator import itemgetter

# students = [
#     ("jane", 22, 'A'),
#     ("dave", 32, 'B'),
#     ("sally", 17, 'B'),
# ]

# result = sorted(students, key=itemgetter(1))
# print(result)

# 이 파일을 실행하여 출력해 보면 다음과 같이 나이 순서대로 정렬한 것을 확인할 수 있다.

# c:\projects\pylib>python operator_itemgetter_sample.py
# [('sally', 17, 'B'), ('jane', 22, 'A'), ('dave', 32, 'B')]

# itemgetter(1)은 students의 아이템인 튜플의 2번째 요소를 기준으로 정렬하겠다는 의미이다. 
# 만약 itemgetter(2)와 같이 사용한다면 성적순으로 정렬한다. 이번에는 students의 요소가 다음처럼 딕셔너리일 때를 생각해 보자.

# students = [
#     {"name": "jane", "age": 22, "grade": 'A'},
#     {"name": "dave", "age": 32, "grade": 'B'},
#     {"name": "sally", "age": 17, "grade": 'B'},
# ]
# 딕셔너리일 때도 마찬가지로 age를 기준으로 정렬해 보자. 이때도 마찬가지로 itemgetter()를 적용하면 된다. 단, 이번에는 itemgetter('age')처럼 딕셔너리의 키를 사용해야 한다. itemgetter('age')는 딕셔너리의 키인 age를 기준으로 정렬하겠다는 의미이다.

# [파일명: operator_itemgetter_dict_sample.py]

# from operator import itemgetter

# students = [
#     {"name": "jane", "age": 22, "grade": 'A'},
#     {"name": "dave", "age": 32, "grade": 'B'},
#     {"name": "sally", "age": 17, "grade": 'B'},
# ]

# result = sorted(students, key=itemgetter('age'))
# print(result)
# 출력 결과는 다음과 같이 age 순으로 정렬된 것을 확인할 수 있다.

# c:\projects\pylib>python operator_itemgetter_dict_sample.py

# [{'name': 'sally', 'age': 17, 'grade': 'B'}, {'name': 'jane', 'age': 22, 'grade': 'A'}, {'name': 'dave', 'age': 32, 'grade': 'B'}]

# 알아두면 좋아요
# operator.attrgetter()
# ---------------------

# students 리스트의 요소가 튜플이 아닌 Student 클래스의 객체라면 다음처럼 attrgetter()를 적용하여 정렬해야 한다.

# from operator import attrgetter

# class Student:
#     def __init__(self, name, age, grade):
#         self.name = name
#         self.age = age
#         self.grade = grade


# students = [
#     Student('jane', 22, 'A'),
#     Student('dave', 32, 'B'),
#     Student('sally', 17, 'B'),
# ]

# result = sorted(students, key=attrgetter('age'))
# attrgetter('age')는 Student 객체의 age 속성으로 정렬하겠다는 의미이다. 마찬가지로 attrgetter('grade')와 같이 사용하면 성적순으로 정렬한다.

# 참고
# operator - 함수로서의 표준 연산자: https://docs.python.org/ko/3/library/operator.html
# 동영상 - https://youtube.com/shorts/2J_PjSgNETQ?feature=share

In [102]:
import operator

students = [
    ("jane", 22, 'A'),
    ("dave", 32, 'B'),
    ("sally", 17, 'B'),
]

print(sorted(students, key=operator.itemgetter(1)))
print('-'*70)
print(sorted(students, key=operator.itemgetter(2)))
print('-'*70)

students = [{'name': 'sally', 'age': 17, 'grade': 'B'}, {'name': 'jane', 'age': 22, 'grade': 'A'}, {'name': 'dave', 'age': 32, 'grade': 'B'}]
print(sorted(students, key=lambda x: x['age']))
print('-'*70)
print(sorted(students, key=lambda x: x['grade']))
print('-'*70)

sorted(students, key=operator.itemgetter('age'))
print('-'*70)

# from operator import attrgetter

# class Student:
#     def __init__(self, name, age, grade):
#         self.name = name
#         self.age = age
#         self.grade = grade


# students = [
#     Student('jane', 22, 'A'),
#     Student('dave', 32, 'B'),
#     Student('sally', 17, 'B'),
# ]

# result = sorted(students, key=attrgetter('age'))
# attrgetter('age')는 Student 객체의 age 속성으로 정렬하겠다는 의미이다. 마찬가지로 attrgetter('grade')와 같이 사용하면 성적순으로 정렬한다.

class Student:
    def __init__(self, name, age, grade):
        self.name = name
        self.age = age
        self.grade = grade
        
students = [
    Student('jane', 22, 'A'),
    Student('dave', 32, 'B'),
    Student('sally', 17, 'B'),
]        

result = sorted(students, key=lambda x: x.age)
print([ (i.name, i.age, i.grade) for i in result ])
print('-'*70)

result = sorted(students, key=lambda x: x.grade)
print([ (i.name, i.age, i.grade) for i in result ])
print('-'*70)

result = sorted(students, key=operator.attrgetter('age'))
print([ (i.name, i.age, i.grade) for i in result ])
print('-'*70)

result = sorted(students, key=operator.attrgetter('grade'))
print([ (i.name, i.age, i.grade) for i in result ])
print('-'*70)



[('sally', 17, 'B'), ('jane', 22, 'A'), ('dave', 32, 'B')]
----------------------------------------------------------------------
[('jane', 22, 'A'), ('dave', 32, 'B'), ('sally', 17, 'B')]
----------------------------------------------------------------------
[{'name': 'sally', 'age': 17, 'grade': 'B'}, {'name': 'jane', 'age': 22, 'grade': 'A'}, {'name': 'dave', 'age': 32, 'grade': 'B'}]
----------------------------------------------------------------------
[{'name': 'jane', 'age': 22, 'grade': 'A'}, {'name': 'sally', 'age': 17, 'grade': 'B'}, {'name': 'dave', 'age': 32, 'grade': 'B'}]
----------------------------------------------------------------------
----------------------------------------------------------------------
[('sally', 17, 'B'), ('jane', 22, 'A'), ('dave', 32, 'B')]
----------------------------------------------------------------------
[('jane', 22, 'A'), ('dave', 32, 'B'), ('sally', 17, 'B')]
----------------------------------------------------------------------
[('sa