In [None]:
# 05장 함수형 프로그래밍 다루기
# ---------------------------
# 함수형 프로그래밍(functional programming)은 자료 처리를 수학 함수 계산으로 취급하고 상태와 가변 데이터를 멀리하는 프로그래밍 패러다임의 하나다. 《클린 코드(Clean Code)》의 저자 로버트 C. 마틴은 함수형 프로그래밍을 대입문이 없는 프로그래밍으로 정의하기도 했다. 이번 장에서는 파이썬의 함수형 프로그래밍을 지원하는 모듈을 알아본다.

## 023 상담원을 순서대로 배정하려면? ― itertools.cycle

In [None]:
# 023 상담원을 순서대로 배정하려면? ― itertools.cycle
# -------------------------------------------------
# itertools.cycle(iterable)은 반복 가능한 객체(iterable)를 순서대로 무한히 반복하는 이터레이터를 생성하는 함수이다.

# 이터레이터란 next() 함수 호출 시 계속 그다음 값을 반환하는 객체를 말한다(참고: 부록 03 이터레이터와 제너레이터).

# 문제
# ----
# 어느 고객센터에 다음과 같이 3명이 근무 중이라 할 때 이 3명이 순서대로 고객 상담 전화를 받을 수 있도록 하는 상담 프로그램을 개발해야 한다.

# ['김은경', '이명자', '이성진']
# 상담 전화가 올 때마다 순서대로 상담원을 배정하려면 어떻게 하면 될까?


In [5]:
import itertools

teller = ['김은경', '이명자', '이성진']

cnt = 0
for name in itertools.cycle(teller):
    print(name)
    if cnt > 100:
        break
    cnt += 1




김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진
김은경
이명자
이성진


In [None]:
# 풀이
# ----
# 다음처럼 itertools.cycle() 함수로 무한히 반복하는 이터레이터를 만들고 next()를 호출하여 다음 사람을 계속 요청하면 된다.

# >>> import itertools
# >>> emp_pool = itertools.cycle(['김은경', '이명자', '이성진'])
# >>> next(emp_pool)
# '김은경'
# >>> next(emp_pool)
# '이명자'
# >>> next(emp_pool)
# '이성진'
# >>> next(emp_pool)
# '김은경'
# >>> next(emp_pool)
# '이명자'
# ...
# 그러면 next()로 요청할 때마다 순서대로 3명의 상담원을 무한히 반복하는 것을 확인할 수 있다.

# next() 함수는 파이썬 내장 함수로, 이터레이터의 다음 요소를 반환하는 함수이다.

# 참고
# 부록 03 이터레이터와 제너레이터
# itertools - 효율적인 루핑을 위한 이터레이터를 만드는 함수: https://docs.python.org/ko/3/library/itertools.html#itertools.cycle
# 함수 더 알아보기: https://wikidocs.net/24
# 동영상 - https://youtube.com/shorts/XKULKY5H8YU?feature=share

In [8]:
import itertools

emp_pool = itertools.cycle(['김은경', '이명자', '이성진'])

next(emp_pool)
next(emp_pool)
next(emp_pool)

'이성진'

## 024 연간 매출액을 계산하려면? ― itertools.accumulate

In [None]:
# 024 연간 매출액을 계산하려면? ― itertools.accumulate
# --------------------------------------------------
# itertools.accumulate(iterable)은 반복 가능한 객체(iterable)의 누적합을 계산하여 이터레이터로 반환하는 함수이다.

# 문제
# ----
# 다음은 어떤 회사의 1월부터 12월까지의 매출 데이터이다(단위는 만 원).

# [1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]
# 1월에는 1,161만 원, 2월에는 1,814만 원, …, 12월에는 2,134만 원의 매출이 발생했다. 
# 이에 경영자는 1년간 매출의 월별 누적 합계를 알고자 한다. 
# 즉, 1월에는 1,161만 원, 2월에는 1,161+1,814=2,975만 원, 3월에는 2,975+1,270=4,245만 원, … 식으로 
# 월별 누적 합계를 구하는 프로그램이 필요하다.

# 파이썬으로 월별 누적 합계를 구하는 프로그램을 만들려면 어떻게 해야 할까?

In [16]:
incomes = [1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]

acc_incomes = []
acc_income = 0
for income in incomes:
    acc_income += income
    acc_incomes.append(acc_income)
print(acc_incomes)
print('-'*70)

import itertools

result = []
for acc in itertools.accumulate(incomes):
    result.append(acc)
print(result)
print(list(result))

[1161, 2975, 4245, 6501, 7914, 9756, 11977, 14184, 16634, 19457, 21997, 24131]
----------------------------------------------------------------------
[1161, 2975, 4245, 6501, 7914, 9756, 11977, 14184, 16634, 19457, 21997, 24131]
[1161, 2975, 4245, 6501, 7914, 9756, 11977, 14184, 16634, 19457, 21997, 24131]


In [None]:
# 풀이
# ----
# 누적 합계를 알고 싶을 때는 itertools의 accumulate() 함수를 사용하는 것이 가장 편리하다. 
# 다음은 itertools.accumulate() 함수를 사용하여 1월부터 12월까지의 월별 누적 합계를 구하는 프로그램이다.

# [파일명: itertools_accumulate_sample.py]

# import itertools

# monthly_income = [1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]
# result = list(itertools.accumulate(monthly_income))

# print(result)
# 출력 결과는 다음과 같다.

# c:\projects\pylib>python itertools_accumulate_sample.py
# [1161, 2975, 4245, 6501, 7914, 9756, 11977, 14184, 16634, 19457, 21997, 24131]


# 알아두면 좋아요

# 그때까지의 최댓값(running maximum) 표시하기
# -----------------------------------------
# 1월에서 12월 동안 그때까지의 최대 월수입을 표시하고 싶다면 다음처럼 itertools.accumulate() 함수의 두 번째 인수로 max를 전달하면 된다.

# import itertools

# monthly_income = [1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]
# result = list(itertools.accumulate(monthly_income, max))

# print(result)
# 실행한 결과는 다음과 같다.

# [1161, 1814, 1814, 2256, 2256, 2256, 2256, 2256, 2450, 2823, 2823, 2823]
# 3월까지는 월 최고 수입이 1,814만 원이었고 8월까지는 월 최고 수입이 2,256만 원임을 알 수 있다.

# 참고
# 부록 03 이터레이터와 제너레이터
# itertools - 효율적인 루핑을 위한 이터레이터를 만드는 함수: https://docs.python.org/ko/3/library/itertools.html#itertools.accumulate
# 동영상 - https://youtube.com/shorts/MFabfIeMmdY?feature=share

In [22]:
import itertools

years_incomes = [1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]
print(years_incomes)
print(list(itertools.accumulate(years_incomes)))
list(itertools.accumulate(years_incomes, max))


[1161, 1814, 1270, 2256, 1413, 1842, 2221, 2207, 2450, 2823, 2540, 2134]
[1161, 2975, 4245, 6501, 7914, 9756, 11977, 14184, 16634, 19457, 21997, 24131]


[1161, 1814, 1814, 2256, 2256, 2256, 2256, 2256, 2450, 2823, 2823, 2823]

In [None]:
# 025 키값으로 데이터를 묶으려면? ― itertools.groupby
# itertools.groupby(iterable, key=None)은 반복 가능한 객체를 키값으로 분류하고 그 결과를 반환하는 함수이다.

# 문제
# 다음은 이름과 혈액형으로 구성한 8명의 데이터이다.

# data = [
#     {'name': '이민서', 'blood': 'O'},
#     {'name': '이영순', 'blood': 'B'},
#     {'name': '이상호', 'blood': 'AB'},
#     {'name': '김지민', 'blood': 'B'},
#     {'name': '최상현', 'blood': 'AB'},
#     {'name': '김지아', 'blood': 'A'},
#     {'name': '손우진', 'blood': 'A'},
#     {'name': '박은주', 'blood': 'A'}
# ]
# 이 데이터를 다음처럼 혈액형별로 분류하여 표시하려면 어떻게 해야 할까?

# data = {
#     'A': [{'name': '김지아', 'blood': 'A'}, {'name': '손우진', 'blood': 'A'}, {'name': '박은주', 'blood': 'A'}], 
#     'AB': [{'name': '이상호', 'blood': 'AB'}, {'name': '최상현', 'blood': 'AB'}], 
#     'B': [{'name': '이영순', 'blood': 'B'}, {'name': '김지민', 'blood': 'B'}], 
#     'O': [{'name': '이민서', 'blood': 'O'}]
# }
# 풀이
# itertools.groupby() 함수를 사용하면 혈액형별로 묶어 데이터를 분류할 수 있다.

# 먼저 다음과 같이 문제에서 제시한 data부터 선언하자.

# >>> data = [
# ...     {'name': '이민서', 'blood': 'O'},
# ...     {'name': '이영순', 'blood': 'B'},
# ...     {'name': '이상호', 'blood': 'AB'},
# ...     {'name': '김지민', 'blood': 'B'},
# ...     {'name': '최상현', 'blood': 'AB'},
# ...     {'name': '김지아', 'blood': 'A'},
# ...     {'name': '손우진', 'blood': 'A'},
# ...     {'name': '박은주', 'blood': 'A'}
# ... ]
# itertools.groupby() 함수를 사용하기 전에 먼저 분류 기준인 혈액형 순으로 정렬해야 한다.

# 혈액형으로 정렬하지 않고 itertools.groupby()를 사용하면 분류 기준이 바뀔 때마다 그룹이 생성되므로 원하는 결과를 얻을 수 없다. 자세한 내용은 잠시 후 알아보자.

# >>> import operator
# >>> data = sorted(data, key=operator.itemgetter('blood'))
# 혈액형 순으로 정렬하고자 operator.itemgetter ('blood')를 사용했다.

# 참고: 034 다양한 기준으로 정렬하려면? - operator.itemgetter

# 잘 정렬되었는지는 pprint()를 사용하면 확인할 수 있다.

# >>> import pprint
# >>> pprint.pprint(data)
# [{'blood': 'A', 'name': '김지아'},
#  {'blood': 'A', 'name': '손우진'},
#  {'blood': 'A', 'name': '박은주'},
#  {'blood': 'AB', 'name': '이상호'},
#  {'blood': 'AB', 'name': '최상현'},
#  {'blood': 'B', 'name': '이영순'},
#  {'blood': 'B', 'name': '김지민'},
#  {'blood': 'O', 'name': '이민서'}]
# 혈액형 순으로 잘 정렬된 것을 확인할 수 있다. 이제 itertools.groupby()로 혈액형별 그룹으로 나누어 보자.

# >>> import itertools
# >>> grouped_data = itertools.groupby(data, key=operator.itemgetter('blood'))
# itertools.groupby() 역시 데이터를 혈액형별로 나누어야 하므로 키 항목을 key=operator.itemgetter('blood')와 같이 사용했다. itertools.groupby()는 (분류 기준, 분류 기준으로 묶은 데이터)와 같은 튜플 형식의 이터레이터를 반환한다. 따라서 문제에서 요구하는 결과를 만들려면 grouped_data를 다음과 같이 변환해야 한다.

# >>> result = {}
# >>> for key, group_data in grouped_data:
# ...     result[key] = list(group_data)
# ...
# group_data 역시 이터레이터이므로 list로 변환했다. 잘 분류되었는지 pprint()로 확인해 보자.

# >>> pprint.pprint(result)
# {'A': [{'blood': 'A', 'name': '김지아'},
#        {'blood': 'A', 'name': '손우진'},
#        {'blood': 'A', 'name': '박은주'}],
#  'AB': [{'blood': 'AB', 'name': '이상호'}, {'blood': 'AB', 'name': '최상현'}],
#  'B': [{'blood': 'B', 'name': '이영순'}, {'blood': 'B', 'name': '김지민'}],
#  'O': [{'blood': 'O', 'name': '이민서'}]}
# 지금까지의 내용을 종합한 풀이는 다음과 같다.

# [파일명: itertools_groupby_sample.py]

# import itertools
# import operator
# import pprint

# data = [
#     {'name': '이민서', 'blood': 'O'},
#     {'name': '이영순', 'blood': 'B'},
#     {'name': '이상호', 'blood': 'AB'},
#     {'name': '김지민', 'blood': 'B'},
#     {'name': '최상현', 'blood': 'AB'},
#     {'name': '김지아', 'blood': 'A'},
#     {'name': '손우진', 'blood': 'A'},
#     {'name': '박은주', 'blood': 'A'}
# ]

# data = sorted(data, key=operator.itemgetter('blood'))  # groupby 전 분류 기준으로 정렬
# grouped_data = itertools.groupby(data, key=operator.itemgetter('blood'))

# result = {}
# for key, group_data in grouped_data:
#     result[key] = list(group_data)  # group_data는 이터레이터이므로 리스트로 변경

# pprint.pprint(result)
# 알아두면 좋아요
# 정렬 없이 groupby를 하면 발생하는 문제
# 정렬하지 않고 다음처럼 groupby()만 적용하면 어떻게 될까?

# import itertools
# import operator

# data = [
#     {'name': '이민서', 'blood': 'O'},
#     {'name': '이영순', 'blood': 'B'},
#     {'name': '이상호', 'blood': 'AB'},
#     {'name': '김지민', 'blood': 'B'},
#     {'name': '최상현', 'blood': 'AB'},
#     {'name': '김지아', 'blood': 'A'},
#     {'name': '손우진', 'blood': 'A'},
#     {'name': '박은주', 'blood': 'A'}
# ]

# grouped_data = itertools.groupby(data, key=operator.itemgetter('blood'))

# result = {}
# for key, group_data in grouped_data:
#     print(key, list(group_data))
# 출력 결과는 다음과 같다.

# O [{'name': '이민서', 'blood': 'O'}]
# B [{'name': '이영순', 'blood': 'B'}]
# AB [{'name': '이상호', 'blood': 'AB'}]
# B [{'name': '김지민', 'blood': 'B'}]
# AB [{'name': '최상현', 'blood': 'AB'}]
# A [{'name': '김지아', 'blood': 'A'}, {'name': '손우진', 'blood': 'A'}, {'name': '박은주', 'blood': 'A'}]
# 혈액형이 바뀔 때마다 혈액형 그룹이 생성되어 뒤죽박죽이 된 모습이다.

# 참고
# itertools - 효율적인 루핑을 위한 이터레이터를 만드는 함수: https://docs.python.org/ko/3/library/itertools.html#itertools.groupby
# 동영상 - https://youtube.com/shorts/4V-u_ubFWCk?feature=share