# Chapter 5 일급 함수
다음 작업을 수행할 수 있는 객체를 일급 객체라고 한다.
- 런타임에 생성
- 데이터 구조체의 변수나 요소에 할당
- 함수의 인자로 전달
- 함수의 결과로 반환
  
다른 많은 언어에서 함수는 일급 객체가 아니지만, 파이썬은 일급 객체이다. 따라서 이번 장에서는 함수를 객체로 처리하는 방법에 대해 알아본다.


## 5.1 함수를 객체처럼 다루기
- `__doc__` 속성은 객체의 도움말 텍스트를 생성하기 위해 사용되며, `help(객체)`에 사용된다.


In [1]:
# 예제 5-1 함수를 생성해서 테스트하고, 함수의 __doc__을 읽어서 자료형 확인하기
def factorial(n):  # 런타임 중에 생성 가능 (콘솔 환경에서)
    '''return n!'''
    return 1 if n < 2 else n * factorial(n - 1)  # 출력으로 반환 가능

print('42!: ', factorial(42))
print('docstring: ', factorial.__doc__)
print('type: ', type(factorial))  # 함수의 인자로 사용 가능

42!:  1405006117752879898543142606244511569936384000000000
docstring:  return n!
type:  <class 'function'>


In [2]:
# 예제 5-2 함수를 다른 이름으로 사용하고 함수의 인수로 전달하기
fact = factorial
print(fact)

print('fact(5): ', fact(5))
print(list(map(factorial, range(11))))

<function factorial at 0x000002073F25A700>
fact(5):  120
[1, 1, 2, 6, 24, 120, 720, 5040, 40320, 362880, 3628800]


## 5.2 고위 함수 (High-order function)
- 함수를 인자로 받거나, 함수를 반환하는 함수
- (ex) `sorted()`는 `key` 인자는 함수를 입력 받는다. 인지가 하나인 함수라면 다 입력 받을 수 있다.

In [3]:
# 예제 5-3 단어 리스트를 길이에 따라 정렬하기
fruits = ['strawberry', 'fig', 'apple', 'cherry', 'raspberry', 'banana']
sorted(fruits, key=len)

['fig', 'apple', 'cherry', 'banana', 'raspberry', 'strawberry']

In [4]:
# 예제 5-4 단어리스트를 철자 역순으로 정렬하기
def reverse(s):
    return s[::-1]

sorted(fruits, key=reverse)

['banana', 'apple', 'fig', 'raspberry', 'strawberry', 'cherry']

### 5.2.1 map(), filter(), reduce()의 대안
- `map()`, `filter()`가 있긴 하지만 지능형 리스트나 제너레이터 표현식으로 처리 가능하다.
- `map()`, `filter()`가 제너레이터를 반환하기 때문이다.


In [5]:
# 예제 5-5 팩토리얼 목록을 map()/filter()로 생성하는 방법과 지능형 리스트로 생성하는 방법
list(map(factorial, range(6)))


[1, 1, 2, 6, 24, 120]

In [6]:
[factorial(n) for n in range(6)]

[1, 1, 2, 6, 24, 120]

In [7]:
list(map(factorial, filter(lambda n: n % 2, range(6))))

[1, 6, 120]

In [8]:
[factorial(n) for n in range(6) if n % 2]

[1, 6, 120]

- `reduce()`는 주로 합계를 계산할 때 사용되며 `sum()`으로 대체 가능하기 때문에 `functools` 모듈에 들어가게 되었다. 
- 2개의 인자를 받는 함수와 배열을 입력 받으며, 맨 앞 2개부터 연산을 하고, 결과와 다음 값으로 연산하는 것을 반복하여 하나의 값으로 리덕션한다.
  - <span style="background-color:green">텐서플로우의 reduce_mean, reduce_sum의 의미를 이제야 알게 되었네요.</span>
- `any()`와 `all()`도 내장된 리덕션 함수이다.


In [9]:
# 예제 5-6 reduce()와 sum()을 이용해서 99까지 정수 더하기
from functools import reduce
from operator import add
print(reduce(add, range(100))) 
print(sum(range(100)))

4950
4950


## 5.3 익명 함수
- `lambda`에 의해 생성되며, 일회용 함수라고 생각하면 좋다.
- <span style="background-color:green">`lambda`의 이름이 익명 함수라는 것을 처음 알게되었습니다 !!</span>

In [10]:
# 예제 5-7 lambda를 이용해서 철자 역순으로 단어 리스트 정렬하기
fruits = ['strawberry', 'fig', 'apple', 'cherry', 'raspberry', 'banana']
sorted(fruits, key=lambda s: s[::-1])

['banana', 'apple', 'fig', 'raspberry', 'strawberry', 'cherry']

## 5.4 일곱 가지 맛의 콜러블 객체
- 호출 연산자 `()`를 다른 객체에도 적용하는 방법
- 호출할 수 있는 객체인지 알아보려면 `callable()` 내장 함수를 사용.
- 다음 일곱 가지 콜러블이 있음
  - 사용자 정의 함수
  - 내장함수
  - 내장 메서드
  - 메서드
  - 클래스
  - 클래스 객체: `__call__()` 메서드가 구현된 클래스
  - 제너레이터 함수: `yield()` 키워드를 사용하는 함수나 메서드   

In [11]:
callable(factorial)

True

In [12]:
callable(fruits)

False

## 5.5 사용자 정의 콜러블형

In [13]:
# 예제 5-8: BingoCage 클래스는 뒤섞인 리스트에서 항목을 골라낼 뿐이다.
import random

class BingoCage:
    def __init__(self, items):
        self._items = list(items)  # 지역에 사본을 만들어서 원본 리스트의 예기치 않은 변화를 방지
        random.shuffle(self._items)
        
    def pick(self):
        try:
            return self._items.pop()
        except IndexError:
            raise LookupError('pick from empty BingoCage')
        
    def __call__(self):
        return self.pick()

bingo = BingoCage(range(3))
print(bingo.pick())
print(bingo.pick())
print(bingo.pick())
callable(bingo.pick)

2
0
1


True

## 5.6 함수 인트로스펙션
- `__dict__`: 객체에 할당된 사용자 속성을 보관

In [14]:
print(dir(factorial))

['__annotations__', '__call__', '__class__', '__closure__', '__code__', '__defaults__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__get__', '__getattribute__', '__globals__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__kwdefaults__', '__le__', '__lt__', '__module__', '__name__', '__ne__', '__new__', '__qualname__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__']


- 함수에 사용자 속성을 보관하는 것은 일반적이지 않다. 

In [15]:
factorial.__dict__

{}

- 파이썬 사용자 정의 객체에는 없지만 함수에만 있는 고유한 속성들
  - 이 중 `__defaults__`, `__code__`, `__anotations__`에 대해서 알아볼 것이다.

In [16]:
# 예제 5-9 일반 객체에는 존재하지 않는 함수 속성 나열하기
class C: pass  # 사용자 정의 클래스
obj = C()

def func(): pass  # 사용자 정의 함수

print(sorted(set(dir(func)) - set(dir(obj))))

['__annotations__', '__call__', '__closure__', '__code__', '__defaults__', '__get__', '__globals__', '__kwdefaults__', '__name__', '__qualname__']


## 5.7 위치 매개변수에서 키워드 전용 매개변수까지
- 위치 인수 (positional argument) 
- 키워드 전용 인수 (keyword-only argument)
  - *가 붙은 인수 뒤에 이름을 지정하면 키워드 전용 인수가 된다.
  - 해당 인수에 값을 넘겨줄 때는 반드시 인수의 이름을 적어줘야 한다.

In [17]:
# 예제 5-10 HTML을 생성하는tag() 함수. class는 파이썬에 정의된 키워드이므로, 이를 피해 class 속성을 전달하기 위해 키워드 전용 매개변수로 cls를 사용했다.
def tag(name, *content, cls=None, **attrs):
    """하나 이상의 HTML 태그를 생성한다."""
    if cls is not None:
        attrs['class'] = cls
        
    if attrs:
        attr_str = ''.join(' %s="%s"' % (attr, value) for attr, value in sorted(attrs.items()))
        
    else:
        attr_str = ''
        
    if content:
        return '\n'.join('<%s%s>%s</%s>' % (name, attr_str, c, name) for c in content)
    
    else:
        return '<%s%s />'% (name, attr_str)


In [18]:
tag('br')

'<br />'

In [19]:
tag('p', 'hello')  # name 인수 이후는 모두 *content 매개변수에 튜플로 전달된다.

'<p>hello</p>'

In [20]:
print(tag('p', 'hello', 'world'))  # name 인수 이후는 모두 *content 매개변수에 튜플로 전달된다.

<p>hello</p>
<p>world</p>


In [21]:
tag('p','hello', id=33)  # tag 함수의 시그니처에 명시적으로 이름이 지정되지 않은 키워드 인수들은 딕셔너리로 **attrs 인수에 전달 된다.

'<p id="33">hello</p>'

In [22]:
print(tag('p', 'hello', 'world', cls='siderbar'))  # cls 매개변수만 키워드 인수로 전달된다.

<p class="siderbar">hello</p>
<p class="siderbar">world</p>


- <span style="background-color:green">*content 아님 주의. content 인수는 attrs로 들어갔음.</span>

In [23]:
tag(content='testing', name='img')  # 

'<img content="testing" />'

In [24]:
tag('img', 'testing')

'<img>testing</img>'

딕셔너리 안의 모든 항목을 별도의 인수로 전달한다. 명명된 매개변수를 찾아서 전달한다.

In [25]:
my_tag = {'name': 'img', 'title': 'Sunset Boulevard', 'src': 'sunset.jpg', 'cls': 'framed'}
tag(**my_tag)

'<img class="framed" src="sunset.jpg" title="Sunset Boulevard" />'

In [26]:
def f(a, *, b):
    return a, b

print(f(1, b=2))
print()
print(f(1, 2))

(1, 2)



TypeError: f() takes 1 positional argument but 2 were given

## 5.8 매개변수에 대한 정보 읽기

- 함수 객체 안의 `__defaults__()` 속성에는 위치 인수와 키워드 인수의 기본값을 가진 튜플이 들어있음
- `__kwddefaults__` 속성에는 키워드 전용 인수의 기본값
- `__code__`: 인수명이 들어 있으며, 여러 속성을 담고 있는 code 객체를 가리킨다.

In [66]:
# 예제 5-15 원하는 길이 가까이에 있는 공백에서 잘라서 문자열을 단축하는 함수
# 예제 5-19 애너테이션을 추가한 clip() 함수
def clip(text, max_len=80):
    """
    max_len 앞이나 뒤의 마지막 공백에서 잘라낸 텍스트를 반환한다.
    """
    end = None
    if len(text) > max_len:
        space_before = text.rfind(' ', 0, max_len)
        if space_before >= 0:
            end = space_before
        else:
            space_after = text.rfind(' ', max_len)
            if space_after >= 0:
                end = space_after
                
    if end is None:
        end = len(text)
    return text[:end].rstrip()

In [69]:
clip.__defaults__

(80,)

In [73]:
tag.__kwdefaults__

{'cls': None}

In [75]:
tag.__code__

<code object tag at 0x000002073F6D7710, file "<ipython-input-63-2fb0b8a8ae1f>", line 5>

In [76]:
clip.__code__.co_varnames  # 함수 안에서 생성한 지역 변수명도 있다.

('text', 'max_len', 'end', 'space_before', 'space_after')

In [77]:
clip.__code__.co_argcount  # co_varnames 중 첫 co_argcount개가 함수 인수

2

In [78]:
# 예제 5-17 함수 시그니처 추출하기
from inspect import signature

sig = signature(clip)
str(sig)

'(text, max_len=80)'

- Parameter 객체의 kind 속성은 다음 다섯가지 종류가 있음
  - POSITIONAL_OR_KEYWORD: 위치 인수나 키워드 인수
  - VAR_POSITIONAL: *args
  - VAR_KEYWORD: **kwargs
  - KEYWORD_ONLY: 키워드 전용 인수
  - POSITIONAL_ONLY: 위치 전용 매개변수 (사용자 선언 함수에는 없지만, 매개변수를 받지 않는 divmod() 같은 놈에 있다.)

In [79]:
for name, param in sig.parameters.items():
    print(param.kind, ':', name, '=', param.default)

POSITIONAL_OR_KEYWORD : text = <class 'inspect._empty'>
POSITIONAL_OR_KEYWORD : max_len = 80


In [80]:
sig = signature(tag)
for name, param in sig.parameters.items():
    print(param.kind, ':', name, '=', param.default)

POSITIONAL_OR_KEYWORD : name = <class 'inspect._empty'>
VAR_POSITIONAL : content = <class 'inspect._empty'>
KEYWORD_ONLY : cls = None
VAR_KEYWORD : attrs = <class 'inspect._empty'>


- Signature 객체의 bind() 메서드는 임의 개수의 인수를 받으며, 인수를 매개변수에 대응시키는 일반적인 규칙을 적용해서 그것을 시그니처에 들어 있는 매개변수에 바인딩한다.
  - 실제 함수를 호출하기 전에 인수를 검증하기 위해 사용될 수 있다.
  - 단순히 딕셔너리에 다 대입해서 넣는 것보다 안전할 것 같다.

In [81]:
# 예제 5-18 tag()에서 가져온 시그니처를 인수들의 딕셔너리에 바인딩하기
import inspect
sig = inspect.signature(tag)
my_tag = {'name': 'img', 'title': 'Sunset Boulevard', 'src': 'sunset.jpg', 'cls': 'framed'}
bound_args = sig.bind(**my_tag)
bound_args

<BoundArguments (name='img', cls='framed', attrs={'title': 'Sunset Boulevard', 'src': 'sunset.jpg'})>

In [82]:
for name, value in bound_args.arguments.items():
    print(name, '=', value)

name = img
cls = framed
attrs = {'title': 'Sunset Boulevard', 'src': 'sunset.jpg'}


In [83]:
del my_tag['name']
bound_args = sig.bind(**my_tag)

TypeError: missing a required argument: 'name'

## 5.9 함수 애너테이션
- 함수의 매개변수와 반환값에 메타데이터를추가할 수 있는 구문
  - 매개변수 애너테이션은 콜론 뒤에 추가, 기본값이 있을 때, 애너테이션은 인수명과 등호 사이에 들어간다.
  - 반환값 애너테이션은 -> 뒤에
  - 표현식은 어떤 자료형도 될 수 있다.
- 말 그대로 애너테이션일 뿐이지, 애너테이션을 따르지 않았다고 오류가 발생하지는 않는다.
  - 정적 자료형 검사를 지원하기 위해 선택적인 자료형 정보를 전달하는 데 큰 도움이 된다.

In [27]:
# 예제 5-19 애너테이션을 추가한 clip() 함수
def clip(text:str, max_len:'int > 0'=80) -> str:
    """
    max_len 앞이나 뒤의 마지막 공백에서 잘라낸 텍스트를 반환한다.
    """
    end = None
    if len(text) > max_len:
        space_before = text.rfind(' ', 0, max_len)
        if space_before >= 0:
            end = space_before
        else:
            space_after = text.rfind(' ', max_len)
            if space_after >= 0:
                end = space_after
                
    if end is None:
        end = len(text)
    return text[:end].rstrip()

In [28]:
clip.__annotations__

{'text': str, 'max_len': 'int > 0', 'return': str}

- inspect.signature()는 애너테이션을 추출하는 방법을 안다.

In [29]:
from inspect import signature

sig = signature(clip)
print(sig)
print()
print(sig.return_annotation)
print()
print(sig.parameters)
print()
for param in sig.parameters.values():
    note = repr(param.annotation).ljust(13)
    print(note, ':', param.name, '=', param.default)

(text: str, max_len: 'int > 0' = 80) -> str

<class 'str'>

OrderedDict([('text', <Parameter "text: str">), ('max_len', <Parameter "max_len: 'int > 0' = 80">)])

<class 'str'> : text = <class 'inspect._empty'>
'int > 0'     : max_len = 80


## 5.10 함수형 프로그래밍을 위한 패키지
- operator와 functools 같은 패키지들을 사용해서 함수형 코딩 스타일을 사용할 수 있다.
- 함수형 프로그래밍?
  - 순수 함수를 조합하고 소프트웨어를 만드는 방식, 작은 문제를 해결하기 위한 함수를 작성
  - 함수를 함수에 입력 및 출력한다 (1급 객체).
  - 대입문이 없는 프로그래밍

### 5.10.1 operator 모듈
- 함수형 프로그래밍을 할 때, 산술 연산자를 함수로 사용하는 것이 편리할 때가 있다.

In [31]:
# 예제 5-21 reduce()와 익명 함수로 구현한 팩토리얼
from functools import reduce


def fact(n):
    return reduce(lambda a, b: a*b, range(1, n + 1))

In [32]:
# 예제 5-22 reduce()와 operator.mul로 구현한 팩토리얼
from functools import reduce
from operator import mul


def fact(n):
    return reduce(mul, range(1, n + 1))

- `operator.itemgetter()`: 시퀀스로부터 항목을 가져오는 함수

In [37]:
# 예제 5-23 튜플의 리스트를 정렬하기 위한 itemgetter() 사용 예
from operator import itemgetter

metro_data = [
    ('Tokyo', 'JP', 36.993, (35.689722, 139.691617)),
    ('Deihi NCR', 'IN', 21.935, (28.613889, 77.208889)),
    ('Mexico City', 'MX', 20.142, (19.433333, -99.133333)),
    ('New York-Newark', 'US', 20.104, (40.808611, -74.020386)),
    ('Sao Paulo', 'BR', 19.649, (-23.547778, -46.635833))
]

# 주어진 시퀀스형에서 1번 인덱스를 가져오는 itemgetter(1)
for city in sorted(metro_data, key=itemgetter(1)):
    print(city)

('Sao Paulo', 'BR', 19.649, (-23.547778, -46.635833))
('Deihi NCR', 'IN', 21.935, (28.613889, 77.208889))
('Tokyo', 'JP', 36.993, (35.689722, 139.691617))
('Mexico City', 'MX', 20.142, (19.433333, -99.133333))
('New York-Newark', 'US', 20.104, (40.808611, -74.020386))


In [38]:
# 주어진 시퀀스형에서 1번 인덱스와 0번 인덱스를 가져오는 객체 생성
cc_name = itemgetter(1, 0)  
for city in metro_data:
    print(cc_name(city))

('JP', 'Tokyo')
('IN', 'Deihi NCR')
('MX', 'Mexico City')
('US', 'New York-Newark')
('BR', 'Sao Paulo')


- `operator.attrgetter()`: 객체의 속성을 가져오는 함수

In [41]:
# 5-24 metro_areas라는 명명된 튜플의 리스트를 처리하기 위한 attrgetter() 사용 예
from collections import namedtuple
from operator import attrgetter

LatLong = namedtuple('LatLong', 'lat long')
Metropolis = namedtuple('Metropolis', 'name cc pop coord')
metro_areas = [Metropolis(name, cc, pop, LatLong(lat, long)) 
               for name, cc, pop, (lat, long) in metro_data]

name_lat = attrgetter('name', 'coord.lat')

for city in sorted(metro_areas, key=attrgetter('coord.lat')):
    print(name_lat(city))

('Sao Paulo', -23.547778)
('Mexico City', 19.433333)
('Deihi NCR', 28.613889)
('Tokyo', 35.689722)
('New York-Newark', 40.808611)


- `operator.methodcaller()`: 객체의 메서드를 가져오는 함수

In [51]:
# 예제 5-25 methodcaller() 사용 예. 
# 두 번째 테스트 hiphenate()에서 여번의 인수가 바인딩되는 것에 주의하라
from operator import methodcaller

s = 'The time has come'
upcase = methodcaller('upper')

print('s.upper(): ', s.upper())
print('upcase(s): ', upcase(s))

hiphenate = methodcaller('replace', ' ', '-')  # replace의 인수들이 바인딩된다.
print("s.replace(' ', '-'): ", s.replace(' ', '-'))
print("hiphenate(s): ", hiphenate(s))


s.upper():  THE TIME HAS COME
upcase(s):  THE TIME HAS COME
s.replace(' ', '-'):  The-time-has-come
hiphenate(s):  The-time-has-come


- `operator` 모듈에 정의된 함수들 중 일부

In [44]:
import operator


print([name for name in dir(operator) if not name.startswith('_')])

['abs', 'add', 'and_', 'attrgetter', 'concat', 'contains', 'countOf', 'delitem', 'eq', 'floordiv', 'ge', 'getitem', 'gt', 'iadd', 'iand', 'iconcat', 'ifloordiv', 'ilshift', 'imatmul', 'imod', 'imul', 'index', 'indexOf', 'inv', 'invert', 'ior', 'ipow', 'irshift', 'is_', 'is_not', 'isub', 'itemgetter', 'itruediv', 'ixor', 'le', 'length_hint', 'lshift', 'lt', 'matmul', 'methodcaller', 'mod', 'mul', 'ne', 'neg', 'not_', 'or_', 'pos', 'pow', 'rshift', 'setitem', 'sub', 'truediv', 'truth', 'xor']


### 5.10.2 functools.partial()로 인수 고정하기
- 함수를 부분적으로 실행할 수 있게 해주는 고위 함수.
- 원래 함수의 일부 인수를 고정한 콜러블을 생성
- 하나 이상의 인수를 받는 함수를 그보다 적은 인수를 받는 콜백 함수를 사용

In [53]:
# 5-26 인수를 하나 받는 콜러블이 필요한 곳에인수 두 개를 받는 함수를 사용하기 위해 partial() 적용하기
from operator import mul
from functools import partial

triple = partial(mul, 3)  # mul의 인수 중 하나는 3으로 고정됌
print(triple(7))
print(list(map(triple, range(1, 10))))

21
[3, 6, 9, 12, 15, 18, 21, 24, 27]


In [54]:
# 5-27 partial()을 이용해서 편리한 유니코드 정규화 함수 만들기
import unicodedata, functools
nfc = functools.partial(unicodedata.normalize, 'NFC')

s1 = 'café'
s2 = 'cafe\u0301'

print(s1, s2)
print(s1 == s2)
print(nfc(s1) == nfc(s2))

café café
False
True


In [63]:
# 5-28 tag() 함수에 적용한 partial 함수
from functools import partial


def tag(name, *content, cls=None, **attrs):
    """하나 이상의 HTML 태그를 생성한다."""
    if cls is not None:
        attrs['class'] = cls
        
    if attrs:
        attr_str = ''.join(' %s="%s"' % (attr, value) for attr, value in sorted(attrs.items()))
        
    else:
        attr_str = ''
        
    if content:
        return '\n'.join('<%s%s>%s</%s>' % (name, attr_str, c, name) for c in content)
    
    else:
        return '<%s%s />'% (name, attr_str)


picture = partial(tag, 'img', cls='pic-frame')
print(picture)
picture(src='wumpus.jpeg')

functools.partial(<function tag at 0x000002073F45DF70>, 'img', cls='pic-frame')


'<img class="pic-frame" src="wumpus.jpeg" />'

In [65]:
print(picture.func)
print(picture.args)
print(picture.keywords)

<function tag at 0x000002073F45DF70>
('img',)
{'cls': 'pic-frame'}
