일급 객체는 다음 성질들을 만족하는 프로그램 객체를 뜻한다.
* 런타임에 생성할 수 있다.
* 데이터 구조체의 변수나 요소에 할당할 수 있다.
* 함수 인수로 전달할 수 있다.
* 함수 결과로 반환할 수 있다.

따라서 정수, 문자열, 딕셔너리 등은 파이썬의 일급 객체이다.

# 5.1 함수를 객체처럼 다루기

파이썬 함수 또한 `function` 클래스의 객체이다.

In [69]:
def factorial(n):
    """returns n!"""
    return 1 if n < 2 else n * factorial(n-1)

In [70]:
factorial(10)

3628800

In [71]:
factorial.__doc__

'returns n!'

In [72]:
type(factorial)

function

In [73]:
help(factorial)

Help on function factorial in module __main__:

factorial(n)
    returns n!



In [74]:
fact = factorial
fact

<function __main__.factorial(n)>

In [75]:
fact(5)

120

In [76]:
map(factorial, range(11))

<map at 0x7f3e440402e8>

In [77]:
list(map(fact, range(11)))

[1, 1, 2, 6, 24, 120, 720, 5040, 40320, 362880, 3628800]

# 5.2 고위 함수

함수를 인수로 받거나, 함수를 결과로 반환하는 함수를 __고위 함수(higher-order function)__라고 한다. 대표적으로 `map()`, `sorted()` 등이 있다. `sorted()` 함수는 선택적인 key 인수로 함수를 전달받아 정렬할 각 항목에 전달한다.

In [78]:
fruits = ['strawberry', 'fig', 'apple', 'cherry', 'raspbrry', 'banana']
sorted(fruits, key=len)

['fig', 'apple', 'cherry', 'banana', 'raspbrry', 'strawberry']

In [79]:
def reverse(word):
    return word[::-1]
reverse('testing')

'gnitset'

In [80]:
sorted(fruits, key=reverse)

['banana', 'apple', 'fig', 'raspbrry', 'strawberry', 'cherry']

# 5.3 익명 함수

`lambda` 키워드는 파이썬 표현식 내에 익명 함수를 생성한다.

In [81]:
sorted(fruits, key=lambda word: word[::-1])

['banana', 'apple', 'fig', 'raspbrry', 'strawberry', 'cherry']

# 5.4 일곱 가지 맛의 콜러블 객체

호출할 수 있는 객체인지 알아보려면 `callable()` 내장 함수를 사용한다. 파이썬 데이터 모델 문서는 다음 일곱 가지 콜러블을 나열하고 있다.

* 사용자 정의 함수 : `def`문이나 람다 표현식으로 생성
* 내장 함수 : `len()`이나 `time.strftime()`처럼 C언어로 구현된 함수
* 내장 메서드 : `dict.get()`처럼 C언어로 구현된 메서드
* 메서드 : 클래스 본체에 정의된 함수
* 클래스 : ??
* 클래스 객체 : 클래스가 `__call__()` 메서드를 구현하면 이 클래스의 객체는 함수로 호출될 수 있다.
* 제너레이터 함수 : `yield` 키워드를 사용하는 함수나 메서드

In [82]:
abs, str, 13

(<function abs(x, /)>, str, 13)

In [83]:
[callable(obj) for obj in (abs, str, 13)]

[True, True, False]

# 5.5 사용자 정의 콜러블형

파이썬 클래스가 함수처럼 동작하게 만들려면 `__call()__` 인스턴스 메서드를 구현하면 된다.

In [84]:
import random

class BingoCage:
    
    def __init__(self, items):
        self._items = list(items)
        random.shuffle(self._items)
        
    def pick(self):
        try:
            return self._items.pop()
        except:
            raise LookupError('pick from empty BingoCage')
            
    def __call__(self):
        return self.pick()

In [85]:
bingo = BingoCage(range(3))
bingo.pick()

1

In [86]:
bingo()

0

In [87]:
callable(bingo)

True

In [88]:
bingo()

2

In [89]:
bingo()

LookupError: pick from empty BingoCage

# 5.6 함수 인트로스펙션

함수 객체는 `__doc__` 이외에도 많은 속성을 가지고 있다.

In [90]:
dir(factorial)

['__annotations__',
 '__call__',
 '__class__',
 '__closure__',
 '__code__',
 '__defaults__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__get__',
 '__getattribute__',
 '__globals__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__kwdefaults__',
 '__le__',
 '__lt__',
 '__module__',
 '__name__',
 '__ne__',
 '__new__',
 '__qualname__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

이중 `__dict__` 속성은 객체에 할당된 사용자 속성을 보여준다. 일반적으로 함수에 어떤 속성을 할당하는 것은 흔한 일이 아니지만, 장고와 같은 프레임워크는 이 기능을 사용한다.

이제 일반적인 파이썬 사용자 정의 객체에는 없지만 함수에는 있는 고유한 속성을 살펴보자.

In [91]:
class C: pass
def func(): pass
obj = C()

In [92]:
sorted(set(dir(func)) - set(dir(obj)))

['__annotations__',
 '__call__',
 '__closure__',
 '__code__',
 '__defaults__',
 '__get__',
 '__globals__',
 '__kwdefaults__',
 '__name__',
 '__qualname__']

# 5.7 위치 매개변수에서 키워드 전용 매개변수까지

키워드 전용 인수는 [여기](https://m.blog.naver.com/PostView.nhn?blogId=jodi999&logNo=221492571718&proxyReferer=https%3A%2F%2Fwww.google.com%2F)를 참고

In [93]:
def tag(name, *content, cls=None, **attrs):
    """하나 이상의 HTML 태그를 생성"""
    if cls is not None:
        attrs['class'] = cls
    if attrs:
        attr_str = ''.join(' %s="%s"' % (attr, value)
                          for attr, value in sorted(attrs.items()))
    else:
        attr_str = ''
    if content:
        return '\n'.join('<%s%s>%s</%s>' %
                        (name, attr_str, c, name) for c in content)
    else:
        return '<%s%s />' % (name, attr_str)

위와 같이 함수를 정의하면 `cls`가 키워드 전용 인수가 된다. 따라서 그외의 미지정 인수들은 모두 `*content`에, 그리고 `cls` 외의 키워드 인수들은 `**attrs`에 전달된다.

In [94]:
tag('br')

'<br />'

In [95]:
tag('p', 'hello') # 첫 번째 이후 인수들은 모두 *content 매개변수에 튜플로 전달된다.

'<p>hello</p>'

In [96]:
print(tag('p','hello','world'))

<p>hello</p>
<p>world</p>


In [97]:
tag('p','hello',id=33) # 명시적으로 이름이 지정되지 않은 키워드 인수들은 딕셔너리로 **attrs 인수에 전달됨

'<p id="33">hello</p>'

In [98]:
print(tag('p', 'hello', 'world', cls='sidebar'))

<p class="sidebar">hello</p>
<p class="sidebar">world</p>


In [99]:
tag(content='testing', name='img')

'<img content="testing" />'

In [100]:
my_tag = {'name':'img', 'title':'Sunset Boulevard',
         'src':'sunset.jpg', 'cls':'framed'}

In [101]:
tag(**my_tag) # 명명된 매개변수 외 나머지는 **attrs에 전달

'<img class="framed" src="sunset.jpg" title="Sunset Boulevard" />'

키워드 전용 인수는 파이썬3에 새로 추가된 기능이다. 위 예제에서 `cls` 매개변수는 키워드 인수로만 전달될 수 있다. 

함수를 정의할 때 키워드 전용 인수를 지정하려면 `*`가 붙은 인수 뒤에 이름을 지정한다. 가변 개수의 위치 인수를 지원하지 않으면서 키워드 전용 인수를 지원하고 싶으면 다음과 같이 `*`만 시그니처에 포함시키면 된다.

In [102]:
def f(a=1, *, b=2):
    return a,b
f(1,2)

TypeError: f() takes from 0 to 1 positional arguments but 2 were given

In [103]:
f(1,b=2)

(1, 2)

In [104]:
print(f.__defaults__, f.__kwdefaults__, f.__code__.co_varnames, f.__code__.co_argcount)

(1,) {'b': 2} ('a', 'b') 1


# 5.8 매개변수에 대한 정보 읽기

함수 객체 안의 `__defaults__` 속성에는 위치 인수와 키워드 인수의 기본값을 가진 튜플이 들어 있다. 키워드 전용 인수의 기본값은 `__kwdefaults__` 속성에 들어 있다. 그러나 인수명은 `__code__` 속성에 들어 있는데, 이 속성은 여러 속성을 담고 있는 `code` 객체를 가리킨다.

In [105]:
# S.rfind(sub[, start[, end]]) -> int

In [106]:
def clip(text, max_len=80):
    """max_len 앞이나 뒤의 마지막 공백에서 잘라낸 텍스트를 반환한다."""
    
    end=None
    if len(text) > max_len:
        space_before = text.rfind(' ', 0, max_len)
        # 0부터 max_len 사이에서 역순으로 ' '를 찾음
        if space_before >= 0:
            end = space_before
        else:
            space_after = text.rfind(' ', max_len)
            # max_len부터 ' ' 를 찾음
            if space_after >= 0:
                end = space_after
    
    if end is None: # 공백이 없다.
        end = len(text)
    return text[:end].rstrip()

In [107]:
clip.__defaults__

(80,)

In [108]:
clip.__code__

<code object clip at 0x7f3e4408bdb0, file "<ipython-input-106-2f9113397e4d>", line 1>

In [109]:
clip.__code__.co_varnames

('text', 'max_len', 'end', 'space_before', 'space_after')

In [110]:
clip.__code__.co_argcount

2

인수명이 `__code__.co_varnames`에 들어있지만 여기엔 함수 본체에서 생성한 지역 변수명도 들어 있으므로, 앞에서 `__code__.co_argcount`개의 변수가 인수명이다. 이때 `__code__.co_argcount`에는 앞에 `*`나 `**`가 붙은 인수가 포함되어 있지 않다. 

인수의 기본값은 `__defaults__` 튜플의 위치에 따라 알 수 있으므로, 인수를 뒤에서부터 추적하면서 대응시켜야 한다. 

`inspect` 모듈을 사용하면 더 깔끔하게 처리할 수 있다.

In [111]:
from inspect import signature
sig = signature(clip)

In [112]:
sig # doctest: +ELLIPSIS

<Signature (text, max_len=80)>

In [113]:
str(sig)

'(text, max_len=80)'

In [114]:
for name, param in sig.parameters.items():
    print(param.kind, ":", name, "=", param.default)

POSITIONAL_OR_KEYWORD : text = <class 'inspect._empty'>
POSITIONAL_OR_KEYWORD : max_len = 80


`inspector.Signature` 객체에는 `bind()` 메서드가 있는데, 이는 임의 개수의 인수를 받고, 인수를 매개변수에 대응시키는 일반적인 규칙을 적용해서 그것을 시그너처에 들어있는 매개변수에 바인딩한다. 이를 이용해 프레임워크에서 실제 함수를 호출하기 전에 인수를 검증하기 위해 사용할 수 있다.

In [115]:
sig = signature(tag)

In [116]:
my_tag

{'name': 'img',
 'title': 'Sunset Boulevard',
 'src': 'sunset.jpg',
 'cls': 'framed'}

In [117]:
bound_args = sig.bind(**my_tag)
bound_args

<BoundArguments (name='img', cls='framed', attrs={'title': 'Sunset Boulevard', 'src': 'sunset.jpg'})>

In [118]:
for name, value in bound_args.arguments.items():
    print(name, '=', value)

name = img
cls = framed
attrs = {'title': 'Sunset Boulevard', 'src': 'sunset.jpg'}


In [119]:
del my_tag['name']

In [120]:
bound_args = sig.bind(**my_tag)
bound_args # 필수 인수인 name이 없으므로 에러가 발생

TypeError: missing a required argument: 'name'

# 5.9 함수 애너테이션

파이썬3는 함수의 매개변수와 반환값에 메타데이터를 추가할 수 있는 구문을 제공한다.

In [121]:
def clip2(text:str, max_len:'int>0'=80) -> str:
    """max_len 앞이나 뒤의 마지막 공백에서 잘라낸 텍스트를 반환한다."""
    
    end=None
    if len(text) > max_len:
        space_before = text.rfind(' ', 0, max_len)
        # 0부터 max_len 사이에서 역순으로 ' '를 찾음
        if space_before >= 0:
            end = space_before
        else:
            space_after = text.rfind(' ', max_len)
            # max_len부터 ' ' 를 찾음
            if space_after >= 0:
                end = space_after
    
    if end is None: # 공백이 없다.
        end = len(text)
    return text[:end].rstrip()

In [122]:
clip2('Hello world this is good',-100)

'Hello world this is'

함수 선언에서 각 매개변수는 콜론(:) 뒤에 애너테이션 표현식을 추가할 수 있다. 반환값에도 함수 선언 마지막에 -> 기호와 표현식을 추가하여 선언할 수 있다. 

애너테이션은 전혀 처리하지 않으며, 단지 함수 객체 안의 `dict`형 `__annotations__` 속성에 저장될 뿐이다.

In [123]:
clip2.__annotations__

{'text': str, 'max_len': 'int>0', 'return': str}

In [124]:
sig2 = signature(clip2)
sig2.return_annotation

str

In [125]:
for param in sig2.parameters.values():
    note = repr(param.annotation).ljust(13)
    print(note, ':', param.name, '=', param.default)

<class 'str'> : text = <class 'inspect._empty'>
'int>0'       : max_len = 80


# 5.10 함수형 프로그래밍을 위한 패키지

`operator`와 `functool` 같은 패키지를 쓰면 함수형 코딩을 할 수 있다.

## 5.10.1 operator 모듈

함수형 프로그래밍을 할 때 산술 연산자를 함수로 사용할 때가 있다. 가령 팩토리얼을 재귀적으로 함수를 호출하는 대신 숫자 시퀀스를 곱하는 경우를 생각해보자.

In [126]:
from functools import reduce

In [127]:
help(reduce)

Help on built-in function reduce in module _functools:

reduce(...)
    reduce(function, sequence[, initial]) -> value
    
    Apply a function of two arguments cumulatively to the items of a sequence,
    from left to right, so as to reduce the sequence to a single value.
    For example, reduce(lambda x, y: x+y, [1, 2, 3, 4, 5]) calculates
    ((((1+2)+3)+4)+5).  If initial is present, it is placed before the items
    of the sequence in the calculation, and serves as a default when the
    sequence is empty.



In [128]:
def fact(n):
    return reduce(lambda a,b:a*b, range(1, n+1))

In [129]:
fact(10)

3628800

`lambda a,b:a*b`와 같은 익명 함수를 작성하는 수고를 덜기 위해 `operator` 모듈은 수십 개의 연산자에 대응하는 함수를 제공한다.

In [130]:
from operator import mul

def fact2(n):
    return reduce(mul, range(1,n+1))

In [131]:
fact2(10)

3628800

특정 필드의 값을 기준으로 튜플의 리스트를 정렬할 때 사용하는 `itemgetter()`를 보자. 본질적으로 `itemgetter(1)`은 `lambda fields: fields[1]`과 동일하다.

In [132]:
from example-code.02-array-seq.metro_lat_long import metro_area

SyntaxError: invalid syntax (<ipython-input-132-fa994e3310bf>, line 1)

In [133]:
metro_data = [
    ('Tokyo', 'JP', 36.933, (35.689722, 139.691667)),   # <1>
    ('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889)),
    ('Mexico City', 'MX', 20.142, (19.433333, -99.133333)),
    ('New York-Newark', 'US', 20.104, (40.808611, -74.020386)),
    ('Sao Paulo', 'BR', 19.649, (-23.547778, -46.635833)),
]

In [134]:
from operator import itemgetter
for city in sorted(metro_data, key=itemgetter(1)):
    print(city)

('Sao Paulo', 'BR', 19.649, (-23.547778, -46.635833))
('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889))
('Tokyo', 'JP', 36.933, (35.689722, 139.691667))
('Mexico City', 'MX', 20.142, (19.433333, -99.133333))
('New York-Newark', 'US', 20.104, (40.808611, -74.020386))


`itemgetter()`에 여러 개의 인덱스를 인수로 전달하면 해당 인덱스의 값들로 구성된 튜플을 반환한다.

In [135]:
cc_name = itemgetter(1,0)
for city in metro_data:
    print(cc_name(city))

('JP', 'Tokyo')
('IN', 'Delhi NCR')
('MX', 'Mexico City')
('US', 'New York-Newark')
('BR', 'Sao Paulo')


`itemgetter()`는 시퀀스 뿐 아니라 매핑 및 `__getitem__()`을 구현한 모든 클래스를 지원한다.

`itemgetter()`의 형제인 `attrgetter()`는 이름으로 객체 속성을 추출하는 함수를 생성한다.

In [136]:
from collections import namedtuple
LatLong = namedtuple('LatLong', 'lat long')
Metropolis = namedtuple('Metropolis', 'name cc pop coord')
metro_areas = [Metropolis(name, cc, pop, LatLong(lat, long))
              for name, cc, pop, (lat, long) in metro_data]

In [137]:
metro_areas[0]

Metropolis(name='Tokyo', cc='JP', pop=36.933, coord=LatLong(lat=35.689722, long=139.691667))

In [138]:
metro_areas[0].coord.lat

35.689722

In [139]:
from operator import attrgetter
name_lat = attrgetter('name', 'coord.lat')

In [140]:
name_lat(metro_areas[0])

('Tokyo', 35.689722)

In [141]:
for city in sorted(metro_areas, key=attrgetter('coord.lat')):
    print(name_lat(city))

('Sao Paulo', -23.547778)
('Mexico City', 19.433333)
('Delhi NCR', 28.613889)
('Tokyo', 35.689722)
('New York-Newark', 40.808611)


In [142]:
# 뜬금없는 언패킹 연습
metro_areas2 = [Metropolis(name, cc, pop, LatLong(*loc))
              for name, cc, pop, loc in metro_data]
metro_areas2[0]

Metropolis(name='Tokyo', cc='JP', pop=36.933, coord=LatLong(lat=35.689722, long=139.691667))

`operator`에 정의된 함수들

In [143]:
import operator
[name for name in dir(operator) if not name.startswith('_')]

['abs',
 'add',
 'and_',
 'attrgetter',
 'concat',
 'contains',
 'countOf',
 'delitem',
 'eq',
 'floordiv',
 'ge',
 'getitem',
 'gt',
 'iadd',
 'iand',
 'iconcat',
 'ifloordiv',
 'ilshift',
 'imatmul',
 'imod',
 'imul',
 'index',
 'indexOf',
 'inv',
 'invert',
 'ior',
 'ipow',
 'irshift',
 'is_',
 'is_not',
 'isub',
 'itemgetter',
 'itruediv',
 'ixor',
 'le',
 'length_hint',
 'lshift',
 'lt',
 'matmul',
 'methodcaller',
 'mod',
 'mul',
 'ne',
 'neg',
 'not_',
 'or_',
 'pos',
 'pow',
 'rshift',
 'setitem',
 'sub',
 'truediv',
 'truth',
 'xor']

In [144]:
help(str.startswith)

Help on method_descriptor:

startswith(...)
    S.startswith(prefix[, start[, end]]) -> bool
    
    Return True if S starts with the specified prefix, False otherwise.
    With optional start, test S beginning at that position.
    With optional end, stop comparing S at that position.
    prefix can also be a tuple of strings to try.



`methodcaller()`에 대해 알아보자. 얘가 생성한 함수는 인수로 전달받은 객체의 메서드를 호출한다.

In [145]:
from operator import methodcaller
s = 'The time has come'
upcase = methodcaller('upper')

In [146]:
upcase(s)

'THE TIME HAS COME'

In [147]:
s.upper()

'THE TIME HAS COME'

In [148]:
hiphenate = methodcaller('replace', ' ', '-')
hiphenate(s)

'The-time-has-come'

In [149]:
hiphenate2 = lambda x : x.replace(' ', '-')
hiphenate2(s)

'The-time-has-come'

## 5.10.2 functools.partial() 로 인수 고정하기

`functools.partial()`은 함수를 부분적으로 실행할 수 있게 해주는 고위 함수이다. 어떤 함수에 `partial()`을 적용하면 원래 함수의 일부 인수를 고정한 콜러블을 생성한다.

In [150]:
# 인수를 하나 받는 콜러블이 필요한 곳에 인수 두 개를 받는 함수를 사용하기 위해 partial() 적용하기
from operator import mul
from functools import partial
triple = partial(mul, 3)
triple(7)

21

In [151]:
list(map(triple, range(1,10)))

[3, 6, 9, 12, 15, 18, 21, 24, 27]

In [152]:
# partial()을 이용해서 편리한 유니코드 정규화 함수 만들기
import unicodedata
nfc = partial(unicodedata.normalize, 'NFC')

In [153]:
s1 = 'café'
s2 = 'cafe\u0301'
s1, s2

('café', 'café')

In [154]:
s1 == s2, nfc(s1) == nfc(s2)

(False, True)

`partial()`의 첫번째 인수는 콜러블이며, 그 뒤에 바인딩할 위치 인수와 키워드 인수가 원하는 만큼 나온다.

In [155]:
# tag() 함수에 적용한 partial() 함수
tag
picture = partial(tag, 'img', cls='pic-frame')

In [156]:
picture(src='wumpus.jpg')

'<img class="pic-frame" src="wumpus.jpg" />'

In [160]:
tag, picture, picture.func, picture.args, picture.keywords

(<function __main__.tag(name, *content, cls=None, **attrs)>,
 functools.partial(<function tag at 0x7f3e44015620>, 'img', cls='pic-frame'),
 <function __main__.tag(name, *content, cls=None, **attrs)>,
 ('img',),
 {'cls': 'pic-frame'})

`functools.partialmethod()` 함수는 `partial()`과 동일하지만 메서드에 대해 작동하도록 설계됨