## Chapter 5

+ 일급 객체

Python의 함수가 일급 객체(First-class object)라는 건 파이썬 해본 사람이라면 누구든 알고 있다. 참고로 이 일급 객체라는 말은 최고라는 뜻이거나 뭔가 좋다는 뜻이 아니라 다른 요소들과 차별이 없다는 뜻이다. 그럼 이 일급 객체란 무엇인가?

1. 런타임에 생성할 수 있다.
2. 데이터 구조체의 변수, 요소에 할당할 수 있다.
3. 함수 인수로 전달할 수 있다.
4. 함수 결과로 반환할 수 있다.

위 4가지를 만족하면 일급 객체가 된다. 당연히 정수, 문자열, 리스트, 딕셔너리 등도 일급 객체다. 그럼 함수가 정수, 리스트 등의 자료형들과 같이 일급 객체라는 건 무슨 의미를 가지는가?

+ 일급 객체 함수, 고위 함수

다음과 같이 함수를 변수에 할당할 수 있다. 또 map이나 sort의 key등, 고위 함수의 인자로 함수를 줄 수 있다. 여기서 고위 함수란 함수를 인자로 받거나 함수를 결과로 반환하는 함수를 말한다(물론 map등의 함수는 파이썬에 list comprehension이 도입되면서 중요도가 좀 떨어졌다. filter함수도 마찬가지다).

In [None]:
def factorial(n):
  return 1 if n<2 else n*factorial(n-1)

fact=factorial

print(factorial(5))
print(fact(5))
print(list(map(fact,range(10))))
#map함수의 인자로 fact 함수가 들어간다
print(type(fact))

120
120
[1, 1, 2, 6, 24, 120, 720, 5040, 40320, 362880]
<class 'function'>


+ 람다 함수

파이썬에서 익명 함수를 생성할 수 있는 lambda 키워드는 파이썬을 하다 보면 한번쯤 마주치게 되는 단어이다. 물론 파이썬은 람다 함수 본체가 순수한 표현식으로만 구성되도록 제한하기 때문에 람다식으로 복잡한 함수를 작성하기는 힘들다. 또 람다식을 이용해 복잡한 함수를 어떻게든 작성하더라도 가독성이 떨어진다. 따라서 람다함수는 거의 고위 함수의 인수로만 사용된다. 재활용되지 않는 간단한 함수들을 익명으로 생성할 수 있기 때문이다.

In [None]:
l=[(1,2),(10,3),(1,1),(5,5)]
print(sorted(l, key=lambda x:x[1]))
# 튜플의 2번째 원소만 뽑아내는 람다 함수를 정렬에 사용하는 예시

[(1, 1), (1, 2), (10, 3), (5, 5)]


+ 람다 함수의 대용품

하지만 람다 함수는 여러가지 단점들이 있기 때문에, 사칙연산(add,sub,mul,div)이나 시퀀스의 특정 인덱스나 특정 원소를 뽑아내는 것(itemgetter, attrgetter)과 같은 함수들을 파이썬에서는 operator 모듈을 통해 지원한다. 이를테면 리스트에 있는 모든 원소를 xor한다든지 할 때 유용하게 쓸 수 있는 것이다.

In [4]:
from functools import reduce
from operator import xor

l=[1,2,3,4,5,6,7,8,9,10]
# 아래 두 줄의 코드는 완전히 같은 기능을 한다. operator.xor 함수로 람다를 대체할 수 있는 것이다.
print(reduce(lambda a,b:a^b, l))
print(reduce(xor, l))

11
11


In [6]:
from operator import itemgetter

l=[(1,2),(10,3),(1,1),(5,5)]
print(sorted(l, key=itemgetter(1)))
# 튜플의 2번째 원소를 기준으로 정렬하는 데 쓰이는 위의 람다함수를 itemgetter 로 대체

[(1, 1), (1, 2), (10, 3), (5, 5)]


하나의 원소를 뽑아내는 것만이 아니라, itemgetter에 여러 개의 인덱스를 전달하면 그 인덱스의 값들로 구성된 튜플을 반환해 준다. 이름으로 객체 속성을 추출해 주는 함수인 attrgetter(namedtuple 등에 사용)도, 여러 인수를 주면 비슷하게 작동한다.

+ 콜러블 객체

또한 함수 호출을 할 때 쓰이는 호출 연산자 ()는 사용자 정의 함수 외의 다른 객체에도 사용할 수 있다. callable() 내장 함수를 이용하면 어떤 객체가 ()를 이용해 호출 가능한 콜러블 객체인지 판별할 수 있다. 파이썬의 콜러블 객체는 총 7종류인데,
1. 사용자 정의 함수
2. 내장 함수
3. 내장 메서드
4. 메서드
5. 클래스
6. 클래스 객체
7. 제너레이터 함수

1,2,3,4는 너무 당연하며 5. 클래스의 경우 클래스 호출시 클래스가 생성되므로 클래스를 사용해 본 사람이라면 클래스를 ()를 이용해 호출할 수 있다는 것을 이해할 수 있다. 그런데 6. 클래스 객체 를 ()를 이용해 호출할 수 있다는 건 무슨 의미인가? 이는 클래스에 `__call__`메서드를 구현할 시 알 수 있다.



In [8]:
import random

class BaekjoonBest:
  member=["Cono", "Gidong", "Yun", "Delta", "Witch"]

  def pick(self):
    return random.choice(self.member)

  def __call__(self):
    return self.pick()

BB=BaekjoonBest()
print(BB())
print(BB())

Witch
Delta


+ `__call__` 의 구현

BaekjoonBest 클래스의 인스턴스인 BB를 ()로 호출하자 `__call__` 메서드가 호출되어 정의된 동작을 수행하는 것을 볼 수 있다. 이 메서드는 클래스 내 member 리스트에서 임의의 원소를 뽑아 리턴하므로 코드를 실행할 때마다 결과가 바뀐다. 이런 식으로 `__call__` 메서드를 구현하면 어떤 파이썬 객체든지 함수처럼 사용할 수 있게 된다.

함수 객체는 이 외에도 많은 속성을 가지고 있는데 이는 dir 내장 함수를 통해 볼 수 있다. dir 내장 함수는 객체에 내장된 메서드와 변수들을 모두 나열해 주는 역할을 한다.


+ 키워드 전용 인수

또한 함수는 인수를 받는데, 파이썬에서 함수의 인수를 키워드를 이용해 줄 수 있다는 건 널리 알려진 사실이다. 그런데 키워드로만 입력할 수 있는 키워드 전용 인수(keyword-only argument) 를 만들 수도 있다. 키워드 전용 인수로는 sort 함수의 key인수가 대표적인데, 이를 사용자 정의로 만들 수 있다는 것이다. 방법은 간단한데 여러 인자를 받는, `*`가 붙은 인수 뒤에 키워드명을 지정하는 것이다. 아래 코드를 보면 키워드를 지정하지 않고 익명 인수로 전달할 시 무시되는 것을 알 수 있다. 익명 인수는 `*misc` 에 전달되기 때문이다.

In [9]:
def info(name, *misc, sex="default"):
  print(name, sex)

info("Kakao")
info("witch", sex="male")
info("witch", "male")

Kakao default
witch male
witch default


+ 매개변수 폭발

또한 함수의 인수에 `*` 나 `**` 를 사용하여 반복 가능 객체나 매핑형을 폭발시키는 것도 파이썬의 훌륭한 기능 중 하나다. 혹은 다음 코드와 같이, 여러 개의 키워드 인수를 하나의 딕셔너리로 묶어 줄 수도 있다.

In [19]:
def read_func(**kwargs):
  return kwargs

print(read_func(a=1,b=2,c=3))

{'a': 1, 'b': 2, 'c': 3}


+ 파이썬의 타입 힌팅

파이썬은 동적 타입을 사용하기 때문에 기본적으로 함수의 리턴 타입이나 함수 인수의 리턴 타입을 지정해 주지 않아도 파이썬에서 알아서 추론된다. 그러나 함수 선언부에서 함수의 인수와 리턴값에 대한 타입 힌팅을 제공할 수 있다. (type annotation) 물론 이는 별도의 라이브러리를 사용하지 않는 한, 타입 힌트를 지키지 않는다고 해서 컴파일 에러가 발생하지는 않는다. 그저 함수 객체 내부의 `__annotation__` 딕셔너리에 저장될 뿐이다. 또한 컴파일러에 따라 type annotation을 지키지 않을 시 경고를 띄워주기도 한다. 이런 경고나 타입 오류를 강제하기 위해서 mypy나 typing 이라는 라이브러리도 존재한다.
https://xo.dev/python-3-type-annotation-and-typing/

+ 함수 인수 고정

또한 함수의 인수가 상당히 많을 때, 몇 가지 인수를 고정한 상태에서 함수를 사용할 수 있게 만들면 좋을 때가 있다. 예를 들어 앞에서 나왔던 unicode.normalize함수(유니코드 정규화 함수)는 인수로 'NFC' 나 'NFD' 등을 줘야 하는데 어차피 대부분 하나의 정규화 방식만 사용할 것이므로 NFC 형식으로 정규화하는 함수가 있으면 좋을 것이다. 이를 해결하기 위한 functools.partial() 함수가 존재한다. 

In [None]:
import unicodedata, functools

nfc=functools.partial(unicodedata.normalize, 'NFC')
#normalize 함수의 첫번째 인수를 'NFC' 로 고정함
s1='cafe'
s2='cafe\u0301'
print(len(s1),len(s2))
print(len(nfc(s1)), len(nfc(s2)))

4 5
4 4
