# 함수형 패러다임

https://docs.python.org/ko/3/howto/functional.html

만만치 않다. 오렐리 책에 있는 50페이지 가까이에 있는 것을 풀어 쓴 것이다. 주말에 시간내서 꼭 공부하고 와야 한다. 함수만 가지고 프로그래밍 하는 방식을 말한다. 함수의 정의 자체가 조금 다르다. higer order function, first class function, 수학함수이다. 특히 수학함수의 경우, 파이썬의 함수와는 조금 다른 성질을 가진다.

### 형식적 증명 가능성
이론적 바탕을 가진 얘들을 프로그래밍 할 때, 자주 쓰일 수 있다는 말이다. 코드가 간결한 대신 우리가 이해를 못한다 ㅋ 

함수형 패러다임은 FP Functional Programming이라고 한다. 왜 중요할까? 분산처리 개념과 연관되기 때문이다. 함수를 여러개 동시에 실행하면 분산환경이 된다. 디버깅할 때 쉽다. 인풋 아웃풋이 정확하니까 함수만 보면 되니까.

 - 퍼스트 클래스 함수이다.
 - 리스트 프로그래밍: 여러개의 데이터를 동시에 다룬다.
 - 코드양이 작아서 빨리 개발할 수 있다.
 - 디버깅도 빠르다.
 - 모듈화 되어있다.

### for를 쓰면 안좋은 점

1. 코드가 길어질 때, 흐름찾기가 어렵다. 
2. 명령이 많아져서, 속도가 느려진다.
 
### for를 안쓰는 방법

1. iterator/generator
2. comprehension
3. map, filter, reduce
4. recursion

# comprehension

listp 같은 언어는 리스트를 기반으로 한다.

In [1]:
%%timeit
temp = []
for i in range(10):
    temp.append(i+1)

temp

965 ns ± 105 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [2]:
%%timeit
[i+1 for i in range(10)]

737 ns ± 73 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [6]:
# %%timeit

map(lambda x: x+1, range(10))

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

map이 엄청빠르기 때문에, 빅데이터 하는 사람들은 map을 많이 사용한다.

### 컴프리헨션 종류

1. 리스트
2. 셋
3. 딕셔너리

너무 컴프리헨션이 이름이 길어서 그냥 컴프라고 한다. (comp)

In [1]:
[str(i) for i in range(100) if i%2 == 0] # 속도도 빠르고 식 중첩도 가능하다.

['0',
 '2',
 '4',
 '6',
 '8',
 '10',
 '12',
 '14',
 '16',
 '18',
 '20',
 '22',
 '24',
 '26',
 '28',
 '30',
 '32',
 '34',
 '36',
 '38',
 '40',
 '42',
 '44',
 '46',
 '48',
 '50',
 '52',
 '54',
 '56',
 '58',
 '60',
 '62',
 '64',
 '66',
 '68',
 '70',
 '72',
 '74',
 '76',
 '78',
 '80',
 '82',
 '84',
 '86',
 '88',
 '90',
 '92',
 '94',
 '96',
 '98']

많은 것을 한꺼번에 만들거나, 한꺼번에 많은 데이터를 변환시킬 때 컴프리헨션을 쓴다.

### 튜플 컴프리헨션은 좀 애매하다.

튜플로 컴프리헨션을 하면 제너레이터가 나온다. 이터러블이 포뒤에 올수 있는 것이라고 말했다.

In [2]:
(i+1 for i in range(10))

<generator object <genexpr> at 0x000001F9E33B9D48>

In [3]:
x = iter(range(10)) # iteragle은 iter의 인자로 들어갈 수 있다.

In [14]:
next(x) # 끝까지 돌리면 에러가 나는데, 에러가 안나게끔 파이썬에서 지원을 알아서 해준다.

StopIteration: 

이렇게 이터레이터는 하나씩 나오는 것이다. 항상 왜 이걸 쓰는지, 언제 쓰는지가 중요하다.

메모리 관리 관점에서 매우 좋다. 이것을 레이지 기법이라고 한다. 이터레이터는 할 수 있는게 next 하나밖에 없다.

이터레이터의 형제는 제너레이터이다.

 - 이터레이터 만드는 방식: iter로 만든다.
 - 제너레이터 만드는 방식: 튜플로 만든 컴프리헨션, yield(immutable 이다)
 
똑같은 기능을 하는데 만드는 방법이 달라서 그렇다. 한개씩 뽑아내서 처리하는 기능도 필요하기 때문에, 이터레이터/제너레이터를 배우는 것이다. 

In [25]:
def t():
    yield 1
    yield 2
    yield 3
    
a = t()

def t2():
    yield from [1, 2, 3]
    
def t3():
    while True:
        yield 1

In [23]:
next(a)

1

In [26]:
import dis

dis.dis(t)

  2           0 LOAD_CONST               1 (1)
              2 YIELD_VALUE
              4 POP_TOP

  3           6 LOAD_CONST               2 (2)
              8 YIELD_VALUE
             10 POP_TOP

  4          12 LOAD_CONST               3 (3)
             14 YIELD_VALUE
             16 POP_TOP
             18 LOAD_CONST               0 (None)
             20 RETURN_VALUE


from이 나오는 경우

1. import
2. yield
3. exception

In [27]:
%%writefile sun.txt

asasdfasd
asdfasdf
asdfadsf

Overwriting sun.txt


In [28]:
x = open('sun.txt')
x

<_io.TextIOWrapper name='sun.txt' mode='r' encoding='cp949'>

In [31]:
next(x)

'\n'

즉, 내부파일 구조는 다 이터레이터, 제너레이터로 만들어져있다. 다 레이지 구조로 만들어져 있는 것이다.

### recursion

일반항을 만들 수 있는 얘들은 모두 recursion으로 만들 수 있다. 형식적 증명 가능성!

In [35]:
def fibo(n):
    if n<2:
        return 1
    return fibo(n-1) + fibo(n-2)

fibo(5)

def fibo(n):
    return fibo(n-1) + fibo(n-2) if n>=2 else 1

fibo(5)

8

꼬리 재귀 (tail recursion)

최적화가 안되어 있어서, 파이썬 쓰는 사람들은 잘 안 쓴다. 너무 비효율적이라서. (메모리 속도가 너무 느리다)

이걸 극복하는 방법들을 수업 자료실에 올려두실 것이다. 그 중 하나가 다이나믹 프로그램인데, 취준생은 이걸 잘해야 한다.

식으로 표현할 수 있으면, 다 재귀함수로 만들 수 있다.

함수형 프로그래밍 모듈

 - itertools --- Functions creating iterators for efficient looping
 - functools --- Higher-order functions and operations on callable objects
 - operator --- 함수로서의 표준 연산자
 
함수형 패러다임으로 프로그래밍을 한다는 것은, 문을 쓰지 않고 합성함수로 변환시키는 것이다. 수학적 함수기 때문에 문이 아니라 식을 더 좋아한다. 그 함수는 보통 식으로 구현해서, for를 가능한 사용하지 않고 개발하는 프로그래밍 기법인 것이다.

이는 일반적인 함수의 정의와 다르다. 인풋, 아웃풋이 명확해야하고 global 있으면 안 좋다. 이제부터는 골치아픈 얘들을 배워본다.

In [15]:
import time

time.time() # 현재 시간을 1975년도부터 나노밀리세컨드초 단위로 더해준다.

def x(a = time.time()):
    return a

In [20]:
x() # 단점 1. 실행할 때마다 바뀌지 않는다. 디폴트값은 한 번 들어가면 바꿀 수가 없다. 디폴트 값은 동적으로 만들 수 없다.

1573376324.1841576

In [63]:
def x(a = []):
    return a.append(3) # 단점2. append의 결과는 none이기 때문에 결과가 없을 수 밖에 없다.

In [21]:
x()

1573376324.1841576

In [22]:
# 단점 2
def x(a = []):
    a.append(3)
    return a # side-effect 이다. 인풋 아웃풋외 다른 결과를 초래할 수 있다.

In [26]:
x()

[3, 3, 3, 3]

인풋이 들어가면 아웃풋이 나오는 형태의 함수를 만들어야 한다. 위의 2가지 처럼 코딩하면 안된다. (단점 2가지)

함수형 패러다임은 뮤터블이 있으면 안 된다. 자기 자신이 바뀌면 안되기 때문. 하지만 우리는 취사선택해서 쓸 것이다.

In [28]:
class X():
    def __call__(self):
        print('CALL') # 인스턴스에 괄호를 붙일 수 있는
        
x = X()

In [31]:
x() # 인스턴스에 괄호 붙일 수 있는 얘

CALL


In [32]:
X()()

CALL


In [46]:
def x():
    print(1)
print(x.__name__)

a = lambda : print(1) # 식이다. 할당이 가능하다. 재사용하지 않을거면 람다가 효율적이다.
print(a.__name__)

x
<lambda>


In [83]:
callable(a)

True

In [84]:
class Adder(object):
    def __init__(self, n):
        self.n = n
    def __call__(self, n):
        return self.n + n
add5_i = Adder(5)

In [88]:
add5_i(1)

6

In [89]:
add5_i(2)

7

In [91]:
def mn(x):
    def n(y):
        return x + y
    
    return n

mn(3)(10) # 이렇게 함수를 중첩해 쓰는 것을 클로저 기법이라고 한다.

13

클로저기법은 파셜이라는 얘가 있는데, 그럴 때도 많이 쓴다.

In [55]:
from operator import mul

mul(5, 4)

20

In [48]:
from functools import partial

add3 = partial(add, 3) # 이런식으로 남이 만든 함수를 바꿔서 쓸 수 있다. 이것도 일종의 클로저 기법이다.
add3(5)

NameError: name 'add' is not defined

In [34]:
def x(a):
    return str(a)

b = partial(mul, 4)
b(5)

NameError: name 'partial' is not defined

클로저 -> 중첩 ok, 리턴을 함수로 할 수 있다. 이 2가지다. 첫번째 인자에 따라서 리턴값이 바뀌는 것.

# Lazy Evaluation

필요할 때마다 짐을 하나씩 꺼내오는 것이다. 짐을 전부 실으면 부지런... 하나씩 하면 게으른 것. 메모리가 아주 많을 때는 효율적이다. 근데 이건 큰 데이터에서는 유일한 대안이다.

1. Haskell이라는 언어에서 가져온 것이다.
2. 

시퀀스 타입 3가지 (인덱싱, 슬라이싱 가능)

1. 리스트
2. 튜플
3. 레인지

In [37]:
a = list([3, 3, ])
b = 1

In [38]:
dir(a) 

# get_item -> []를 써서 인덱싱 할 수 있다.

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__rmul__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'append',
 'clear',
 'copy',
 'count',
 'extend',
 'index',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort']

In [39]:
dir(b)

['__abs__',
 '__add__',
 '__and__',
 '__bool__',
 '__ceil__',
 '__class__',
 '__delattr__',
 '__dir__',
 '__divmod__',
 '__doc__',
 '__eq__',
 '__float__',
 '__floor__',
 '__floordiv__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__index__',
 '__init__',
 '__init_subclass__',
 '__int__',
 '__invert__',
 '__le__',
 '__lshift__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__neg__',
 '__new__',
 '__or__',
 '__pos__',
 '__pow__',
 '__radd__',
 '__rand__',
 '__rdivmod__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rfloordiv__',
 '__rlshift__',
 '__rmod__',
 '__rmul__',
 '__ror__',
 '__round__',
 '__rpow__',
 '__rrshift__',
 '__rshift__',
 '__rsub__',
 '__rtruediv__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__truediv__',
 '__trunc__',
 '__xor__',
 'bit_length',
 'conjugate',
 'denominator',
 'from_bytes',
 'imag',
 'numerator',
 'real',
 'to_bytes']

In [100]:
class Myint(int): # 이게 덕타이핑이다. int를 상속했는데, len을 정의하면 len을 쓸 수 있다!
    def __len__(self):
        return 1

In [101]:
len(Myint(3))

1

오버로딩... 다시 개념 알기.

In [102]:
a = [1, 2, 3]
b = iter(a) # next가 있다.

In [108]:
set(dir(b)) - set(dir(a))

{'__length_hint__', '__next__', '__setstate__'}

In [112]:
x = open('sun.txt')
dir(x) # next가 있기 때문에 iter가 가능하고, 그래서 for 뒤에 쓸 수 있다.

['_CHUNK_SIZE',
 '__class__',
 '__del__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__enter__',
 '__eq__',
 '__exit__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__lt__',
 '__ne__',
 '__new__',
 '__next__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '_checkClosed',
 '_checkReadable',
 '_checkSeekable',
 '_checkWritable',
 '_finalizing',
 'buffer',
 'close',
 'closed',
 'detach',
 'encoding',
 'errors',
 'fileno',
 'flush',
 'isatty',
 'line_buffering',
 'mode',
 'name',
 'newlines',
 'read',
 'readable',
 'readline',
 'readlines',
 'reconfigure',
 'seek',
 'seekable',
 'tell',
 'truncate',
 'writable',
 'write',
 'write_through',
 'writelines']

# 데코레이터

텐서플로의 tf.function이라는 것을 써야 하기 때문이다. 수업자료 준 거 다 쳐봐야 한다.

In [114]:
def foo(): # 객체지향에 맞지 않다.
    print('foo')

foo()

foo


In [117]:
def x(func):
    def y():
        func('문근영')
    return y # () 유무 차이 알기

In [118]:
x(print)()

문근영


In [119]:
def x(func):
    def y(z):
        print('-----')
        func(z)
        print('-----')
    return y # () 유무 차이 알기

x(print)('문근영') # 프린트의 기능에 다른 것을 추가시켰다.

-----
문근영
-----


In [128]:
@x
def t(a):
    print(a) # 이렇게 데코레이터를 붙이면, 기능을 추가하거나 변경할 수 있음.

In [129]:
t(5)

-----
5
-----


꼭 함수를 인자로 받고,
2중 구조로 되어 있어야 한다.

데코레이터는 기능을 추가하거나 변경할 때 쓴다. 이걸 알아둬라.

In [134]:
def x(func):
    def y(*args, **kwargs):
        print('-----')
        func(*args, **kwargs)
        print('-----')
    return y

In [135]:
@x
def s():
    print('aaa')

In [136]:
s()

-----
aaa
-----


인자 맞출 필요 없고, 버전 업데이트가 용이하다.