# Functional Programming

## What is Functional Programming

**함수형 프로그래밍(Functional Programming)**은 자료 처리를 수학적 함수의 계산으로 취급하고 상태와 가변 데이터를 멀리하는 프로그래밍 패러다임 중 하나이다. 명령형 프로그래밍에서는 상태를 바꾸는 것을 강조하는 것과는 달리, 함수형 프로그래밍은 함수의 응용을 강조한다. 

예를 들어, LineCounter 클래스는 파일을 읽고, 각각의 행을 읽어, 총 행의 수를 계산하는 클래스이다. 객체 지향형(Object Oriented) 관점에서는 속성과 메소드의 개념을 사용하여 해석한다. 속성은 객체의 상태를 의미하고, 메소드는 객체의 상태를 변화하는 것이다. 이때 객체의 상태는 메소드를 사용할 때마다 변하게 된다. 객체의 변화하는 상태는 좋을 수도 있고 나쁠 수도 있다. 

대표적으로 웹서버의 로그파일을 불러와서 로그의 수를 세는 함수를 작성하는 것을 예로 들 수 있다. 

```Python
def read(filename) : 
    file = open(filename, 'r') 
    lines = [line for line in file]
    return lines 

def count(lst) : 
    return len(lst)

example_lines = read('example_log.txt')
lines_count = count(example_lines)
```

## Pure Function

함수만을 사용해서 기능을 구현하는 것을 **함수형 프로그래밍(Functional Programming)**이라고 한다. 함수형 프로그램 내부에서는 **상태가 없으며(stateless)**, 주어진 input과 생성된 output에만 의존하게 된다. 

함수형 프로그래밍을 위한 기준을 만족하는 함수를 **순수한 함수(Pure Function)**이라고 한다. 순수한 함수란 부작용이 없는 함수, 즉 함수의 실행이 외부에 영향을 끼치지 않는 함수를 뜻한다. 순수한 함수를 사용하는 장점은 부작용의 감소를 창출할 수있다. 부작요은 함수가 작동하는 내부에서 범위를 넘어서는 변화가 일어났을 때 발생하게 된다. 예를 들어 객체의 상태를 변화했을 때나, I/O 연산을 했을 때나, 심지어 print() 함수를 사용할 때도 발생하게 된다. 

프로그래머는 코드 내부의 부작용을 줄여 테스트하기 쉽고, 디버깅하기 쉬운 코드를 만들어야 한다. 코드에 부작용이 많아질수록, 프로그램이나 실행을 이해하기 어려워진다. 

## The Lambda Expression

함수를 선언하기 위해 def 문법을 사용하는 방법 대신에 **lambda expression**을 사용해서 함수를 선언하게 된다. Lambda expression은 comma로 분리된 연속적인 입력값을 받고, colon(:)뒤에 있는 표현을 return statement없이 즉시 반환하게 된다. 생성한 lambda expression을 변수에 할당하게 되면 실제 함수처럼 작동하게 된다. 

변수명 없이 람다 표현을 사용하게 되면 **익명 함수(anonymous function)**이라고 부르게 된다. 익명함수는 다른 함수의 입력값으로 사용할 때 유용하게 사용된다. 

```Python
def read(filename):
    with open(filename, 'r') as f:
        return [line for line in f]
    
lines = read('example_log.txt')
sorted_lines = sorted(lines, key = lambda x : x.split(' ')[5])
print(sorted_lines)
```

## Higher-Order Function

### The Map Function

**고계 함수(higher-order function)**란, 함수를 다루는 함수를 뜻한다. 사실 함수형 언어에서는 함수도 '값(value)'으로 취급한다. 그러므로 정수 1이나 인수를 제곱하는 함수나 동등한 입장에서 다룰 수 있게 된다. 정수를 함수의 인수로 전달할 수 있듯이 어떠한 함수도 다른 함수의 인수로 전달할 수 있다. 즉, 앞서 사용했던 sorted 의 argument에 익명함수를 사용한 방식과 동일하다. 

함수형 패러다임에서 흔하게 사용되는 중요한 고계함수들은 다음과 같다. sorted 함수와 같이 리스트 내부의 각각의 원소에 대해 함수를 적용하는 Python iterable를 가지고 있는 함수들이다. 일반적으로 function_name(function_to_apply, iterable_of_elements)의 형태를 가지고 있다. 

map 함수는 첫번째 인수로 주어진 함수를 두번째 인수로 주어진 각 원소에 적용한 결과를 Map 객체로 반환한다. 

```Python
# Pseudocode for map.
def map(func, seq):
    # Return `Map` object with
    # the function applied to every
    # element.
    return Map(
        func(x)
        for x in seq
    )

# Map each line in the lines variable to its corresponding IP address
lines = read('example_log.txt')
ip_addresses = list(map(lambda x : x.split(' ')[0], lines))
print(ip_addresses)
```

### The Filter Function

filter 함수도 map 함수와 동일하게 반복되는 값을 받은 후에 조건문에 의해 생성된 bool값을 가지는 고계함수 이다. 

```Python
# Pseudocode for filter.
def filter(evaluate, seq):
    # Return `Map` object with
    # the evaluate function applied to every
    # element.
    return Map(
        x for x in seq
        if evaluate(x) is True
    )

# Filter each line in ip_addresses list to IP addreses that begin with less than or equal to 20.
lines = read('example_log.txt')
ip_addresses = list(map(lambda x: x.split()[0], lines))
filtered_ips = list(filter(lambda x: int(x.split('.')[0]) <= 20, ip_addresses))
print(filtered_ips)
```

### The Reduce Function

functools package의 reduce 함수는 반복되는 값을 받아서 리스트 내부의 값들을 주어진 함수를 적용하여 하나의 값으로 축약하는 함수이다. 함수에 대해 첫번째 원소와 두번째 원소를 사용해 결과를 출력하고 다음 원소와 동일한 연산을 반복하게 된다. Lambda expression 내부에서 두번째 값에 대해 연산을 할 필요가 없는 경우 \_를 사용해 무시할 수 있다. 

reduce 함수의 중요한 점은 input으로 동일한 타입의 값을 리턴할 필요가 없다는 뜻이다. 예를들어 리스트 내부의 모든 단어의 길이를 계산하는 lambda expression을 생성한다면 두번째 연산에 대해서 TypeError : object of type 'int' has no len()을 출력할 것이다. 이 문제를 해결하기 위해 lambda expression을 if-else 문을 활용해서 수정할 수 있다. 

```Python
from functools import reduce

lines = read('example_log.txt')
ip_addresses = list(map(lambda x: x.split()[0], lines))
filtered_ips = list(filter(lambda x: int(x.split('.')[0]) <= 20, ip_addresses))
num_lines = reduce(lambda x, _: 2 if isinstance(x, str) else x + 1, lines)
num_filtered = reduce(lambda x, _: 2 if isinstance(x, str) else x + 1, filtered_ips) 
ratio = num_filtered / num_lines
print(ratio)
```

### Rewriting with List Comprehension 

map, filter 함수는 결과적으로 list로 변환해야하기 때문에 list comprehension을 사용해서 코드를 다시 작성할 수 있다. 

```Python
lines = read('example_log.txt')
# Rewrite ip_addresses, and filtered_ips.
# list(map(lambda x: x.split()[0], lines))
ip_addresses = [x.split()[0] for x in lines]
# list(filter(lambda x: int(x.split('.')[0]) <= 20, ip_addresses))
filtered_ips = [x for x in ip_addresses if int(x.split('.')[0]) <= 20]
count_all = reduce(lambda x, _: 2 if isinstance(x, str) else x + 1, lines)
count_filtered = reduce(lambda x, _: 2 if isinstance(x, str) else x + 1, filtered_ips)
ratio = count_filtered / count_all
print(ratio)
```

## Writing Function Partials 

함수의 기능은 유지하면서 함수의 입력값을 감소하고자 하는 경우, 하나의 입력값을 저장하고 있는 새로운 함수를 생성하면 된다. functools package의 partial modeule은 함수의 default값을 입력받아 그 상태의 함수를 '얼리는'것 과 같은 효과를 가진 함수를 새로 생성한다. 생성된 함수는 입력되지 않은 남은 입력값을 입력받아 기존의 함수의 기능을 실행하게 된다. 

```Python
from functools import partial

lines = read('example_log.txt')
ip_addresses = list(map(lambda x: x.split()[0], lines))
filtered_ips = list(filter(lambda x: int(x.split('.')[0]) <= 20, ip_addresses))

# reduce(lambda x, _: 2 if isinstance(x, str) else x + 1, lines)
extract = partial(reduce, lambda x, _: 2 if isinstance(x, str) else x + 1)
count_all = extract(lines) 
# reduce(lambda x, _: 2 if isinstance(x, str) else x + 1, filtered_ips)
count_filtered = extract(filtered_ips)

ratio = count_filtered / count_all
print(ratio)
```

## Using Functional Composition 

함수 호출은 연속적으로 시행하여 한 함수의 결과값을 다른 함수의 입력값으로 연결하는 작업을 수학적으로 **합성 함수(Function Composition)**이라고 한다. compose 함수는 single argument 함수를 연속으로 입력받아 하나로 연결된 함수를 생성한다. 파일 시스템의 pipeline 연산자 '|'와 동일하다. 

```Python
lines = read('example_log.txt')
ip_addreses = list(map(lambda x: x.split()[0], lines)) 
filtered_ips = list(filter(lambda x: int(x.split('.')[0]) <= 20, ip_addresses)) 

ratio = count_flitered / count_all 
extract_ips = partial(map, lambda x: x.split()[0])
extract_filtered = partial(filter, lambda x: int(x.split('.')[0]) <= 20) 
count = partial(reduce, lambda x, _: 2 if isinstance(x, str) else x + 1)

composed = compose(extract_ips, 
                   extract_filtered, 
                   count)
counted = composed(lines) 
```

# Pipline Tasks