# 재귀의 문제점

* 예시 : n번째 피보나치 수열 구하기

C 코드

```c
int fib(int n)
{
if (n==0 || n==1)
    return 1; 
else
    return fib(n-1) + fib(n-2);
}
```

 * 문제점 : 같은 계산이 중복됨
 * 해결방법 : **Memoization, Dynamic Programming**


# Memoization

> * 중간 계산 결과를 배열에 캐싱함으로써 중복 계산을 피함<br/>
* DFS 형식

<br/>

* 배열 f : 피보나치 수열을 차례로 넣을 배열

## C 코드

```c
int fib(int n)
{
    if (n==0 || n==1)
        return 1;
    else if (f[n] > -1) // 배열 f가 -1으로 초기화되어 있다고 가정
        return f[n];    // 즉 이미 계산된 값이라는 의미
    else {
        f[n] = fib(n-2) + fib(n-1);  // 중간 계산 결과를 caching
        return f[n];
    }
}
```

## Python 코드

In [1]:
f = [-1]*9  # 피보나치 수열을 차례로 넣을 배열(9번째 수열(0번부터 시작이므로 n=8)을 구한다고 가정)
            # 배열 f가 -1으로 초기화되어 있다고 가정(다시말해 -1이라는 건 실질적인 초기화가 안되어 있다는 의미)
def fib(n):
    if n == 0 or n == 1:
        return 1
    elif f[n] > -1:  # 실질적 초기화가 진행됐다는 의미, 즉 이미 계산된 값임
        return f[n]  # 따라서 그 계산된 값을 바로 리턴해줌
    else:  # 실질적 초기화가 진행되지 않았을 경우
        f[n] = fib(n-2) + fib(n-1)  # 중간 계산 결과를 캐싱
        return f[n]

In [2]:
print(fib(8))

34


In [3]:
f

[-1, -1, 2, 3, 5, 8, 13, 21, 34]

## 특징

* `Memoization` 은 형식적으로는 위에서부터 **호출**됨
* 그러나 **계산과정**에서는 초기화되지 않은 수열들을 역행해, 결국은 맨처음 수열부터 순차적으로 구하게 됨
* 즉, 호출과 실질적 계산의 방향이 정반대


# Dynamic Programming

## Memoization과 비교

* 공통점
    * 실질적 **계산이 순차적으로** 이뤄짐
    * **순환식**의 값을 계산하는 기법들이다.
    * 둘 다 **동적 계획법의 일종**으로 보기도 한다.

* 차이점
    * Dynamic Programming
        * 위에서부터 호출 하는  **호출 과정 자체가 부재**
        * base case는 초기에, 캐시에 직접 저장
        * 동적 계획법은 bottom-up 방식이며, recursion에 수반되는 overhead가
없다.
    * Memozation
        * Momoization은 top-down방식이며, 실제로 필요한 subproblem만을 푼다.

## C 코드

```c
int fib(int n)
{
    f[0] = f[1] = 1;  // base case는 초기에 직접 저장
    for (int i=2; i<=n; i++)
        f[i] = f[i-1] + f[i-2];
    return f[n];
}
```

## Python 코드

> 9번째 피보나치 수열 구하기

In [4]:
f = [-1]*9

def fib(n):
    f[0] = f[1] = 1
    for i in range(2,n+1):
        f[i] = f[i-1] + f[i-2]
    return f[n]

In [5]:
fib(8)

34

In [6]:
f

[1, 1, 2, 3, 5, 8, 13, 21, 34]

## 정리

* memoization **Recursive call + Caching** vs. Dynamic Programming **Array programming**

* Dynamic Programming : **bottom-up 방식 + array programming**

* 작은 문제의 답들 사이의 관계
    * Memoization : 재귀호출의 파라미터로 표현
    * Dynamic Programming : 첨자(=인덱스, 위의 예시에서는 `f[i]`의 `i`)로 표현
* Dynamic Programming이 필요한 경우
    * **low level programming** 시 (리눅스 커널, 임베디드 시스템 등) 허용가능한 **stack overhead**의 사이즈가 매우 작아 재귀호출이 불가한 경우 필요

# 행렬 경로 문제

* 정수들이 저장된 n×n 행렬의 좌상단에서 우하단까지 이동한다. 단 오른쪽
이나 아래쪽 방향으로만 이동할 수 있다.
* 방문한 칸에 있는 정수들의 합이 최소화되도록 하라.

| 0 | 1 | 2 | 3 |
|--|--|--|--|
| 6 | 7 | 12 | 5 |
| 5 | 3 | 11 | 18 |
| 7 | 17 | 3 | 3 |
| 8 | 10 | 14 | 9 |

## 핵심 idea
1. 이전 칸은 무조건 윗칸 혹은 왼칸임
2. (i, j)(i행 j열 칸)에 도달하기 위해서는 (i, j-1) 혹은 (i-1, j)를 거쳐야 한다.
3. (i, j-1) 혹은 (i-1, j)까지 최선의 방법으로 이동한 후 보다 총합이 작은 경로를 구해야 한다.

## Recursion

* 시간복잡도 : $O(2^n)$


### C 코드

```c
int mat(int i, int j)
{
    if (i == 0 && j == 0) 
        return m[i][j];
    else if (i == 0)
        return mat(0, j-1) + m[i][j];
    else if (j == 0)
        return mat(i-1, 0) + m[i][j];
    else
        return Math.min(mat(i-1, j), mat(i, j-1)) + m[i][j];
}
```

### Python 코드

In [7]:
m = [[6, 7, 12, 5],
     [5, 3, 11, 18],
     [7, 17, 3, 3],
     [8, 10, 14, 9]]

def mat(i, j):
    if i == 0 and j == 0:  # 시작점 (0, 0)인 경우
        return m[i][j]
    elif i == 0:  # 0행인 경우(이전 칸은 무조건 0행 j-1열임)
        return mat(0, j-1) + m[i][j]
    elif j == 0:  # 0열인 경우(이전 칸은 무조건 i-1행 0열임)
        return mat(i-1, 0) + m[i][j]
    else:  # 이전 칸일 수 있는 칸이 2개 존재하므로 계산 필요
        return min(mat(i-1, j), mat(i, j-1)) + m[i][j]  # 윗칸 : mat(i-1, j), 왼칸 : mat(i, j-1)

In [8]:
mat(2,3)  # 2행 3열 칸

31

## Memoization

* 계산이 필요한 칸만 계산

### C 코드

```c
int mat(int i, int j)
{
    if (L[i][j] != -1) return L[i][j];
    if (i == 0 && j == 0)
        L[i][j] = m[i][j];
    else if (i == 0)
        L[i][j] = mat(0, j-1) + m[i][j];
    else if (j == 0)
        L[i][j] = mat(i-1, 0) + m[i][j];
    else
        L[i][j] = Math.min(mat(i-1, j), mat(i, j-1)) + m[i][j];
    return L[i][j];
}
```

### Python 코드

In [9]:
m = [[6, 7, 12, 5],
     [5, 3, 11, 18],
     [7, 17, 3, 3],
     [8, 10, 14, 9]]

L = [[-1]*4, [-1]*4, [-1]*4, [-1]*4]  # 4by4행렬. 모든 칸을 -1로 초기화.

def mat(i, j):
    if L[i][j] != -1:
        pass
    elif i == 0 and j == 0:
        L[i][j] = m[i][j]
    elif i == 0:
        L[i][j] = mat(0, j-1) + m[i][j]
    elif j == 0:
        L[i][j] = mat(i-1, 0) + m[i][j]
    else:
        L[i][j] = min(mat(i-1, j), mat(i, j-1)) + m[i][j]
    return L[i][j]

In [10]:
mat(2,3)  # 2행 3열 칸

31

In [11]:
L  # 2행 2열까지의 최저점수를 구할 때, 3행과 3열에 해당하는 칸은 모두 계산 안함 / 나머지는 모두 계산.

[[6, 13, 25, 30], [11, 14, 25, 43], [18, 31, 28, 31], [-1, -1, -1, -1]]

## Dynamic Programming(순환식)

* L[i, j] : (0, 0)에서 (i, j)까지 이르는 최소합
* L[i, j]
    *  if i = 0 and j = 0 : $m_{ij} \quad$
    *  if j = 0 : $L[i-1, j] + m_{ij} \quad$
    *  if i = 0 : $L[i, j-1] + m_{ij} \quad$
    *  otherwise : $min(L[i-1, j], L[i, j-1]) + m_{ij} \quad$

$.$

* Bottom Up
    * 순서로 계산하면 필요한 값이 항상 먼저 계산됨
    * 시간복잡도: $O(n^2)$



### C 코드

```c
int mat(int n)
{
    for (int i=0; i<n; i++) {
        for (int j=0; j<n; j++) {
            if (i==0 && j==0)
                L[i][j] = m[0][0];
            else if (i==0)
                L[i][j] = m[i][j] + L[i][j-1];
            else if (j==0)
                L[i][j] = m[i][j] + L[i-1][j];
            else
                L[i][j] = m[i][j] + Math.min(L[i-1][j],L[i][j-1]);
        }
    }
    return L[n][n];
}
```

### Python 코드 1

In [12]:
# 모든 칸에 대해 최저점수 구하기

m = [[6, 7, 12, 5],
     [5, 3, 11, 18],
     [7, 17, 3, 3],
     [8, 10, 14, 9]]

L = [[-1]*4, [-1]*4, [-1]*4, [-1]*4]  # 4by4행렬. 모든 칸을 -1로 초기화.

def mat(n):
    for i in range(n+1):
        for j in range(n+1):
            if i == 0 and j == 0:
                L[i][j] = m[0][0]
            elif i == 0:
                L[i][j] = m[i][j] + L[i][j-1]
            elif j == 0:
                L[i][j] = m[i][j] + L[i-1][j]
            else:
                L[i][j] = m[i][j] + min(L[i-1][j],L[i][j-1])
    return L[n][n]

In [13]:
mat(3)

40

In [14]:
L

[[6, 13, 25, 30], [11, 14, 25, 43], [18, 31, 28, 31], [26, 36, 42, 40]]

### Python 코드 2

In [15]:
# a행 b열에 대한 최저점수 구하기

m = [[6, 7, 12, 5],
     [5, 3, 11, 18],
     [7, 17, 3, 3],
     [8, 10, 14, 9]]

L = [[-1]*4, [-1]*4, [-1]*4, [-1]*4]  # 4by4행렬. 모든 칸을 -1로 초기화.

def mat(a, b):
    for i in range(a+1):
        for j in range(b+1):
            if i == 0 and j == 0:
                L[i][j] = m[0][0]
            elif i == 0:
                L[i][j] = m[i][j] + L[i][j-1]
            elif j == 0:
                L[i][j] = m[i][j] + L[i-1][j]
            else:
                L[i][j] = m[i][j] + min(L[i-1][j],L[i][j-1])
    return L[a][b]

In [16]:
mat(2,3)

31

In [17]:
L  # Memoization과 결과는 같음

[[6, 13, 25, 30], [11, 14, 25, 43], [18, 31, 28, 31], [-1, -1, -1, -1]]

### Python 코드 3

* 더 깔끔한 ver

In [30]:
# a행 b열에 대한 최저점수 구하기

m = [[6, 7, 12, 5],
     [5, 3, 11, 18],
     [7, 17, 3, 3],
     [8, 10, 14, 9]]

L = [[float('inf')]*5,
     [float('inf'),-1,-1,-1,-1],
     [float('inf'),-1,-1,-1,-1],
     [float('inf'),-1,-1,-1,-1],
     [float('inf'),-1,-1,-1,-1]]  # 5by5행렬

def mat(a, b):
    for i in range(1,a+1):
        for j in range(1,b+1):
            if i == 1 and j == 1:
                L[i][j] = m[0][0]
            else:
                L[i][j] = m[i-1][j-1] + min(L[i-1][j], L[i][j-1])
    return L[a][b]

In [31]:
mat(4,4)

40

In [32]:
L

[[inf, inf, inf, inf, inf],
 [inf, 6, 13, 25, 30],
 [inf, 11, 14, 25, 43],
 [inf, 18, 31, 28, 31],
 [inf, 26, 36, 42, 40]]

# optimal substructure

## 개요

* 동적 계획법
1. 일반적으로 최적화 문제(optimisation problem) 혹은 카운팅(counting) 
문제에 적용됨
2. 주어진 문제에 대한 순환식(recurrence equation)을 정의한다.
3. 순환식을 memoization 혹은 bottom-up 방식으로 푼다.

* 동적 계획법 vs. 분할 정복법
4. subproblem들을 풀어서 원래 문제를 푸는 방식. 그런 의미에서 분할정복법(merge sort, quick sort)과 공통성이 있음
5. 분할 정복법에서는 분할된 문제들이 서로 disjoint하지만(계산이 안겹침) 동적 계획법에서는 그렇지 않음
6. 즉 서로 overlapping하는 subproblem 들을 해결함으로써 원래 문제를 해결

## 정의

> 최적의 솔루션을 하위 문제의 최적 솔루션으로 구성 할 수 있다면 문제는 최적의 하위 구조를 가지고 있다고합니다. 이 특성은 문제점에 대한 동적 프로그래밍 및 탐욕스러운 알고리즘의 유용성을 판별하는 데 사용됩니다.

* 어떤 문제의 최적해가 그것의 subproblem들의 최적해로부터 효율적으로
구해질 수 있을 때 그 문제는 optimal substructure를 가진다고 말한다. 
* 분할정복법, 탐욕적기법, 동적 계획법은 모두 문제가 가진 이런 특성을 이용
한다.

## 조건

* "최적해의 일부분이 그 부분에 대한 최적해인가?"
    * 0 ~ u까지의 최단 경로를 구하는 문제가 있다고 가정하자. 그리고 최단 경로 d[0,u]가 지나는 임의의 지점을 v(0<=v<=u)라고 하자. 이때, d[0,u][:v] = d[0,v]가 성립할 경우 optimal substructure라고 할 수 있다.
* d[u] = min(d[v]+ w(v, u))
    * u까지 가는 최단 경로의 길이 = u에 인접한 모든 정점 v에 대해서 v까지 가는 최단경로의 길이 + edge(v,u)의 가중치의 합의 최소값


## Longest Common Subsequence(LCS)

* <bcdb\>는 문자열<abcbdab\>의 subsequence이다.
* <bca\>는 문자열<abcbdab\>와 <bdcaba\>의 common subsequence 이다.
* Longest common subsequence(LCS)
    * common subsequence들 중 가장 긴 것
    * <bcba\>는 <abcbdab\>와 <bdcaba\>의 LCS이다

### 브루트 포스

> 문자열 x의 모든 subsequence에 대해서 그것이 y의 subsequence가
되는지 검사한다.

* x의 길이 : m, y의 길이 : n
* x의 subsequence의 개수 : $2^m$
* 각각이 y의 subsequence인지 검사: $O(n)$시간
* 시간복잡도 $O(n\times2^{m})$  --> 쓸 수 없음...

### Idea

* 가정
    * len(x) = 10, len(y) = 9, z = LCS of x,y
    * x : [? ? ? ? ? ? ? A ? ?]<br/>
    * LCS z : [? ? ? ? A]<br/>
    * y : [? ? ? ? ? A ? ? ?]
* 특징
    * x[8:]와 y[6:]는 겹치는 문자열이 전혀 없음
    * z[:-1] = LCS(x[:7], y[:5])
        * optimal substructure의 조건과 일치하는 내용

### 순환식

* LCS(i, j) : 문자열 x[:i+1]와 문자열 y[:j+1]의 LCS의 길이 반환
* $case 1: x_{i} = y_{j}$
    * $LCS(i, j) = LCS(i-1, j-1) + 1$
* $case 2: x_{i} \ne y_{j}$
    * $LCS(i, j) = max(LCS(i —1,j), LCS(i, j —1))$
* base case
    *  0행과 0열 모두 0으로 초기화
        * i = 3, j = 4 일 경우, 4 by 5 array 생성


### Recursion

* C 코드

```c
int LCS(char*X, char *Y, m, n) 
{ 
    if (m = 0 or n = 0) 
        return 0; 
    else if (X[m-1]= y[n-1]) 
        return LCS(X,Y,m-1, n-1) + 1; 
    else 
        return max(LCS(X,Y,m-1, n), LCS(X,Y,m, n-1)); 
}
```

* 엄청난 중복 호출 발생...!

### 동적 계획법

* 시간 복잡도 : $O(m\times n)$

#### C 코드

```c
int lcs(int m, int n) /* m: length of X, n: length of Y */
{
    for (int i=0; i<=m; i++)
        c[i][0] = 0;
    for (int j=0; j<=n; j++)
        c[0][j] = 0;
    for (int i=0; i<=m; i++) {
        for (int j = 0; j <= n; j++) {
            if (x[i] == y[j])
                c[i][j] = c[i - 1][j - 1] + 1;
            else
                c[i][j] = Math.max(c[i - 1][j], c[i][j - 1]);
        }
    }
    return c[m][n];
}
```

#### Python 코드

In [10]:
c = []
x, y = "abcbdab", "bdcaba"
Y = [0]*(len(y) + 1)
for i in range(len(x)+1):
    c.append(Y[:])  # c.append(Y)하면 안됨! 주소 참조되어버림

def lcs(m, n):  # m: length of x, n: length of y
    '''
    for i in range(m+1):
        c[i][0] = 0
    for j in range(n+1):
        c[0][j] = 0
    '''
    for i in range(1, m+1):
        for j in range(1, n+1):
            if x[i-1] == y[j-1]:
                c[i][j] = c[i - 1][j - 1] + 1
            else:
                c[i][j] = max(c[i - 1][j], c[i][j - 1])
    return c[m][n]

In [11]:
lcs(len(x), len(y))

4

In [12]:
c

[[0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 1, 1, 1],
 [0, 1, 1, 1, 1, 2, 2],
 [0, 1, 1, 2, 2, 2, 2],
 [0, 1, 1, 2, 2, 3, 3],
 [0, 1, 2, 2, 2, 3, 3],
 [0, 1, 2, 2, 3, 3, 4],
 [0, 1, 2, 2, 3, 4, 4]]

## Maximum Sum Interval

* N 개의 정수 a1, a2, . . . , aN이 주어진다.<br/>
이 중 하나 혹은 그 이상의 연속된 정수들을 더하여 만들 수 있는 최대값은?
* 예시
    * 입력 : [-2, 1, -3, 4, -1, 2, 1, -5, 4]
    * 최대합 구간 : [4, -1, 2, 1]
    * 최대값 : 6 (=sum([4, -1, 2, 1]))

### 브루트 포스

* 시간 복잡도 : $O(n^2)$
* C 코드

```c
int max_sum(int *A, int n){
    int max = A[0];
    for(i=0; i < n ; i++ ) {
        int sum = A[i];
        for(j=i+1; j < n ; j++ ) { //A[i]부터 시작하는 최대값을 구한다.
            sum = sum + A[j];
            if ( max < sum ) max = sum;
        }
    }
    return max;
}
```

### 분할 정복법

* 시간 복잡도 : $O(nlogn)$

[참고](https://siahn95.tistory.com/entry/AlgorithmLeetCodeEasyPython-53-Maximum-Subarray)

In [31]:
def findBestSubarray(nums, left, right):
    # Base case - empty array.
    if left > right:
        return -float("inf")

    mid = (left + right) // 2
    curr = best_left_sum = best_right_sum = 0

    # Iterate from the middle to the beginning.
    for i in range(mid - 1, left - 1, -1):
        curr += nums[i]
        best_left_sum = max(best_left_sum, curr)

    # Reset curr and iterate from the middle to the end.
    curr = 0
    for i in range(mid + 1, right + 1):
        curr += nums[i]
        best_right_sum = max(best_right_sum, curr)

    # The best_combined_sum uses the middle element and
    # the best possible sum from each half.
    best_combined_sum = nums[mid] + best_left_sum + best_right_sum

    # Find the best subarray possible from both halves.
    left_half = findBestSubarray(nums, left, mid - 1)
    right_half = findBestSubarray(nums, mid + 1, right)

    # The largest of the 3 is the answer for any given input array.
    return max(best_combined_sum, left_half, right_half)

In [32]:
nums = [-2, 1, -3, 4, -1, 2, 1, -5, 4]
findBestSubarray(nums, 0, len(nums) - 1)

6

### Optimal Substructure

* 가정
    * 길이가 10인 배열 A
    * 합이 최대가 되는 구간 : A[3:8]
* 특징
    * A[3:7] : 끝점이 A[6]인 구간들 중 합이 최대가 되는 구간
        * 끝점이 A[6]인 구간들 : A[i:7]\(0<=i<=6)

### 순환식

* maxEndsAt[i]: 끝점이i인 구간들중 최대합
    * if i = 0 : A[0]
    * if i > 0 : max(maxEndsAt[i-1] + A[i], A[i])
* 최대합 = max(maxEndsAt)
* 시간 복잡도 : $O(n)$


#### C 코드

```c
int maxSumInterval(int A[]) { /* assume A[0],…,A[n] */
    int maxEndsAt = A[0];
    int max = maxEndsAt[0]; /* 하나도 선택하지 않아도 되면 0으로 초기화 */
    for (int i=1; i<n; i++) {
        maxEndsAt[i] = Math.max(maxEndsAt[i-1] + A[i], A[i]);
        if (maxEndsAt[i]> max)
            max = maxEndsAt[i];
    }
    return max;
}
```

#### Python 코드

> 변수 max 없어도 되기 때문에 없앰

In [28]:
def maxSumInterval(A):  # assume A[0],…,A[n]
    maxEndsAt = [-float("inf")]*len(A)  # 배열 선언 및 임의적 초기화
    maxEndsAt[0] = A[0] # 첫번째 원소에 대해 초기화
    for i in range(1,len(A)):
        maxEndsAt[i] = max(maxEndsAt[i-1] + A[i], A[i])
    
    print("maxEndsAt:", maxEndsAt)
    return max(maxEndsAt)

In [29]:
A = [-2, 1, -3, 4, -1, 2, 1, -5, 4]
maxSumInterval(A)

maxEndsAt: [-2, 1, -2, 4, 3, 5, 6, 1, 5]


6