# Python으로 배우는 Algorithm 기초

# Ch 2. 분할 정복 알고리즘 Divide-and-Conquer

## Ch 2.1 이분 검색 Binary Search

### (1) 이분 검색 문제
- 정렬되지 않은 리스트 S에서 주어진 키 x가 존재하는가? : 순차 탐색
- 정렬된 리스트 S에서 주어진 키 x가 존재하는가? : 이분 검색
> 재귀적 방법으로 이분 검색 로직 구상하기

### (2) 분할정복 알고리즘으로서의 이분 검색
#### 1) 문제 : 정렬된 리스트 S에서 어떤 키 x가 존재하는가?
#### 2) 해답 : 존재하면 S에서의 x의 위치, 존재하지 않는 경우 -1을 반환
#### 3) 분할정복법
- S의 정가운데 원소와 x를 비교하여, 같으면 해당 위치를 반환
- 아닌 경우
- [Divide] 정가운데 원소를 기준으로 S를 두 개의 리스트로 분할
- [Conquer] x가 정가운데 원소보다 크면 오른쪽, 작으면 왼쪽을 호출. 남은 반쪽은 버림.
- [Obtain] 선택한 리스트에서 얻은 답을 반환

#### 4) 코드 (Recursive)

In [2]:
def binarySearch (S, x, low, high):
    if low > high:
        return -1
    else:
        mid = (low + high)//2
        if x == S[mid]:
            return mid
        elif x < S[mid]:
            return binarySearch(S, x, low, mid-1)
        else:
            return binarySearch(S, x, mid+1, high)

In [3]:
S = [8, 10, 12, 13, 14, 18, 20, 25, 27, 30, 35, 40, 45]
x = 18
loc = binarySearch(S, x, 0, len(S)-1)
print("S = ", S)
print("x = ", x)
print("loc = ", loc)

S =  [8, 10, 12, 13, 14, 18, 20, 25, 27, 30, 35, 40, 45]
x =  18
loc =  5


In [4]:
y = 17 # which doesn't exist in the list S
loc2 = binarySearch(S, y, 0, len(S)-1)
print("S = ", S)
print("y = ", y)
print("loc2 = ", loc2)

S =  [8, 10, 12, 13, 14, 18, 20, 25, 27, 30, 35, 40, 45]
y =  17
loc2 =  -1


## Ch 2.2 합병 정렬 Merge Sort

### (1) 정렬되지 않은 리스트의 정렬
: 기존에 교환정렬을 통한 리스트 정렬 (greedy algorithm에 가까운 형태)
> 합병정렬을 통해 개선된 알고리즘 사용 가능 !

### (2) 합병 정렬

#### 1) Divide
: 원소가 n개인 S를 n/2개의 원소를 가진 두 개의 리스트로 분할
#### 2) Conquer
: 왼쪽의 리스트와 오른쪽의 리스트를 각각 재귀적으로 합병해 정렬
#### 3) Combine
: 각각 정렬된 두 개의 리스트를 정렬된 하나의 리스트로 합병하여 리턴
#### 4) 정렬 방식
: merge 과정에서 대소 비교해서 정렬

- input S = [27, 10, 12, 20 | 25, 13, 15, 22]
- Divide    [27, 10 | 12, 20] [25, 13 | 15, 22]
- Divide    [27 | 10] [12 | 20] [25 | 13] [15 | 22]
- Divide    [27] [10] [12] [20] [25] [13] [15] [22]
- merge    [10, 27] [12, 20]   [13, 25] [15, 22]
- merge    [10, 12, 20, 27]    [13, 15, 22, 25]
- merge    [10, 12, 13, 15, 20, 22, 25, 27]

#### 5) 코드

In [5]:
def mergesort(S):
    n = len(S)
    if n <= 1:
        return S
    else :
        mid = n//2
        U = mergesort(S[0:mid])
        V = mergesort(S[mid:n])
        return merge(U, V)

def merge(U, V):
    S = []
    i = j = 0
    while (i < len(U)) & (j < len(V)):
        if U[i] < V[j]:
            S.append(U[i])
            i += 1
        else:
            S.append(V[j])
            j += 1
    if i < len(U):
        S += U[i:len(U)]
    else :
        S += V[j:len(V)]
    return S

#### 6) 입력 사례 확인

In [6]:
S = [27, 10, 12, 20, 25, 13, 15, 22]
print("Before : ", S)
X = mergesort(S)
print("After : ", X)

Before :  [27, 10, 12, 20, 25, 13, 15, 22]
After :  [10, 12, 13, 15, 20, 22, 25, 27]


In [7]:
def mergesort_detail(S):
    n = len(S)
    if n <= 1:
        return S
    else :
        mid = n//2
        U = mergesort_detail(S[0:mid])
        V = mergesort_detail(S[mid:n])
        print(U)
        print(V)
        return merge(U, V)

Y = mergesort_detail(S)
print(Y)

[27]
[10]
[12]
[20]
[10, 27]
[12, 20]
[25]
[13]
[15]
[22]
[13, 25]
[15, 22]
[10, 12, 20, 27]
[13, 15, 22, 25]
[10, 12, 13, 15, 20, 22, 25, 27]


### (3) 합병정렬 알고리즘의 개선
#### 1)  기존 알고리즘의 문제점
- 입력 리스트 S 이외에 리스트 U, V를 추가적으로 사용
> 메모리 사용의 비효율성이 발생. 더 효율적인 방법 필요
- 추가적으로 만들어지는 리스트 원소의 수가 너무 많아지는 문제
- mergesort() 호출 시, 새로운 리스트 U와 V를 생성
- 첫번째 재귀 호출 시 원소 수 : U n/2개, V n/2개
- 두번째 재귀 호출 시 원소 수 : U n/4개, V n/4개
...
- 전체 재귀 호출 시 원소 개수 : n + n/2 + n/4 + ... = 약 2n

#### 2) 개선된 코드

In [15]:
def mergesort2(S, low, high):
    if low < high:
        mid = (low + high)//2
        mergesort2(S, low, mid) # previously U
        mergesort2(S, mid+1, high) #previously V
        print(S[low:high+1])
        merge2(S, low, mid, high)
        
def merge2(S, low, mid, high):
    U = [] # as temporary array list
    i = low
    j = mid + 1
    while (i <= mid) & (j <= high):
        if (S[i] < S[j]):
            U.append(S[i])
            i += 1
        else:
            U.append(S[j])
            j += 1
    if i <= mid:
        U += S[i:mid + 1]
    else:
        U += S[j:high + 1]
    for k in range(low, high+1):
        S[k] = U[k-low]

In [16]:
S = [27, 10, 12, 20, 25, 13, 15, 22]
print("Before : ", S)
mergesort2(S, 0, len(S)-1)
print("After : ", S)

Before :  [27, 10, 12, 20, 25, 13, 15, 22]
[27, 10]
[12, 20]
[10, 27, 12, 20]
[25, 13]
[15, 22]
[13, 25, 15, 22]
[10, 12, 20, 27, 13, 15, 22, 25]
After :  [10, 12, 13, 15, 20, 22, 25, 27]


## Ch 2.3. 분할정복의 설계 방법

### (1) 설계 전략
#### 1) 분할
: 문제 입력 사례를 둘 이상의 작은 입력사례로 분할
#### 2) 정복
: 작은 입력 사례들을 각각 정복. 작은 입력 사례들이 충분히 작지않다면 재귀호출로 작게 만든다.
#### 3) 통합
: (필요 시) 작은 입력 사례들의 해답을 통합하여, 원래 입력 사례의 해답을 도출 (merge sort 사례에서)

### (2) 문제해결 알고리즘의 종류

#### 1) Brute Force
: 순차 탐색 sequential search와 같이 단순무식(...)한 방법으로 답 찾아내기
#### 2) Divide-and-Conquer
: 분할정복. Binary Search, merge sort 등
#### 3) Greedy Approach
: 탐욕법. 하나씩 순차적으로 찾아가는 방식. Exchange sort. 어떤 측면에서는 가장 비효율적인 분할정복 알고리즘이라고도 볼 수 있다.
#### 4) Dynamic Programming
: 동적 계획법. 분할 정복이 Top-Down 방식이라면, 동적 계획법은 Bottom-up 방식이라고 볼 수 있음.

## Ch 2.4. Quick Sort 퀵 정렬 (분할 교환정렬)

### (1) 퀵 정렬 : 가장 대표적인 분할 정복 알고리즘
#### 1) 내부 (in-place) 정렬
- 추가적인 리스트, 배열을 생성하지 않는 정렬
- Hoare (1962), Quick Sort Algorithm

#### 2) 원리
- [Divide] : 기준 원소(pivot)를 정해서, 기준 원소를 기준으로 좌우로 분할
- [Conquer] : 왼쪽의 리스트와 오른쪽의 리스트를 각각 재귀적으로 퀵 정렬
- [Obtain] : 정렬된 리스트를 반환

#### 3) 코드

In [18]:
def quicksort(S, low, high):
    if high > low:
        pivotpoint = partition(S, low, high)
        quicksort(S, low, pivotpoint-1)
        quicksort(S, pivotpoint+1, high)

### (2) 기준원소 pivot을 어떻게 정할 것인가?

#### 1) 편의상 리스트의 첫 원소를 기준 원소로 지정해서 알고리즘을 생성
#### 2)  정렬 과정

- input S = [15, 22, 13, 27, 12, 10, 20, 25]
- 리스트의 첫 원소 15를 pivot으로 하고, pivot보다 작은 것은 왼쪽, 큰 것은 오른쪽에 배치
- S' = [13, 12, 10] [15] [22, 27, 20, 25]
- 재귀 호출을 통해 각각 분할된 상태에서 각각의 첫 원소를 pivot으로 하여 재배치하는 방식으로 진행
- S'' = [12, 10] [13] [15] [20] [22] [27, 25]
- S''' = [10][12][13][15][20][22][25][27]

> 결과적으로 새로운 리스트를 생성하지 않고, 동일한 리스트 S 내에서 정렬이 완료됨

#### 3) 기준원소를 이용해서 어떻게 리스트를 나눌 수 있을까?
: 두 개의 인덱스 i,j를 이용해서 비교한 후 서로 교환하는 방식 (compare & swap)
> pivotpoint = partition(S, low=0, high=7)

#### 4) 리스트를 나누는 partition 함수 코드 구현

In [21]:
def partition(S, low, high):
    pivotitem = S[low] # set the first item of the list as pivot
    j = low
    for i in range(low+1, high+1):
        print(i, j, S) # to see the sorting process
        if S[i] < pivotitem :
            j +=1
            S[i], S[j] = S[j], S[i] # swap
    pivotpoint = j
    S[low], S[pivotpoint] = S[pivotpoint], S[low]
    return pivotpoint

#### 5) 입력 예시

In [20]:
S = [15, 22, 13, 27, 12, 10, 20, 25]
print("Before : ", S)
quicksort(S, 0, len(S)-1)
print("After : ", S)

Before :  [15, 22, 13, 27, 12, 10, 20, 25]
After :  [10, 12, 13, 15, 20, 22, 25, 27]


In [22]:
S = [15, 22, 13, 27, 12, 10, 20, 25]
print("Before : ", S)
quicksort(S, 0, len(S)-1)
print("After : ", S)

Before :  [15, 22, 13, 27, 12, 10, 20, 25]
1 0 [15, 22, 13, 27, 12, 10, 20, 25]
2 0 [15, 22, 13, 27, 12, 10, 20, 25]
3 1 [15, 13, 22, 27, 12, 10, 20, 25]
4 1 [15, 13, 22, 27, 12, 10, 20, 25]
5 2 [15, 13, 12, 27, 22, 10, 20, 25]
6 3 [15, 13, 12, 10, 22, 27, 20, 25]
7 3 [15, 13, 12, 10, 22, 27, 20, 25]
1 0 [10, 13, 12, 15, 22, 27, 20, 25]
2 0 [10, 13, 12, 15, 22, 27, 20, 25]
2 1 [10, 13, 12, 15, 22, 27, 20, 25]
5 4 [10, 12, 13, 15, 22, 27, 20, 25]
6 4 [10, 12, 13, 15, 22, 27, 20, 25]
7 5 [10, 12, 13, 15, 22, 20, 27, 25]
7 6 [10, 12, 13, 15, 20, 22, 27, 25]
After :  [10, 12, 13, 15, 20, 22, 25, 27]


### (3) Partition 함수의 개선

#### 1) 앞에서 구현한 함수의 경우, 인덱스 i, j의 위치가 혼선을 줄 수 있어, 개선 필요
#### 2) 개선한 로직

- input S = [26, 5, 37, 1, 61, 11, 59, 15, 48, 19]
- pivot은 리스트의 가장 첫 값인 S[0] = 26인 상태에서, i는 S[1]부터 시작, j는 S[len(S)-1] 위치에서부터 역순으로 시작
- i는 pivot보다 큰 값을 찾을 때까지 이동, j는 pivot보다 작은 값을 찾을 때까지 이동
- S = [26, 5, 37(i 멈춤), 1, 61, 11, 59, 15, 48, 19(j 멈춤)] > i, j 값 서로 swap
- S' = [26, 5, 19, 1, 61, 11, 59, 15, 48, 37]
- i는 1씩 증가, j는 1씩 감소하며, i < j 일때까지 동일한 과정을 계속 반복
- S' = [26, 5, 19, 1, 61(i 멈춤), 11, 59, 15(j 멈춤), 48, 37] > i, j swap
- S'' = [26, 5, 19, 1, 15, 11, 59, 61, 48, 37]
- S'' = [26, 5, 19, 1, 15, 11(j 멈춤), 59(i 멈춤), 61, 48, 37]
- 각 i = 6, j = 5 상태에서, i < j 가 되면서 1차 루프 종료, j 위치의 값과 pivot의 값을 swap
- S''' = [11, 5, 19, 1, 15] [26] [59, 61, 48, 37]
- 첫 루프가 끝나고 나면, 첫 pivot을 기준으로 왼쪽에는 작은 값만, 오른쪽에는 큰 값만 남게 된다.
- 재귀 호출을 통해, 각각의 분할된 부분에서 동일한 로직으로 최종적으로 정렬이 완료되는 방식

#### 3) 개선된 partition 함수 구현 코드

In [26]:
def partition2 (S, low, high):
    pivotitem = S[low] # set S[0] as pivot
    i = low + 1 # start from the next item of pivot
    j = high # start from the end of list
    while i <= j:
        while S[i] < pivotitem:
            i +=1
        while S[j] > pivotitem:
            j -=1
        print(i,j,S)
        if i<j:
            S[i],S[j] = S[j], S[i] # swap!
    pivotpoint = j
    S[low], S[pivotpoint] = S[pivotpoint], S[low] # swap!
    return pivotpoint

In [24]:
def quicksort2(S, low, high):
    if high > low:
        pivotpoint = partition2(S, low, high)
        quicksort2(S, low, pivotpoint-1)
        quicksort2(S, pivotpoint+1, high)

#### 4) 입력 예시

In [25]:
S = [26, 5, 37, 1, 61, 11, 59, 15, 48, 19]
print("Before : ", S)
quicksort2(S, 0, len(S)-1)
print("After : ", S)

Before :  [26, 5, 37, 1, 61, 11, 59, 15, 48, 19]
After :  [1, 5, 11, 15, 19, 26, 37, 48, 59, 61]


In [27]:
S = [26, 5, 37, 1, 61, 11, 59, 15, 48, 19]
print("Before : ", S)
quicksort2(S, 0, len(S)-1)
print("After : ", S)

Before :  [26, 5, 37, 1, 61, 11, 59, 15, 48, 19]
2 9 [26, 5, 37, 1, 61, 11, 59, 15, 48, 19]
4 7 [26, 5, 19, 1, 61, 11, 59, 15, 48, 37]
6 5 [26, 5, 19, 1, 15, 11, 59, 61, 48, 37]
2 3 [11, 5, 19, 1, 15, 26, 59, 61, 48, 37]
3 2 [11, 5, 1, 19, 15, 26, 59, 61, 48, 37]
1 0 [1, 5, 11, 19, 15, 26, 59, 61, 48, 37]
5 4 [1, 5, 11, 19, 15, 26, 59, 61, 48, 37]
7 9 [1, 5, 11, 15, 19, 26, 59, 61, 48, 37]
9 8 [1, 5, 11, 15, 19, 26, 59, 37, 48, 61]
8 7 [1, 5, 11, 15, 19, 26, 48, 37, 59, 61]
After :  [1, 5, 11, 15, 19, 26, 37, 48, 59, 61]


#### 5) Quick Sort Algorithm의 성능이 최악으로 떨어지는 경우
- 예시 : S = [1, 2, 3, 4, 5]
- 잘 정렬된 리스트인 경우, 괜히 리스트를 섞어버리게 되므로, 성능이 떨어짐
- 오히려 랜덤으로 뒤죽박죽 섞인 리스트를 정렬할 때 유용

## Ch 2.5. 쉬트라센의 행렬 곱셈 Strassen's Matrix Multiplication

### (1) 행렬의 곱셈 문제

#### 1) 문제 : 두 n x n 행렬의 곱을 구하시오
- 이전에 행렬곱 정의에 충실하게 알고리즘을 적용했을 때의 시간 복잡도는 O(n^3)
- 행렬 곱셈의 시간 복잡도를 더 줄일 수 있을까? : Strassen(1969) 시간 복잡도를 O(n^2.81)로 줄일 수 있다.

#### 2) Strassen의 방법

> [[c11, c12], [c21, c22]] = [[a11, a12], [a21, a22]] * [[b11, b12], [b21, b22]]

- m1 = (a11 + a22)(b11 + b22)
- m2 = (a21 + a22)b11
- m3 = a11(b12 - b22)
- m4 = a22(b21 - b11)
- m5 = (a11 + a12)b22
- m6 = (a21 - a11)(b11 + b12)
- m7 = (a12 - a22)(b21 + b22)

> C = [[m1 + m4 - m5 + m7, m3 + m5], [m2 + m4, m1 + m3 - m2 + m6]]

#### 3) 기존 행렬 곱 공식과 비교
- 기존 : 8 multiplications & 4 additions cij = Σaik*bkj. 시간 복잡도 O(n^3)
- Strassen : 7 multiplications & 18 additions, subtractions. 시간 복잡도 O(n^2.81)
- 덧셈 연산이 늘어나면서 복잡해 보이지만, 곱셈연산은 기본적으로 부하가 큰 연산이므로, 실질적으로는 알고리즘이 개선되는 결과를 얻음.

### (2) Strassen's Multiplication as 'Divide-and-Conquer'

#### 1) 원리
- 큰 행렬을 네 개의 부분 행렬로 나누어 정복
> [[C11, C12], [C21, C22]] = [[A11, A12], [A21, A22]] * [[B11, B12], [B21, B22]]

- 예를 들어, 8x8 행렬 곱의 경우, 분할해서 4x4 행렬 4개로, 다시 2x2 행렬 4개로 분할해서 Strassen의 방식을 적용한다.

#### 2) 예시
> [[C11, C12], [C21, C22]] = [[[1,2],[5,6]], [[3,4],[7,8]], [[9,1],[4,5]], [[2,3],[6,7]]] * [[[8,9],[3,4]], [[1,2],[5,6]], [[7,8],[2,3]], [[9,1],[4,5]]]

- 4x4 행렬 A, B가 주어졌을 때, 이를 각각 2x2 부분행렬 4개로 분할해서, Strassen의 방식을 적용
- M1 = (A11 + A22) * (B11 + B22) = [[3,5],[11,13]] * [[17, 10],[7,9]] = [[86,75], [278,227]]
- 이 과정을 M7까지 반복, 최종적으로 Conquer 과정에서 분할해서 연산한 내용을 병합
- C = [[(M1 + M4 - M5 + M7), (M3 + M5)], [(M2 + M4), (M1 + M3 - M2 + M6)]]

### (3) 코드 구현
#### 1) 메인 함수 strassen

In [36]:
def strassen(A,B):
    n = len(A)
    if n <= 2:
        return matrixmult(A,B)
    A11, A12, A21, A22 = divide(A)
    B11, B12, B21, B22 = divide(B)
    M1 = strassen(madd(A11, A22), madd(B11, B22))
    M2 = strassen(madd(A21, A22), B11)
    M3 = strassen(A11, msub(B12, B22))
    M4 = strassen(A22, msub(B21, B11))
    M5 = strassen(madd(A11, A12), B22)
    M6 = strassen(msub(A21, A11), madd(B11, B12))
    M7 = strassen(msub(A12, A22), madd(B21, B22))
    return conquer(M1, M2, M3, M4, M5, M6, M7)

#### 2) 부분행렬로 분할하는 함수 divide

In [37]:
def divide(A):
    n = len(A)
    m = n//2
    A11 = [[0] * m for _ in range(m)] # creating m*m sized matrix
    A12 = [[0] * m for _ in range(m)]
    A21 = [[0] * m for _ in range(m)]
    A22 = [[0] * m for _ in range(m)]
    for i in range(m):
        for j in range(m):
            A11[i][j] = A[i][j]
            A12[i][j] = A[i][j+m]
            A21[i][j] = A[i+m][j]
            A22[i][j] = A[i+m][j+m]
    return A11, A12, A21, A22

#### 3) 분할해서 연산한 후 다시 병합하는 함수 conquer

In [38]:
def conquer(M1, M2, M3, M4, M5, M6, M7):
    C11 = madd(msub(madd(M1, M4), M5), M7)
    C12 = madd(M3, M5)
    C21 = madd(M2, M4)
    C22 = madd(msub(madd(M1, M3), M2), M6)
    m = len(C11)
    n = m*2
    C = [[0] * n for _ in range(n)] # creating n*n sized matrix as result C
    for i in range(m):
        for j in range(m):
            C[i][j] = C11[i][j]
            C[i][j+m] = C12[i][j]
            C[i+m][j] = C21[i][j]
            C[i+m][j+m] = C22[i][j]
    return C

#### 4) 행렬 덧셈 & 뺄셈

In [46]:
def madd(A,B):
    n = len(A)
    C = [[0] * n for _ in range(n)]
    for i in range(n):
        for j in range(n):
            C[i][j] = A[i][j] + B[i][j]
    return C

def msub(A,B):
    n = len(A)
    C = [[0] * n for _ in range(n)]
    for i in range(n):
        for j in range(n):
            C[i][j] = A[i][j] - B[i][j]
    return C

#### 5) 전통적인 방식의 행렬곱 공식 matrixmult
: n <= threshold 일때 적용되며, 본 예시에서는 threshold = 2로 지정

In [58]:
def matrixmult(A,B):
    n = len(A)
    C = [[0] * n for _ in range(n)]
    for i in range(n):
        for j in range(n):
            for k in range(n):
                C[i][j] += A[i][k] * B[k][j]
    return C

### (4) 입력 예시

In [59]:
A = [[1, 2, 3, 4],
     [5, 6, 7, 8],
     [9, 1, 2, 3],
     [4, 5, 6, 7]]
B = [[8, 9, 1, 2],
     [3, 4, 5, 6],
     [7, 8, 9, 1],
     [2, 3, 4, 5]]

threshold = 2
print("A = ", A)
print("B = ", B)
C = strassen(A,B)

for i in range(len(C)):
    print("C[%d] = "%(i), C[i])

A =  [[1, 2, 3, 4], [5, 6, 7, 8], [9, 1, 2, 3], [4, 5, 6, 7]]
B =  [[8, 9, 1, 2], [3, 4, 5, 6], [7, 8, 9, 1], [2, 3, 4, 5]]
C[0] =  [43, 53, 54, 37]
C[1] =  [123, 149, 130, 93]
C[2] =  [95, 110, 44, 41]
C[3] =  [103, 125, 111, 79]


In [60]:
D = matrixmult(A,B)

for i in range(len(D)):
    print("D[%d] = "%(i), D[i])

D[0] =  [43, 53, 54, 37]
D[1] =  [123, 149, 130, 93]
D[2] =  [95, 110, 44, 41]
D[3] =  [103, 125, 111, 79]


> Strassen 방식을 통해서 구한 C와 전통적인 방식으로 구한 D의 결과가 같음을 알 수 있다.

## Ch 2.6. 큰 정수의 계산법

### (1) 큰 정수를 다룰 때의 문제

#### 1) 문제
: 특정 컴퓨터나 언어가 표현할 수 없는 큰 정수의 산술연산 (int, double type 등이 표현할 수 있는 범위를 넘어서는 경우

#### 2) 10진수를 소프트웨어적으로 표현하는 방법
- 리스트를 이용하여 각 자리 수(digit)를 하나의 원소로 저장
- 예 : 567832 -> S = [2, 3, 8, 7, 6, 5]
- S[5]= 5, S[4]= 6, S[3]= 7, S[2]= 8, S[1]= 3, S[0]= 2

### (2) 큰 정수의 덧셈

#### 1) n개의 자릿수(digit) 각각을 더하면서, 올림수 (carry)를 고려
- | 1 1 0 0 << CARRY
- | 9 8 7 6
- | + 5 4 3
- | -------
- 1 0 4 1 9

#### 2) 코드 구현

In [1]:
def ladd(u,v):
    n = len(u) if (len(u)>len(v)) else len(v) # choose the longer one as n
    result = []
    carry = 0
    for k in range(n):
        i = u[k] if (k < len(u)) else 0
        j = v[k] if (k < len(v)) else 0
        value = i + j + carry
        carry = value//10
        result.append(value%10)
    if carry > 0:
        result.append(carry)
    return result

#### 3) 예시

In [2]:
u = [3,2,1] #u = 123
v = [5,4] #v = 45
print(123+45)
print(ladd(u,v)[::-1]) #[::-1] makes the list reversed

168
[1, 6, 8]


In [3]:
u = [2,3,8,7,6,5] #u = 567832
v = [3,2,7,3,2,4,9] #v = 9423723
print(567832+9423723)
print(ladd(u,v)[::-1])

9991555
[9, 9, 9, 1, 5, 5, 5]


### (3) 큰 정수의 곱셈

#### 1) BruteForce 방법을 이용할 경우
: 각 자리 수끼리 곱하고 마지막에 더해주는 방식 ∈ Θ(n^2)

#### 2) 분할정복 Divide-and-Conquer을 이용한 큰 정수의 곱셈
- n개의 자릿수(digit)로 된 숫자를 n/2개의 자릿수로 분할
- 둘 중 하나의 자릿수는 [n/2]개이고, 다른 하나는 [n/2]개가 됨

> 567832 = 567 * 10^3 + 832
- 6 digits 3 digits   3 digits

> 9423723 = 9423 * 10^3 + 723
- 7 digits  4 digits   3 digits

- 자릿수가 분할된 두 정수의 곱셈
: 두 개의 정수 u, v를 분할하여 곱셈 연산을 함

> u = x * 10^m + y

> v = w * 10^m + z

> uv = (x * 10^m + y)(w * 10^m + z)
   = xw * 10^2m + (xz + yw) * 10^m + yz
   
#### 3) 코드 구현

In [4]:
def prod(u,v):
    n = len(u) if (len(u)>len(v)) else len(v)
    if (len(u)==0) | (len(v)==0):
        return [0]
    elif n<= threshold: # we'll stop when n reaches to threshold (here we assume 1)
        return lmult(u,v)
    else:
        m = n//2
        x = div(u,m); y = rem(u,m)
        w = div(v,m); z = rem(v,m)
        p1 = prod(x,w)
        p2 = ladd(prod(x,z), prod(w,y))
        p3 = prod(y,z)
        return ladd(ladd(exp(p1, 2*m), exp(p2, m)),p3)

### (4) 큰 정수의 지수 곱셈(exp)과 나눗셈(div)

#### 1) 10^m으로 곱하기
: 왼쪽으로 m 자릿수만큼 shift
> 567 * 10^3 = 567000 (567 각각을 3자리 shift한 후, 빈 자리는 0으로 채운다)

#### 2) 10^m으로 나눈 나머지와 몫
- 1의 자리에서 m의 자리까지가 나머지 567832 rem 10^3 = 832
- m+1의 자리에서 n자리까지가 몫 567832 div 10^3 = 567

#### 3) 코드 구현

In [5]:
def exp(u,m):
    if u == [0]:
        return [0]
    else:
        return ([0]*m)+u

In [6]:
def div(u,m):
    if len(u) < m:
        u.append(0)
    return u[m:len(u)] # from m to n

In [7]:
def rem(u,m):
    if len(u) < m:
        u.append(0)
    return u[0:m] #from 0 to m-1

### (5) 임계값 (threshold)과 단순 곱셈

#### 1) 임계값
: 특정 자리수까지 반복하고, 그 지점에서 종료
> 본 예제에서는 임계값을 1로 설정해서, 자리수를 1자리 단위로 쪼개었을 때, 더 이상 쪼개기를 하지 않고, 연산을 시작하게 된다.

#### 2) 코드 구현

In [8]:
def lmult(u,v):
    i = u[0] if (len(u) > 0) else 0
    j = v[0] if (len(v) > 0) else 0
    value = i * j
    carry = value//10
    result = []
    result.append(value%10)
    if carry > 0:
        result.append(carry)
    return result

#### 3) 최종 코드를 활용한 예시
: prod(u,v) | exp(u,m) | div(u,m) | rem(u,m) | lmult(u,v) | ladd(u,v) 활용

In [10]:
u = [2,3,8,7,6,5]
v = [3,2,7,3,2,4,9]
threshold = 1
print(567832 * 9423723)
print(prod(u,v)[::-1])

5351091478536
[5, 3, 5, 1, 0, 9, 1, 4, 7, 8, 5, 3, 6]


### (6) 큰 정수 연산 알고리즘의 효율성 개선

#### 1) 큰 정수의 곱셈 알고리즘에서 한 것
- 기본 연산 : 한 자릿수에서의 단위 연산 (총 m번 실행)
- 입력 크기 : 두 정수의 자릿수 (n개의 자릿수)
- 최선 | 최악 | 평균 : 최악의 경우 두 정수에 모두 0이 없을 때
- 시간 복잡도 분석 : prod() 함수에서 재귀호출을 4번 실행
- W(s) = 0, W(n) = 4W(n/2) + cn
- W(n) ∈ Θ(n^log2 4) = Θ(n^2)
> 결국 brute force 방식으로 계산한 것보다 이점이 없음 !

#### 2) 효율성 개선
- 기존 알고리즘 모델에서 재귀호출을 4번 하기 때문에 효율성이 개선되지 않았다.
- 재귀호출의 횟수를 줄이는 방향으로 효율성을 개선

> uv = xw * 10^2m + (xz+yw) * 10^m + yz

> uv를 r로 치환하여 식 정리

> r = uv = (x+y)(w+z) = xw + (xz+yw) + yz

> xz + yw = r - (xw+yz)

> 곱셈이 3번으로 줄어든다 : xz, yw, 그리고 xw+yz는 직접 계산하는 것이 아니라 xz와 yw를 통해 구하게 되므로, 한번 연산을 줄이는 효과
 
#### 3) 코드 구현

In [27]:
def prod2(u,v):
    n = len(u) if (len(u) > len(v)) else len(v)
    if (len(u) == 0) | (len(v) == 0):
        return [0]
    elif n <= threshold:
        return lmult(u,v)
    else:
        m = n//2
        x = div(u,m); y = rem(u,m)
        w = div(v,m); z = rem(v,m)
        r = prod2(ladd(x,y), ladd(w,z))
        p1 = prod2(x,w)
        p3 = prod2(y,z)
        p2 = lsub(r, ladd(p1, p3))
        return ladd(ladd(exp(p1, 2*m), exp(p2,m)), p3)

In [33]:
def lsub(u,v):
    n = len(u) if (len(u) > len(v)) else len(v)
    result = []
    borrow = 0
    for k in range(n):
        i = u[k] if (k < len(u)) else 0
        j = v[k] if (k < len(v)) else 0
        value = i - j + borrow
        if value < 0 :
            value +=10
            borrow = -1
        else:
            borrow = 0
        result.append(value%10)
    #if borrow < 0:
    #    print("음의 정수는 처리 못 함")
    return result

#### 4) 개선된 알고리즘 prod2()의 시간 복잡도
: 재귀 호출의 숫자를 3회로 줄임
> W(n) ∈ Θ(n^log2 3) ≈ Θ(n^1.58) < Θ(n^2)

#### 5) 예시

In [34]:
u = [2,3,8,7,6,5]
v = [3,2,7,3,2,4,9]
print(567832 * 9423723)
print(prod2(u,v)[::-1])

5351091478536
[0, 5, 3, 5, 1, 0, 9, 1, 4, 7, 8, 5, 3, 6]
