# Python으로 배우는 Algorithm 기초

# Ch 2. 분할 정복 알고리즘 Divide-and-Conquer

## Ch 2.1 이분 검색 Binary Search

### (1) 이분 검색 문제
- 정렬되지 않은 리스트 S에서 주어진 키 x가 존재하는가? : 순차 탐색
- 정렬된 리스트 S에서 주어진 키 x가 존재하는가? : 이분 검색
> 재귀적 방법으로 이분 검색 로직 구상하기

### (2) 분할정복 알고리즘으로서의 이분 검색
#### 1) 문제 : 정렬된 리스트 S에서 어떤 키 x가 존재하는가?
#### 2) 해답 : 존재하면 S에서의 x의 위치, 존재하지 않는 경우 -1을 반환
#### 3) 분할정복법
- S의 정가운데 원소와 x를 비교하여, 같으면 해당 위치를 반환
- 아닌 경우
- [Divide] 정가운데 원소를 기준으로 S를 두 개의 리스트로 분할
- [Conquer] x가 정가운데 원소보다 크면 오른쪽, 작으면 왼쪽을 호출. 남은 반쪽은 버림.
- [Obtain] 선택한 리스트에서 얻은 답을 반환

#### 4) 코드 (Recursive)

In [2]:
def binarySearch (S, x, low, high):
    if low > high:
        return -1
    else:
        mid = (low + high)//2
        if x == S[mid]:
            return mid
        elif x < S[mid]:
            return binarySearch(S, x, low, mid-1)
        else:
            return binarySearch(S, x, mid+1, high)

In [3]:
S = [8, 10, 12, 13, 14, 18, 20, 25, 27, 30, 35, 40, 45]
x = 18
loc = binarySearch(S, x, 0, len(S)-1)
print("S = ", S)
print("x = ", x)
print("loc = ", loc)

S =  [8, 10, 12, 13, 14, 18, 20, 25, 27, 30, 35, 40, 45]
x =  18
loc =  5


In [4]:
y = 17 # which doesn't exist in the list S
loc2 = binarySearch(S, y, 0, len(S)-1)
print("S = ", S)
print("y = ", y)
print("loc2 = ", loc2)

S =  [8, 10, 12, 13, 14, 18, 20, 25, 27, 30, 35, 40, 45]
y =  17
loc2 =  -1


## Ch 2.2 합병 정렬 Merge Sort

### (1) 정렬되지 않은 리스트의 정렬
: 기존에 교환정렬을 통한 리스트 정렬 (greedy algorithm에 가까운 형태)
> 합병정렬을 통해 개선된 알고리즘 사용 가능 !

### (2) 합병 정렬

#### 1) Divide
: 원소가 n개인 S를 n/2개의 원소를 가진 두 개의 리스트로 분할
#### 2) Conquer
: 왼쪽의 리스트와 오른쪽의 리스트를 각각 재귀적으로 합병해 정렬
#### 3) Combine
: 각각 정렬된 두 개의 리스트를 정렬된 하나의 리스트로 합병하여 리턴
#### 4) 정렬 방식
: merge 과정에서 대소 비교해서 정렬

- input S = [27, 10, 12, 20 | 25, 13, 15, 22]
- Divide    [27, 10 | 12, 20] [25, 13 | 15, 22]
- Divide    [27 | 10] [12 | 20] [25 | 13] [15 | 22]
- Divide    [27] [10] [12] [20] [25] [13] [15] [22]
- merge    [10, 27] [12, 20]   [13, 25] [15, 22]
- merge    [10, 12, 20, 27]    [13, 15, 22, 25]
- merge    [10, 12, 13, 15, 20, 22, 25, 27]

#### 5) 코드

In [5]:
def mergesort(S):
    n = len(S)
    if n <= 1:
        return S
    else :
        mid = n//2
        U = mergesort(S[0:mid])
        V = mergesort(S[mid:n])
        return merge(U, V)

def merge(U, V):
    S = []
    i = j = 0
    while (i < len(U)) & (j < len(V)):
        if U[i] < V[j]:
            S.append(U[i])
            i += 1
        else:
            S.append(V[j])
            j += 1
    if i < len(U):
        S += U[i:len(U)]
    else :
        S += V[j:len(V)]
    return S

#### 6) 입력 사례 확인

In [6]:
S = [27, 10, 12, 20, 25, 13, 15, 22]
print("Before : ", S)
X = mergesort(S)
print("After : ", X)

Before :  [27, 10, 12, 20, 25, 13, 15, 22]
After :  [10, 12, 13, 15, 20, 22, 25, 27]


In [7]:
def mergesort_detail(S):
    n = len(S)
    if n <= 1:
        return S
    else :
        mid = n//2
        U = mergesort_detail(S[0:mid])
        V = mergesort_detail(S[mid:n])
        print(U)
        print(V)
        return merge(U, V)

Y = mergesort_detail(S)
print(Y)

[27]
[10]
[12]
[20]
[10, 27]
[12, 20]
[25]
[13]
[15]
[22]
[13, 25]
[15, 22]
[10, 12, 20, 27]
[13, 15, 22, 25]
[10, 12, 13, 15, 20, 22, 25, 27]


### (3) 합병정렬 알고리즘의 개선
#### 1)  기존 알고리즘의 문제점
- 입력 리스트 S 이외에 리스트 U, V를 추가적으로 사용
> 메모리 사용의 비효율성이 발생. 더 효율적인 방법 필요
- 추가적으로 만들어지는 리스트 원소의 수가 너무 많아지는 문제
- mergesort() 호출 시, 새로운 리스트 U와 V를 생성
- 첫번째 재귀 호출 시 원소 수 : U n/2개, V n/2개
- 두번째 재귀 호출 시 원소 수 : U n/4개, V n/4개
...
- 전체 재귀 호출 시 원소 개수 : n + n/2 + n/4 + ... = 약 2n

#### 2) 개선된 코드

In [15]:
def mergesort2(S, low, high):
    if low < high:
        mid = (low + high)//2
        mergesort2(S, low, mid) # previously U
        mergesort2(S, mid+1, high) #previously V
        print(S[low:high+1])
        merge2(S, low, mid, high)
        
def merge2(S, low, mid, high):
    U = [] # as temporary array list
    i = low
    j = mid + 1
    while (i <= mid) & (j <= high):
        if (S[i] < S[j]):
            U.append(S[i])
            i += 1
        else:
            U.append(S[j])
            j += 1
    if i <= mid:
        U += S[i:mid + 1]
    else:
        U += S[j:high + 1]
    for k in range(low, high+1):
        S[k] = U[k-low]

In [16]:
S = [27, 10, 12, 20, 25, 13, 15, 22]
print("Before : ", S)
mergesort2(S, 0, len(S)-1)
print("After : ", S)

Before :  [27, 10, 12, 20, 25, 13, 15, 22]
[27, 10]
[12, 20]
[10, 27, 12, 20]
[25, 13]
[15, 22]
[13, 25, 15, 22]
[10, 12, 20, 27, 13, 15, 22, 25]
After :  [10, 12, 13, 15, 20, 22, 25, 27]


## Ch 2.3. 분할정복의 설계 방법

### (1) 설계 전략
#### 1) 분할
: 문제 입력 사례를 둘 이상의 작은 입력사례로 분할
#### 2) 정복
: 작은 입력 사례들을 각각 정복. 작은 입력 사례들이 충분히 작지않다면 재귀호출로 작게 만든다.
#### 3) 통합
: (필요 시) 작은 입력 사례들의 해답을 통합하여, 원래 입력 사례의 해답을 도출 (merge sort 사례에서)

### (2) 문제해결 알고리즘의 종류

#### 1) Brute Force
: 순차 탐색 sequential search와 같이 단순무식(...)한 방법으로 답 찾아내기
#### 2) Divide-and-Conquer
: 분할정복. Binary Search, merge sort 등
#### 3) Greedy Approach
: 탐욕법. 하나씩 순차적으로 찾아가는 방식. Exchange sort. 어떤 측면에서는 가장 비효율적인 분할정복 알고리즘이라고도 볼 수 있다.
#### 4) Dynamic Programming
: 동적 계획법. 분할 정복이 Top-Down 방식이라면, 동적 계획법은 Bottom-up 방식이라고 볼 수 있음.

## Ch 2.4. Quick Sort 퀵 정렬 (분할 교환정렬)

### (1) 퀵 정렬 : 가장 대표적인 분할 정복 알고리즘
#### 1) 내부 (in-place) 정렬
- 추가적인 리스트, 배열을 생성하지 않는 정렬
- Hoare (1962), Quick Sort Algorithm

#### 2) 원리
- [Divide] : 기준 원소(pivot)를 정해서, 기준 원소를 기준으로 좌우로 분할
- [Conquer] : 왼쪽의 리스트와 오른쪽의 리스트를 각각 재귀적으로 퀵 정렬
- [Obtain] : 정렬된 리스트를 반환

#### 3) 코드

In [18]:
def quicksort(S, low, high):
    if high > low:
        pivotpoint = partition(S, low, high)
        quicksort(S, low, pivotpoint-1)
        quicksort(S, pivotpoint+1, high)

### (2) 기준원소 pivot을 어떻게 정할 것인가?

#### 1) 편의상 리스트의 첫 원소를 기준 원소로 지정해서 알고리즘을 생성
#### 2)  정렬 과정

- input S = [15, 22, 13, 27, 12, 10, 20, 25]
- 리스트의 첫 원소 15를 pivot으로 하고, pivot보다 작은 것은 왼쪽, 큰 것은 오른쪽에 배치
- S' = [13, 12, 10] [15] [22, 27, 20, 25]
- 재귀 호출을 통해 각각 분할된 상태에서 각각의 첫 원소를 pivot으로 하여 재배치하는 방식으로 진행
- S'' = [12, 10] [13] [15] [20] [22] [27, 25]
- S''' = [10][12][13][15][20][22][25][27]

> 결과적으로 새로운 리스트를 생성하지 않고, 동일한 리스트 S 내에서 정렬이 완료됨

#### 3) 기준원소를 이용해서 어떻게 리스트를 나눌 수 있을까?
: 두 개의 인덱스 i,j를 이용해서 비교한 후 서로 교환하는 방식 (compare & swap)
> pivotpoint = partition(S, low=0, high=7)

#### 4) 리스트를 나누는 partition 함수 코드 구현

In [21]:
def partition(S, low, high):
    pivotitem = S[low] # set the first item of the list as pivot
    j = low
    for i in range(low+1, high+1):
        print(i, j, S) # to see the sorting process
        if S[i] < pivotitem :
            j +=1
            S[i], S[j] = S[j], S[i] # swap
    pivotpoint = j
    S[low], S[pivotpoint] = S[pivotpoint], S[low]
    return pivotpoint

#### 5) 입력 예시

In [20]:
S = [15, 22, 13, 27, 12, 10, 20, 25]
print("Before : ", S)
quicksort(S, 0, len(S)-1)
print("After : ", S)

Before :  [15, 22, 13, 27, 12, 10, 20, 25]
After :  [10, 12, 13, 15, 20, 22, 25, 27]


In [22]:
S = [15, 22, 13, 27, 12, 10, 20, 25]
print("Before : ", S)
quicksort(S, 0, len(S)-1)
print("After : ", S)

Before :  [15, 22, 13, 27, 12, 10, 20, 25]
1 0 [15, 22, 13, 27, 12, 10, 20, 25]
2 0 [15, 22, 13, 27, 12, 10, 20, 25]
3 1 [15, 13, 22, 27, 12, 10, 20, 25]
4 1 [15, 13, 22, 27, 12, 10, 20, 25]
5 2 [15, 13, 12, 27, 22, 10, 20, 25]
6 3 [15, 13, 12, 10, 22, 27, 20, 25]
7 3 [15, 13, 12, 10, 22, 27, 20, 25]
1 0 [10, 13, 12, 15, 22, 27, 20, 25]
2 0 [10, 13, 12, 15, 22, 27, 20, 25]
2 1 [10, 13, 12, 15, 22, 27, 20, 25]
5 4 [10, 12, 13, 15, 22, 27, 20, 25]
6 4 [10, 12, 13, 15, 22, 27, 20, 25]
7 5 [10, 12, 13, 15, 22, 20, 27, 25]
7 6 [10, 12, 13, 15, 20, 22, 27, 25]
After :  [10, 12, 13, 15, 20, 22, 25, 27]


### (3) Partition 함수의 개선

#### 1) 앞에서 구현한 함수의 경우, 인덱스 i, j의 위치가 혼선을 줄 수 있어, 개선 필요
#### 2) 개선한 로직

- input S = [26, 5, 37, 1, 61, 11, 59, 15, 48, 19]
- pivot은 리스트의 가장 첫 값인 S[0] = 26인 상태에서, i는 S[1]부터 시작, j는 S[len(S)-1] 위치에서부터 역순으로 시작
- i는 pivot보다 큰 값을 찾을 때까지 이동, j는 pivot보다 작은 값을 찾을 때까지 이동
- S = [26, 5, 37(i 멈춤), 1, 61, 11, 59, 15, 48, 19(j 멈춤)] > i, j 값 서로 swap
- S' = [26, 5, 19, 1, 61, 11, 59, 15, 48, 37]
- i는 1씩 증가, j는 1씩 감소하며, i < j 일때까지 동일한 과정을 계속 반복
- S' = [26, 5, 19, 1, 61(i 멈춤), 11, 59, 15(j 멈춤), 48, 37] > i, j swap
- S'' = [26, 5, 19, 1, 15, 11, 59, 61, 48, 37]
- S'' = [26, 5, 19, 1, 15, 11(j 멈춤), 59(i 멈춤), 61, 48, 37]
- 각 i = 6, j = 5 상태에서, i < j 가 되면서 1차 루프 종료, j 위치의 값과 pivot의 값을 swap
- S''' = [11, 5, 19, 1, 15] [26] [59, 61, 48, 37]
- 첫 루프가 끝나고 나면, 첫 pivot을 기준으로 왼쪽에는 작은 값만, 오른쪽에는 큰 값만 남게 된다.
- 재귀 호출을 통해, 각각의 분할된 부분에서 동일한 로직으로 최종적으로 정렬이 완료되는 방식

#### 3) 개선된 partition 함수 구현 코드

In [26]:
def partition2 (S, low, high):
    pivotitem = S[low] # set S[0] as pivot
    i = low + 1 # start from the next item of pivot
    j = high # start from the end of list
    while i <= j:
        while S[i] < pivotitem:
            i +=1
        while S[j] > pivotitem:
            j -=1
        print(i,j,S)
        if i<j:
            S[i],S[j] = S[j], S[i] # swap!
    pivotpoint = j
    S[low], S[pivotpoint] = S[pivotpoint], S[low] # swap!
    return pivotpoint

In [24]:
def quicksort2(S, low, high):
    if high > low:
        pivotpoint = partition2(S, low, high)
        quicksort2(S, low, pivotpoint-1)
        quicksort2(S, pivotpoint+1, high)

#### 4) 입력 예시

In [25]:
S = [26, 5, 37, 1, 61, 11, 59, 15, 48, 19]
print("Before : ", S)
quicksort2(S, 0, len(S)-1)
print("After : ", S)

Before :  [26, 5, 37, 1, 61, 11, 59, 15, 48, 19]
After :  [1, 5, 11, 15, 19, 26, 37, 48, 59, 61]


In [27]:
S = [26, 5, 37, 1, 61, 11, 59, 15, 48, 19]
print("Before : ", S)
quicksort2(S, 0, len(S)-1)
print("After : ", S)

Before :  [26, 5, 37, 1, 61, 11, 59, 15, 48, 19]
2 9 [26, 5, 37, 1, 61, 11, 59, 15, 48, 19]
4 7 [26, 5, 19, 1, 61, 11, 59, 15, 48, 37]
6 5 [26, 5, 19, 1, 15, 11, 59, 61, 48, 37]
2 3 [11, 5, 19, 1, 15, 26, 59, 61, 48, 37]
3 2 [11, 5, 1, 19, 15, 26, 59, 61, 48, 37]
1 0 [1, 5, 11, 19, 15, 26, 59, 61, 48, 37]
5 4 [1, 5, 11, 19, 15, 26, 59, 61, 48, 37]
7 9 [1, 5, 11, 15, 19, 26, 59, 61, 48, 37]
9 8 [1, 5, 11, 15, 19, 26, 59, 37, 48, 61]
8 7 [1, 5, 11, 15, 19, 26, 48, 37, 59, 61]
After :  [1, 5, 11, 15, 19, 26, 37, 48, 59, 61]


#### 5) Quick Sort Algorithm의 성능이 최악으로 떨어지는 경우
- 예시 : S = [1, 2, 3, 4, 5]
- 잘 정렬된 리스트인 경우, 괜히 리스트를 섞어버리게 되므로, 성능이 떨어짐
- 오히려 랜덤으로 뒤죽박죽 섞인 리스트를 정렬할 때 유용