# 3. 분할정복 알고리즘

## 3.1. 분할정복 방법의 원리

>순환적으로 문제를 푸는 하향식 접근 방법  
>Recursive, Top-down

- 주어진 문제의 입력을 더 이상 나눌 수 없을 때까지 두개 이상의 작은 문제로 순환적으루 분할
- 분할된 작은 문제들을 각각 해결한 후, 이 해(결과)들을 결합해서 원래 문제의 해를 구하는 방식



### 3.1.1. 분할정복의 특징
- 분할된 작은 문제는 원래 문제와 동일함
    - 단, 입력 크기만 작아짐  
- 분할된 작은 문제는 서로 독립적임
    - 순환적 분할 및 결과 통합이 가능함

### 3.1.2. 분할정복의 처리 단계

1. 분할: 주어진 문제를 여러 개의 작은 문제로 분할
2. 정복: 작은 문제를 순환적으로 분할
    - 만약 작은 문제가 더 이상 분할되지 않을 정도로 크기가 충분히 작다면
    - 순환호출 없이 작은 문제의 해를 구함
3. 결합: 작은 문제에 대한 해를 결합
    - 원래 문제의 해를 구함
    - 단, 결합 단계가 없는/필요하지 않은 문제도 존재함

### 3.1.3. 분할정복의 대표적 알고리즘

- 이진탐색
    - 크기가 n인 문제를 n/2인 두개의 작은 문제로 분할
    - 분할된 문제 중, 둘 중 하나는 처리 대상에서 제외
- 합병 정렬
    - 크기가 n인 문제를 n/2인 두개의 작은 문제로 분할
- 퀵 정렬
    - 크기가 n인 문제를 크기는 감소하지만, 크기가 일정하지 않은 두 개의 작은 문제로 분할
- 선택 문제
    - 크기가 n인 문제를 크기는 감소하지만, 크기가 일정하지 않은 두 개의 작은 문제로 분할
    - 분할된 문제 중, 둘 중 하나는 처리 대상에서 제외


## 3.2. 이진 탐색 Binary Search

>- 정렬된 상태의 입력 데이터에 대한 효과적 탐색 방법  
>- 입력 데이터가 오름차순으로 정렬되었다고 가정)

### 3.2.1. 탐색 방법

>다음 배열이 주어졌다고 가정  
>`A[i ... j]`

- 배열의 가운데 원소 `A[mid]`와 탐색키 x를 비교 (`mid` $= \frac{(i + j)}{2}$)
    - 탐색키 = 가운데 원소 $\rightarrow$ 탐색 성공
        - `mid` 반환 후 종료
    - 탐색키 < 가운데 원소 $\rightarrow$ 이진탐색(원래 크기 1/2 인 왼쪽 부분 배열) 순환
    - 탐색키 > 가운데 원소 $\rightarrow$ 이진탐색(원래 크기 1/2 인  오른쪽 부분 배열) 순환
    
탐색을 반복할 때마다 대상 원소의 개수가 1/2씩 감소


### 3.2.2. 분할 / 정복 / 결합

- 분할
    - 배열의 가운데 원소를 기준으로 왼쪽과 오른쪽 부분 배열로 분할
    - 탐색키와 가운데 원소가 같으면 가운데 원소의 배열 인덱스를 반환
    - 종료
- 정복
    - 탐색키가 가운데 원소보다 작으면, 왼쪽 부분배열을 대상으로 이진탐색을 순환 호출.
    - 탐색키가 가운데 원소보다 크면, 오른쪽 부분배열을 대상으로 이진 탐색을 순환 호출
- 결합
    - 필요 없음
    - 탐색 결과 직접적으로 반환
    
    
### 3.2.3. Pseudo code

- 순환형태의 이진 탐색
    ```c
    // 순환형태로 표현된 이진탐색
    int BinarySearch_recursive(A[], Left, Right, x) 
    {
        if (Left > Right) return -1;
        Mid = floor((Left + Right) / 2);
        if (x == A[Mid]) return Mid;
        // 왼쪽 부분배열 탐색
        else if (x < A[Mid]) BianrySearch(A, Left, Mid-1, x); 
        // 오른쪽 부분배열 탐색
            else BinarySearch(A, Mid+1, Right, x); 
    }

    ```

- 반복 형태의 이진탐색 

   ```c
   // 반복 형태로 표현된 이진탐색
   // Left : 왼쪽 부분 배열의 최소값
   // Right : 오른쪽 부분 배열의 최대값
   // n: 탐색대상 원소의 개수
   int BinarySearch_recursive(A[], n, x)
   {
       Left = 0;
       Right = n-1;
       while (Left <= Right) {
           Mid = floor((Left + Right)/2);
           if (x == A[Mid]) return Mid;
           // 왼쪽 부분 배열 탐색
           else if (x < A[Mid]) Right = Mid - 1;
               // 오른쪽 부분 배열 탐색
               else Left = Mid + 1;
       }
   }
   ```
   
   
**분할, 비교 횟수**

- 최대 분할 횟수 $k = \text{floor}(\log_2 n)$
- 최대 비교 횟수 $ = k + 1$
   
### 3.2.4. 성능 분석   

$$T(n) = T(\frac{n}{2}) + O(1) (n > 1), T(1) = 1$$

- `T(n)`
    - 입력 크기 n에 대한 탐색 과정에서의 모든 비교 횟수의 합
    - 최초 시도에서의 비교 횟수(`O(1)`) + 순환 호출에서의 비교 횟수(`T(n/2)`)
    - 점화식을 풀면 $T(n) = O(\log_2n)$
    
    
### 3.2.5. 특징

- 입력 배열의 데이터가 정렬된 경우에 대해서만 적용 가능함
- 삽입/삭제 연산은 부가적인 데이터 이동을 수반함
    - 데이터의 정렬 상태 유지를 위해서 평균 n/2개의 데이터 이동이 발생함
    - 삽입/삭제가 빈번한 응용에서는 부적합함

## 3.3. 퀵 정렬 Quick Sort

>- 특정 원소를 기준으로 주어진 배열을 **2개의 부분 배열로 분할**
>- 각 부분 배열에 대해서 퀵 정렬을 순환적으로 적용하는 방식  
>- 단, 오름차순으로 정렬한다고 가정

**피벗 Pivot**

- 주어진 배열을 두 부분배열로 분할할 때, 기준이 되는 특정 원소
    - 보통 주어진 배열의 첫 번재 원소로 지정 `A[0]`

### 3.3.1. 퀵정렬 원리

>피벗이 제자리를 잡도록 하여 정렬하는 원리

1. 피벗을 기준으로 좌/우 부분배열 형성
    - 왼쪽 부분 배열의 모든 값 < 피벗
    - 오른쪽 부분 배열의 모든 값 > 피벗
2. 반복
    - 왼쪽 부분 배열에 대해 퀵 정렬 시행
    - 오른쪽 부분 배열에 대해 퀵 정렬 시행

### 3.3.2. 분할 / 정복 / 결합

- 분할
    - 피벗을 기준으로 주어진 배열을 두 부분배열로 분할
- 정복
    - 두 부분배열에 대해서 퀵 정렬을 순환적으로 적용
    - 각 부분배열을 정렬
- 결합
    - 필요 없음

### 3.3.3. Pseudo code

- 퀵 정렬
    ```c
    int QuickSort(A[], n)
    {
        if(n > 1){
            // Partition() 두 부분배열로 분할
            pivot = Partition(A[0 .. n-1], n);
            
            // 왼쪽 부분배열에 대해서 순환호출
            QuickSort(A[0 .. pivot-1], pivot);
            
            // 오른쪽 부분배열에 대해서 순환호출
            QuickSort(A[[pivot+1 .. n-1], n-pivot-1);
        }
    }
    ```

- 분할함수 `Partition()`
    ```c
    int Patition(A[], n)
    {
        Left=1; Right=n-1;
        while (Left < Right){
            // 피벗보다 큰 값의 위치를 찾음. 오른쪽으로 이동
            while (Left < n && A[Left] < A[0]) Left++;
            // 피벗보다 작은 값의 위치를 찾음. 왼쪽으로 이동
            while (Right > 0 && A[Right >= A[0]) Right --;
            if (Left < Right) switch_location(A[Left], A[Right]);
            else switch_loaction(A[0], A[Right]);
        }
        return Right;
    }
    ```

### 3.3.4. 성능 분석

- 분할함수 `Partition()` 수행시간
    - 피벗과의 비교 횟수
        - 입력 크기(데이터 개수) `n`에 선형적으로 비례함
        - $O(n)$

- 퀵정렬 `QuickSort()` 수행시간
    - 최악의 경우
        - 불균형적으로 분할됨
        - 피벗이 항상 부분배열의 최소값 또는 최대값
            - 입력 데이터가 정렬된 경우
            - 피벗을 배열의 처음 원소를 정한 경우
            - 배열이 항상 `0:n-1` 또는 `n-1:0`으로 분할되는 경우
        - $T(n) = T(n-1) + T(0) + O(n) ... (n>0), T(0)=0$
            - $T(n) = T(n-1) + O(n)$
            - $T(n) = O(n^2)$
    - 최선의 경우
        - 좌우가 동일한 크기로 균형적으로 분할됨
        - 피벗이 항상 부분배열의 중간값이 됨
        - $T(n) = T(floor(n/2)) + T(floor(n/2)) + O(n) ... (n>1), T(1)=1$
            - $T(n) = 2T(n/2) + O(n)$
            - $T(n) = O(n \log_2 n)$
    - 평균적인 경우
         - $\frac{1}{n} \sum (T(i-1) + T(n-i)) + O(n) ... n\geq 2$
         - $T(n) = O(n \log_2 n)$
         
         
### 3.2.5. 특징

- 최악의 수행시간에서
    - 피벗을 배열의 제일 첫 원소로 선택하지 않고, 랜덤으로 선택한다면...
        - 피벗 선택의 임의성만 보장되면, 평균 성능을 보일 가능성이 매우 높음
    - 적용방법: 배열에서 임의의 값을 선택한 후, 배열의 첫 원소와 서로 교환한 후, 정렬을 수행

## 3.4. 합병 정렬 Merge Sort

>전형적인 분할정복 방법이 적용된 알고리즘

### 3.4.1. 합병 정렬 원리

### 3.4.2. 분할 / 정복 / 결합

- 분할
    - 입력 크기 n인 배열을 크기 n/2인 두개의 부분배열로 분할
    - 주어진 배열이 하나의 원소 단위로 쪼개질 때까지 분할
- 정복
    - 각각 부분배열에 대해서 합병 정렬을 순환적으로 적용
    - 두 부분배열을 정렬함
- 결합
    - 정렬된 두 부분배열을 합병하여 하나의 정렬된 배열을 만듬

### 3.4.3. Pseudo code

- 합병 정렬 `MergeSort`
    ```c
    int MergeSort(A[], n)
    {
        if (n > 1){
            Mid = floor(n/2);
            // 왼쪽 부분 배열 B에 합병 정렬 순환호출
            B[0 .. Mid-1] = MergeSort(A[0 .. Mid-1], Mid);
            // 오른쪽 부분 배열 C에 합병 정렬 순환호출
            C[0 .. n-Mid-1] = MergeSort(A[Mid .. n-1], n-Mid);
            
            // 정렬된 두 부분 배열의 합병
            A[0 .. n-1] = Merge(B[0 .. Mid-1], C[0 .. n-Mid-1], Mid, n-Mid);
        }
        return A;
    }
    ```
- 합병 함수 `Merge`
    ```c
    // n, m은 B[]와 C[]의 원소 개수
    int Merge(B[], C[], n, m)
    {
        i = j = k = 0;
        while (i < n && j < m)
            if (B[i] <= C[j])
                A[k++] = B[i++];
            else A[k++] = C[j++];
        
        for (; i<n; i++)
            A[k++] = B[i];
        for (; j<m; j++)
            A[k++] = C[j];
        return A[0 .. n+m-1];
    }
    ```
### 3.4.4. 성능 분석

- 합병 함수 `Merge()` 수행시간
    - 두 부분배열 간의 비교 횟수
        - 최소 `n/2`
        - 최대 `n-1`
    - 최악의 경우
        - `n-1`
        - 데이터의 크기에 비례함
        - $O(n)$
    - 단, 입력 데이터 개수 `n`만큼, 추가 저장 장소가 필요함. (`B[], C[]`)
    - 제자리 정렬(in-place) 알고리즘이 아님
- 합병 정렬 `MergeSort()` 수행시간
    - 왼쪽 $T(floor(\frac{n}{2}))$
    - 오른쪽 $T(floor(\frac{n}{2}))$
    - 합병함수 $O(n)$
    - 즉, $T(n) = 2T(n/2) + O(n)$
        - $T(n) = O(n \log_2 n)$


### 3.4.5. 특징

## 3.5. 선택 문제 Selection

>임의의 순서로 저장된 배열에서 i번째로 작은 원소를 찾는 문제
    
**두가지 방법이 존재함**

1. 퀵 정렬의 분할함수 사용
2. 중간값의 중간값을 사용.

### 3.5.1. 방법(1) : 선택 정렬 원리

- 퀵 정렬의 분할 함수 `Partition()`을 순환적으로 적용함


### 3.5.2. 방법(1) : 분할 / 정복 / 결합

- 분할
    1. 피벗을 기준으로 주어진 배열을 두개의 부분배열로 분할하고, 
    2. i가 피벗의 인덱스 p와 같으면 피벗의 값을 반환하고 종료
- 정복
    - 인덱스 i가 포함된 부분배열에 대해서 알고리즘을 순환적으로 호출하여 적용
- 결합
    - 필요 없음

### 3.5.3. 방법(1) : Pseudo code

- Selection()
    ```c
    int Selection(A[], n, i)
    {
        Left = 0; Right = n-1;
        p = Partition(A, n);
        
        // i번 째 최소값이 피벗인덱스p와 같다면, A[p]를 리턴함.
        if (i == p+1) return A[p];
        
        // i가 피벗인덱스보다 작다면, 왼쪽 부분배열에 적용
        else if (i < p+1) Selection(A[Left .. p-1], (p-1) - Left + 1, i);
            // i가 피벗인덱스보다 크다면
            else SElection(A[p+1 .. Right], Right - (p+1) - 1, i-p-1);
    }
    ```

### 3.5.4. 방법(1) : 성능 분석

- 최악의 경우 -> 퀵 정렬의 최악의 경우와 같음
    - 분할 함수 `Partition()`이 항상 하나의 부분배열만 생성하는 경우
    - 오름차순을 정렬된 상태에서 최대값을 찾는 경우 (`i = n`)
    - 분할함수를 호출할 때마다 피벗 인덱스는 1씩 증가
    - `Partition()`를 `O(n)` 호출 --> $O(n^2)$
    - 해결방법
        - 항상 일정한 비율의 두 부분배열로 분할
        - 최악의 경우에도 $O(n)$

* * *

### 3.5.5. 방법(2) : 선택 정렬 원리

- 항상 일정한 비율의 두개의 부분배열로 분할되도록, 특정 성질을 만족하는 값을 피벗으로 선택
- **중간값들의 중간값** 이용


**피벗 선택 방법**

1. 크기 n인 배열의 원소를 5개씩 묶어서 floor(n/5)개의 그룹을 만듬
    - 5의 배수가 되지 않아 그룹을 형성하지 못한 채 남는 원소는 그대로 남겨 둠
2. 각 그룹에 대해서 중간값을 찾음
3. floor(n/5) 개의 중간값을 대상으로 다시 중간값을 찾음
    - "중간값들의 중간값" --> 피벗으로 선택


### 3.5.6. 방법(2) : Pseudo code

- Selection()
    ```
    Selection_n(A[], n, i)
    {
        [step_1]: if (n <= 5) 배열 A에서 i번째 원소를 찾아서 반환
                  else [step_2] ~ [step_6]을 진행한다
        [step_2]: 배열 A의 원소를 5개씩 묶어서 floor(n/5)개의 그룹을 만든다.
        [step_3]: 각 그룹에서 중간값을 구하고, 이들을 모아서 배열 M을 구성한다.
        [step_4]: 중간값들의 중간값을 계산하기 위해 선택 함수를 순한호출한다.
                  p = Selection_n(M, floor(n/5), ceil(floor(n/5)/2)
        [step_5]: p를 피벗으로 사용하여 주어진 배열A를 분할한다. 분할 함수의 반환값(분할 후 피벗 인덱스)은 j라고 가정한다.
        [step_6]: if (i = j+1) return A[j]
                  else if(i < j+1) Selection_n(A[0 .. j-1], j, i)를 순환호출
                       else Selection_n(A[j+1 .. n-1], n-j-1, i-j-1)을 순환호출
    }
    ```

### 3.5.7. 방법(2) : 성능 분석

- 최악 $O(n)$
- 평균 $O(n)$