# <a href="https://en.wikipedia.org/wiki/Merge_sort">Merge Sort</a>

###### <a href="https://www.geeksforgeeks.org/merge-sort/">geeksforgeeks</a>
Merge Sort is a Divide and Conquer algorithm. It divides input array in two halves, calls itself for the two halves and then merges the two sorted halves. The merge() function is used for merging two halves. The merge(arr, l, m, r) is key process that assumes that arr[l..m] and arr[m+1..r] are sorted and merges the two sorted sub-arrays into one. See following C implementation for details.

```
MergeSort(arr[], l,  r)
If r > l
     1. Find the middle point to divide the array into two halves:  
             middle m = (l+r)/2
     2. Call mergeSort for first half:   
             Call mergeSort(arr, l, m)
     3. Call mergeSort for second half:
             Call mergeSort(arr, m+1, r)
     4. Merge the two halves sorted in step 2 and 3:
             Call merge(arr, l, m, r)
```
<br>

###### <a href="https://ko.wikipedia.org/wiki/%ED%95%A9%EB%B3%91_%EC%A0%95%EB%A0%AC">Korean Wikipedia</a>
합병 정렬 또는 병합 정렬(merge sort)은 O(n log n) 비교 기반 정렬 알고리즘이다.  
일반적인 방법으로 구현했을 때 이 정렬은 안정 정렬에 속하며, 분할 정복 알고리즘의 하나이다.

합병 정렬은 다음과 같이 작동한다.  
리스트의 길이가 1 이하이면 이미 정렬된 것으로 본다. 그렇지 않은 경우에는
1. 분할(divide) : 정렬되지 않은 리스트를 절반으로 잘라 비슷한 크기의 두 부분 리스트로 나눈다.
2. 정복(conquer) : 각 부분 리스트를 재귀적으로 합병 정렬을 이용해 정렬한다.
3. 결합(combine) : 두 부분 리스트를 다시 하나의 정렬된 리스트로 합병한다. 이때 정렬 결과가 임시배열에 저장된다.
4. 복사(copy) : 임시 배열에 저장된 결과를 원래 배열에 복사한다.
<br><br>

<table>
    <tr>
        <th></th>
        <th>Best</th>
        <th>Average</th>
        <th>Worst</th>
        <th>Memory</th>
        <th>Stable</th>
        <th>Method</th>
        <th>Other Notes</th>
    </tr>
    <tr>
        <td>Merge sort</td>
        <td>$$n\log n$$</td>
        <td>$$n\log n$$</td>
        <td>$$n\log n$$</td>
        <td>$$n$$<br>A hybrid block merge sort is $O(1)$ mem.</td>
        <td>Yes</td>
        <td>Merging</td>
        <td>Highly parallelizable (up to $O(\log n)$ using the Three Hungarians' Algorithm or, more practically, Cole's parallel merge sort) for processing large amounts of data.</td>
    </tr>
</table><br><br>
<img src="https://user-images.githubusercontent.com/41245985/71685293-3811cd80-2ddb-11ea-8de7-6bbf09f31abd.gif"><br><br>

## Complexity
1회 분할 시 $n/2$ 가 2개가 생기고 2회 분할 시 $n/4$가 4개가 생긴다.  
이렇게 분할과정은 매번 반씩 감소하므로 $\log_2{n}$ 회 반복하여야 길이가 1인 배열로 분할 할 수 있다.  
따라서 길이가 1인 배열끼리 비교할 때 시간 복잡도는 $O(\log n)$이다.  
각 분할을 병합하는 과정에서의 시간복잡도는 $O(n)$이므로 전체 시간 복잡도는 $O(n\log n)$이 된다.

# 정리
서로 인접한 두 원소를 검사하여 정리하는 방법이다.  
1회전을 수행하면 가장 큰 원소가 가장 마지막에 위치하게 된다. 따라서 2회전에서는 마지막 원소는 정렬에서 제외된다.  
이러한 방식으로 1회전 수행할 때마다 정렬에서 제외되는 원소가 하나씩 늘어난다.

In [1]:
def merge_sort(array, reverse=False):
    if len(array) <= 1:
        return array
    left = merge_sort(array[:len(array)//2], reverse)
    right = merge_sort(array[len(array)//2:], reverse)
    
    i, j = 0, 0
    result = []
    if not reverse:
        while i < len(left) and j < len(right):
            if left[i] < right[j]:
                result.append(left[i])
                i += 1
            else:
                result.append(right[j])
                j += 1
    else:
        while i < len(left) and j < len(right):
            if left[i] > right[j]:
                result.append(left[i])
                i += 1
            else:
                result.append(right[j])
                j += 1
    # left와 right 둘 중 하나는 남은 길이가 0이다.
    result += left[i:]
    result += right[j:]
    return result

In [2]:
def make_test(row=10, column=10):
    import numpy as np
    return np.random.randint(0, 100, row*column).reshape(row, column).tolist()

test_case = make_test(10, 10)
test_case

[[96, 96, 56, 36, 83, 80, 5, 13, 76, 78],
 [94, 21, 14, 61, 96, 70, 72, 83, 81, 90],
 [32, 60, 33, 81, 33, 82, 6, 64, 28, 61],
 [89, 2, 30, 82, 23, 14, 12, 55, 96, 27],
 [77, 5, 64, 30, 56, 81, 90, 61, 13, 93],
 [51, 16, 30, 32, 51, 45, 20, 65, 25, 89],
 [13, 0, 89, 76, 96, 87, 15, 23, 4, 83],
 [77, 32, 23, 59, 59, 73, 66, 89, 20, 9],
 [73, 9, 86, 9, 8, 67, 2, 2, 66, 96],
 [41, 79, 29, 62, 63, 76, 99, 35, 78, 47]]

In [3]:
# 오름차순 정렬
[merge_sort(i, False) for i in test_case]

[[5, 13, 36, 56, 76, 78, 80, 83, 96, 96],
 [14, 21, 61, 70, 72, 81, 83, 90, 94, 96],
 [6, 28, 32, 33, 33, 60, 61, 64, 81, 82],
 [2, 12, 14, 23, 27, 30, 55, 82, 89, 96],
 [5, 13, 30, 56, 61, 64, 77, 81, 90, 93],
 [16, 20, 25, 30, 32, 45, 51, 51, 65, 89],
 [0, 4, 13, 15, 23, 76, 83, 87, 89, 96],
 [9, 20, 23, 32, 59, 59, 66, 73, 77, 89],
 [2, 2, 8, 9, 9, 66, 67, 73, 86, 96],
 [29, 35, 41, 47, 62, 63, 76, 78, 79, 99]]

In [4]:
# 내림차순 정렬
[merge_sort(i, True) for i in test_case]

[[96, 96, 83, 80, 78, 76, 56, 36, 13, 5],
 [96, 94, 90, 83, 81, 72, 70, 61, 21, 14],
 [82, 81, 64, 61, 60, 33, 33, 32, 28, 6],
 [96, 89, 82, 55, 30, 27, 23, 14, 12, 2],
 [93, 90, 81, 77, 64, 61, 56, 30, 13, 5],
 [89, 65, 51, 51, 45, 32, 30, 25, 20, 16],
 [96, 89, 87, 83, 76, 23, 15, 13, 4, 0],
 [89, 77, 73, 66, 59, 59, 32, 23, 20, 9],
 [96, 86, 73, 67, 66, 9, 9, 8, 2, 2],
 [99, 79, 78, 76, 63, 62, 47, 41, 35, 29]]