## 대표적인 정렬4 : 병합 정렬 (Merge Sort) 

### 1. 병합 정렬 (merge sort)  과정

* 재귀용법을 활용한 정렬 알고리즘
  1. 리스트를 절반으로 잘라 비슷한 크기의 **두 부분 리스트로 나눈다**.(재귀)
  2. 두 부분 리스트는 정렬 과정을 거치며, 하나의 리스트로 **병합**한다.

<img src="https://upload.wikimedia.org/wikipedia/commons/c/cc/Merge-sort-example-300px.gif" width=500/>

출처: https://ko.wikipedia.org/wiki/%ED%95%A9%EB%B3%91_%EC%A0%95%EB%A0%AC

### 2. 알고리즘 이해
* 데이터가 네 개 일때 (데이터 갯수에 따라 복잡도가 떨어지는 것은 아니므로, 네 개로 바로 로직을 이해해보자.)
  - 예: data_list = [1, 9, 3, 2]
    - 먼저 [1, 9], [3, 2] 로 나누고
    - 다시 앞 부분은 [1], [9] 로 나누고
    - 다시 정렬해서 합친다. [1, 9]
    - 다음 [3, 2] 는 [3], [2] 로 나누고
    - 다시 정렬해서 합친다 [2, 3]
    - 이제 [1, 9] 와 [2, 3]을 합친다.
      - 1 < 2 이니 [1]
      - 9 > 2 이니 [1, 2]
      - 9 > 3 이니 [1, 2, 3]
      - 9 밖에 없으니, [1, 2, 3, 9]

### 3. 알고리즘 구현하기 

In [3]:
def merge(left, right):
    merged = list()
    left_point, right_point = 0, 0
    
    # case1 - left/right 둘다 있을때
    while len(left) > left_point and len(right) > right_point:
        if left[left_point] > right[right_point]:
            merged.append(right[right_point])
            right_point += 1
        else:
            merged.append(left[left_point])
            left_point += 1

    # case2 - left 데이터만 남아 있을 때
    while left_point < len(left):
        merged.append(left[left_point])
        left_point += 1
        
    # case3 - right 데이터만 남아 있을 때 
    while right_point < len(right):
        merged.append(right[right_point])
        right_point += 1
    
    return merged


# 첫 번째 단계, 두 부분으로 Split 하기
def mergesplit(data):
    
    # 배열 길이가 1이면 나누기 재귀 종료
    if len(data) <= 1:
        return data
    
    medium = int(len(data) / 2)
    
    left = mergesplit(data[:medium])
    right = mergesplit(data[medium:])
    
    return merge(left, right)

In [5]:
import random
data_list = random.sample(range(100), 10)

print(data_list)
print(sorted(data_list))
print(mergesplit(data_list))

[66, 40, 8, 81, 19, 10, 93, 51, 79, 13]
[8, 10, 13, 19, 40, 51, 66, 79, 81, 93]
[8, 10, 13, 19, 40, 51, 66, 79, 81, 93]


### 4. 알고리즘 분석

* 시간 복잡도: 일정하게, O(N logN)
  - 원리
    - 몇 단계 깊이까지 만들어지는지를 depth 라고 하고 i로 놓자. 맨 위 단계는 0으로 놓자.
      - 다음 그림에서 n/$2^2$ 는 2단계 깊이라고 해보자.
      - 각 단계에 있는 하나의 노드 안의 리스트 길이는 n/$2^2$ 가 된다.
      - 각 단계에는 $2^i$ 개의 노드가 있다.
    - 따라서, 각 단계는 항상 <font size=4em>$2^i * \frac { n }{ 2^i }$ = O(n)</font>
    - 단계는 항상 $log_2 n$ 개 만큼 만들어짐 -> O(log n)
    - 따라서, 시간 복잡도 O(n) * O(log n) = O(n log n)

<img src="https://www.fun-coding.org/00_Images/mergesortcomplexity.png" width=300/>

* 특징
    - 무조건 절반으로 분할하기 때문에 성능이 일정하다.
    - 가장 큰 단점은 **추가적인 메모리 필요**하다는 점 