# 병합 정렬 (merge sort) 

- 재귀용법을 활용한 정렬 알고리즘
  1. 리스트를 절반으로 잘라 비슷한 크기의 두 부분 리스트로 나눈다.
  2. 각 부분 리스트를 재귀적으로 병합 정렬을 이용해 정렬한다.
  3. 두 부분 리스트를 다시 하나의 정렬된 리스트로 병합한다.

https://visualgo.net/en/sorting

<img src="https://upload.wikimedia.org/wikipedia/commons/c/cc/Merge-sort-example-300px.gif" width=500/>

출처: [위키피디아](https://ko.wikipedia.org/wiki/%ED%95%A9%EB%B3%91_%EC%A0%95%EB%A0%AC)

## 알고리즘 이해
데이터가 네 개 일때 (데이터 갯수에 따라 복잡도가 떨어지는 것은 아니므로, 네 개로 바로 로직을 이해해보자.)
- 예: data_list = [1, 9, 3, 2]
- 먼저 [1, 9], [3, 2] 로 나누고
- 다시 앞 부분은 [1], [9] 로 나누고
- 다시 정렬해서 합친다. [1, 9]
- 다음 [3, 2] 는 [3], [2] 로 나누고
- 다시 정렬해서 합친다 [2, 3]
- 이제 [1, 9] 와 [2, 3]을 합친다.
  - 1 < 2 이니 [1]
  - 9 > 2 이니 [1, 2]
  - 9 > 3 이니 [1, 2, 3]
  - 9 밖에 없으니, [1, 2, 3, 9]

**재귀용법으로 리스트를 분할하는 함수와 분할된 리스트를 병합하는 함수 2개가 필요하다.**

## 알고리즘 구현
* mergesplit 함수 만들기
  - 만약 리스트 갯수가 한개이면 해당 값 리턴
  - 그렇지 않으면, 리스트를 앞뒤, 두 개로 나누기
  - left = mergesplit(앞)
  - right = mergesplit(뒤)
  - merge(left, right)

* merge 함수 만들기
  - 리스트 변수 하나 만들기 (sorted)
  - left_index, right_index = 0
  - while left_index < len(left) or right_index < len(right):
    - 만약 left_index 나 right_index 가 이미 left 또는 right 리스트를 다 순회했다면, 그 반대쪽 데이터를 그대로 넣고, 해당 인덱스 1 증가
    - if left[left_index] < right[right_index]:
      - sorted.append(left[left_index])
      - left_index += 1
    - else:
      - sorted.append(right[right_index])
      - right_index += 1

## 작은 부분부터 작성해서 하나씩 구현하기
- 주어진 리스트를 2개의 리스트로 분할하기

In [22]:
def split(lst) :
    if len(lst) == 1 : 
        print(lst)
    mid = int(len(lst) / 2)
    left = lst[:mid]
    right = lst[mid:]
    print(left, right)

In [23]:
split([1,5,2,6,2,2,1])

[1, 5, 2] [6, 2, 2, 1]


## 재귀용법 활용하기
- 주어진 리스트를 2개의 리스트로 분할하는 과정을 반복해서 더 이상 분할할 수 없을 때까지 분할하기

In [30]:
def merge(left, right) : 
    lp = 0 
    rp = 0 
    res = list() 
    
    while lp < len(left) and rp < len(right) : 
        if left[lp] < right[rp] :
            res.append(left[lp])
            lp += 1 
        else : 
            res.append(right[rp])
            rp += 1 
        
    if lp < len(left) : 
        res += left[lp:]
    else : 
        res += right[rp:] 
        
    return res

In [45]:
def splitmerge(lst) : 
    if len(lst) == 1 : 
        return lst 
    mid = int(len(lst)/2)
    left = splitmerge(lst[:mid])
    right = splitmerge(lst[mid:])
    return merge(left, right)

In [46]:
import random
example = random.sample(range(1000), 10)
example

[333, 441, 141, 890, 805, 799, 61, 545, 274, 347]

In [47]:
mergesplit(example)

[61, 141, 274, 333, 347, 441, 545, 799, 805, 890]

## 알고리즘 분석
* 알고리즘 분석은 쉽지 않음, <font color='#BF360C'>이 부분은 참고로만 알아두자.</font>
  - 다음을 보고 이해해보자
    - 몇 단계 깊이까지 만들어지는지를 depth 라고 하고 i로 놓자. 맨 위 단계는 0으로 놓자.
      - 다음 그림에서 n/$2^2$ 는 2단계 깊이라고 해보자.
      - 각 단계에 있는 하나의 노드 안의 리스트 길이는 n/$2^2$ 가 된다.
      - 각 단계에는 $2^i$ 개의 노드가 있다.
    - 따라서, 각 단계는 항상 <font size=4em>$2^i * \frac { n }{ 2^i } = O(n)$</font>
    - 단계는 항상 $log_2 n$ 개 만큼 만들어짐, 시간 복잡도는 결국 O(log n), 2는 역시 상수이므로 삭제
    - 따라서, 단계별 시간 복잡도 O(n) * O(log n) = O(n log n)

<img src="https://www.fun-coding.org/00_Images/mergesortcomplexity.png" />



# 코드 복습

In [71]:
def merge(left, right) : 
    lp = 0 
    rp = 0 
    res = list() 
    
    while lp < len(left) and rp < len(right) : 
        if left[lp] < right[rp] :
            res.append(left[lp])
            lp += 1 
        else : 
            res.append(right[rp])
            rp += 1 
        
    if lp < len(left) : 
        res += left[lp:]
    else : 
        res += right[rp:] 
        
    return res
        
def merge_split(lst) : 
    if len(lst) == 1 : 
        return lst 
    mid = int(len(lst)/2)
    left = merge_split(lst[:mid])
    right = merge_split(lst[mid:])
    return merge(left, right)

In [72]:
import random 
ex = random.sample(range(1000), 10)
ex

[177, 396, 625, 118, 225, 792, 435, 351, 791, 522]

In [73]:
merge_split(ex)

[118, 177, 225, 351, 396, 435, 522, 625, 791, 792]