# 11.1 병합 정렬 알고리즘(Merge Sort Algorithm)

- 병합 정렬 알고리즘은 이미 정렬되어 있는 데이터들을 하나로 합쳐서 정렬하는 방법

- 파일에 정렬되어 있는 데이터들을 하나로 합쳐서 정렬하는 경우에도 종종 사용되는 정렬 알고리즘

병합 정렬 알고리즘의 특징

- 이미 정렬되어 있는 데이터의 그룹 혹은 묶음들을 하나로 합칠 때 사용하는 방법

```

|1|4|2|           |5|7|3|        |6|8|

 v v   v
|1|2|3|4|5|6|7|8|

```

- 위의 그림과 같이 3개의 서로 다른 데이터 그룹을 하나로 합치는 병합 정렬 알고리즘은 3-way 병합 정렬 알고리즘이라 함

- 보통의 경우 자주 사용되는 것은 2개의 데이터 그룹을 하나로 합치는 2-way 병합 정렬 알고리즘

```

|1|4|2|5|7|3|6|8|


```

- 병합 정렬 알고리즘은 위의 그림과 같이 정렬되지 않은 데이터들을 정렬하기 위해서 그룹으로 묶음

- 하나의 데이터 리스트를 여러 개로 쪼갬




2-way방식으로 2개씩 그룹으로 묶음
```

|1|4|  |2|5|  |7|3|  |6|8|


```



- 위와 같이 병합 정렬 알고리즘에서 병합을 하기 위한 데이터를 런(RUN)이라고 표현

- 일단 2개씩 데이터들이 묶이고 나면 본격적으로 그 그룹 내에서 정렬이 시작

- 현재는 하나의 런 안에 데이터가 2개 밖에 없으므로 2개의 값을 비교해서 크기 순서대로 정렬

```

|1|4|  |2|5|  |7|3|  |6|8|


               V V     
|1|4|  |2|5|  |3|7|  |6|8|


```
- 데이터 3과 7의 위치가 변경

- 2개의 런을 묶어서 하나의 런으로 합치는 정렬

- 이부분이 병합 정렬 알고리즘의 핵심

- 2개의 런을 묶어서 정렬을 하게 되면 다음과 같은 결과가 됨

```


 v     v    v     v     
|1|2|4|5|  |3|6|7|8|



```

- 이 다음 부터는 모든 데이터가 하나의 런으로 합쳐질 때까지 반복하게 됨

In [1]:
from math import log10
from random import randint

def merge_sort(mylist):
    
    if len(mylist) <= 1: return mylist
    
    half = len(mylist) // 2
    left_list = merge_sort(mylist[:half])
    right_list = merge_sort(mylist[half:])
    merged_list = []
    
    while len(left_list) > 0 and len(right_list) > 0:
        if left_list[0] > right_list[0]:
            merged_list.append(right_list[0])
            right_list.pop(0)
        else:
            merged_list.append(left_list[0])
            left_list.pop(0)
    
    if len(left_list) > 0: merged_list += left_list
    if len(right_list) > 0:merged_list += right_list
    return merged_list

if __name__ == "__main__":
    data = []
    input_n = input("정렬할 데이터의 수 : ")
    data = [randint(1, 99999) for x in range(int(input_n))]
    
    print("정렬 전")
    print(data)
    
    sorted_data = merge_sort(data)
    
    print("정렬 후")
    print(sorted_data)

정렬할 데이터의 수 : 100
정렬 전
[94174, 82341, 70535, 81547, 17943, 81676, 92968, 81081, 94508, 10935, 5524, 71992, 6215, 50848, 71134, 97562, 49930, 18442, 68710, 73517, 99053, 33066, 64106, 6332, 24565, 74837, 57220, 23280, 65808, 10321, 2211, 19338, 54725, 97913, 66391, 83533, 60329, 52110, 7563, 19209, 87836, 4233, 59152, 22716, 52014, 46435, 60742, 58904, 56038, 61723, 25975, 33109, 69046, 9452, 41694, 4989, 60946, 43931, 44759, 46022, 6372, 4120, 85107, 49090, 38579, 9189, 45963, 33486, 71948, 59562, 6983, 32898, 64704, 73408, 33787, 28777, 6619, 40970, 14493, 27170, 56112, 64355, 80216, 90654, 6111, 67138, 84112, 60340, 53114, 58846, 37029, 79235, 68928, 93723, 67713, 15217, 18101, 88928, 86080, 36751]
정렬 후
[2211, 4120, 4233, 4989, 5524, 6111, 6215, 6332, 6372, 6619, 6983, 7563, 9189, 9452, 10321, 10935, 14493, 15217, 17943, 18101, 18442, 19209, 19338, 22716, 23280, 24565, 25975, 27170, 28777, 32898, 33066, 33109, 33486, 33787, 36751, 37029, 38579, 40970, 41694, 43931, 44759, 45963, 46022

- 병합 정렬 알고리즘은 이미 앞의 알고리즘 설명에서 다룬대로 데이터들을 런으로 쪼개어 정렬한 후에 병합하는 방식

- 퀵 정렬 알고리즘과 비슷하게 재귀 호출을 사용하면 간단해짐

- 최소한의 데이터를 갖는 런이 될 때 까지 재귀 호출이 됨

### 11.1.2 병합 정렬 알고리즘의 분석

- 수치적으로만 보면 퀵 정렬 알고리즘과 비슷

- 모두 데이터를 분할한 후에 재귀 호출을 사용하고 있기 때문

- 데이터를 분할하는데 걸리는 시간은 log2 N 이 됨

- 분할한 후에 2개의 데이터 그룹을 하나로 합치는데 O(N)의 시간이 걸림

- 결국 병합 정렬의 성능을 O 표기법으로 표시하면 O(N * log2 N)이 됨

### 시간의 효율성

- 병합 정렬 할고리즘은 O 표기법에 의하면 O(NlogN)의 실행 시간을 갖음

- 다른 정렬 알고리즘들이 O(N^2)의 실행 시간을 갖는데 비해서 보면 상당히 빠른 정렬 알고리즘

- 최악의 경우와 같이 이미 정렬이 되어 있는 상태에서는 성능이 저하 됨

- 퀵 정렬 알고리즘이 최악의 경우에 O(N^2)의 성능을 갖는 것에 비하면 좀더 나은 정렬 알고리즘

### 공간의 효율성

- 원래의 데이터 공간 외에 별도의 데이터 공간이 필요하다는 점
- 데이터들을 연결 리스트로 만든 후에 병합 정렬 알고리즘을 사용하는 방법도 있음



### 코드의 효율성

- 재귀 호출을 사용
- 코드의 길이가 짧아지고 컴팩트하다는 장점이 있는 반면
  디버깅이 어렵고 이해하기 어려워짐