# 1. 병합정렬 Merge Sort

* 재귀용법을 활용한 정렬 알고리즘으로 분할 정복 알고리즘 중 하나이다
* 리스트를 절반으로 잘라 비슷한 크기의 두 부분 리스트로 나눔 
* 각 부분 리스트를 재귀적으로 한병 정렬을 이용해 정렬
* 두 부분 리스트를 다시 하나의 정렬된 리스트로 합병 

<img src="https://upload.wikimedia.org/wikipedia/commons/c/cc/Merge-sort-example-300px.gif" width=500/>

# 2. 알고리즘 이해

### 2-1 단계 이해
* 분할 (Divide): 하나의 리스트를 균등한 두개의 크기로 분할
* 정복 (Conquer): 분할 된 부분 리스트를 정렬
    * 이때 리스트의 크기가 충분히 작지 않다면 재귀 함수를 호출해 분할 정복을 적용
* 결합 (Combine): 두개의 정렬 된 부분 리스트를 합함

### 2-2 과정 
1. 리스트의 길이가 0 또는 1이면 이미 정렬된 것으로 본다.
2. 그렇지 않은 경우에는 정렬되지 않은 리스트를 절반으로 잘라 비슷한 크기의 두 부분 리스트로 나눈다.
3. 각 부분 리스트를 재귀적으로 합병 정렬을 이용해 정렬한다.
4. 두 부분 리스트를 다시 하나의 정렬된 리스트로 합병한다.
<img src = https://gmlwjd9405.github.io/images/algorithm-merge-sort/merge-sort-concepts.png>

# 3. 장단점

* 장점
    * 안정적인 정렬 방법: 데이터의 분포에 영향을 덜 받음. 입력 데이터가 무엇이든 시간 복잡도는 동일하게 O($nlog_{2}n$)
* 단점
    * 레코드를 배열로 구성하다면, 임시 배열이 필요하다
    * 레코드들의 크기가 큰 경우에는 이동 횟수가 많으므로 시간적 낭비를 초래한다  

# 4. 시간 복잡도 

* 분할: 비교 연산과 이동 연산이 수행되지 않음
* 합병: O($nlog_{2}n$)
    * 비교 횟수:
        * <img src=https://gmlwjd9405.github.io/images/algorithm-merge-sort/sort-time-complexity-etc.png> 
        * 합병 단계의 수 (순환 호출의 깊이): $k = log_{2}n$  
        * 각 합병 단계의 비교 연산: 최대 n번
        * 순환 호출의 깊이 * 각 합병 단계의 비교 연산 = $nlog_{2}n$
    * 이동 횟수:
        *  합병 단계의 수 (순환 호출의 깊이): $k = log_{2}n$
        *  각 합병 단계의 이동 연산: 2n
        * 순환 호출의 깊이 * 각 합병 단계의 이동 연산 = $2nlog_{2}n$
    * $T(n) = nlog_{2}n + 2nlog_{2}n = 3nlog_{2}n = O(nlog_{2}n)$

# 5. 알고리즘 구현 

### 3-1. mergesplit 함수 
* 만약 리스트 갯수가 1개이면 해당 값을 리턴 
* 그렇지 않으면 리스트를 앞 뒤 두개로 나눔
  * 홀수라면 left에 적은 값
* left = mergesplit(앞)
* right = mergesplit(뒤)
* 모두 나눠지면 merge(left, right) 호출 

In [2]:
def mergesplit (data):
  if len(data) <= 1:
    return data

  medium = int(len(data)/2)
  # [:n]라면 0 부터 n-1까지 create 되므로
  left = mergesplit(data[:medium])
  right = mergesplit(data[medium:])

  return merge(left, right)

### 3-2. merge 함수 
* 리스트 변수 하나 만듬 (sorted)
* left_index, right_index = 0 to comapre two separate list when 병합 
* while left_index < len(left) or right_index < len(right):
* 만약 left_index나 right_index가 이미 left 또는 right 리스트를 모두 순회했다면 그 반대쪽 데이터를 그대로 넣고 해당 인덱스를 1 증가 

```
  if left[left_index] < right[right_index]:
    sorted.append(left[left_index])
    left_index += 1
  else:
    sorted.append(rihgt[right_index])
    right_index += 1
  
```


In [3]:
def merge(left, right):
  # combined / sorted list
  merged = list()

  left_point, right_point = 0, 0

  # left랑 right 둘 다 있을때  
  while len(left) > left_point and len(right) > right_point:
    # if right has smaller data than left 
    # append right data to merged list and increase right_point 
    if left[left_point] > right[right_point]:
      merged.append(right[right_point])
      right_point += 1
    else:
      merged.append(left[left_point])
      left_point += 1

  # left에만 데이터가 남았을때
  # 따로 오름차순 if-else문이 필요없음; bc 합쳐질때 이미 sorted 되어서 병렬 되었기 때문 
  while len(left) > left_point:
    merged.append(left[left_point])
    left_point += 1

  # only right만 남았을때 
  while len(right) > right_point:
    merged.append(right[right_point])
    right_point += 1

  return merged 


In [4]:
import random

data_list = random.sample(range(100), 10)
print(data_list)
mergesplit(data_list)

[83, 91, 86, 3, 89, 62, 30, 61, 17, 79]


[3, 17, 30, 61, 62, 79, 83, 86, 89, 91]

# 6. 예상 질문

Merge Sort는 어떻게 동작하나요?
> Merge Sort는 분할 정복 알고리즘으로, 배열을 반으로 나눈 후 각각을 재귀적으로 정렬하고, 정렬된 부분 배열을 병합하는 방식으로 동작합니다. 이러한 병합 작업을 반복하면서 최종적으로 정렬된 배열을 얻습니다. Merge Sort의 시간 복잡도는 항상 O(n log n)이며, 안정적인 정렬 알고리즘 중 하나입니다.

Merge Sort와 다른 정렬 알고리즘과의 차이점은 무엇인가요?
>  Merge Sort는 항상 O(n log n)의 시간 복잡도를 가지며, 안정적인 특성을 갖고 있습니다. Quick Sort와는 달리 최악의 경우에도 일관된 성능을 보장합니다. 그러나 추가적인 메모리 공간이 필요하며, 다른 알고리즘들에 비해 상대적으로 느릴 수 있습니다.

Merge Sort의 장단점은 무엇인가요?

> 장점으로는 안정적이며, 항상 O(n log n)의 성능을 보장하여 대규모 데이터에 적합합니다. 분할 정복 알고리즘으로 구현되어 병렬 처리가 가능합니다. 단점으로는 추가적인 메모리 공간이 필요하며, 이는 배열을 복사하는 데 사용됩니다. 따라서 메모리 사용에 제한이 있는 경우에는 다른 정렬 알고리즘을 고려해야 할 수 있습니다. 또한, 상수 계수가 다른 알고리즘에 비해 큰 편입니다.