# 6. 병합 정렬 (Merge Sort)

## 6.1 병합 정렬(Merge Sort) 이란?

- 재귀 용법을 활용한 정렬 알고리즘  
  
  
1. 리스트를 절반으로 잘라 비슷한 크기의 두 부분 리스트로 나눈다.
2. 각 부분 리스트를 재귀적으로 합병 정렬을 이용해 정렬한다.
3. 두 부분 리스트를 다시 하나의 정렬된 리스트로 합병한다.  
  
  
- [시뮬레이션 링크](https://visualgo.net/en/sorting)

<img src="https://upload.wikimedia.org/wikipedia/commons/c/cc/Merge-sort-example-300px.gif" width=500/>

<br>

## 6.2 병합 정렬 알고리즘 이해

### 6.2.1 데이터가 4개일 때

- 데이터 갯수에 따라 복잡도가 떨어지는 것이 아니다.
- 그러므로 4개로 바로 로직을 이해해본다.  
  
  
- ex) `data_list = [1, 9, 2, 3]`
  - 먼저 데이터를 `[1, 9]`, `[3, 2]`로 나눈다.
  - 다시 앞 부분은 `[1]`, `[9]`로 나눈다.
  - 다시 정렬해서 합친다. (`[1, 9]`)
  - 다음 `[3, 2]`를 `[3]`, `[2]`로 나눈다.
  - 다시 정렬해서 합친다. (`[2, 3]`)
  - 이제 `[1, 9]`와 `[2, 3]`을 합친다.
    - `1 < 2` $\rightarrow$ `[1]`
    - `2 < 9` $\rightarrow$ `[1, 2]`
    - `9 > 3` $\rightarrow$ `[1, 2, 3]`
    - `9`밖에 없음 $\rightarrow$ `[1, 2, 3, 9]`

<br>

## 6.3 알고리즘 구현

### 6.3.1 `mergesplit()` 함수 만들기

- 리스트의 개수가 1개 $\rightarrow$ 해당 값 리턴
- 리스트의 개수가 1개가 아님 $\rightarrow$ 리스트를 앞뒤, 2개로 나누기
  - `left = mergesplit[데이터 앞]`
  - `right = mergesplit[데이터 뒤]`
  - `merge(left, right)`

<br>

### 6.3.2 `merge()` 함수 만들기

- 리스트 변수 하나 만듬 (`sorted`)
- `left_index, right_index = 0`
- `while left_index < len(left) or right_index < len(right):`
  - 만약 `left_index`나 `right_index`가 이미 `left` 또는 `right` 리스트를 다 순회했다면, 그 반대쪽 데이터를 그대로 넣고, 해당 인덱스 `1` 증가
  - `if left[left_index] < right[right_index]:`
    - `sorted.append(left[left_index])`
    - `left_index += 1`
  - `else:`
    - `sorted.append(right[right_index])`
    - `right_index += 1`

<br>

## 6.4 `mergesplit()` 함수 만들기

### 6.4.1 리스트 분할 함수 작성

- 어떤 데이터 리스트가 있을 때 리스트를 앞뒤로 자르는 코드 작성 (일반화)

In [1]:
def split_func(data):
    medium = int(len(data) / 2)
    print(medium)
    left = data[:medium]
    right = data[medium:]
    print(left, right)

In [2]:
split_func([1, 5, 3, 2, 4])

2
[1, 5] [3, 2, 4]


<br>

### 6.4.2 `mergesplit()` 함수 구현

- 재귀용법을 활용

In [3]:
def mergesplit(data):
    if len(data) == 1:
        return data
    medium = int(len(data)/2)
    left = mergesplit(data[:medium])
    right = mergesplit(data[medium:])
    return merge(left, right)

<br>

## 6.5 `merge()` 함수 만들기

### 6.5.1 `left`, `right` 각각 데이터가 1개일 때

In [29]:
def merge(left, right):
    sorted_list = list()
    small = ""
    
    if left[0] > right[0]:
        sorted_list.append(right[0])
        small = "right"
    else:
        sorted_list.append(left[0])
        small = "left"
        
    if small == "left":
        sorted_list.append(right[0])
    else:
        sorted_list.append(left[0])
        
    return sorted_list

In [30]:
left = [0]
right = [3]
merge(left, right)

[0, 3]

<br>

### 6.5.2 `left`, `right`의 데이터가 각각 2개, 1개일 때

In [31]:
def merge(left, right):
    sorted_list = list()
    left_point, right_point = 0, 0
    
    while len(left) > left_point and len(right) > right_point:
        if left[left_point] > right[right_point]:
            sorted_list.append(right[right_point])
            right_point += 1
        else:
            sorted_list.append(left[left_point])
            left_point += 1
            
    while len(left) > left_point:
        sorted_list.append(left[left_point])
        left_point += 1
        
    while len(right) > right_point:
        sorted_list.append(right[right_point])
        right_point += 1
            
    return sorted_list

In [32]:
left = [0, 2]
right = [1]

merge(left, right)

[0, 1, 2]

<br>

### 6.5.3 `left`, `right`의 데이터가 각각 2개일 때

In [33]:
def merge(left, right):
    sorted_list = list()
    left_point, right_point = 0, 0
    
    while len(left) > left_point and len(right) > right_point:
        if left[left_point] > right[right_point]:
            sorted_list.append(right[right_point])
            right_point += 1
        else:
            sorted_list.append(left[left_point])
            left_point += 1
            
    while len(left) > left_point:
        sorted_list.append(left[left_point])
        left_point += 1
        
    while len(right) > right_point:
        sorted_list.append(right[right_point])
        right_point += 1
            
    return sorted_list

In [34]:
left = [0, 2]
right = [1, 3]

merge(left, right)

[0, 1, 2, 3]

<br>

### 6.5.4 일반화

- `left`, `right` 리스트 변수의 데이터 수가 한 개에서 여러 개가 될 수 있을 때 작성 (일반화)  
  
  
1. `sorted_list` 리스트 변수 선언
2. `left_index`, `right_index` 를 `0`으로 초기화
3. `while left_index < len(left) and right_index < len(right)` 이면
  - 만약 `left_index >= len(left)` 이면
    - `sorted_list`에 `right[right_index]`를 추가
    - `right_index` 값을 1 증가
  - 만약 `right_index >= len(right)` 이면
    - `sorted_list`에 `left[left_index]`를 추가
    - `left_index` 값을 1 증가
  - 만약 `left[left_index] < right[right_index]`이면
    - `sorted_list`에 `left[left_index]`를 추가
    - `left_index` 값을 1 증가
  - 위 3가지가 아니면
    - `sorted_list`에 `right[right_index]`를 추가
    - `right_index` 값을 1 증가

<br>

### 6.5.5 `merge()` 함수 구현

- 목표 : `left`와 `right`의 리스트 데이터를 정렬해서 `sorted_list` 라는 이름으로 리턴하기
- `left`와 `right`는 이미 정렬된 상태 또는 데이터가 하나이다.

In [11]:
def merge(left, right):
    merged = list()
    left_point, right_point = 0, 0
    
    # case 1 - left/right 둘 다 있을 때
    while len(left) > left_point and len(right) > right_point:
        if left[left_point] > right[right_point]:
            merged.append(right[right_point])
            right_point += 1
        else:
            merged.append(left[left_point])
            left_point += 1
            
    # case 2 - left 데이터가 없을 때
    while len(left) > left_point:
        merged.append(left[left_point])
        left_append += 1
        
    # case 3 - right 데이터가 없을 때
    while len(right) > right_point:
        merged.append(right[right_point])
        right_point += 1
    
    return merged

<br>

## 6.6 최종 코드

In [23]:
def merge(left, right):
    merged = list()
    left_point, right_point = 0, 0
    
    # case 1 - left/right 둘 다 있을 때
    while len(left) > left_point and len(right) > right_point:
        if left[left_point] > right[right_point]:
            merged.append(right[right_point])
            right_point += 1
        else:
            merged.append(left[left_point])
            left_point += 1
        
    # case 2 - left 데이터가 없을 때
    while len(left) > left_point:
        merged.append(left[left_point])
        left_point += 1
    
    # case 3 - right 데이터가 없을 때
    while len(right) > right_point:
        merged.append(right[right_point])
        right_point += 1
        
    return merged

def mergesplit(data):
    if len(data) <= 1:
        return data
    medium = int(len(data) / 2)
    left = mergesplit(data[:medium])
    right = mergesplit(data[medium:])
    return merge(left, right)

In [36]:
import random

data_list = random.sample(range(100), 10)
print(data_list)
mergesplit(data_list)

[64, 28, 91, 63, 20, 70, 7, 98, 71, 39]


[7, 20, 28, 39, 63, 64, 70, 71, 91, 98]

In [22]:
mergesplit(data_list)

[27, 28, 42, 50, 56, 60, 64, 67, 82, 89]

<br>

## 6.7 알고리즘 분석

- 알고리즘 분석은 쉽지 않다. (참고적으로만 알고 있으면 된다.)  
  
  
- 다음을 보고 이해해보자.  
  
<img src="https://www.fun-coding.org/00_Images/mergesortcomplexity.png" />
  
- 몇 단계 깊이까지 만들어지는 지 = `depth`
- 이 `depth`를 `i`로 놓자.
- 맨 위 단계는 `0`으로 놓자.  
  
  
- 위의 그림에서 $n / 2^2$는 2단계 깊이라고 해보자.
- 각 단계에 있는 하나의 노드 안의 리스트 길이는 $n / 2^2$가 된다.
- 각 단계에는 $2^i$개의 노드가 있다.
- 따라서, 각 단계는 항상 $2^i \times \frac{n}{2^i} = O(n)$  
  
  
- 단계는 항상 $log_2 n$개 만큼 만들어진다.
- 시간 복잡도는 결국 $O(log n)$
- 2는 역시 상수이므로 삭제
- 따라서, 단계별 시간 복잡도 : $O(n) \times O(log n) = O(n log n)$