## 필수 자료구조4: 병합 정렬(merge sort)

### 1. 병합 정렬(merge sort)
- 재귀용법을 활용한 정렬 알고리즘
    1. 리스트를 절반으로 잘라 비슷한 크기의 두 부분 리스트로 나눈다.
    2. 각 부분 리스트를 재귀적으로 합병 정렬을 이용해 정렬한다.
    3. 두 부분 리스트를 다시 하나의 정렬된 리스토로 합병한다.


### 2. 알고리즘 이해
- 데이터가 네 개 일 때
    - 예시: data_list = [1, 9, 3, 2]
        - 먼저 [1, 9], [3, 2]로 나누고
        - 다시 앞 부분은 [1], [9]로 나누고
        - 다시 정렬해서 합친다. [1, 9]
        - 다음 [3, 2]는 [3], [2]로 나누고
        - 다시 정렬해서 합친다 [2, 3]
        - 이제 [1, 9]와 [2, 3]을 합친다.
            - 1 < 2이니 [1]
            - 9 > 2 이니 [1, 2]
            - 9 > 3 이니 [1, 2, 3]
            - 9 밖에 없으니, [1, 2, 3, 9]

### 3. 알고리즘 구현
- mergeSplit 함수 만들기
    - 만약 리스트 갯수가 한개면 해당 값 리턴
    - 그렇지 않으면, 리스트를 앞뒤, 2개로 나누기
    - left = mergeSplit(앞)
    - right = mergeSplit(뒤)
    - merge(left, right)
- merge 함수 만둘기
    - 리스트 변수 하나 만들기 (sorted)
    - left_index, right_index = 0
    - while left_index < len(left) or right_index < len(right):
        - 만약 left_index, right_index가 left, right를 다 순회했다면, 그 반대쪽 데이터를 넣고, 해당 인덱스 1 증가
        - if left[left_index] < right[right_index]:
            - sorted.append(left[left_index])
            - left_index += 1
        - else:
            - sorted.append(right[right_index])
            - right_index += 1

In [1]:
def split(data):
    medium = len(data) // 2
    left = data[:medium]
    right = data[medium:]

    print(left, right)

In [3]:
def merge(left, right):
    merged = list()

    left_index, right_index = 0, 0

    # case1: left/right가 아직 남아있을 때
    while len(left) > left_index and len(right) > right_index:
        if left[left_index] > right[right_index]:
            merged.append(right[right_index])
            right_index += 1
        else:
            merged.append(left[left_index])
            left_index += 1

    # case2: left만 남아있을 때
    while len(left) > left_index:
        merged.append(left[left_index])
        left_index += 1

    # case3: right만 남아있을 때
    while len(right) > right_index:
        merged.append(right[right_index])
        right_index += 1
    return merged

In [4]:
def merge_split(data):
    if len(data) <= 1:
        return data

    medium = len(data) // 2

    left = merge_split(data[:medium])
    right = merge_split(data[medium:])

    return merge(left, right)

In [5]:
def merge_sort(data):
    return merge_split(data)

In [6]:
import random

to_sort = [random.randint(1, 100000) for _ in range(1000)]


print(merge_sort(to_sort))

[68, 276, 285, 309, 362, 464, 539, 554, 780, 1015, 1069, 1083, 1149, 1214, 1220, 1256, 1262, 1364, 1598, 1621, 1777, 1853, 2081, 2112, 2245, 2291, 2383, 2538, 2584, 2736, 2819, 2895, 3024, 3132, 3168, 3272, 3373, 3573, 3578, 3889, 3935, 4073, 4091, 4096, 4188, 4632, 4639, 4666, 4714, 4993, 5021, 5406, 5600, 5640, 5880, 6193, 6318, 6330, 6353, 6521, 6531, 6579, 6593, 6643, 6844, 7010, 7042, 7361, 7386, 7416, 7418, 7644, 7692, 7786, 7865, 7921, 8368, 8395, 8419, 8489, 8498, 8597, 8633, 8642, 8654, 8696, 8763, 8810, 8831, 8927, 8962, 9311, 9316, 9317, 9336, 9422, 9562, 9626, 9706, 9711, 9739, 9797, 9809, 9963, 10303, 10328, 10330, 10828, 10908, 10979, 11067, 11093, 11144, 11326, 11435, 11620, 11725, 11957, 11983, 11993, 12056, 12162, 12179, 12349, 12354, 12442, 12541, 12610, 12645, 12674, 12857, 12919, 12960, 13092, 13144, 13169, 13258, 13705, 13986, 14014, 14214, 14250, 14335, 14420, 14730, 14815, 14836, 14966, 15049, 15050, 15070, 15102, 15135, 15282, 15307, 15349, 15457, 15571, 15574, 