## Merge Sort Algorithm

- 이미 정렬되어 있는 데이터들을 하나로 합쳐서 정렬하는 경우에 사용
- 성능은 수치적으로만 보면 퀵 정렬 알고리즘과 비슷하다.(분할후 재귀 호출을 사용하기 때문)
- 상당히 빠른 알고리즘에 해당
- 이미 정렬된 상태에서는 성능이 급격히 저하된다.
- 원래 데이터 이외의 별도의 데이터 공간이 필요하다는 단점이 있으나, 데이터들을 연결 리스트로 만들어 사용하면 극복할 수 있다.

In [1]:
def merge_sort(mylist):
    if len(mylist) <= 1: return mylist
    half = len(mylist) // 2
    left_list = merge_sort(mylist[:half])
    right_list = merge_sort(mylist[half:])
    merged_list = []
    
    while len(left_list) > 0 and len(right_list) > 0:
        if left_list[0] > right_list[0]:
            merged_list.append(right_list[0])
            right_list.pop(0)
        else:
            merged_list.append(left_list[0])
            left_list.pop(0)
    if len(left_list) > 0: merged_list += left_list
    if len(right_list) > 0: merged_list += right_list
    return merged_list

In [2]:
from math import log10
from random import randint

In [3]:
input_n = input('정렬할 데이터의 수: ')
data = [randint(1, 99999) for i in range(int(input_n))]

print('<before>')
print(data)


sorted_data = merge_sort(data)

print('<after>')
print(sorted_data)

정렬할 데이터의 수: 10
<before>
[72166, 26135, 39818, 74101, 83527, 91089, 46670, 91971, 14833, 99232]
<after>
[14833, 26135, 39818, 46670, 72166, 74101, 83527, 91089, 91971, 99232]


## Heap Sort Algorithm

- 운영체제나 네트워크 등 시스템 내부에서 가장 많이 사용되는 정렬 알고리즘
- Priority Queue(우선순위 큐)를 이용하여 우선순위에 따라 정렬
- 완전 이진 트리 구조로 정렬을 진행
  
- 힙을 다시 재구성하는 과정이 있기 때문에 퀵 알고리즘보다 성능이 떨어진다.
- 트리 구조를 사용하고, 리스트를 사용해 구현이 가능하기 때문에 공간 효율성은 뛰어나다.
- 단순히 트리 구조만 알면 되기 때문에, 다른 알고리즘들에 비해 코드의 효율성이 좋다.

In [4]:
def left_node(idx=None):
    return ((idx + 1) << 1) - 1

def right_node(idx=None):
    return (idx + 1) << 1

def up_heap(mylist=None, idx=None, heap_size=None):
    l_node = left_node(idx)
    r_node = right_node(idx)
    
    if l_node <= heap_size and mylist[l_node] > mylist[idx]:
        largest = l_node
    else:
        largest = idx
    if r_node <= heap_size and mylist[r_node] > mylist[largest]:
        largest = r_node
    if largest != idx:
        mylist[idx], mylist[largest] = mylist[largest], mylist[idx]
        up_heap(mylist, largest, heap_size)
        
def build_heap(mylist=None):
    heap_size = len(mylist) - 1
    for i in reversed(range(len(mylist) // 1)):
        up_heap(mylist, i, heap_size)
        
def heap_sort(heap=None):
    tmp_arry = list()
    for i in range(len(heap)):
        tmp_arry.append(heap.pop(0))
        up_heap(heap, 0, len(heap) - 1)
    return tmp_arry

In [7]:
data = [randint(1, 99999) for x in range(int(input_n))]

print('<before>')
print(data)

build_heap(data)

sorted_data = heap_sort(data)

print('<after>')
print(sorted_data)

<before>
[24735, 48946, 50792, 78725, 56797, 33836, 73014, 93605, 44224, 12642]
<after>
[93605, 78725, 73014, 56797, 50792, 48946, 44224, 33836, 24735, 12642]
