# Sorting algorithms

## Table of contents
- [Selection Sort](#Selection-Sort)
- [Insertion Sort](#Insertion-Sort)
- [Merge Sort](#Merge-Sort)
- [Quick Sort](#Quick-Sort)

## Selection Sort
선택 정렬은 제자리 비교 정렬이다. 복잡도는 O(n2)이므로 큰 리스트에는 비효율적이며, 유사한 삽입 정렬보다 성능이 더 떨어지는 것이 일반적이다. 선택 정렬은 단순함이 특징이며 특정한 상황에서는 더 복잡한 알고리즘보다 성능상 우위가 있다.
이 알고리즘은 최소값을 찾고 값을 최초 위치와 바꿔친 다음 리스트의 나머지 부분에 대해 이 과정을 반복한다. 교환 과정은 n개를 넘지 않으므로 교환 비용이 많이 드는 상황에서 유용하다.

In [162]:
def get_min(arr):
    result = arr[0]
    for item in arr:
        if item < result:
            result = item
    return result

# arr.pop(arr.index(get_min(arr)))
def get_min_index(arr):
    result = 0
    temp = arr[0]
    for i in range(len(arr)):
        if arr[i] < temp:
            temp = arr[i] # 최솟값을 구하기 위해 임시변수에 다시 할당
            result = i
    return result

def selection_sort(arr):
    result = [] # 정렬된 리스트
    while(len(arr)):
        result.append(get_min(arr))
        # print('get_min:', get_min(arr))
        # print('get_min_index:', get_min_index(arr))
        arr.pop(get_min_index(arr))
    return result

arr = [11, 15, 54, 66, 10, 5, 32, 77] # 입력값
print('selection_sort:',selection_sort(arr))

selection_sort: [5, 10, 11, 15, 32, 54, 66, 77]


## Insertion Sort

삽입 정렬(揷入整列, insertion sort)은 자료 배열의 모든 요소를 앞에서부터 차례대로 이미 정렬된 배열 부분과 비교하여, 자신의 위치를 찾아 삽입함으로써 정렬을 완성하는 알고리즘이다. k번째 반복 후의 결과 배열은, 앞쪽 k + 1 항목이 정렬된 상태이다.

In [152]:
def get_insertion_index(extracted_item, result, arr):
    for i in range(len(result)):
        if extracted_item < result[i]:
            return i
    return len(arr)

def insertion_sort(arr):
    result = []
    while(arr):
        extracted_item = arr.pop(0)
        index = get_insertion_index(extracted_item, result, arr)
        result.insert(index, extracted_item)
    return result
    
arr = [5, 10, 66, 77, 54, 32, 11, 15] # 입력값
print('insertion_sort:',insertion_sort(arr))

insertion_sort: [5, 10, 11, 15, 32, 54, 66, 77]


## Merge Sort

합병 정렬 또는 병합 정렬(merge sort)은 O(n log n) 비교 기반 정렬 알고리즘이다. 일반적인 방법으로 구현했을 때 이 정렬은 안정 정렬에 속하며, 분할 정복 알고리즘의 하나이다. 존 폰 노이만이 1945년에 개발했다. 상향식 합병 정렬에 대한 자세한 설명과 분석은 1948년 초 헤르만 골드스타인과 폰 노이만의 보고서에 등장하였다.

<pre>
# 병합정렬
# 분할, 정복
arr = [5, 10, 66, 77, 54, 32, 11, 15] # 입력값
length = len(arr)
mid = length // 2
arr[:mid]
arr[mid:]

# 분할
[5, 10, 66, 77, 54, 32, 11, 15]
[5, 10, 66, 77], [54, 32, 11, 15]
[5, 10], [66, 77], [54, 32], [11, 15]
[5], [10], [66], [77], [54], [32], [11], [15]

# 정복 - 값을 비교하여 더 작은 값이 앞으로 오도록
[5], [10], [66], [77], [54], [32], [11], [15]
[5, 10], [66, 77], [32, 54], [11, 15]
[5, 10, 66, 77], [11, 15, 32, 54]
[5, 10, 11, 15, 32, 54, 66, 77]
</pre>

In [60]:
def merge_sort(list):
    result = []
    length = len(list)
    if length <= 1:
        return list
    mid = length // 2
    # divide (분할)
    first_subgroup = merge_sort(list[:mid])
    second_subgroup = merge_sort(list[mid:])
    
    # conquer(정복)
    while len(first_subgroup) and len(second_subgroup):
        if first_subgroup[0] < second_subgroup[0]:
            result.append(first_subgroup.pop(0))
        else:
            result.append(second_subgroup.pop(0))            
    while len(first_subgroup):
        result.append(first_subgroup.pop(0))
    while len(second_subgroup):
        result.append(second_subgroup.pop(0))
    # return '첫 번째:{}, 두 번째: {}\n'.format(first_subgroup, second_subgroup)
    print(result)
    return result

In [61]:
arr = [5, 10, 66, 77, 54, 32, 11, 15] # 입력값
print('merge_sort:',merge_sort(arr))

[5, 10]
[66, 77]
[5, 10, 66, 77]
[32, 54]
[11, 15]
[11, 15, 32, 54]
[5, 10, 11, 15, 32, 54, 66, 77]
merge_sort: [5, 10, 11, 15, 32, 54, 66, 77]


## Quick Sort

퀵 정렬은 다른 원소와의 비교만으로 정렬을 수행하는 비교 정렬에 속한다. n개의 데이터를 정렬할 때, 평균적으로 O(n log n)번의 비교를 수행하지만 최악의 경우에는 O(n2)번의 비교를 수행한다. 

퀵 정렬은 **분할 정복(divide and conquer) 방법**을 통해 리스트를 정렬한다.

1. 리스트 가운데서 하나의 원소를 고른다. 이렇게 고른 원소를 피벗이라고 한다.
1. 피벗 앞에는 피벗보다 값이 작은 모든 원소들이 오고, 피벗 뒤에는 피벗보다 값이 큰 모든 원소들이 오도록 피벗을 기준으로 리스트를 둘로 나눈다. 이렇게 리스트를 둘로 나누는 것을 분할이라고 한다. 분할을 마친 뒤에 피벗은 더 이상 움직이지 않는다.
1. 분할된 두 개의 작은 리스트에 대해 재귀(Recursion)적으로 이 과정을 반복한다. 재귀는 리스트의 크기가 0이나 1이 될 때까지 반복된다. 재귀 호출이 한번 진행될 때마다 최소한 하나의 원소는 최종적으로 위치가 정해지므로, 이 알고리즘은 반드시 끝난다는 것을 보장할 수 있다.

<pre>
# 분할, 정복 방법 예시

[66, 77, 54, 32, 10, 5, 11, 15]
[54, 32, 10, 5, 11, 15] + [66] + [77]
[32, 10, 5, 11, 15] + [54] + [66] + [77] 
[10, 5, 11, 15] + [32] + [54] + [66] + [77] 
[5], [10], [11, 15] + [32] + [54] + [66] + [77]
[5], [10], [11], [15] + [32] + [54] + [66] + [77]
</pre>

In [125]:
g_list = []

def quick_sort(list):
    global g_list
    length = len(list)
    if length <= 1:
        return list
    pivot = list.pop(0)
    smaller_group = []
    bigger_group = []
    
    for iterator in list:
        if pivot < iterator:
            bigger_group.append(iterator)
        else:
            smaller_group.append(iterator)
            
    console_log = 'smaller_group: {}, pivot: {}, bigger_group: {}'.format(smaller_group, [pivot], bigger_group)
    g_list.append(console_log)
    return quick_sort(smaller_group) + [pivot] + quick_sort(bigger_group)

In [126]:
arr = [66, 77, 54, 32, 10, 5, 11, 15] # 입력값
print('quick_sort:', quick_sort(arr))

quick_sort: [5, 10, 11, 15, 32, 54, 66, 77]


In [127]:
for iter in g_list:
    print(iter)

smaller_group: [54, 32, 10, 5, 11, 15], pivot: [66], bigger_group: [77]
smaller_group: [32, 10, 5, 11, 15], pivot: [54], bigger_group: []
smaller_group: [10, 5, 11, 15], pivot: [32], bigger_group: []
smaller_group: [5], pivot: [10], bigger_group: [11, 15]
smaller_group: [], pivot: [11], bigger_group: [15]
