## Comparison of sorting algorithms

<br>

### Quick, Merge, Heap Sorting
- 세 가지 정렬 알고리즘을 구현
- 세 정렬 알고리즘의 시간과 비교 및 교환-이동 횟수를 비교할 것

<br>

### 추가 고려 사항
- Quick Sort를 굳이 하나가 남을 때까지 분할할 필요는 없다.
  - 적당한 개수(10~40)가 남으면대부분 정렬된 상태
  - 이 경우 분할을 멈추고 inssertion Sort 정렬하면 더 빠름.
- 수행 시간 - timeit 모듈 활용 
- n 값을 100, 500, ..., 50000 정도까지 증가하면서 세 가지 정렬의 수행시간과 비교 및 교환-이동횟수가 어떻게 달라지는지 기록하고 비교하기.

<br>

In [2]:
import random, timeit

def quick_sort(A, first, last):
    global Qc; global Qs
    k = 10   
    if last - first + 1 < k:
        insertion_sort(A, first, last)
        return
    
    left, right = first+1, last
    pivot = A[first]
    while left <= right:
        while left <= last and A[left] < pivot:
            Qc += 1
            left += 1
        while right > first and A[right] > pivot:
            Qc += 1
            right -=1
        if left <= right:
            A[left], A[right] = A[right], A[left] #swap
            Qs += 1
            left += 1
            right -= 1
            
    A[first], A[right] = A[right], A[first]
    Qs += 1
    
    quick_sort(A, first, right -1)
    quick_sort(A, right+1, last)

    
def insertion_sort(A, first, last):
    global Qc; global Qs
    for i in range(first+1, last+1):
        ch = A[i]
        j = i - 1
        while j >= first and A[j] > ch: #swap
            Qc += 1
            A[j+1] = A[j] 
            Qs += 1
            j -= 1
        A[j+1] = ch

def merge_sort(A, first, last):
    global Mc; global Ms
    if first >= last:
        return
    merge_sort(A, first, (first+last)//2)
    merge_sort(A, (first+last)//2+1, last)
    merge_two_sorted_lists(A, first, last)

def merge_two_sorted_lists(A, first, last):
    global Mc; global Ms
    m = (first+last)//2
    i, j = first, m+1
    B = []
    while i<=m and j<=last:
        Mc += 1
        if A[i] <= A[j]:
            B.append(A[i])
            i += 1
        else:
            B.append(A[j])
            j += 1
    for k in range(i, m+1):
        B.append(A[k])
    for k in range(j, last+1):
        B.append(A[k])
    for i in range(first, last+1):
        A[i] = B[i-first]
        Ms += 1

def heap_sort(A):
    global Hc; global Hs
    n = len(A)
    for k in range(n // 2 - 1, -1, -1):
        heapify_down(A, k, n)
    for k in range(n-1, 0, -1):
        A[0], A[k] = A[k], A[0]
        Hs += 1
        heapify_down(A, 0, k)

def heapify_down(A, k, n):
    global Hc; global Hs
    while 2*k + 1 < n:
        L, R = 2*k+1, 2*k+2
        m = L
        if R < n and A[R] > A[L]:
            m = R
        if A[k] >= A[m]:
            break
        A[k], A[m] = A[m], A[k]
        Hs += 1
        k = m
        Hc += 1
    return A

def tim_sort(A):
    A.sort()
    return A

def check_sorted(A):
	for i in range(n-1):
		if A[i] > A[i+1]: return False
	return True


# Qc는 quick sort에서 리스트의 두 수를 비교한 횟수 저장
# Qs는 quick sort에서 두 수를 교환(swap)한 횟수 저장
# Mc, Ms는 merge sort에서 비교, 교환(또는 이동) 횟수 저장
# Hc, Hs는 heap sort에서 비교, 교환(또는 이동) 횟수 저장

Qc, Qs, Mc, Ms, Hc, Hs = 0, 0, 0, 0, 0, 0

n = int(input())
random.seed()
A = []
for i in range(n):
    A.append(random.randint(-1000,1000))
B = A[:]
C = A[:]

print("")
print("Quick sort:")
print("time =", timeit.timeit("quick_sort(A, 0, n-1)", globals=globals(), number=1))
print("  comparisons = {:10d}, swaps = {:10d}\n".format(Qc, Qs))

print("Merge sort:")
print("time =", timeit.timeit("merge_sort(B, 0, n-1)", globals=globals(), number=1))
print("  comparisons = {:10d}, swaps = {:10d}\n".format(Mc, Ms))

print("Heap sort:")
print("time =", timeit.timeit("heap_sort(C)", globals=globals(), number=1))
print("  comparisons = {:10d}, swaps = {:10d}\n".format(Hc, Hs))

print("Tim sort:")
print("time =", timeit.timeit("heap_sort(C)", globals=globals(), number=1))

# 정렬이 맞게 되었는지 확인. 정렬이 되지 않았다면, assert 함수가 fail 된다.
assert(check_sorted(A))
assert(check_sorted(B))
assert(check_sorted(C))

10000

Quick sort:
time = 0.04178079199982676
  comparisons =      90216, swaps =      32329

Merge sort:
time = 0.05531808299997465
  comparisons =     120315, swaps =     133616

Heap sort:
time = 0.055810042000075555
  comparisons =     114116, swaps =     124115

Tim sort:
time = 0.05861558300011893


<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Frc6oy%2FbtsgNWzZJeM%2FwLZzejkA5Q6aGOKpqOoOIK%2Fimg.png"  width="1000" height="6000">

## Quick Sort

<br>

### 실행시간 및 시간 복잡도 분석
- Best와 Average의 경우, Quick Sort는 n을 약 절반으로 분할한다. 따라서 재귀 트리의 높이는 log n이고 각 높이 에서 O(n) 시간이 걸리며, 총 실행 시간은 O(n logn)이다. 
- Worst Case의 경우, n은 0과 n-1의 두 부분으로 나눈다. 이 경우 재귀 트리의 높이는 n이고 각 수준은 O(n) 시간이 걸린다. 따라서 Worst case의 총 실행 시간은 O(n^2)이다.
- 해당 코드에서 k = 10보다 작아지면 Insertion Sort 알고리즘으로 전환하여 정렬을 개선한다. Insertion Sort 알고리즘은 Worst Case의 O(n^2)의 실행 시간에도 불구하고 비교적 빠르게 수행된다. 
- 정리하면 전반적으로 주어진 코드의 실행 시간 복잡도는 Best와 Average의 경우 O(n logn)이고 Worst의 경우 O(n^2)이다.

<br>

### 코드 상의 비교 및 교환 횟수
- Qc : 정렬 과정의 비교 횟수 
  - Best와 Average Case의 비교 횟수 : O(n log n)
  - Worst Case의 비교 횟수 : n-1이며 (pivot이 리스트에서 가장 작거나 가장 큰 수일 경우) -> O(n^2)
- Qs : 정렬 과정에서의 교환 횟수 
  - Best Case 교환 횟수 : O(n log n)
  - Worst Case 교환 횟수 : n/2 (모든 요소가 pivot보다 크거나 작을 때 발생) -> O(n) •InsertionSort 알고리즘에서의 Worst Case 교환 횟수 : O(n^2)

<br>

## Merge Sort

<br>

### 실행시간 및 시간 복잡도 분석
- merge_sort는 입력 n에 대해 시간 복잡도는 O(n logn)이다. 재귀에서 logn이 필요하고, 각 단계에서 merge_two_sorted_lists 함수는 O(n) 시간이 걸린다.
- 따라서 전체 시간 복잡도는 O(n logn)이다.
- merge_two_sorted_lists 함수는 각각 n/2 크기 분할된 리스트를 합치는데 O(n) 시간이 걸린다. 
- 임시 리스트롤 틍해 합치고 정렬된 결과를 원래 리스트에 다시 복사한다. 이 과정에서의 시간 복잡도는 O(n)이다.
- 전체 시간 복잡도 는 merge_sort 함수의 시간 복잡도인 O(n logn)에 의해 결정된다.

<br>

### 코드 상의 비교 및 교환 횟수
- Mc : 비교 횟수 = O(n logn)
  - 각 재귀 호출이 입력 배열을 반으로 나누고, 각 숫자가 한 번 비교된다. 
  - 재귀 트리의 깊이가 logn이므로 전체 비교 횟수는 대략적으로 n logn 이다.
- Ms : 교환횟수 = O(n log n)
  - 각 숫자가 한 번씩 이동되고, 입력이 n인 배열에 재귀 트리의 깊이(log n)를 곱한 값 -> n log n

<br>

## Heap Sort

<br>

### 실행시간 및 시간 복잡도 분석
- Worst Case의 경우 O(nlogn)이다.
- 힙을 만드는 데 연산은 O(n) 시간이 걸리고, 가장 큰 수 제거 및 heapify- down 연산은 O(logn) 시간이 걸리며, 이러한 연산은 정렬 과정에서 n-1 번 수행된다. 
- 따라서 알고리즘의 전체 시 간 복잡도는 O(n logn))이다.


<br>

### 코드 상의 비교 및 교환 횟수
- Hc : 비교 횟수 = O(nlogn)
  - heapify-down 수행할 때, 힙의 각 수준에서 비교할 요소가 최대 2개이고 O(logn)만큼 수행된다.

- Hs : worst case - nlog(n)
  - 힙에서 최대 요소를 제거할 때마다 힙의 마지막 요소와 교체한 다음 나머지 힙에서 heapify-down 작업을 수행 해야 한다. 
  - heapify-down 작업 중에 수행되는 교환횟수는 힙의 높이인 O(logn)이고, 정렬 과정에서 제거 및 heapify-down 작업이 n-1번 수행되므로 총 교환횟수는 O(nlogn))이다.

<br>