# 고급 정렬
## 12.1 다양한 정렬 알고리즘

- 선택 정렬: 입력의 크기에 따라 자료 이동 횟수가 결정된다.
- 삽입 정렬: 레코드의 많은 이동이 필요하지만 대부분의 레코드가 이미 정려되어 있는 경우에는 효율적이다.
- 버블 정렬: 인접 요소를 교환하는 방식의 가장 간단한 알고리즘을 사용한다.
- 셸 정렬: 삽입 정렬 개념을 개선한 방법
- 힙 정렬: 추가적인 메모리 공간이 필요 없는 제자리 정렬로 구현하는 방법
- 병합 정렬: 연속적인 분할과 병합을 이용하는 방법
- 퀵 정렬, 이중피벗 퀵 정렬: 피벗을 이용한 정렬 방법으로 대표적인 효율적인 정렬 알고리즘
- 기수 정렬, 카운팅 정렬: 항목의 비교를 사용하지 않고 분배를 이용해 정렬하는 방법이지만 적용할 수 있는 킷값에 제한이 있는 알고리즘

## 12.2 셸 정렬

셸 정렬: 삽입정렬이 어느 정도 정렬된 배열에 대새허는 대단히 바른 것에 착안했다.

![image](https://user-images.githubusercontent.com/68596881/108025043-18824680-7069-11eb-888e-d1df4011f6cf.png)

셸 정렬은 먼저 리스트를 일정한 기준에 따라 여러 개의 부분 리스트로 나누고, 각 부분리스트를 삽입 정렬을 이용해 정렬한다. 모든 부분 리스트가 정렬되면 다시 전체 리스트를 더 적은 개수의 부분 리스트로 만들어 앞의 과정을 되풀이한다. 이 과정은 부분 리스트의 개수가 1이 될 때까지 반복된다.

In [1]:
#gap만큼 떨어진 요소들을 삽입 정렬. 정렬 범위는 first에서 last
def sortGapInsertion(A, first, last, gap):
    for i in range(first+gap, last+1, gap):
        key = A[i]
        j = i-gap
        while j >= first and key<A[j]: #삽입 위치를 찾음
            A[j+gap] = A[j] #항목 이동
            j = j- gap
        A[j+gap] = key #최종 위치에 삽입

def shell_sort(A):
    n = len(A)
    gap = n//2
    while gap > 0 :
        if gap%2 == 0:
            gap += 1
        for i in range(gap):
            sortGapInsertion(A,i,n-1, gap)
        print('    Gap=', gap, A)
        gap = gap//2

In [2]:
A = [5,3,8,4,9,1,6,2,7]
shell_sort(A)

    Gap= 5 [1, 3, 2, 4, 9, 5, 6, 8, 7]
    Gap= 3 [1, 3, 2, 4, 8, 5, 6, 9, 7]
    Gap= 1 [1, 2, 3, 4, 5, 6, 7, 8, 9]


시간 복잡도는 최왁의 경우 $O(n^2)$이지만, 평균적인 경우 $O(n^{1.5})$ 이다.

## 12.3 힙 정렬
힙은 우선순위 큐를 완전이진트리로 구현하는 방법으로 최댓값이나 최솟값을 쉽게 추출할 수 있는 자료구조이므로 힙을 이용하면 리스트를 간단히 정렬할 수 잇다.

### 힙을 이용한 정렬

In [3]:
# 8.3절에서 최대 힙을 구현한 코드
class MaxHeap:
    def __init__(self):
        self.heap = []
        self.heap.append(0) #0번 항목은 사용하지 않음

    def size(self):
        return len(self.heap) - 1

    def isEmpty(self):
        return self.size() == 0

    def Parent(self,i):
        return self.heap[i//2]

    def Left(self, i):
        return self.heap[i*2]

    def Right(self, i):
        return self.heap[i*2 + 1]

    def display(self, msg = '힙 트리 '):
        print(msg, self.heap[1:])

    def insert(self, n):
        self.heap.append(n)
        i = self.size() #노드 n의 위치
        while (i != 1 and n > self.Parent(i)): #부모보다 큰 동안 계속 업힙
            self.heap[i] = self.Parent(i)
            i = i//2
        self.heap[i] = n

    def delete(self):
        parent = 1
        child = 2
        if not self.isEmpty():
            hroot = self.heap[1] # 삭제할 루트를 복사해 둠
            last = self.heap[self.size()] # 마지막 노드
            while (child <= self.size()): # 마지막 노드 이전까지
                #만약 오른쪽 노드가 더 크면 child를 1 증가(기본은 왼쪽 노드)
                if child < self.size() and self.Left(parent) < self.Right(parent):
                    child += 1
                if last >= self.heap[child]: # 더 큰 자식이 더 작으면 삽입 위치 찾음. down-heap 종료
                    break
                self.heap[parent] = self.heap[child] #down-heap
                parent = child
                child *= 2

            self.heap[parent] = last #맨 마지막 노드를 parent 위치에 복사
            self.heap.pop(-1) #맨 마지막 노드 삭제
            return hroot

In [4]:
def heapSort(data):
    heap = MaxHeap()
    for n in data:
        heap.insert(n)
    
    for i in range(1, len(data)+1):
        data[-i] = heap.delete()

힙의 삽입 연산과 삭제연산의 시간 복잡도는 모두 $O(log_{2}n)$이고, 이러한 연산을 2n번 해야 하므로 정렬의 시간복잡도는 $O(nlog_{2}n)$이다. 하지만 이 방법은 다른 메모리 공간인 힙에 모두 넣었다가 빼야하므로 추가적인 메모리를 필요로 하다.

### 제자리 정렬로 구현한 힙 정렬

#### 정렬되지 않은 배열 -> 최대 힙

![image](https://user-images.githubusercontent.com/68596881/108025076-26d06280-7069-11eb-982c-3fe1b52856a5.png)

In [6]:
def heapify(arr, n, i): #n: 배열의 길이, i: 다운힙을 진행하고자 하는 항목의 인덱스
    largest = i #i번째가 가장 크다고 하자
    l = 2*i + 1 #왼쪽 자식
    r = 2*i + 2 #오른쪽 자식
    
    if l < n and arr[i] < arr[l]: #교환조건 검사
        largest = l
    if r < n and arr[largest] < arr[r]: #교환조건 검사
        largest = r
    if largest != i: #교환이 필요하면
        arr[i], arr[largest] = arr[largest], arr[i] #교환
        heapify(arr, n ,largest) #순차적으로 자식노드로 내려감

#### 최대 힙 -> 정렬된 배열

최대 힙에서 항목들을 하나씩 꺼내 순서대로 저장해야 최종 정렬이 완료된다.  
힙의 삭제는 루트를 삭제하는 것이다. 따라서 루트의 숫자를 힙의 마지막 숫자와 교환하고 힙 크기를 1 줄인다. 이 상태는 힙 조건을 만족하지 않을 수 있다. 따라서 다운힙 연산으로 반드시 힙을 복원해야 한다.

In [7]:
def heapSort(arr):
    n = len(arr)
    print('i=', 0 ,arr)
    for i in range(n//2, -1, -1): #최대 힙을 만듦
        heapify(arr, n ,i)
        print("i=", i, arr)
    print()
    
    for i in range(n-1, 0, -1):
        arr[i],arr[0] = arr[0],arr[i] #루트를 뒤쪽으로 옮김. 교체
        heapify(arr, i, 0) #heap 조건을 맞춤
        print('i=', i ,arr)

In [8]:
A = [5,3,8,4,9,1,6,2,7]
heapSort(A)

i= 0 [5, 3, 8, 4, 9, 1, 6, 2, 7]
i= 4 [5, 3, 8, 4, 9, 1, 6, 2, 7]
i= 3 [5, 3, 8, 7, 9, 1, 6, 2, 4]
i= 2 [5, 3, 8, 7, 9, 1, 6, 2, 4]
i= 1 [5, 9, 8, 7, 3, 1, 6, 2, 4]
i= 0 [9, 7, 8, 5, 3, 1, 6, 2, 4]

i= 8 [8, 7, 6, 5, 3, 1, 4, 2, 9]
i= 7 [7, 5, 6, 2, 3, 1, 4, 8, 9]
i= 6 [6, 5, 4, 2, 3, 1, 7, 8, 9]
i= 5 [5, 3, 4, 2, 1, 6, 7, 8, 9]
i= 4 [4, 3, 1, 2, 5, 6, 7, 8, 9]
i= 3 [3, 2, 1, 4, 5, 6, 7, 8, 9]
i= 2 [2, 1, 3, 4, 5, 6, 7, 8, 9]
i= 1 [1, 2, 3, 4, 5, 6, 7, 8, 9]


힙 정렬의 시간 복잡도는 $O(nlog_{2}n)$이고, 제자리 겅렬로 구현할 수 있어 추가적인 메모리가 필요 없다.

## 12.4 병합 정렬
병합 정렬(merge sort)은 하나의 리스트를 두 개의 균등한 크기로 분할하고 분할된 부분리스트를 정렬한 다음, 두 리스트를 합하여 전체가 정렬된 리스트를 만드는 방법

![image](https://user-images.githubusercontent.com/68596881/108025100-32bc2480-7069-11eb-8154-9ab206d023de.png)

In [9]:
def merge_sort(A, left, right):
    if left < right:
        mid = (left + right) //2
        merge_sort(A, left, mid)
        merge_sort(A, mid+1, right)
        merge(A, left, mid, right)
        
def merge(A, left, mid ,right):
    global sorted
    k = left
    i = left
    j = mid + 1
    while i <= mid and j <= right:
        if A[i] <= A[j]:
            sorted[k] = A[i]
            i,k = i+1, k+1
        else:
            sorted[k] = A[j]
            j,k = j+1, k+1
    if i > mid:
        sorted[k:k+right-j+1] = A[j:right + 1]
    else:
        sorted[k:k+mid-i+1] = A[i:mid+1]
    A[left:right+1] = sorted[left:right+1]

병합정렬은 최악, 평균, 최선의 모든 경우에 $O(nlog_{2}n)$의 시간 복잡도를 갖는다. 단점은 추가적인 메모리가 필요하다는 것이다.