# 힙 정렬

힙은 부모와 자식 간의 대소 관계가 모든 노드에 대해 한 방향인 완전 이진 트리이다.<br/>
즉, 다음 두 가지 규칙 중 하나만을 만족하는 트리이다.<br/>
1. 부모 노드가 항상 자식 노드보다 크다.
2. 부모 노드가 항상 자식 노드보다 작다.

힙에서는 부모와 자식 간의 대소 관계만 따지기 때문에 형제 간의 대소 관계는 따지지 않는다. 따라서 힙은 형제의 대소 관계가 정해져 있지 않다는 의미에서 부분 순서 트리라고도 한다.

### <span style='color: green'>트리</span>

- 이진 트리 : 부모가 가질 수 있는 자식 노드의 개수가 최대 2개인 것
- 완전 이진 트리 : '완전'은 부모는 왼쪽 자식부터 추가하여 모양을 유지하라는 의미

### 힙과 배열의 원소 대응

루트부터 시작하여 왼쪽 -> 오른쪽 노드의 순서로 배열에 저장하면 완전 이진 트리 구조를 배열에 저장할 수 있으며 인덱스 규칙은 다음과 같다.<br/>
- **부모** : ```a[(i - 1) //2]```
- **왼쪽 자식** : ```a[i * 2 + 1]```
- **오른쪽 자식** : ```a[i * 2 + 2]```



### 루트를 삭제한 힙의 재구성

루트를 삭제한 힙을 다시 힙으로 만들기 위해서는 힙의 노드 중 가장 작은 값을 갖는 노드를 루트 노드로 옮긴 뒤 루트에서 알맞은 위치를 찾아가면 된다.<br/>
알맞은 위치를 찾기 위해서는 두 자식 노드와 가장 작은 노드에 해당하는 루트 노드를 비교하면서 세 노드 중 가장 큰 값이 부모 노드를 차지하도록 교환하면 된다. 이때 루트 노드가 리프 노드가 되어 더이상 교환할 자식이 없거나 자식 노드 중 자신보다 더 큰 자식 노드가 없다면 이동을 중단한다.

**[루트를 삭제한 힙의 재구성]**
1. 루트 노드를 삭제한다.
2. 가장 마지막에 위치한 가장 작은 원소를 루트 노드로 이동시킨다.
3. 루트 노드부터 자식노드와 대소 관계를 따져 알맞은 위치로 이동시킨다.
4. 이동한 루트 노드가 리프 노드가 되었거나 자식 노드 중 자신보다 큰 노드가 없다면 이동을 중단한다.

## 힙 정렬 알고리즘

힙을 이용하여 정렬하는 방법은 다음과 같다.

**[알고리즘]**
1. 힙에서 가장 큰 값의 노드를 꺼내 배열의 가장 마지막 노드와 교환한다. (노드를 삭제하는 것으로 간주 - 정렬된 영역의 인덱스 관리 필요)
2. 마지막 노드를 제외한 나머지 노드로 다시 힙을 재구성한다.
3. 힙이 재구성되면 1, 2번을 반복하여 모두 정렬이 완료될 때 종료한다.

<br/>

$n$ : 배열의 원소 수<br/>
$i$ : 배열의 마지막 인덱스<br/>

<br/>

**while문 시작<br/>**

1. $i = n - 1$ 로 지정<br/>
2. heap[0] 과 heap[i] 를 교환<br/>
3. heap[0] ~ heap[i - 1]까지 힙 재구성
4. i가 0이 되면 종료

### 배열을 힙으로 만들기

힙 정렬 알고리즘은 주어진 배열이 힙이라는 가정 하에 사용할 수 있는 방법이다. 따라서 주어진 배열을 힙으로 만들기 위한 알고리즘은 다음과 같다.

**[알고리즘]**
1. 가장 하단의 서브트리를 힙으로 구성한다. 
2. 하단의 모든 서브트리를 힙으로 만들면 서브 트리들의 부모 노드를 알맞은 위치로 이동시키는 방식으로 힙을 구성한다.

In [20]:
# 힙 정렬 알고리즘 구현하기 - 내가 짠 코드

def arr_to_heap(a, left: int, right: int):
    """정해진 범위의 배열을 힙으로 만들기"""
    parent = left
    biggerIdx = -1
    while (parent * 2 + 1) <= right:
        try:
            biggerIdx = (parent * 2 + 1) if a[parent * 2 + 1] > a[parent * 2 + 2] else parent * 2 + 2
        except IndexError:
            biggerIdx = parent * 2 + 1
        if a[biggerIdx] > a[parent]:
            a[biggerIdx], a[parent] = a[parent], a[biggerIdx]
            parent = biggerIdx
        else:
            break
            
def heap_sort(a, left, right):
    """힙 정렬"""
    a[0], a[right] = a[right], a[0]
    right -= 1
    arr_to_heap(a, left, right)
    print(a)
        

a = [1, 10, 5, 8, 9, 2, 4, 6, 7, 3]
arr_to_heap(a, 0, len(a) - 1)
print(a)
heap_sort(a, 0, len(a) - 1)


[10, 9, 5, 8, 3, 2, 4, 6, 7, 1]
[9, 8, 5, 7, 3, 2, 4, 6, 1, 10]


In [40]:
# step 1 : 힙으로 구성된 배열로 정렬하기

def heap_sort(a, left, right):
    """힙 정렬"""
    
    def arr_to_heap(a, left: int, right: int):
        """정해진 범위의 배열을 힙으로 만들기"""
        parent = left
        biggerIdx = -1
        while (parent * 2 + 1) <= right:
            if parent * 2 + 2 <= right:
                biggerIdx = (parent * 2 + 1) if a[parent * 2 + 1] > a[parent * 2 + 2] else parent * 2 + 2
            else:
                biggerIdx = parent * 2 + 1
            if a[biggerIdx] > a[parent]:
                a[biggerIdx], a[parent] = a[parent], a[biggerIdx]
                parent = biggerIdx
            else:
                break
    
    # 힙 정렬
    for i in range(right, - 1, -1):
        a[0], a[i] = a[i], a[0]
        arr_to_heap(a, 0, i - 1)

a = [10, 9, 5, 8, 3, 2, 4, 6, 7, 1]
heap_sort(a, 0, len(a) - 1)
print(a)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


In [57]:
# step 2 : 일반 배열을 힙으로 구성 -> 힙 정렬 구현 (구현 완성, 개선 필요)

def heap_sort(a, left, right):
    """힙 정렬"""
    
    def arr_to_heap(a, left: int, right: int):
        """정해진 범위의 배열을 힙으로 만들기"""
        parent = left
        
        biggerIdx = -1
        while (parent * 2 + 1) <= right:
            if parent * 2 + 2 <= right:
                biggerIdx = (parent * 2 + 1) if a[parent * 2 + 1] > a[parent * 2 + 2] else parent * 2 + 2
            else:
                biggerIdx = parent * 2 + 1
            if a[biggerIdx] > a[parent]:
                a[biggerIdx], a[parent] = a[parent], a[biggerIdx]
                parent = biggerIdx
            else:
                break
    # 힙 구성
    p = (right - 1) // 2 if right % 2 == 0 else right // 2
    for i in range(p, -1, -1):
        tmp = i * 2 + 2 if right % 2 == 0 else i * 2 + 1
        arr_to_heap(a, i, tmp)
    
    # 힙 정렬
    for i in range(right, -1, -1):
        a[0], a[i] = a[i], a[0]
        arr_to_heap(a, 0, i - 1)

a = [6, 4, 3, 7, 1, 9, 8]
heap_sort(a, 0, len(a) - 1)
print(a)

[1, 3, 4, 6, 7, 8, 9]


### 개선 필요

1. 인덱스 개선 필요
2. 변수명 개선 필요


In [64]:
# step 2 : 일반 배열을 힙으로 구성 -> 힙 정렬 구현 2 (개선)

def heap_sort(a, left, right):
    """힙 정렬"""
    
    def arr_to_heap(a, left: int, right: int):
        """정해진 범위의 배열을 힙으로 만들기"""
        parent = left
        
        biggerIdx = -1
        while parent < (right + 1) // 2: # 1. 부모 인덱스의 마지막까지만
            cl = parent * 2 + 1
            cr = parent * 2 + 2
            child = cr if cr <= right and a[cr] > a[cl] else cl    
            if a[parent] >= a[child]:
                break
            a[parent], a[child] = a[child], a[parent]
            parent = child
    
    n = len(a)
    # 힙 구성
    for i in range((n - 1) // 2, -1, -1):
        arr_to_heap(a, i, n - 1) # ??
    
    # 힙 정렬
    for i in range(right, 0, -1): # 0까지 가면 a[0] 빼고 모두 정렬되어 있는 것이므로 정렬하지 않아도 된다.
        a[0], a[i] = a[i], a[0] 
        arr_to_heap(a, 0, i - 1)

a = [6, 4, 3, 7, 1, 9, 8]
heap_sort(a, 0, len(a) - 1)
print(a)

[1, 3, 4, 6, 7, 8, 9]


In [61]:
def heap_sort(a):
    
    
    def down_heap(a, left, right):
        temp = a[left]
        
        parent = left
        while parent < (right + 1) // 2:
            cl = parent  * 2 + 1
            cr = cl + 1
            child = cr if cr <= right and a[cr] > a[cl] else cl
            if temp >= a[child]:
                break
            a[parent] = a[child]
            parent = child
        a[parent] = temp
    
    n = len(a)
    
    for i in range((n - 1) // 2, -1, -1):
        down_heap(a, i, n - 1)
        
    for i in range(n - 1, 0, -1):
        a[0], a[i] = a[i], a[0]
        down_heap(a, 0, i - 1)
        
# a = [6, 4, 3, 7, 1, 9, 8]
a = [10, 9, 5, 8, 3, 2, 4, 6, 7, 1]
heap_sort(a)
print(a)   


[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


## heapq 모듈을 사용하는 힙 정렬

파이썬에서 제공하는 heapq 모듈로 heappush() 함수와 heappop() 함수를 사용하여 원소를 추가하고 제거할 수 있다. 이때 푸시와 팝을 수행하면 힙의 조건을 유지하며 수행한다.

In [65]:
import heapq

def heap_sort(a):
    heap = []
    for i in a:
        heapq.heappush(heap, i)
    
    for i in range(len(a)):
        a[i] = heapq.heappop(heap)
        
a = [10, 9, 5, 8, 3, 2, 4, 6, 7, 1]
heap_sort(a)
print(a)   

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
