힙 (Heaps)

# 힙(Heap) 이란?
 - 이진 트리의 한 종류 (이진 힙 - binary heap)
1. 루트 (root) 노드가 언제나 최댓값 또는 최솟값을 가짐
 - 최대 힙 (max heap), 최소 힙 (min heap)
2. 완전 이진 트리여야 함

이진 탐색 트리와의 비교
1. 원소들은 완전히 크기 순으로 정렬되어 있는가?
2. 특정 키 값을 가지는 원소를 빠르게 검색할 수 있는가?
3. 부가의 제약 조건은 어떤 것인가?

최대 힙(Max Heap)의 추상적 자료구조

연산의 정의
 - __init__() - 빈 최대 힙을 생성
 - insert(item) - 새로운 원소를 삽입
 - remove() - 최대 원소 (root node)를 반환 (그리고 동시에 이 노드를 삭제)

# 데이터 표현의 설계
배열을 이용한 이진 트리의 표현
노드 번호 m을 기준으로
 - 왼쪽 자식의 번호: 2 * m
 - 오른쪽 자식의 번호: 2 * m + 1
 - 부모 노드의 번호: m // 2
완전 이진 트리이므로
 - 노드의 추가/삭제는 마지막 노드에서만



# 최대 힙에 원소 삽입
1. 트리의 마지막 자리에 새로운 원소리를 임시로 저장
2. 부모 노드와 키값을 비교하여 위로, 위로, 이동

# 최대 힙에 원소 삽입 - 복잡도
- 원소의 개수가 n인 최대 힙에 새로운 원소 삽입
 -> 부모 노드와의 대소 비교 최대 회수: log_2(n)
 -> 최악 복잡도 O(log(n))복잡도 연산

# 삽입 연산의 구현 - insert(item) 메서드
class MaxHeap:
    def insert(self, item):
        ...

힌트: pythonn에서 두 변수의 값 바꾸기
a = 3; b = 5
a,b = b,a

# 최대 힙에서 원소의 삭제
1. 루트 노드의 제거 - 이것이 원소들 중 최댓값
2. 트리 마지막 자리 노드를 임시로 루트 노드의 자리에 배치
3. 자식 노드들과의 값 비교로 아래로, 아래로 이동
 - 자식은 둘 있을 수도 있는데, 어느 쪽으로 이동?
 - 더 큰 키 값을 가지는 쪽으로!

# 최대 힙으로부터 원소 삭제 - 복잡도
원소의 개수가 n인 최대 힙에서 최대 원소 삭제
 -> 자식 노드들과의 대소 비교 최대 회수: 2 x log_2(n)
 -> 최악 복잡도 O(log(n))의 삭제 연산

In [None]:
class MaxHeap:

    def __init__(self):
        self.data = [None]


    def insert(self, item):
        self.data.append(item)
        m = self.data.index(item)
        
        while m > 1:
            if self.data[m//2] < self.data[m]:
                self.data[m//2], self.data[m] = self.data[m], self.data[m//2]
                m = m // 2
            else:
                break
                
                
    def remove(self):
        if len(self.data) > 1:
            self.data[1], self.data[-1] = self.data[-1], self.data[1]
            data = self.data.pop(-1)
            self.maxHeapify(1)
        else:
            data = None
        return data


    def maxHeapify(self, i):
        # 왼쪽 자식 (left child) 의 인덱스를 계산합니다.
        left = 2 * i

        # 오른쪽 자식 (right child) 의 인덱스를 계산합니다.
        right = 2 * i + 1

        smallest = i
        # 왼쪽 자식이 존재하는지, 그리고 왼쪽 자식의 (키) 값이 (무엇보다?) 더 큰지를 판단합니다.
        if left < len(self.data) and self.data[left] > self.data[smallest]:
            # 조건이 만족하는 경우, smallest 는 왼쪽 자식의 인덱스를 가집니다.
            smallest = left

        # 오른쪽 자식이 존재하는지, 그리고 오른쪽 자식의 (키) 값이 (무엇보다?) 더 큰지를 판단합니다.
        if right < len(self.data) and self.data[right] > self.data[smallest]:
            # 조건이 만족하는 경우, smallest 는 오른쪽 자식의 인덱스를 가집니다.
            smallest = right
        if smallest != i:
            # 현재 노드 (인덱스 i) 와 최댓값 노드 (왼쪽 아니면 오른쪽 자식) 를 교체합니다.
            self.data[i], self.data[smallest] = self.data[smallest], self.data[i]
            # 재귀적 호출을 이용하여 최대 힙의 성질을 만족할 때까지 트리를 정리합니다.
            self.maxHeapify(smallest)

# 최대/최소 힙의 응용
1. 우선 순위 큐 (priority queue)
 - Enqueue할 때 "느슨한 정렬"을 이루고 있도록 함: O(log(n))
 - Dequeue할 때 최댓값을 순서대로 추출: O(log(n))
 - 제 16강에서의 양방향 연결 리스트 이용 구현과 효율성 비교
2 힙 정렬 (heap sort)
 - 정렬되지 않은 원소들을 아무 순서로나 최대 힙에 삽입
 - 삽입이 끝나면, 힙이 비게 될 때까지 하나씩 삭제
 - 원소들이 삭제된 순서가 원소들의 정렬 순서
 - 정렬 알고리즘의 복잡도