<a href="https://colab.research.google.com/github/Jwavely/Data-Structure/blob/main/Data_Structure_heap.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **힙 (heap)**

## **힙 구현하기**


<img src = "https://drive.google.com/uc?id=1qtXP_5ZOOP5n_Sw0iFH7F9WecKd3PGl1" height = 500 width = 700>

## **heapify 구현**

In [1]:
def swap(tree, index_1, index_2):
    """완전 이진 트리의 노드 index_1과 노드 index_2의 위치를 바꿔준다"""
    temp = tree[index_1]
    tree[index_1] = tree[index_2]
    tree[index_2] = temp


def heapify(tree, index, tree_size):
    """heapify 함수"""

    # 왼쪽 자식 노드의 인덱스와 오른쪽 자식 노드의 인덱스를 계산
    left_child_index = 2 * index
    right_child_index = 2 * index + 1
    
    max_index = index
    if 0 < left_child_index < tree_size and tree[max_index] < tree[left_child_index]:
        max_index = left_child_index

    # 오른쪽 자식 노드의 값과 비교
    if 0 < right_child_index < tree_size and tree[max_index] < tree[right_child_index]:
        max_index = right_child_index

    if max_index != index:
        swap(tree, index, max_index)
        heapify(tree, max_index, tree_size)

In [2]:
# 실행 코드
tree = [None, 15, 5, 12, 14, 9, 10, 6, 2, 11, 1]  # heapify하려고 하는 완전 이진 트리
heapify(tree, 2, len(tree))  # 노드 2에 heapify 호출
print(tree) 

[None, 15, 14, 12, 11, 9, 10, 6, 2, 5, 1]


## **힙 정렬 구현하기**

어떤 리스트 하나가 있다고 합시다. 이때 그 리스트를 힙 정렬하려면



1.   먼저 리스트를 힙으로 만듭니다.
2.   root 노드와 마지막 노드의 위치를 바꿉니다. 마지막 위치로 간 기존의 root 노드는 이제 힙에서 없다고 가정합니다.
3.   새로운 root 노드가 힙 속성을 지킬 수 있게 heapify합니다.
4.   힙에 남아있는 노드가 없도록 단계 2 ~ 3을 반복합니다.

힙 정렬을 하기위해 heapsort라는 함수를 구현해볼게요. heapsort 함수는 정렬할 리스트를 tree라는 파라미터로 받아서 힙 정렬합니다. 이때 저번 과제에서 완성한 heapify 함수를 사용할게요.



In [14]:
def swap(tree, index_1, index_2):
    """완전 이진 트리의 노드 index_1과 노드 index_2의 위치를 바꿔준다"""
    temp = tree[index_1]
    tree[index_1] = tree[index_2]
    tree[index_2] = temp


def heapify(tree, index, tree_size):
    """heapify 함수"""

    # 왼쪽 자식 노드의 인덱스와 오른쪽 자식 노드의 인덱스를 계산
    left_child_index = 2 * index
    right_child_index = 2 * index + 1

    largest = index  # 일단 부모 노드의 값이 가장 크다고 설정

    # 왼쪽 자식 노드의 값과 비교
    if 0 < left_child_index < tree_size and tree[largest] < tree[left_child_index]:
        largest = left_child_index

    # 오른쪽 자식 노드의 값과 비교
    if 0 < right_child_index < tree_size and tree[largest] < tree[right_child_index]:
        largest = right_child_index
    
    if largest != index: # 부모 노드의 값이 자식 노드의 값보다 작으면
        swap(tree, index, largest)  # 부모 노드와 최댓값을 가진 자식 노드의 위치를 바꿔준다
        heapify(tree, largest, tree_size)  # 자리가 바뀌어 자식 노드가 된 기존의 부모 노드를대상으로 또 heapify 함수를 호출한다

def heapsort(tree):
    """힙 정렬 함수"""
    tree_size = len(tree)

    for index in range(tree_size-1,0,-1):
        heapify(tree, index, tree_size)
    
    for i in range(tree_size-1,1,-1):
        swap(tree, 1,i)
        heapify(tree,1, i)


In [15]:
# 실행 코드
data_to_sort = [None, 6, 1, 4, 7, 10, 3, 8, 5, 1, 5, 7, 4, 2, 1]
heapsort(data_to_sort)
print(data_to_sort)

[None, 1, 1, 1, 2, 3, 4, 4, 5, 5, 6, 7, 7, 8, 10]


## **힙 데이터 삽입 구현하기**

이번 과제에서는 힙에 데이터를 삽입하는 것을 구현해볼게요.

먼저 우선순위 큐를 PriorityQueue라는 클래스로 정의하고 그 안에 힙을 두겠습니다. 
PriorityQueue 클래스에는 heap이라는 인스턴스 변수가 있고, 그것은 파이썬의 리스트를 가리킵니다. 가장 처음 heap에는 None이라는 원소 하나만 있는데요. 이제 이 힙에 데이터를 하나씩 삽입하려고 합니다.


힙에 데이터를 삽입하는 메소드의 이름은 insert입니다. insert 메소드는 데이터를 삽입할 때 리스트가 계속 힙의 속성을 유지하록 하는 기능도 포함해야 합니다.

insert 메소드로 데이터를 삽입할 때 이루어져야 하는 일을 순서대로 정리하면 아래의 3단계로 나눌 수 
있습니다.


1.   힙의 마지막 인덱스에 노드를 삽입합니다.
2.   (1)삽입한 노드와 그 부모 노드를 비교해서 부모 노드가 더 작으면 둘의 위치를 바꿉니다. (2) 삽입한 노드와 그 부모 노드를 비교해서 부모 노드가 더 크면 그대로 둡니다.
3.   2-1의 경우에는 삽입한 노드가 올바른 위치를 찾을 때까지 단계 2를 반복합니다.

이때 단계 2와 단계 3의 작업을 하는 별도의 함수 reverse_heapify를 정의할게요. 
reverse_heapify 함수는

리스트로 구현한 완전 이진 트리, tree
삽입된 노드의 인덱스, index
를 파라미터로 받습니다. 그리고 삽입된 노드를 힙 속성을 유지할 수 있는 위치로 이동시킵니다.

이전에 배운 heapify 함수가 위에 있는 노드를 아래로 이동시켜서 힙 속성을 유지했다면 reverse_heapify 함수는 아래에 있는 노드를 위로 이동시켜서 힙 속성을 유지하는 거죠.

reverse_heapify 함수만 완성되면 insert 메소드를 완성하는 건 간단합니다. 
insert  함수는


*   self
*   삽입하는 데이터, data

를 파라미터로 받는데요. insert 메소드는

(1) 리스트, heap의 마지막에 새로운 데이터를 삽입하고

(2) 그 마지막 인덱스를 reverse_heapify 함수에 파라미터로 넘겨서 호출하면 됩니다.

In [16]:
def swap(tree, index_1, index_2):
    """완전 이진 트리의 노드 index_1과 노드 index_2의 위치를 바꿔준다"""
    temp = tree[index_1]
    tree[index_1] = tree[index_2]
    tree[index_2] = temp


def reverse_heapify(tree, index):
    """삽입된 노드를 힙 속성을 지키는 위치로 이동시키는 함수"""
    parent_index = index // 2  # 삽입된 노드의 부모 노드의 인덱스 계산
    
    if 0< parent_index and tree[parent_index]<tree[index]:
        swap(tree, parent_index, index)
        reverse_heapify(tree, parent_index)

class PriorityQueue:
    """힙으로 구현한 우선순위 큐"""
    def __init__(self):
        self.heap = [None]  # 파이썬 리스트로 구현한 힙


    def insert(self, data):
        """삽입 메소드"""
        self.heap.append(data)
        reverse_heapify(self.heap, len(self.heap)-1)


    def __str__(self):
        return str(self.heap)


In [17]:
# 실행 코드
priority_queue = PriorityQueue()

priority_queue.insert(6)
priority_queue.insert(9)
priority_queue.insert(1)
priority_queue.insert(3)
priority_queue.insert(10)
priority_queue.insert(11)
priority_queue.insert(13)

print(priority_queue)

[None, 13, 9, 11, 3, 6, 1, 10]


## **힙 우선순위 데이터 추출 구현**

이번 과제에서는 힙에서 가장 우선순위가 높은 데이터를 추출하는 함수를 구현해볼게요. 
이전 영상에서 배운 데이터 추출의 과정을 정리해보면 아래의 4단계로 정리할 수 있습니다.

1. root 노드와 마지막 노드의 위치를 바꿉니다.
2. 마지막 위치로 간 원래 root 노드의 데이터를 별도 변수에 저장하고, 노드는 힙에서 지웁니다.
3. 새로운 root 노드를 대상으로 heapify해서 망가진 힙 속성을 복원합니다.
4. 2단계에서 따로 저장해 둔 최우선순위 데이터를 리턴합니다.

이렇게 나타낼 수 있었는데요.

이 기능을 PriorityQueue 클래스의 extract_max라는 메소드로 구현해볼게요.

extract_max 메소드는 파라미터로 self만 받고, heap에서 가장 우선 순위가 높은 데이터를 추출(지우면서 리턴)합니다.

이번 과제에서는 PriorityQueue 클래스를 제외한 나머지 코드는 heapify_code.py 파일에 옮겨 놨습니다. 실제 코드 작성은 main.py에서 하시면 됩니다!

In [20]:
def swap(tree, index_1, index_2):
    """완전 이진 트리의 노드 index_1과 노드 index_2의 위치를 바꿔준다"""
    temp = tree[index_1]
    tree[index_1] = tree[index_2]
    tree[index_2] = temp


def heapify(tree, index, tree_size):
    """heapify 함수"""

    # 왼쪽 자식 노드의 인덱스와 오른쪽 자식 노드의 인덱스를 계산
    left_child_index = 2 * index
    right_child_index = 2 * index + 1

    largest = index  # 일단 부모 노드의 값이 가장 크다고 설정

    # 왼쪽 자식 노드의 값과 비교
    if 0 < left_child_index < tree_size and tree[largest] < tree[left_child_index]:
        largest = left_child_index

    # 오른쪽 자식 노드의 값과 비교
    if 0 < right_child_index < tree_size and tree[largest] < tree[right_child_index]:
        largest = right_child_index
    
    if largest != index: # 부모 노드의 값이 자식 노드의 값보다 작으면
        swap(tree, index, largest)  # 부모 노드와 최댓값을 가진 자식 노드의 위치를 바꿔준다
        heapify(tree, largest, tree_size)  # 자리가 바뀌어 자식 노드가 된 기존의 부모 노드를대상으로 또 heapify 함수를 호출한다


def reverse_heapify(tree, index):
    """삽입된 노드를 힙 속성을 지키는 위치로 이동시키는 함수"""
    parent_index = index // 2  # 삽입된 노드의 부모 노드의 인덱스 계산

    # 부모 노드가 존재하고, 부모 노드의 값이 삽입된 노드의 값보다 작을 때
    if 0 < parent_index < len(tree) and tree[index] > tree[parent_index]:
        swap(tree, index, parent_index)  # 부모 노드와 삽입된 노드의 위치 교환
        reverse_heapify(tree, parent_index)  # 삽입된 노드를 대상으로 다시 reverse_heapify 호출



In [21]:
#from heapify_code import *

class PriorityQueue:
    """힙으로 구현한 우선순위 큐"""
    def __init__(self):
        self.heap = [None]  # 파이썬 리스트로 구현한 힙

    def insert(self, data):
        """삽입 메소드"""
        self.heap.append(data)  # 힙의 마지막에 데이터 추가
        reverse_heapify(self.heap, len(self.heap)-1) # 삽입된 노드(추가된 데이터)의 위치를 재배치

    def extract_max(self):
        """최우선순위 데이터 추출 메소드"""
        swap(self.heap, 1, len(self.heap)-1)
        last = self.heap.pop()
        heapify(self.heap, 1, len(self.heap))
        return last

    def __str__(self):
        return str(self.heap)


In [22]:
# 출력 코드
priority_queue = PriorityQueue()

priority_queue.insert(6)
priority_queue.insert(9)
priority_queue.insert(1)
priority_queue.insert(3)
priority_queue.insert(10)
priority_queue.insert(11)
priority_queue.insert(13)

print(priority_queue.extract_max())
print(priority_queue.extract_max())
print(priority_queue.extract_max())
print(priority_queue.extract_max())
print(priority_queue.extract_max())
print(priority_queue.extract_max())
print(priority_queue.extract_max())

13
11
10
9
6
3
1
