<span style='font-size:20pt'> 데이터 구조 : 힙의 파이썬 구현 </span>

Maxheap 은 Max만, Min heap은 Min만 추출가능

# 데이터 삽입 및 삭제 규칙

## 기본 데이터 삽입 단계

1) 데이터가 부모 노드보다 크든 작든 신경쓰지 않고 좌측부터 채워준다.

2) 채운 이후 크기에 따른 정렬을 위해 

    채워넣은 노드가 부모 노드보다 큰지를 확인한다. => 크면 부모 노드와 위치를 바꾼다. => 언제까지? 마지막 바꾼 노드가 루트노드 or 부모가 더 큰 경우에 멈춘다.

![image.png](attachment:image.png)

## 힙의 데이터 삭제하기(Max Heap) : 힙에서 삭제란 Max or Min 데이터 끄집어내는 것

+ 최댓값은 root node에 있으므로 root node를 꺼내는 작업을 수행.

    - root node를 비우면 안되므로 나머지 데이터 중 root node로 올릴 데이터를 선정 
    
    
        -> 가장 마지막에 들어갔던 데이터를 root node로 올린다. 마지막 데이터란 가장 최우측 하단에 있는 데이터를 말함.
        
        -> 부모 노드(root node)가 자식 노드보다 작으면 root node를 기준으로 자식 노드와 비교하여 자식 노드(왼쪽과 오른쪽) 중 더 큰 값과 바꾼다. ==> 자식 노드로 내려간 root node와 또 그 자식 노드와 비교하여 반복.

# 힙의 구현

<b>힙은 배열로 표현을 한다.</b>

왜냐하면 <b>완전 이진 트리의 형태를 가지기 때문이다.</b> 

노드의 번호를 index로 표현하면 된다.


+ 배열은 인덱스가 0번부터 시작하지만, 힙 구현의 편의를 위해 0번 데이터 공간은 비워두고 1번부터 쌓도록 한다. 따라서 root node index num은 1

    + 부모 노드 인덱스 번호(parent node's index) = {자식 노드 인덱스 번호(child node's index) // 2} (// : 몫)
    
    + 왼쪽 자식 노드 인덱스 번호(left child node's index) = {(부모 노드 인덱스 번호) * 2}
    
    + 오른쪽 자식 노드 인덱스 번호(right child node's index) = {(부모 노드 인덱스 번호) * 2} + 1
    

+ 따라서 index번호를 알면 부모, 왼쪽 자식, 오른쪽 자식 노드 번호를 알 수 있다.

![image.png](attachment:image.png)

## 힙 클래스 구현

In [2]:
class Heap:
    def __init__(self, data):
        self.heap_array = list() #python에서 배열은 list로 한다.
        self.heap_array.append(None) #0번 index을 비워놓고 1부터 index를 설정하기 위해
        self.heap_array.append(data) #초기 데이터 1번 index에 넣음.

In [4]:
heap = Heap(1)
heap.heap_array

[None, 1]

## insert 구현

In [6]:
class Heap:
    def __init__(self, data):
        self.heap_array = list() #python에서 배열은 list로 한다.
        self.heap_array.append(None) #0번 index을 비워놓고 1부터 index를 설정하기 위해
        self.heap_array.append(data) #초기 데이터 1번 index에 넣음.
    
    #삽입 이후 큰 데이터를 위로 올리는 조정작업 시 필요한 method
    #위로 올려야 하는지 판단하는 역할을 함.
    def move_up(self, inserted_idx):
        if inserted_idx <= 1: #이 노드가 루트 노드인 경우
            return False
        
        #비교할 부모 노드 index 계산
        parent_idx = inserted_idx // 2
        if self.heap_array[inserted_idx] > self.heap_array[parent_idx]: #위치를 바꿔야하는 경우에는
            return True
        else:
            return False
            
        
    def insert(self, data):
        #일종의 방어코드, 초기화
        #배열 길이가 0인경우
        if len(self.heap_array) == 0:
            self.heap_array.append(None)
            self.heap_array.append(data)
            return True
        
        #배열 길이가 0이 아닌경우
        self.heap_array.append(data) #그저 append만 해도 insert 규칙을 따르게 된다!! 신기하넹
        
        
        #이제 큰 데이터를 위로 올리는 조정 작업 
        
        #삽입한 data의 index 번호를 알아낸다.
        inserted_idx = len(self.heap_array) - 1 #len은 0번째 index data까지 포함하므로 -1 해줘야 함.
        
        #바꿔줘야 하는 경우
        while self.move_up(inserted_idx):
            parent_idx = inserted_idx // 2
            #inserted_index 노드와 부모 노드를 바꿔주는 구문!! 즉, 스왑한 것. 이렇게도 작성해도 된다!!
            self.heap_array[inserted_idx], self.heap_array[parent_idx] = self.heap_array[parent_idx],self.heap_array[inserted_idx]
            #이제 하나 더 위 상단 노드와 비교하기 위해 변수 재지정
            inserted_idx = parent_idx
        
        return True
        

## Insert Test

In [8]:
heap = Heap(15)
heap.insert(10)
heap.insert(8)
heap.insert(5)
heap.insert(4)
heap.insert(20)
heap.heap_array


[None, 20, 10, 15, 5, 4, 8]

## Heap에서 삭제의 구현 : Max Heap 에서 Max 값 추출

In [10]:
class Heap:
    def __init__(self, data):
        self.heap_array = list() #python에서 배열은 list로 한다.
        self.heap_array.append(None) #0번 index을 비워놓고 1부터 index를 설정하기 위해
        self.heap_array.append(data) #초기 데이터 1번 index에 넣음.
    
    #heap에서 삭제 구현시 필요
    def move_down(self, popped_idx):
        #자식노드와 비교해야하므로 자식 노드 index 계산
        left_child_popped_idx = popped_idx * 2
        right_child_popped_idx = popped_idx * 2 + 1
        
        #Case 1 : 왼쪽 자식 노드도 없을 때 (그러면 당연히 오른쪽 자식 노드도 없다)
        if left_child_popped_idx >= len(self.heap_array): #존재하는 array의 길이보다 큰 값은 없다는 뜻이므로
            return False #바꿀 수가 없다.
        
        #Case 2 : 오른쪽 자식 노드 만 없을 때 (왼쪽은 있을 수 있음)
        elif right_child_popped_idx >= len(self.heap_array):
            if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]: #자식이 더 크다
                return True
            else:
                return False
        
        #Case 3 : 왼쪽, 오른쪽 자식 모두 있을 때
        else:
            #왼쪽 자식 노드가 오른쪽 자식 노드보다 더 클 때(왼쪽과 부모를 비교해야하니까)
            if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_popped_idx]:
                #왼쪽 자식 노드와 부모 노드를 비교했는데 자식이 더 큰 경우에는 바꿔줘야한다.
                if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                    return True
                else:
                    return False
            #오른쪽이 더 크면
            else:
                #부모 노드랑 오른쪽 노드를 비교한다.
                if self.heap_array[right_child_popped_idx] > self.heap_array[popped_idx]:
                    return True
                else:
                    return False
        
        
        
    def pop(self):
        if len(self.heap_array) <= 1:
            return None
        
        #Max data 설정
        returned_data = self.heap_array[1] #1번이 root이기 때문
        
        #Max data 추출 이후 남은 노드들 재정립
        
        #1)남은 노드들 중 가장 마지막에 추가된 노드를 root node로 올린다.
        self.heap_array[1] = self.heap_array[-1]
        del self.heap_array[-1] #맨 뒤의 데이터는 앞으로 옮겼으므로 삭제
        popped_idx = 1
        
    
        #2)root node와 그 자식 노드들과 크기 비교하여 바꿔줘야 하면 바꿔준다.
        while self.move_down(popped_idx): #rootnode를 자식노드와 바꿔줘야한다면
            
            #위에 move_down()에서 False를 return하는 경우를 빼고 나머지 상황을 판단해서 짜야하므로 true return case가져오기
            #자식노드와 비교해야하므로 자식 노드 index 계산
            left_child_popped_idx = popped_idx * 2
            right_child_popped_idx = popped_idx * 2 + 1
            

            #Case 2 : 오른쪽 자식 노드 만 없을 때 (왼쪽은 있을 수 있음)
            if right_child_popped_idx >= len(self.heap_array):
                if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]: #자식이 더 크다
                    #바꿔주자(Swap)
                    self.heap_array[popped_idx], self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx],self.heap_array[popped_idx] 
                    #index번호도 바꿔준다.
                    popped_idx = left_child_popped_idx
            
            #Case 3 : 왼쪽, 오른쪽 자식 모두 있을 때
            else:
                #왼쪽 자식 노드가 오른쪽 자식 노드보다 더 클 때(왼쪽과 부모를 비교해야하니까)
                if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_popped_idx]:
                    #왼쪽 자식 노드와 부모 노드를 비교했는데 자식이 더 큰 경우에는 바꿔줘야한다.
                    if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                        self.heap_array[popped_idx],self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx], self.heap_array[popped_idx]
                        popped_idx = left_child_popped_idx

                        
                #오른쪽이 더 크면
                else:
                    #부모 노드랑 오른쪽 노드를 비교한다.
                    if self.heap_array[popped_idx] < self.heap_array[right_child_popped_idx]:
                        self.heap_array[popped_idx],self.heap_array[right_child_popped_idx] = self.heap_array[right_child_popped_idx], self.heap_array[popped_idx]
                        popped_idx = right_child_popped_idx

        
      
        return returned_data
            

# 전체 코드 정리

In [11]:
class Heap:
    def __init__(self, data):
        self.heap_array = list() #python에서 배열은 list로 한다.
        self.heap_array.append(None) #0번 index을 비워놓고 1부터 index를 설정하기 위해
        self.heap_array.append(data) #초기 데이터 1번 index에 넣음.
    
    #삽입 이후 큰 데이터를 위로 올리는 조정작업 시 필요한 method
    #위로 올려야 하는지 판단하는 역할을 함.
    def move_up(self, inserted_idx):
        if inserted_idx <= 1: #이 노드가 루트 노드인 경우
            return False
        
        #비교할 부모 노드 index 계산
        parent_idx = inserted_idx // 2
        if self.heap_array[inserted_idx] > self.heap_array[parent_idx]: #위치를 바꿔야하는 경우에는
            return True
        else:
            return False
            
        
    def insert(self, data):
        #일종의 방어코드, 초기화
        #배열 길이가 0인경우
        if len(self.heap_array) == 0:
            self.heap_array.append(None)
            self.heap_array.append(data)
            return True
        
        #배열 길이가 0이 아닌경우
        self.heap_array.append(data) #그저 append만 해도 insert 규칙을 따르게 된다!! 신기하넹
        
        
        #이제 큰 데이터를 위로 올리는 조정 작업 
        
        #삽입한 data의 index 번호를 알아낸다.
        inserted_idx = len(self.heap_array) - 1 #len은 0번째 index data까지 포함하므로 -1 해줘야 함.
        
        #바꿔줘야 하는 경우
        while self.move_up(inserted_idx):
            parent_idx = inserted_idx // 2
            #inserted_index 노드와 부모 노드를 바꿔주는 구문!! 즉, 스왑한 것. 이렇게도 작성해도 된다!!
            self.heap_array[inserted_idx], self.heap_array[parent_idx] = self.heap_array[parent_idx],self.heap_array[inserted_idx]
            #이제 하나 더 위 상단 노드와 비교하기 위해 변수 재지정
            inserted_idx = parent_idx
        
        return True
    
    
    ## 삭제 코드 구현 !!(Max data 추출)
    
    #heap에서 삭제 구현시 필요
    def move_down(self, popped_idx):
        #자식노드와 비교해야하므로 자식 노드 index 계산
        left_child_popped_idx = popped_idx * 2
        right_child_popped_idx = popped_idx * 2 + 1
        
        #Case 1 : 왼쪽 자식 노드도 없을 때 (그러면 당연히 오른쪽 자식 노드도 없다)
        if left_child_popped_idx >= len(self.heap_array): #존재하는 array의 길이보다 큰 값은 없다는 뜻이므로
            return False #바꿀 수가 없다.
        
        #Case 2 : 오른쪽 자식 노드 만 없을 때 (왼쪽은 있을 수 있음)
        elif right_child_popped_idx >= len(self.heap_array):
            if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]: #자식이 더 크다
                return True
            else:
                return False
        
        #Case 3 : 왼쪽, 오른쪽 자식 모두 있을 때
        else:
            #왼쪽 자식 노드가 오른쪽 자식 노드보다 더 클 때(왼쪽과 부모를 비교해야하니까)
            if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_popped_idx]:
                #왼쪽 자식 노드와 부모 노드를 비교했는데 자식이 더 큰 경우에는 바꿔줘야한다.
                if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                    return True
                else:
                    return False
            #오른쪽이 더 크면
            else:
                #부모 노드랑 오른쪽 노드를 비교한다.
                if self.heap_array[right_child_popped_idx] > self.heap_array[popped_idx]:
                    return True
                else:
                    return False
        
        
        
    def pop(self):
        if len(self.heap_array) <= 1:
            return None
        
        #Max data 설정
        returned_data = self.heap_array[1] #1번이 root이기 때문
        
        #Max data 추출 이후 남은 노드들 재정립
        
        #1)남은 노드들 중 가장 마지막에 추가된 노드를 root node로 올린다.
        self.heap_array[1] = self.heap_array[-1]
        del self.heap_array[-1] #맨 뒤의 데이터는 앞으로 옮겼으므로 삭제
        popped_idx = 1
        
    
        #2)root node와 그 자식 노드들과 크기 비교하여 바꿔줘야 하면 바꿔준다.
        while self.move_down(popped_idx): #rootnode를 자식노드와 바꿔줘야한다면
            
            #위에 move_down()에서 False를 return하는 경우를 빼고 나머지 상황을 판단해서 짜야하므로 true return case가져오기
            #자식노드와 비교해야하므로 자식 노드 index 계산
            left_child_popped_idx = popped_idx * 2
            right_child_popped_idx = popped_idx * 2 + 1
            

            #Case 2 : 오른쪽 자식 노드 만 없을 때 (왼쪽은 있을 수 있음)
            if right_child_popped_idx >= len(self.heap_array):
                if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]: #자식이 더 크다
                    #바꿔주자(Swap)
                    self.heap_array[popped_idx], self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx],self.heap_array[popped_idx] 
                    #index번호도 바꿔준다.
                    popped_idx = left_child_popped_idx
            
            #Case 3 : 왼쪽, 오른쪽 자식 모두 있을 때
            else:
                #왼쪽 자식 노드가 오른쪽 자식 노드보다 더 클 때(왼쪽과 부모를 비교해야하니까)
                if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_popped_idx]:
                    #왼쪽 자식 노드와 부모 노드를 비교했는데 자식이 더 큰 경우에는 바꿔줘야한다.
                    if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                        self.heap_array[popped_idx],self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx], self.heap_array[popped_idx]
                        popped_idx = left_child_popped_idx

                        
                #오른쪽이 더 크면
                else:
                    #부모 노드랑 오른쪽 노드를 비교한다.
                    if self.heap_array[popped_idx] < self.heap_array[right_child_popped_idx]:
                        self.heap_array[popped_idx],self.heap_array[right_child_popped_idx] = self.heap_array[right_child_popped_idx], self.heap_array[popped_idx]
                        popped_idx = right_child_popped_idx

        
      
        return returned_data
            
        

In [14]:
heap = Heap(15)
heap.insert(10)
heap.insert(8)
heap.insert(5)
heap.insert(4)
heap.insert(20)
heap.heap_array



[None, 20, 10, 15, 5, 4, 8]

In [15]:
heap.pop() # max값인 20이 나왔다. pop함수가 self만 매개로했기에 아무것도 안해도 됨.

20

In [16]:
heap.heap_array #나머지 값들도 잘 재정립 되어있다.

[None, 15, 10, 8, 5, 4]

# Heap의 시간 복잡도

+ depth를 트리의 높이 h라고 한다면,

+ n개의 노드를 가지는 heap에 데이터 삽입 또는 삭제시, 비교를 몇번 하는가?

    + 최악의 경우 root 에서 leaf까지 비교해야 하므로 h = $\log _{2}n$ 에 가까우므로 시간 복잡도는 O(logn)
    
    + 한번 실행시마다, 50%의 실행할 수도 있는 명령을 제거하기에 실행시간을 50% 단축시킬 수 있음