### 힙 : 데이터에서 최대값과 최소값을 빠르게 찾기 위해 고안된 완전 이진 트리

- 완전 이진 트리 : 노드를 삽입할 때 최하단 왼쪽 노드부터 차례대로 삽입
- 힙 사용시 최대 최소 값을 찾으면 O(logn)이 걸림 *배열은 O(n)
- 우선순위 큐와 같이 최대값 또는 최소값을 빠르게 찾아야 하는 자료구조에서 사용

### 힙 (Heap)의 구조

- 최대값을 구하기 위한 구조 : Max 힙 ,최대 힙
- 최소값을 구하기 위한 구조 : Min 힙 ,최소 힙
- 각 노드의 값은 해당 노드의 자식 노드가 가진 값보다 크거나 같다 (최대 힙)
- 각 노드의 값은 해당 노드의 자식 노드가 가진 값보다 작거나 같다 (최소 힙)


### 힙과 이진 탐색 트리의 공통점과 차이점
- 공통점 : 힙과 이진 탐색 트리는 모두 이진 트리이다
- 차이점 : 
- 이진 탐색 트리는 왼쪽 자식 노드의 값이 가장 작음 - 부모노드 - 오른쪽 자식 순
- 힙은 이진 탐색 트리의 조건인 자식 노드에서 작은 값은 왼쪽 , 큰 값은 오른쪽 조건 x 


-이진 탐색 트리는 탐색, 힙은 최대/최소값 검색을 위한 구조


In [4]:
%autosave 10

Autosaving every 10 seconds


### 힙과 배열
- 일반적으로 힙 구현 시 배열 자료구조를 활용
- 배열은 인덱스 0번부터지만 힙 구현을 위해서 root 노드 인덱스 번호를 1로 지정
- 부모 노드 인덱스 번호  = 자식 노드 인덱스 번호 // 2
- 왼쪽   자식 노드 인덱스 번호 = 부모 노드 인덱스 번호 *2 
- 오른쪽 자식 노드 인덱스 번호 = 부모 노드 인덱스 번호 *2 + 1

In [33]:
#이진 트리를 배열로 저장 
class Heap:
    def __init__(self,data):
        self.heap_array = list()
        self.heap_array.append(None) #첫 데이터를 인덱스 1로 설정 (인덱스 0 = None)
        self.heap_array.append(data)
    def move_up(self,inserted_idx): # 교체가 일어나야 하는지 판단하는 메서드
        if inserted_idx <=1:
            return False # 인덱스가 헤더 일시는 교체 x
        parent_idx = inserted_idx//2
        if self.heap_array[inserted_idx]>self.heap_array[parent_idx]:
            return True
        else:
            return False 
        # 부모 노드가 더 커질때 까지 반복해서 바꿔줌
    
    #힙에 데이터 삽입
    def insert(self,data):
        if len(self.heap_array) == 0: #초기화
            self.heap_array.append(None)
            self.heap_array.append(data)
            return True
        self.heap_array.append(data)
        
        inserted_idx = len(self.heap_array) - 1
        while self.move_up(inserted_idx):
            parent_idx = inserted_idx //2 #현재 노드의 부모 노드 인덱스
            self.heap_array[inserted_idx], self.heap_array[parent_idx] = self.heap_array[parent_idx],self.heap_array[inserted_idx] #swqp
            
            inserted_idx = parent_idx #부모 위치로 이동
            
        return True
    
    #힙의 데이터 삭제 (최상의 노드 삭제)
    
    def move_down(self,popped_idx):
        left_child_popped_idx = popped_idx * 2 #왼쪽 자식 노드 검색
        right_child_poped_idx = popped_idx * 2 + 1 #오른쪽 자식 노드 검색
        
        #case1 : 왼쪽 + 오른쪽 자식 노드가 없을 때
        if left_child_popped_idx >= len(self.heap_array):
            #왼쪽 인덱스 번호가 최종 인덱스보다 높으면 없다고 간주
            #왼쪽이 인덱스가 없다면 오른쪽 인덱스도 없음 : 힙의 특징 
            return False 
        #case2 : 오른쪽 자식 노드만 없을 때
        elif right_child_poped_idx >= len(self.heap_array):
            if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                #자식 노드가 더 큼 -> 변경
                return True
            else:
                return False
        #case3 : 왼쪽 , 오른쪽 자식 노드 모두 있을 때
        else:
            if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_poped_idx]:
                #왼쪽이 더 큰 경우:  왼쪽과 부모를 비교
                if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                    return True
                else:
                    return False
            else:
                #오른쪽이 더 큰 경우 : 오른쪽과 부모를 비교
                if self.heap_array[popped_idx] < self.heap_array[right_child_poped_idx]:
                    return True
                else:
                    return False
    def pop(self):
        if len(self.heap_array)<=1:
            return None
        
        returned_data = self.heap_array[1] #1번이 첫번째 데이터
        #별도 삭제는 필요 없음  - 새로운 헤드로 덮어쓰기 때문
        self.heap_array[1] = self.heap_array[-1] #마지막 데이터를 헤더로 이동
        del self.heap_array[-1]
        popped_idx = 1
        
        while self.move_down(popped_idx):
            left_child_popped_idx = popped_idx * 2 #왼쪽 자식 노드 검색
            right_child_poped_idx = popped_idx * 2 + 1 #오른쪽 자식 노드 검색
            #case1 : 왼쪽 + 오른쪽 자식 노드가 없을 때
            # -> 고려 x 
            
            #case2 : 오른쪽 자식 노드만 없을 때
            if right_child_poped_idx >= len(self.heap_array):
                if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                    #자식 노드가 더 큼 -> 변경
                    self.heap_array[popped_idx] , self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx],self.heap_array[popped_idx] 
                    # 왼쪽과 부모를  swap
                    popped_idx = left_child_popped_idx
                    
            #case3 : 왼쪽 , 오른쪽 자식 노드 모두 있을 때
            else:
                if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_poped_idx]:
                    #왼쪽이 더 큰 경우:  왼쪽과 부모를 비교
                    if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                        self.heap_array[popped_idx] , self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx],self.heap_array[popped_idx] 
                        # 왼쪽과 부모를  swap
                        popped_idx = left_child_popped_idx
                else:
                    #오른쪽이 더 큰 경우 : 오른쪽과 부모를 비교
                    if self.heap_array[popped_idx] < self.heap_array[right_child_poped_idx]:
                        self.heap_array[popped_idx] , self.heap_array[right_child_poped_idx] = self.heap_array[right_child_poped_idx],self.heap_array[popped_idx] 
                        # 오른쪽과 부모를  swap
                        popped_idx = right_child_poped_idx
                            
        return returned_data
    

In [34]:
heap = Heap(1)
heap.heap_array

[None, 1]

In [35]:
heap = Heap(15)
heap.insert(10)
heap.insert(8)
heap.insert(5)
heap.insert(4)
# 큰 수 입력 
heap.insert(20)
heap.heap_array

[None, 20, 10, 15, 5, 4, 8]

In [36]:
heap.pop()

20

In [37]:
heap.heap_array

[None, 15, 10, 8, 5, 4]

In [38]:
heap.pop()

15

In [39]:
heap.pop()

10

In [40]:
heap.heap_array

[None, 8, 5, 4]

### 힙 시간 복잡도
- 최악의 경우 루트 노드에서 leaf 노드까지 비교해야 하므로 h = log2n에 가까움 O(logn)
- 한번 실행마다 50%의 실행 할 수 있는 명령을 제거함