# Heap

우선순위가 높은 요소를 먼저 처리할 수 있도록 구성된 자료구조. 트리 기반 구현체로 최소 힙과 최대 힙으로 나뉜다.
- K 번쨰 수 탐색
- 최소 비용/최대 이익 
- 우선순위 기반 스케줄링

```py
import heapq
```

| 함수 | 설명 |
| :-: | :-: |
| heapq.heappush(heap, item) | 힙에 item 추가 |
| heapq.heappop(heap, item) | 가장 작은 값 꺼내기 |
| heapq.heapify(list) | 리스트를 힙으로 변환 |
| heapq.heappushpop(heap, item) | item 추가 후 가장 작은 값 제거 |
| heapq.heapreplace(heap, item) | 가장 작은 값 제거 후 item 추가 |
| heapq.nsmallest(k, list, key=None) | list를 key로 정렬하여 최소 k개 리스트 |
| heapq.nlargest(k, list, key=None) | list를 key로 정렬하여 최대 k개 리스트 |


In [None]:
# K번 째 수 탐색
import heapq

N = 3
datas = [7, 1, 4, 5, 2]

heap = []
for num in datas:
  if len(heap) < N:
    heapq.heappush(heap, num)
  else:
    if num > heap[0]:
      heapq.heappushpop(heap, num)

print(heap[0])


4


In [2]:
# 최소 비용 / 최대 이익
import heapq

edges = [(1, 'A'), (3, 'B'), (2, 'C')]
heapq.heapify(edges)

while edges:
  cost, node = heapq.heappop(edges)
  print(f"{node} 선택, 비용: {cost}")

A 선택, 비용: 1
C 선택, 비용: 2
B 선택, 비용: 3


In [3]:
# 우선순위 기반 스케줄링
import heapq

tasks = [
  (3, "Write report"),
  (1, "Fix bug"),
  (2, "Attend meeting")
]

heapq.heapify(tasks)

while tasks:
  priority, task = heapq.heappop(tasks)
  print(f"처리: {task} (우선순위 {priority})")

처리: Fix bug (우선순위 1)
처리: Attend meeting (우선순위 2)
처리: Write report (우선순위 3)


In [29]:
import heapq

class MedianStream:
  def __init__(self):
    self._max_heap = [] # 중앙값보다 작은 값들을 저장
    self._min_heap = [] # 중앙값보다 큰 값들을 저장

  def add(self, num: int) -> None:
    # Step 1: 최대 힙에 삽입 (음수로)
    heapq.heappush(self._max_heap, -num)

    # Step 2: 최대 힙에서 최댓값 꺼내 최소 힙에 넣기 (값 균형 조정)
    # 해당 과정을 통해 max_heap에는 작은값들이, min_heap에는 큰 값들이 저장
    max_top = -heapq.heappop(self._max_heap)
    heapq.heappush(self._min_heap, max_top)

    # Step 3: 힙 크기 유지 (최대 힙이 항상 크거나 같도록)
    # 중앙값은 max_heap에서 추출
    if len(self._max_heap) < len(self._min_heap):
      min_top = heapq.heappop(self._min_heap)
      heapq.heappush(self._max_heap, -min_top)

  def median(self) -> float:
    if len(self._max_heap) > len(self._min_heap):
      return -self._max_heap[0]
    else:
      return (-self._max_heap[0] + self._min_heap[0]) // 2
  
stream = MedianStream()
for num in [1, 5, 2, 10, 6]:
    stream.add(num)
    print("중앙값:", stream.median())


중앙값: 1
중앙값: 3
중앙값: 2
중앙값: 3
중앙값: 5
