# Assignment 05

## 문제 3. Heap을 이용한 생일 상위 10명 출력

```python
import pandas as pd
from heap import Heap

df = pd.read_csv("DS_Birthdaydata - 시트1.csv")
df['생년월일'] = pd.to_datetime(df['생년월일'], errors='coerce')

heap_data = [
    (row['생년월일'].timestamp(), row['이름'])
    for _, row in df.iterrows()
    if pd.notna(row['생년월일'])
]

h = Heap()
for item in heap_data:
    h.insert(item)

for _ in range(min(10, h.size())):
    timestamp, name = h.deleteMax()
    birthday = pd.to_datetime(timestamp, unit='s').strftime('%Y-%m-%d')
    print(f"{name} - {birthday}")
```

```
출력값:
신수민 - 2005-12-30  
이서영 - 2005-12-25  
강민주 - 2005-12-14  
김민경 - 2005-12-02  
이서영 - 2005-11-12  
배시은 - 2005-11-02  
김여원 - 2005-10-31  
이서진 - 2005-10-28  
서홍빈 - 2005-10-24  
김예빈 - 2005-10-19  
```

## 문제 4. 같은 조 친구들만 이름과 생년월일을 출력하는 코드 작성

```python
import pandas as pd
from circularDoublyLinkedList import CircularDoublyLinkedList

df = pd.read_csv("DS_Birthdaydata - 시트1.csv")
df['생년월일'] = pd.to_datetime(df['생년월일8자리(예.20040101)'], format='%Y%m%d', errors='coerce')

team7 = ['강윤서', '윤여빈', '이예린', '김나영', '김명신', '김지우', '신수민', '이희서', '김지후']
filtered = df[df['이름'].isin(team7)]

lst = CircularDoublyLinkedList()
for _, row in filtered.iterrows():
    item = (row['이름'], row['생년월일'].strftime('%Y-%m-%d'))
    lst.append(item)

for name, birthday in lst:
    print(f"{name} - {birthday}")
```

```
강윤서 - 2004-11-08  
김나영 - 2005-10-05  
김명신 - 2005-10-02  
김지우 - 2004-07-22  
신수민 - 2005-12-30  
윤여빈 - 2003-02-06  
이예린 - 2004-03-16  
이희서 - 2004-04-15  
```

p.s. 김지후는 이름을 찾을 수 없다 (수강철회 예상)

## 문제 5. 교재 8장 우선순위 큐 연습문제 풀이

### 01.

**답:**  
맞다. 최대 힙(Max Heap)은 모든 부모 노드가 자식 노드보다 크거나 같도록 구성되므로, 가장 큰 원소는 항상 루트에 존재한다.

---

### 02.

**답:**  
아니다. A[n-1]은 단지 배열의 마지막 위치일 뿐이며, 가장 작은 값이 마지막에 있을 것이라는 보장은 없다.

---

### 03.

**답:**  
안 된다. 모든 내부 노드(0번부터 n//2 - 1번 인덱스까지)에 대해 스며내리기를 해야 전체 구조가 힙 조건을 만족한다.

---

### 04.

**답:**  
최악의 경우 루트에서 리프까지 내려가야 하므로, 시간 복잡도는 O(log n)이다.

---

### 05.

**답:**  
아니다. 루트 원소를 삭제한 뒤 마지막 원소를 루트로 올리고, 다시 스며내리기를 수행해야 하므로 O(log n)의 시간 복잡도를 가진다.

---

### 06.

**답:**  
비효율적이다. 하위 구조가 힙 상태가 아니므로 위에서 처리해도 다시 위배될 수 있다.  
책에서처럼 아래에서 위로 스며내리는 방식이 더 효율적이며, 시간 복잡도는 O(n)이다.  
루트부터 처리하면 O(n log n)이 된다.

---

### 07.

**답:**  
해당 노드에서 시작하여 부모 노드와 비교하며 위로 올라가는 스며올리기(percolateUp)를 수행하면 된다.  
부모보다 크면 값을 교환하고 루트까지 반복하며, 이 과정은 O(log n)의 시간 복잡도를 가진다.

## 문제 6. LeetCode 703. Kth Largest Element in Stream

```python
import heapq

class KthLargest:

    def __init__(self, k: int, nums: list[int]):
        self.k = k
        self.heap = nums
        heapq.heapify(self.heap)

        while len(self.heap) > k:
            heapq.heappop(self.heap)

    def add(self, val: int) -> int:
        heapq.heappush(self.heap, val)
        if len(self.heap) > self.k:
            heapq.heappop(self.heap)
        return self.heap[0]
```

```python
kth = KthLargest(3, [4, 5, 8, 2])
print(kth.add(3))  # 출력: 4
print(kth.add(5))  # 출력: 5
print(kth.add(10)) # 출력: 5
print(kth.add(9))  # 출력: 8
print(kth.add(4))  # 출력: 8
```
