## <힙을 이용해 생일이 느린 10명의 친구 출력>

In [None]:
import pandas as pd

df = pd.read_csv('birthday.csv')
df.columns = ['학번', '이름', '생년월일']
df = df.dropna(subset=['생년월일'])
df['생년월일'] = df['생년월일'].astype(int)

class Heap:
    def __init__(self, *args):
        self.__A = args[0] if args else []

    def insert(self, x):
        self.__A.append(x)
        self.__percolateUp(len(self.__A) - 1)

    def __percolateUp(self, i):
        parent = (i - 1) // 2
        if i > 0 and self.__A[i] > self.__A[parent]:
            self.__A[i], self.__A[parent] = self.__A[parent], self.__A[i]
            self.__percolateUp(parent)

    def deleteMax(self):
        if self.isEmpty(): return None
        max = self.__A[0]
        self.__A[0] = self.__A.pop()
        self.__percolateDown(0)
        return max

    def __percolateDown(self, i):
        child = 2 * i + 1
        right = 2 * i + 2
        if child <= len(self.__A) - 1:
            if right <= len(self.__A) - 1 and self.__A[child] < self.__A[right]:
                child = right
            if self.__A[i] < self.__A[child]:
                self.__A[i], self.__A[child] = self.__A[child], self.__A[i]
                self.__percolateDown(child)

    def isEmpty(self):
        return len(self.__A) == 0

    def size(self):
        return len(self.__A)

h = Heap()
for _, row in df.iterrows():
    h.insert((row['생년월일'], row['이름']))

top_10 = [h.deleteMax() for _ in range(min(10, h.size()))]

print("생일이 느린 순 Top 10:")
for birth, name in top_10:
    birth_str = str(birth)
    formatted = f"{birth_str[:4]}-{birth_str[4:6]}-{birth_str[6:]}"
    print(f"{name}: {formatted}")

In [None]:
# 실행 결과 예시
생일이 느린 순 Top 10:
홍서연: 2024-12-82
신수민: 2005-12-30
이서영: 2005-12-25
강민주: 2005-12-14
김민경: 2005-12-02
배시은: 2005-11-02
김예빈: 2005-10-19
최가온: 2005-10-08
김혜인: 2005-10-01
김채민: 2005-09-10

## <리스트를 이용해 같은 조의 친구 출력>

In [None]:
import pandas as pd

df = pd.read_csv("birthday.csv")
df.columns = ['학번', '이름', '생년월일']
df = df.dropna(subset=['생년월일'])
df['생년월일'] = df['생년월일'].astype(int)
df['학번'] = df['학번'].astype(str)

group_names = [
    "송민서", "안수민", "오예준", "진혜윤", "김채민", "김예빈", "신희영", "김선민",
    "김혜인", "김주하", "김민주", "최가온", "배시은", "강수아", "김서빈"
]

group_df = df[df['이름'].isin(group_names)][['이름', '생년월일']].drop_duplicates().reset_index(drop=True)

class Node:
    def __init__(self, data):
        self.data = data
        self.llink = None
        self.rlink = None

class CircularDoublyLinkedList:
    def __init__(self):
        self.head = None

    def insertLast(self, data):
        new_node = Node(data)
        if self.head is None:
            self.head = new_node
            new_node.rlink = new_node
            new_node.llink = new_node
        else:
            tail = self.head.llink
            tail.rlink = new_node
            new_node.llink = tail
            new_node.rlink = self.head
            self.head.llink = new_node

    def traverse(self):
        result = []
        if not self.head:
            return result
        current = self.head
        while True:
            name, birth = current.data
            birth_str = f"{birth // 10000:04d}-{(birth % 10000) // 100:02d}-{birth % 100:02d}"
            result.append(f"{name}: {birth_str}")
            current = current.rlink
            if current == self.head:
                break
        return result

cdll = CircularDoublyLinkedList()
for _, row in group_df.iterrows():
    cdll.insertLast((row['이름'], row['생년월일']))

for entry in cdll.traverse():
    print(entry)

In [None]:
# (예시 출력)
강수아: 2004-11-03
김민주: 2004-05-17
김민주: 2004-10-26
김서빈: 2004-06-28
김예빈: 2005-10-19
김주하: 2005-04-17
김채민: 2005-09-10
김혜인: 2005-10-01
배시은: 2005-11-02
송민서: 2004-11-08
신희영: 2005-01-26
안수민: 2003-06-03
오예준: 2005-07-12
최가온: 2005-10-08

## <교재 8장 우선 순위 큐 연습문제>


**1.**  
그럴 수 없다. 최대 힙은 모든 노드에 대해 ‘부모 노드의 값이 자식 노드의 값보다 크거나 같다.’가 성립해야 하므로 더 얕은 곳에 있는 원소가 더 깊은 곳에 있는 원소보다 항상 크거나 같아야 한다.  

**2.**  
아니다. 최대 힙에서 마지막 원소 A[n-1]이 항상 가장 작은 값을 가지는 것은 아니다. 최대 힙에서는 전체 요소들이 정렬되어 있는 것이 아니기 때문에, 가장 작은 값이 꼭 마지막 원소에 위치할 필요는 없다.  

**3.**  
절반인 n/2 개의 노드는 스며내리기 없이 그냥 넘어간다.  

**4.**  
최악의 경우 : Θ(log n)  
최선의 경우 : Θ(1)  

**5.**  
매우 간단한 일이다. 맨 마지막 원소는 트리의 가장 마지막 위치에 있으므로 시간복잡도 Θ(1)에 삭제가 가능하다.  

**6.**  
학생이 말한 방식으로도 힙은 만들어지지만, 매 삽입마다 스며오르기를 하므로 전체 시간 복잡도가 Θ(n log n)이 되어 기존의 방식보다 비효율적이다.  

**7.**  
스며오르기를 사용하면 된다. 증가된 값이 있는 노드를 시작점으로 잡고 부모 노드와 비교하며 교환을 반복한다.


## <LeetCode 703.Kth Largest Element in Stream>

In [None]:
import heapq
from typing import List

class KthLargest:
    def __init__(self, k: int, nums: List[int]):
        self.k = k
        self.min_heap = []
        for num in nums:
            self.add(num)

    def add(self, val: int) -> int:
        heapq.heappush(self.min_heap, val)
        if len(self.min_heap) > self.k:
            heapq.heappop(self.min_heap)
        return self.min_heap[0]

In [None]:
# 예시 사용법
kth = KthLargest(3, [4, 5, 8, 2])
print(kth.add(3))  # 출력: 4
print(kth.add(5))  # 출력: 5
print(kth.add(10)) # 출력: 5
print(kth.add(9))  # 출력: 8
print(kth.add(4))  # 출력: 8