# Assignment 05 - Data Structures (2025)

## 0. birthday.csv 파일 내용 확인

In [None]:
import pandas as pd
df = pd.read_csv("birthday.csv")
df.head()

## 3. Heap을 이용한 생일 Top 10 출력

In [None]:
import csv
import heapq
from datetime import datetime

birthday_data = []
with open("birthday.csv", newline="", encoding="utf-8") as csvfile:
    reader = csv.DictReader(csvfile)
    for row in reader:
        name = row["이름"]
        birth_str = row["생년월일"]
        if birth_str:
            try:
                birthdate = datetime.strptime(birth_str, "%Y%m%d")
                heapq.heappush(birthday_data, (-birthdate.timestamp(), name, birth_str))
            except ValueError:
                pass

latest_birthdays = heapq.nsmallest(10, birthday_data)

print("생일이 가장 늦은 친구 10명:")
for _, name, birth in latest_birthdays:
    print(f"{name} - {birth}")

## 4. Circular Doubly Linked List를 이용한 조원 출력

In [None]:
class Node:
    def __init__(self, name, birthdate):
        self.name = name
        self.birthdate = birthdate
        self.prev = None
        self.next = None

class CircularDoublyLinkedList:
    def __init__(self):
        self.head = None

    def append(self, name, birthdate):
        new_node = Node(name, birthdate)
        if not self.head:
            self.head = new_node
            new_node.prev = new_node
            new_node.next = new_node
        else:
            tail = self.head.prev
            tail.next = new_node
            new_node.prev = tail
            new_node.next = self.head
            self.head.prev = new_node

    def find_by_names(self, names):
        result = []
        if not self.head:
            return result
        current = self.head
        while True:
            if current.name in names:
                result.append((current.name, current.birthdate))
            current = current.next
            if current == self.head:
                break
        return result

In [None]:
import csv

group_mates = {"윤여빈", "강윤서", "김나영", "김명신", "김지우", "이예린", "이희서", "이지후", "신수민"}

cdll = CircularDoublyLinkedList()
with open("birthday.csv", newline="", encoding="utf-8") as csvfile:
    reader = csv.DictReader(csvfile)
    for row in reader:
        name = row["이름"]
        birth = row["생년월일"]
        cdll.append(name, birth)

selected = cdll.find_by_names(group_mates)
print("같은 조 친구들의 생일 정보:")
for name, birth in selected:
    print(f"{name} - {birth}")

## 5. 우선순위 큐 연습문제 풀이 (교재 8장)

### 1. 최대 힙에서 더 깊은 곳의 원소가 루트보다 클 수 있는가?
**답:** 아니요. 최대 힙에서는 루트가 항상 가장 큰 값을 가지므로 더 깊은 원소가 클 수 없다.

### 2. A[n-1]은 항상 가장 작은 값을 가지는가?
**답:** 아니요. 힙은 정렬된 배열이 아니므로 마지막 요소가 최소값일 필요는 없다.

### 3. buildHeap()에서 스며내리기를 하지 않는 노드 수?
**답:** floor(n/2). 리프 노드는 자식이 없어서 스며내리기 대상이 아님.

### 4. 스며내리기의 최악 시간 복잡도?
**답:** Θ(log n). 트리의 높이만큼 이동 가능함.

### 5. 루트보다 큰 값을 가진 원소가 존재할 수 있는가?
**답:** 불가능하다. 루트는 항상 최대값이므로.

### 6. buildHeap을 루트부터 하면?
**답:** 비효율적이며 O(n log n) 시간복잡도 발생.

### 7. 원소 값 증가 시 힙 유지 방법과 시간복잡도?
**답:** 스며올리기 수행, 시간복잡도는 O(log n).


## 6. LeetCode 703번 풀이

### 문제 설명:
정수 `k`와 초기 숫자 리스트 `nums`가 주어졌을 때,
데이터 스트림에서 k번째로 큰 요소를 지속적으로 반환하는 클래스를 구현한다.

### 풀이 전략:
- 크기 `k`인 **최소 힙(min heap)** 을 유지
- 새 값을 추가할 때마다 힙에 넣고, 크기가 `k`보다 크면 가장 작은 값 제거
- 항상 k번째로 큰 값을 힙의 루트로 유지

In [None]:
import heapq

class KthLargest:

    def __init__(self, k, nums):
        self.k = k
        self.min_heap = nums
        heapq.heapify(self.min_heap)
        while len(self.min_heap) > k:
            heapq.heappop(self.min_heap)

    def add(self, val):
        heapq.heappush(self.min_heap, val)
        if len(self.min_heap) > self.k:
            heapq.heappop(self.min_heap)
        return self.min_heap[0]

### 시간 복잡도:
- `__init__`: O(n log n)
- `add`: O(log k)

### 공간 복잡도:
- O(k)

### 결과:
효율적인 최소 힙 기반 풀이로 k번째로 큰 값을 스트리밍 방식으로 유지 가능