## 1. 생일 데이터를 교재 코드 (heap.py)를 이용해 힙으로 저장하고, 생일이 느린 순서로 10명의 친구를 출력하는 코드

In [1]:
import csv

class Heap:
    def __init__(self, *args):
        if len(args) != 0:
            self.__A = args[0]  # 초기 리스트 할당
        else:
            self.__A = []

    def insert(self, x):
        self.__A.append(x)
        self.__percolateUp(len(self.__A) - 1)

    def __percolateUp(self, i: int):
        parent = (i - 1) // 2
        if i > 0 and self.__A[i] > self.__A[parent]:
            self.__A[i], self.__A[parent] = self.__A[parent], self.__A[i]
            self.__percolateUp(parent)

    def deleteMax(self):
        if not self.isEmpty():
            max_elem = self.__A[0]
            if len(self.__A) == 1:
                self.__A.pop()
            else:
                self.__A[0] = self.__A.pop()
                self.__percolateDown(0)
            return max_elem
        else:
            return None

    def __percolateDown(self, i: int):
        child = 2 * i + 1
        right = 2 * i + 2
        if child < len(self.__A):
            if right < len(self.__A) and self.__A[child] < self.__A[right]:
                child = right
            if self.__A[i] < self.__A[child]:
                self.__A[i], self.__A[child] = self.__A[child], self.__A[i]
                self.__percolateDown(child)

    def max(self):
        if not self.isEmpty():
            return self.__A[0]
        return None

    def buildHeap(self):
        for i in range((len(self.__A) - 2) // 2, -1, -1):
            self.__percolateDown(i)

    def isEmpty(self) -> bool:
        return len(self.__A) == 0

    def clear(self):
        self.__A = []

    def size(self) -> int:
        return len(self.__A)

def compute_birthday_key(birthday_str):
    # 변경: 생년월일 전체(YYYYMMDD)를 int로 변환합니다.
    return int(birthday_str)

# CSV 파일(birthday.csv)에서 친구들의 생년월일 데이터를 읽어오기
friends = []
with open('birthday.csv', mode='r', encoding='utf-8') as csvfile:
    reader = csv.DictReader(csvfile)
    for row in reader:
        name = row["이름"]
        # 열 이름이 "생년월일8자리(예.20040101)"로 되어 있음.
        birthday = row["생년월일8자리(예.20040101)"].strip()
        # 생년월일 데이터가 누락된 경우 해당 행은 건너뜁니다.
        if birthday == "":
            continue
        key = compute_birthday_key(birthday)
        # 데이터 형식: (생년월일 전체를 나타내는 key, 이름, 생년월일 문자열)
        friends.append((key, name, birthday))

# Heap 인스턴스 생성 후 CSV 파일에서 읽은 데이터를 삽입
heap = Heap()
for friend in friends:
    heap.insert(friend)

# 연도까지 포함된 생년월일을 기준으로 최신 10명의 친구 출력
print("연도까지 합친 최신 생년월일을 가진 10명의 친구:")
for _ in range(10):
    friend = heap.deleteMax()
    if friend is None:
        break
    print(f"이름: {friend[1]}, 생년월일: {friend[2]}")


연도까지 합친 최신 생년월일을 가진 10명의 친구:
이름: 홍서연, 생년월일: 20241282
이름: 신수민, 생년월일: 20051230
이름: 이서영, 생년월일: 20051225
이름: 강민주, 생년월일: 20051214
이름: 김민경, 생년월일: 20051202
이름: 이서영, 생년월일: 20051112
이름: 배시은, 생년월일: 20051102
이름: 김여원, 생년월일: 20051031
이름: 이서진, 생년월일: 20051028
이름: 서홍빈, 생년월일: 20051024


## 2. 생일 데이터를 교재 코드 (circularDoublyLinkedList.py)를 이용해 리스트로 저장하고, 같은 조의 친구들만 이름과 생년월일을 출력하는 코드

In [2]:
import csv

class BidirectNode:
    def __init__(self, x, prevNode:'BidirectNode', nextNode:'BidirectNode'):
        self.item = x
        self.prev = prevNode
        self.next = nextNode

class CircularDoublyLinkedList:
    def __init__(self):
        self.__head = BidirectNode("dummy", None, None)
        self.__head.prev = self.__head
        self.__head.next = self.__head
        self.__numItems = 0

    def insert(self, i: int, newItem) -> None:
        if (i >= 0 and i <= self.__numItems):
            prev = self.getNode(i - 1)
            newNode = BidirectNode(newItem, prev, prev.next)
            newNode.next.prev = newNode
            prev.next = newNode
            self.__numItems += 1
        else:
            print("index", i, ": out of bound in insert()")

    def append(self, newItem) -> None:
        prev = self.__head.prev
        newNode = BidirectNode(newItem, prev, self.__head)
        prev.next = newNode
        self.__head.prev = newNode
        self.__numItems += 1

    def pop(self, *args):
        if self.isEmpty():
            return None
        if len(args) != 0:
            i = args[0]
        if len(args) == 0 or i == -1:
            i = self.__numItems - 1

        if (i >= 0 and i <= self.__numItems - 1):
            curr = self.getNode(i)
            retItem = curr.item
            curr.prev.next = curr.next
            curr.next.prev = curr.prev
            self.__numItems -= 1
            return retItem
        else:
            return None

    def remove(self, x):
        curr = self.__findNode(x)
        if curr is not None:
            curr.prev.next = curr.next
            curr.next.prev = curr.prev
            self.__numItems -= 1
            return x
        else:
            return None

    def get(self, *args):
        if self.isEmpty():
            return None
        if len(args) != 0:
            i = args[0]
        if len(args) == 0 or i == -1:
            i = self.__numItems - 1
        if (i >= 0 and i <= self.__numItems - 1):
            return self.getNode(i).item
        else:
            return None

    def index(self, x) -> int:
        cnt = 0
        for element in self:
            if element == x:
                return cnt
            cnt += 1
        return -12345

    def isEmpty(self) -> bool:
        return self.__numItems == 0

    def size(self) -> int:
        return self.__numItems

    def clear(self):
        self.__head = BidirectNode("dummy", None, None)
        self.__head.prev = self.__head
        self.__head.next = self.__head
        self.__numItems = 0

    def count(self, x) -> int:
        cnt = 0
        for element in self:
            if element == x:
                cnt += 1
        return cnt

    def extend(self, a):
        for element in a:
            self.append(element)

    def copy(self) -> 'CircularDoublyLinkedList':
        a = CircularDoublyLinkedList()
        for element in self:
            a.append(element)
        return a

    def reverse(self) -> None:
        prev = self.__head
        curr = prev.next
        nxt = curr.next
        self.__head.next = self.__head.prev
        self.__head.prev = curr
        for i in range(self.__numItems):
            curr.next = prev
            curr.prev = nxt
            prev = curr
            curr = nxt
            nxt = nxt.next

    # getNode: 해당 인덱스의 노드를 반환 (0부터 시작)
    def getNode(self, i: int):
        if i < 0 or i >= self.__numItems:
            return None
        curr = self.__head.next
        for _ in range(i):
            curr = curr.next
        return curr

    # 순회를 위한 __iter__ 메서드
    def __iter__(self):
        curr = self.__head.next
        count = 0
        while count < self.__numItems:
            yield curr.item
            curr = curr.next
            count += 1

# 4조에 해당하는 친구들의 이름 집합
group4_names = {
    "권보은", "김승연", "이서영", "이아현", "임성민",
    "은유빈", "이예은", "정예은", "김주원", "서홍빈"
}

# 새로운 원형 양방향 연결 리스트 인스턴스 생성
cdll = CircularDoublyLinkedList()

# CSV 파일(birthday.csv)에서 친구들의 생년월일 데이터를 읽어오기
with open('birthday.csv', mode='r', encoding='utf-8') as csvfile:
    reader = csv.DictReader(csvfile)
    for row in reader:
        name = row["이름"].strip()
        # 4조에 해당하는 친구만 처리
        if name in group4_names:
            birthday = row["생년월일8자리(예.20040101)"].strip()
            cdll.append((name, birthday))

# 4조의 친구들 중, "이서영" 이름을 가진 친구가 2명일 경우 그중 생년월일이 20051225인 친구만 출력하도록 함
print("4조의 친구들 (필터링된 결과):")
for friend in cdll:
    # friend는 (이름, 생년월일) 형태의 튜플입니다.
    # 이름이 "이서영"인 경우 생년월일이 "20051225"인 친구만 출력
    if friend[0] == "이서영":
        if friend[1] != "20051225":
            continue
    print(f"이름: {friend[0]}, 생년월일: {friend[1]}")


4조의 친구들 (필터링된 결과):
이름: 권보은, 생년월일: 20041004
이름: 김승연, 생년월일: 20030124
이름: 김주원, 생년월일: 20030110
이름: 서홍빈, 생년월일: 20051024
이름: 은유빈, 생년월일: 20040503
이름: 이서영, 생년월일: 20051225
이름: 이아현, 생년월일: 20010904
이름: 이예은, 생년월일: 20030109
이름: 임성민, 생년월일: 20021213
이름: 정예은, 생년월일: 


## 3. 교재 8장 우선 순위 큐 연습문제 (3.1부터 3.7까지로 표기하였습니다)


##### 3.1 heap[1]의 값이 5, heap[2]의 값이 8, heap[5]의 값이 2라고 할 때, heap[5]가 heap[2]의 자식 노드라고 하면 이는 깊이가 더 깊은 것과 같습니다. heap[2]은 자식 노드인 heap[5]보다 값이 크므로, 임의의 최대 힙에서 더 얕은 곳에 있는 원소는 더 깊은 곳에 있는 원소보다 더 작은 값을 가질 수 있습니다.

##### 3.2 heap[0] = 9, heap[1] = 6, heap[2] = 3이고 이 두 노드가 말단 노드인 힙이 있다고 할 때, 이 힙은 heap[0] > heap[1], heap[0] > heap[2]가 됩니다. 이는 heap[n-2] < heap[n-1]을 만족하기 때문에, 마지막 원소인 A[n-1]은 항상 가장 작은 값을 갖지는 않습니다.

##### 3.3 부모 노드의 인덱스부터 루트 노드까지 역순으로 percolateDown을 진행하여 힙 구조를 만듭니다. percolateDown을 수행하지 않고 건너뛰는 노드들은 부모 노드가 아니기 때문에 스며내리기가 필요하지 않습니다. 부모 노드의 인덱스는 (n - 2) // 2이므로, n - 1 - ((n - 2) // 2)로 계산하여 리프 노드의 수를 얻을 수 있습니다.

##### 3.4 최악의 경우 시간 복잡도는 스며내리기할 때, 노드가 트리의 맨 아래까지 내려가야 합니다. 힙의 최대 깊이(높이)는 완전 이진 트리이므로 Θ(log𝑛)입니다. 따라서, 최악의 경우 시간 복잡도는 Θ(log𝑛)입니다.

##### 3.5 힙 구조에서는 삭제 작업이 루트 노드에 집중되기 때문에, 루트 노드를 삭제한 후 마지막 노드를 루트로 옮기고, 다시 힙 구조를 유지하는 작업이 필요합니다. 이 작업은 힙의 높이에 따라 O(log⁡𝑛)의 시간 복잡도를 갖기 때문에, 간단한 일이라고 할 수 있습니다.

##### 3.6 buildHeap() 알고리즘은 각 노드마다 비교해야 하는 깊이가 다르기 때문에, 총 작업이 O(n)입니다. 위에서 아래로 스며오르기 방식은 O(nlogn)이므로, 기존 방식에 비해 더 오래 걸립니다.

##### 3.7 최대 힙에서 임의의 원소 값이 증가하면, 그 원소의 새로운 값이 원래 있던 위치의 부모 노드보다 클 수 있습니다. 이 경우 힙의 조건을 만족시키기 위해 해당 원소를 위로 올려 부모 노드와 교환하며 적절한 위치를 찾는데, 이렇게 하면 힙의 높이에 따라 전체 연산으로 O(log𝑛)이 소요됩니다.

## 4. LeetCode 703. Kth Largest Element in Stream

In [3]:
import heapq
from typing import List

class KthLargest:
    def __init__(self, k: int, nums: List[int]):
        """
        :param k: k번째로 큰 원소
        :param nums: 초기 스트림
        """
        self.k = k
        # nums를 최소 힙으로 만들고, 크기가 k를 초과하면 가장 작은 원소를 제거
        self.min_heap = nums[:]
        heapq.heapify(self.min_heap)
        while len(self.min_heap) > k:
            heapq.heappop(self.min_heap)

    def add(self, val: int) -> int:
        """
        스트림에 val을 추가하고, 현재 k번째로 큰 원소를 반환
        """
        if len(self.min_heap) < self.k:
            # 아직 k개 미만 원소라면 그냥 추가
            heapq.heappush(self.min_heap, val)
        else:
            # k개가 이미 유지 중이면, val이 루트(가장 작은)보다 크면 교체
            if val > self.min_heap[0]:
                heapq.heapreplace(self.min_heap, val)
        # 루트가 항상 k번째로 큰 원소
        return self.min_heap[0]

# 사용 예시
if __name__ == "__main__":
    # k=3, 초기 리스트 [4,5,8,2]
    kth = KthLargest(3, [4, 5, 8, 2])
    print(kth.add(3))   # [4,5,8] 유지 → 3번째로 큰 값 = 4
    print(kth.add(5))   # [5,5,8] 유지 → 3번째로 큰 값 = 5
    print(kth.add(10))  # [5,8,10] 유지 → 3번째로 큰 값 = 5
    print(kth.add(9))   # [8,9,10] 유지 → 3번째로 큰 값 = 8
    print(kth.add(4))   # [8,9,10] 유지 → 3번째로 큰 값 = 8


4
5
5
8
8
