# 3번

In [5]:
# heap.py 코드
class Heap:
    def __init__(self, *args):
        if len(args) != 0:
            self.__A = args[0]  # 파라미터로 온 리스트
        else:
            self.__A = []

    # 힙에 원소 삽입하기
    def insert(self, x):
        self.__A.append(x)
        self.__percolateUp(len(self.__A) - 1)

    # 스며오르기
    def __percolateUp(self, i: int):
        parent = (i - 1) // 2
        if i > 0 and self.__A[i] > self.__A[parent]:
            self.__A[i], self.__A[parent] = self.__A[parent], self.__A[i]
            self.__percolateUp(parent)

    # 힙에서 원소 삭제하기
    def deleteMax(self):
        if not self.isEmpty():
            max = self.__A[0]
            self.__A[0] = self.__A.pop()  # 리스트 끝 원소 삭제 후 루트에 복사
            self.__percolateDown(0)
            return max
        else:
            return None

    # 스며내리기
    def __percolateDown(self, i: int):
        child = 2 * i + 1  # 왼쪽 자식
        right = 2 * i + 2  # 오른쪽 자식
        if child <= len(self.__A) - 1:
            if right <= len(self.__A) - 1 and self.__A[child] < self.__A[right]:
                child = right  # 더 큰 자식 선택
            if self.__A[i] < self.__A[child]:
                self.__A[i], self.__A[child] = self.__A[child], self.__A[i]
                self.__percolateDown(child)

    def max(self):
        return self.__A[0]

    def buildHeap(self):
        for i in range((len(self.__A) - 2) // 2, -1, -1):
            self.__percolateDown(i)

    def isEmpty(self) -> bool:
        return len(self.__A) == 0

    def clear(self):
        self.__A = []

    def size(self) -> int:
        return len(self.__A)


import csv

# 힙 객체 생성
heap = Heap()

# CSV 파일 읽기
with open('birthday.csv', 'r', encoding='utf-8') as file:
    reader = csv.reader(file)
    next(reader)  # 첫 줄 (헤더) 건너뛰기
    for row in reader:
        if len(row) < 3:
            continue  # 누락된 데이터가 있는 줄은 건너뛰기
        student_id, name, birthday = row
        if not birthday.strip():  # 생년월일이 비어 있으면 건너뛰기
            continue
        try:
            heap.insert((int(birthday), student_id, name))
        except ValueError:
            continue  # 혹시 모를 잘못된 값 (문자열 등) 건너뛰기

# 생일이 가장 늦은 10명 출력
print("생일이 가장 늦은 친구 10명:")
for _ in range(10):
    if not heap.isEmpty():
        birthday, student_id, name = heap.deleteMax()
        print(f"학번: {student_id}, 이름: {name}, 생년월일: {birthday}")

생일이 가장 늦은 친구 10명:
학번: ******82, 이름: 홍서연, 생년월일: 20241282
학번: ******22, 이름: 신수민, 생년월일: 20051230
학번: ******42, 이름: 이서영, 생년월일: 20051225
학번: ******69, 이름: 강민주, 생년월일: 20051214
학번: ******78, 이름: 김민경, 생년월일: 20051202
학번: ******41, 이름: 이서영, 생년월일: 20051112
학번: ******17, 이름: 배시은, 생년월일: 20051102
학번: ******87, 이름: 김여원, 생년월일: 20051031
학번: ******44, 이름: 이서진, 생년월일: 20051028
학번: ******64, 이름: 서홍빈, 생년월일: 20051024


# 4번

In [4]:
import csv

class BidirectNode:
    def __init__(self, item, prev, next):
        self.item = item
        self.prev = prev
        self.next = next

class CircularDoublyLinkedList:
    def __init__(self):
        self.__head = BidirectNode("dummy", None, None)
        self.__head.prev = self.__head
        self.__head.next = self.__head
        self.__numItems = 0

    def append(self, newItem) -> None:
        prev = self.__head.prev
        newNode = BidirectNode(newItem, prev, self.__head)
        prev.next = newNode
        self.__head.prev = newNode
        self.__numItems += 1

    def isEmpty(self) -> bool:
        return self.__numItems == 0

    def getNode(self, i: int) -> BidirectNode:
        curr = self.__head  # 더미 헤드
        for index in range(i + 1):
            curr = curr.next
        return curr

    def __iter__(self):  # iterator 생성
        self.current_node = self.__head.next  # 첫 번째 노드
        return self

    def __next__(self):
        if self.current_node == self.__head:  # 순환 끝
            raise StopIteration
        else:
            item = self.current_node.item
            self.current_node = self.current_node.next
            return item

# 조원 이름 리스트(총 15명)
friends = ['두경은', '강민주', '김나현', '김민주', '김시연', '김채연',
           '나주희', '민고은', '박지호', '손지원', '안정민', '이서영', '이유빈', '여지혜', '윤혜진']

# CircularDoublyLinkedList 인스턴스 생성
cdll = CircularDoublyLinkedList()

# CSV 파일 읽기
with open('birthday.csv', encoding='utf-8') as file:
    reader = csv.reader(file)
    next(reader)  # 헤더 건너뛰기
    for row in reader:
        student_id, name, birth = row  # 학번, 이름, 생년월일 분리
        cdll.append((student_id, name, birth))  # 데이터 추가

# 이미 출력한 친구 저장 (이름 + 생년월일)
printed_friends = set()

# 김민주 친구 중에서 출력할 생년월일(김민주가 csv파일에 2명 존재)
target_kmj_birth = '20041026'

# 출력
for data in cdll:
    student_id, name, birth = data
    identifier = (name, birth)  # 이름 + 생일로 중복 체크

    if name == '김민주':
        if birth == target_kmj_birth and identifier not in printed_friends:
            print(f"이름: {name}, 생년월일: {birth}")
            printed_friends.add(identifier)
    elif name in friends and identifier not in printed_friends:
        print(f"이름: {name}, 생년월일: {birth}")
        printed_friends.add(identifier)

이름: 강민주, 생년월일: 20051214
이름: 김나현, 생년월일: 20040203
이름: 김민주, 생년월일: 20041026
이름: 김시연, 생년월일: 20030910
이름: 나주희, 생년월일: 20041104
이름: 두경은, 생년월일: 20041105
이름: 민고은, 생년월일: 20050214
이름: 박지호, 생년월일: 20040728
이름: 손지원, 생년월일: 20050620
이름: 안정민, 생년월일: 20040501
이름: 여지혜, 생년월일: 20051009
이름: 윤혜진, 생년월일: 20050517
이름: 이서영, 생년월일: 20051112
이름: 이서영, 생년월일: 20051225
이름: 이유빈, 생년월일: 20050601


# 5번 연습문제 8장

### 1번
#### 임의의 최대 힙에서 더 얕은 곳에 있는 원소가 더 깊은 곳에 있는 원소보다 더 작은 값을 가질 수 있다.
#### 예를 들어보면, heap[1] = 7, heap[2] = 10, heap[5] = 9인 힙이 있다. heap[1]과 heap[2]는 깊이가 같고, 
#### heap[5]는 heap[1]보다 깊이가 깊지만 값은 작다. heap[5]는 heap[2]의 자식 노드로, heap[2] > heap[5]이기 때문에 힙의 조건을 만족한다.

### 2번
#### 최대 힙의 마지막 원소가 항상 가장 작은 값은 아니다.
#### heap[0] = 10, heap[1] = 7, heap[2] = 9이고 이 두 노드가 말단 노드인 힙이 있다고 한다. 
#### 이 힙은 heap[0] > heap[1], heap[0] > heap[2]가 되어 힙의 조건을 만족하며, heap[n-2] < heap[n-1]을 만족하는 힙이다.

### 3번
#### 길이가 n인 임의의 리스트를 힙으로 만들 때, 마지막 요소의 인덱스는 n-1이다. 따라서 인덱스가 
#### ((n-1)-1)//2 즉 (n-2)//2부터 0까지의 인덱스를 갖는 요소를 대상으로 스며내리기를 진행한다.
#### 따라서 루트의 자격으로 스며내리기를 하지 않고 그냥 넘어가는 원소 수는 정확하게 n-1-(n-2)//2개이다.

### 4번
#### 길이가 n인 리스트를 대상으로 하는 스며내리기 알고리즘에서 최악의 경우 Θ(logn)의 시간이 소요된다. 
#### 이진 탐색 트리의 깊이에 따라 층을 나누면 층의 개수는 약 (logn + 1)개가 된다. 스며내리기의 대상이 되는 리스트의 인덱스가 
#### 0인 요소가 이 리스트의 가장 작은 값이라면 최악의 경우가 되어, 스며내리기를 logn번 진행해야 한다.
#### 최선의 경우에는 Θ(1)의 시간이 소요된다. 스며내리기의 대상이 되는 리스트의 인덱스가 
#### 0인 요소가 이 리스트의 가장 큰 값이라면 인덱스가 1, 2인 요소보다 크기 때문에 스며내리기는 진행되지 않고 멈춘다.

### 5번
#### 이 문제에서 말하는 마지막 원소가 단순히 리스트의 마지막 원소라면 매우 간단히 원소를 삭제할 수 있다.

#### 하지만 여기서 말하는 마지막 원소가 우선순위의 마지막이 되는 원소라면 힙의 마지막 원소를 삭제하는 작업은 간단하지는 않다. 
#### 연습문제 2번에서 확인한 바와 같이 마지막 원소가 항상 가장 작은 값을 가지지도 않고, 연습문제 1번에서 확인한 바와 같이 깊이가 
#### 깊은 원소가 항상 깊이가 얕은 원소보다 작은 값을 가지지도 않는다.
#### 하지만 힙의 특성상 자식 노드는 부모 노드보다 작은 값을 가지기 때문에, 깊이가 2인 모든 서브 트리들의 원소들만 비교하면 
#### 가장 마지막 원소를 어렵지 않게 찾을 수 있다. 겨우 깊이가 2인 서브 트리이기 때문에 원소의 삭제 작업도 간단하다.

### 6번
#### 위쪽부터 시작해서 스며오르기를 반복하여 build_heap() 알고리즘을 구현한다고 해보자. 
#### index가 0인 요소에는 이미 맨 위의 요소이므로 스며오르기를 할 수 없다. 
#### 따라서 index가 1인 요소부터 index가 n-1(마지막)인 요소까지 진행한다. 처음 스며오르기를 진행할 땐 대상 노드의 깊이가 얕기 때문에 비교와 교체 작업이 많지 않지만, index가 커질수록 대상 노드의 깊이가 깊어져 스며오르기를 logn번 진행해야 할 수도 있다.
#### n/2 * logn + n/4 * log(n-1) + n/8 * log(n-2) + ... + n/(2**(n-1)) * log2 즉 Θ(nlogn)의 시간이 소요된다. 이 방법은 Θ(n)의 시간이 소요되는 스며내리기를  이용한 build_heap() 알고리즘보다 비효율적이다.

### 7번
#### 임의의 원소의 값이 증가했다면, 그 원소에 해당하는 노드를 제거하는 delete_max() 작업을 실행한다. 
#### 이 작업에 소요되는 시간은 O(logn)이다. 
#### 그리고 증가한 원소의 값을 갖는 노드를 힙에 추가한다. 노드를 추가하는 작업 insert()는 O(logn)의 시간이 든다.
#### 이 두 작업을 통해 힙을 O(logn) 시간만에 변화를 반영하여 힙을 수선할 수 있다.

# 6번 LeetCode 703

In [1]:
import heapq

class KthLargest:

    def __init__(self, k: int, nums: list[int]):
        self.k = k
        self.heap = nums
        heapq.heapify(self.heap)

        while len(self.heap) > k:
            heapq.heappop(self.heap)

    def add(self, val: int) -> int:
        heapq.heappush(self.heap, val)

        if len(self.heap) > self.k:
            heapq.heappop(self.heap)

        return self.heap[0]
        
# 사용예시 
kthLargest = KthLargest(3, [4, 5, 8, 2])
print(kthLargest.add(3))  
print(kthLargest.add(5))  
print(kthLargest.add(10)) 
print(kthLargest.add(9))  
print(kthLargest.add(4))  

4
5
5
8
8
