## Heap (우선순위큐)

#### 3. 생일 데이터를 교재 코드(heap.py)를 이용해 힙으로 저장하고, 생일이 느린 순서로 10명의 친구를 출력하는 코드를 작성한다. 실행 결과가 셀에 나타나야 한다

In [2]:
class Heap:
	def __init__(self, *args):
		if len(args) != 0:
			self.__A = args[0] # 파라미터로 온 리스트
		else:
			self.__A = []
 
	# [알고리즘 8-2] 구현: 힙에 원소 삽입하기(재귀 알고리즘 버전)
	def insert(self, x):
		self.__A.append(x)
		self.__percolateUp(len(self.__A)-1)

	# 스며오르기
	def __percolateUp(self, i:int):
		parent = (i - 1) // 2
		if i > 0 and self.__A[i] > self.__A[parent]:
			self.__A[i], self.__A[parent] = self.__A[parent], self.__A[i]
			self.__percolateUp(parent)

	# [알고리즘 8-2] 구현: 힙에서 원소 삭제하기
	def deleteMax(self):
		# heap is in self.__A[0...len(self.__A)-1]
		if (not self.isEmpty()):
			max = self.__A[0]
			self.__A[0] = self.__A.pop() # *.pop(): 리스트의 끝원소 삭제 후 원소 리턴
			self.__percolateDown(0)
			return max
		else:
			return None

	# 스며내리기
	def __percolateDown(self, i:int):
		# Percolate down w/ self.__A[i] as the root
		child = 2 * i + 1  # left child
		right = 2 * i + 2  # right child
		if (child <= len(self.__A)-1):
			if (right <= len(self.__A)-1 and self.__A[child] < self.__A[right]):
				child = right  # index of larger child
			if self.__A[i] < self.__A[child]:
				self.__A[i], self.__A[child] = self.__A[child], self.__A[i]
				self.__percolateDown(child)

	def max(self):
		return self.__A[0]

	# 힙 만들기
	def buildHeap(self):
		for i in range((len(self.__A) - 2) // 2, -1, -1):
			self.__percolateDown(i)

	# 힙이 비었는지 확인하기
	def isEmpty(self) -> bool:
		return len(self.__A) == 0

	def clear(self):
		self.__A = []

	def size(self) -> int:
		return len(self.__A)

def load_birthdays(filepath):
    heap = Heap()
    with open(filepath, 'r', encoding='cp949') as f:
        for line in f:
            line = line.strip()
            if not line:
                continue
            student_id, name, birth = line.split(',')
            # 생일을 비교 기준으로 넣음 (문자열로 비교 가능)
            heap.insert((birth, name, student_id))
    return heap

def print_top_10_latest_birthdays(heap):
    print("생일이 늦은 친구 Top 10")
    print("생년월일 | 이름 | 학번")
    for _ in range(10):
        if not heap.isEmpty():
            birth, name, student_id = heap.deleteMax()
            print(f"{birth} | {name} | {student_id}")
        else:
            break

# 실행 부분
if __name__ == '__main__':
    filepath = 'birthday.csv'  
    heap = load_birthdays(filepath)
    print_top_10_latest_birthdays(heap)

생일이 늦은 친구 Top 10
생년월일 | 이름 | 학번
생년월일8자리(예.20040101) | 이름 | 학번
20241282 | 홍서연 | ******82
20051230 | 신수민 | ******22
20051225 | 이서영 | ******42
20051214 | 강민주 | ******69
20051202 | 김민경 | ******78
20051112 | 이서영 | ******41
20051102 | 배시은 | ******17
20051031 | 김여원 | ******87
20051028 | 이서진 | ******44


#### 4. 생일 데이터를 교재 코드(circularDoublyLinkedList.py)를 이용해 리스트로 저장하고, 같은 조(지난 과제 지정 조원 참조)의 친구들만 이름과 생년월일을 출력하는 코드를 작성한다. 실행 결과가 셀에 나타나야 한다. 

In [7]:
class BidirectNode:
    def __init__(self, x, prevNode:'BidirectNode', nextNode:'BidirectNode'):
        self.item = x
        self.prev = prevNode
        self.next = nextNode

class CircularDoublyLinkedList:
	def __init__(self):
		self.__head = BidirectNode("dummy", None, None)
		self.__head.prev = self.__head
		self.__head.next = self.__head
		self.__numItems = 0
 
	def insert(self, i:int, newItem) -> None:
		if (i >= 0 and i <= self.__numItems):
			prev = self.getNode(i - 1)
			newNode = BidirectNode(newItem, prev, prev.next)
			newNode.next.prev = newNode
			prev.next = newNode
			self.__numItems += 1
		else:
			print("index", i, ": out of bound in insert()") # 필요 시 에러 처리

	def append(self, newItem) -> None:
		prev = self.__head.prev
		newNode = BidirectNode(newItem, prev, self.__head)
		prev.next = newNode
		self.__head.prev = newNode
		self.__numItems += 1

	def pop(self, *args):
		# 가변 파라미터. 인자가 없거나 -1이면 마지막 원소로 처리하기 위함. 파이썬 리스트 규칙 만족
		if self.isEmpty():
			return None
		# 인덱스 i 결정
		if len(args) != 0: # pop(k)과 같이 인자가 있으면 i = k 할당
			i = args[0]
		if len(args) == 0 or i == -1:# pop()에 인자가 없거나 pop(-1)이면 i에 맨 끝 인덱스 할당
			i = self.__numItems - 1
		# i번 원소 삭제
		if (i >= 0 and i <= self.__numItems - 1):
			curr = self.getNode(i)
			retItem = curr.item
			curr.prev.next = curr.next
			curr.next.prev = curr.prev
			self.__numItems -= 1
			return retItem
		else:
			return None
 
	def remove(self, x):
		curr = self.__findNode(x)
		if curr != None:
			curr.prev.next = curr.next
			curr.next.prev = curr.prev
			self.__numItems -= 1
			return x
		else:
			return None

	def get(self, *args):
		# 가변 파라미터. 인자가 없거나 -1이면 마지막 원소로 처리하기 위함. 파이썬 리스트 규칙 만족
		if self.isEmpty(): return None
		# 인덱스 i 결정
		if len(args) != 0:   # pop(k)과 같이 인자가 있으면 i = k 할당
			i = args[0]
		if len(args) == 0 or i == -1:# pop()에 인자가 없거나 pop(-1)이면 i에 맨 끝 인덱스 할당
			i = self.__numItems - 1
		# i번 원소 리턴
		if (i >= 0 and i <= self.__numItems - 1):
			return self.getNode(i).item
		else:
			return None
 
	def index(self, x) -> int:
		cnt = 0
		for element in self:
			if element == x:
				return cnt
			cnt += 1
		return -12345

	def isEmpty(self) -> bool:
		return self.__numItems == 0
 
	def size(self) -> int:
		return self.__numItems

	def clear(self):
		self.__head = BidirectNode("dummy", None, None)
		self.__head.prev = self.__head
		self.__head.next = self.__head
		self.__numItems = 0
 
	def count(self, x) -> int:
		cnt = 0
		for element in self:
			if element == x:
					cnt += 1
		return cnt

	def extend(self, a): # a는 순회 가능한 모든 객체
		for element in a:
			self.append(element)

	def copy(self) -> 'CircularDoublyLinkedList':
		a = CircularDoublyLinkedList()
		for element in self:
			a.append(element)
		return a
 
	def reverse(self) -> None:
		prev = self.__head; curr = prev.next; next = curr.next
		self.__head.next = prev.prev; self.__head.prev = curr
		for i in range(self.__numItems):
			curr.next = prev; curr.prev = next
			prev = curr; curr = next; next = next.next
 
	def sort(self) -> None:
		a = []
		for element in self:
			a.append(element)
		a.sort()
		self.clear()
		for element in a:
			self.append(element)

	def __findNode(self, x) -> BidirectNode:
		curr = self.__head.next  # 0번 노드
		while curr != self.__head:
 
			if curr.item == x:
				return curr
			else:
				curr = curr.next
		return None

	def getNode(self, i:int) -> BidirectNode:
		curr = self.__head  # 더미 헤드, index: -1
		for index in range(i + 1):
			curr = curr.next
		return curr

	def printList(self) -> None:
		for element in self:
			print(element, end = ' ')
		print()
 
	def __iter__(self):  # generating iterator and return
		return CircularDoublyLinkedListIterator(self)
 
class CircularDoublyLinkedListIterator:
	def __init__(self, alist):
		self.__head = alist.getNode(-1)  		# 더미 헤드
		self.iterPosition = self.__head.next  	# 0번 노드
	def __next__(self):
		if self.iterPosition == self.__head: 	# 순환 끝
			raise StopIteration
		else: # 현재 원소를 리턴하면서 다음 원소로 이동
			item = self.iterPosition.item
			self.iterPosition = self.iterPosition.next
			return item


class Student:
    def __init__(self, student_id, name, birthday):
        self.student_id = student_id
        self.name = name
        self.birthday = birthday

    def __str__(self):
        return f"{self.name} - {self.birthday}"

same_group_names = {
    '최수안', '오하민', '정승주', '이세윤', '이하민',
    '한수진', '성유빈', '안희랑', '정재윤', '김아린'
}

# CSV에서 데이터를 읽고 리스트에 저장
def load_birthdays_to_list(filepath):
    clist = CircularDoublyLinkedList()
    with open(filepath, 'r', encoding='cp949') as f:
        for line in f:
            line = line.strip()
            if not line:
                continue
            student_id, name, birthday = line.split(',')
            student = Student(student_id, name, birthday)
            clist.append(student)
    return clist

# 조원만 출력
def print_same_group_birthdays(clist, same_group_names):
    print("3조 조원 생일")
    for student in	clist:
        if student.name in same_group_names:
            print(f"{student.name} - {student.birthday}")

# 실행 코드
if __name__ == '__main__':
    filepath = 'birthday.csv'  
    clist = load_birthdays_to_list(filepath)
    print_same_group_birthdays(clist, same_group_names)


3조 조원 생일
김아린 - 20031128
성유빈 - 20030104
안희랑 - 20030926
오하민 - 20050509
이세윤 - 20040118
이하민 - 
정승주 - 20020619
정재윤 - 20050224
최수안 - 20050704
한수진 - 20040805


### 5. 교재 8장 우선 순위 큐 연습문제

##### 1. 최대 힙에서는 가장 큰 원소가 항상 루트에 있다. 즉, 루트의 깊이가 가장 얕다. 임의의 최대 힙에서 더 얕은 곳에 있는 원소가 더 깊은 곳에 있는 원소보다 더 작은 값을 가질 수 있는가?

- 가질 수 없다. 최대힙의 정의는 부모노드가 항상 자식노드보다 크거나 같다. 따라서 더 얕은 곳(트리의 상단)에 있는 원소가 더 깊은 곳(트리의 하단)에 있는 원소보다 더 큰 값을 가져야한다. 

#### 2. 최대 힙 A[0,,,n-1]에서 A[0]는 항상 가장 큰 값을 갖고 있다. 반대로 마지막 원소인 A[n-1]은 항상 가장 작은 값을 갖는가?

- 아니다. 최대 힙은 완전이진트리 구조를 배열로 저장한 것이기 때문에 마지막 원소는 단지 가장 마지막에 삽입된 노드가 위치한 자리일 뿐이다. 힙은 전체 정렬이 보장되지 않고, 부모노드가 자식노드보다 크거나 같은 조건만 만족하면 되기 때문에 꼭 가장 작은 값이 마지막 인덱스에 위치하는 것은 아니다.

#### 3. 임의의 리스트 A[0,,,n-1]을 힙으로 만드는 buildHeap() 알고리즘에서 총 n개의 원소 중 루트의 자격으로 스며내리기를 할지 알아보지 않고 그냥 넘어가는 원소(힙의 노드) 수는 정확하게 몇개인가?

- n/2개. buildHeap() 알고리즘에서 스며내리기를 하지 않는 노드는 리프 노드들로 n/2개이다. 자식이 없어 스며내릴 필요가 없기 때문에 buildHeap()을 할 때는 앞쪽 n/2개의 노드만 스며내리기 하면 된다.

#### 4. 리스트 A[0,,,n-1]을 대상으로 하는 스며내리기 알고리즘에서 최악의 경우에 해당하는 시간과 최선의 경우에 해당하는 시간은 어떻게 되는기? 빅세타 표기로 나타내시오.

- 최선의 경우 : 정렬이 된 상태로 한 번도 이동을 안함 -> Θ(1)
- 최악의 경우 : 루트부터 리프노드까지 끝까지 내려가야 하는 경우 -> Θ(log n)

#### 5. 힙인 상태에서 원소 삭제는 루트 노드만 대상으로 한다. 다른 경우는 존재하지 않는다. 테스트 목적으로 힙의 맨 마지막 원소를 삭제하는 작업을 요구한다면 간단한 일인가?

- 힙의 루트 노드를 삭제하는 경우에는 재정렬을 위한 스며내리기가 필요하지만 힙의 맨 마지막 원소는 배열의 끝에 위치하므로 단순히 pop()만으로 삭제할 수 있다. 따라서 테스트 목적 등으로 마지막 원소를 삭제하는 것은 매우 간단한 작업이다.

#### 6. 어떤 학생이 다음과 같은 질문을 했다. buildHeap() 알고리즘에서는 아래쪽에서부터 시작해서 스며내리기를 반복하는데 만약 반대 방향으로 하면 어떤가요? (즉, 위쪽에서부터 시작해서 스며오르기를 반복) 이렇게 해도 힙이 만들어진다. 이 방법은 본문에 제시한 방법에 비해 더 효율적인가? 점근적 시간으로 말하시오.

- 스며올리기를 반복하는 방식도 힙을 만들 수는 있지만, 이 경우 삽입마다 O(log n)의 시간이 걸려 전체 시간 복잡도는 O(n log n)이 된다. 반면 본문에서 제시한 스며내리기 방식은 전체 노드의 깊이를 고려한 최적화 덕분에 Θ(n) 시간만에 힙을 만들 수 있으므로 더 효율적인 방법이다.

#### 7. n개의 원소로 이루어진 최대 힙에서 임의의 원소 값이 증가했을 떄 O(log n)시간에 이를 반영해서 힙을 수선할 수 있다. 어떻게 하면 되는지 그 과정을 기술하시오.

- 최대 힙에서 임의의 원소의 값이 증가한 경우, 해당 노드를 부모와 반복적으로 비교하며 더 크면 서로 교환하는 방식(스며올리기)을 적용한다. 이 과정을 루트까지 반복하면 힙의 성질이 다시 만족되며 전체 시간 복잡도는 O(log n)이다.

### 6. LeetCode 703.Kth Largest Element in Stream

In [10]:
import heapq

class KthLargest:

    def __init__(self, k: int, nums: list[int]):
        self.k = k
        self.heap = nums
        heapq.heapify(self.heap)

        # 힙의 크기를 k개로 유지 (k개보다 작으면 pop)
        while len(self.heap) > k:
            heapq.heappop(self.heap)

    def add(self, val: int) -> int:
        heapq.heappush(self.heap, val)

        # k개보다 많아지면 제일 작은 거 제거
        if len(self.heap) > self.k:
            heapq.heappop(self.heap)

        # k번째로 큰 값은 항상 힙의 루트
        return self.heap[0]
    
kth = KthLargest(3, [4, 5, 8, 2])
print(kth.add(3))  
print(kth.add(5)) 
print(kth.add(10)) 
print(kth.add(9))  
print(kth.add(4))  

4
5
5
8
8
