## 예제 8.9

## 1. 문제 정의

- 허프만 트리 알고리즘

## 2. 알고리즘 설명

- 주어진 빈도와 레이블을 이용해 허프만 트리(Huffman Tree)를 만드는 알고리즘
  
1. 초기화 단계
   - 주어진 빈도 freq와 레이블 label을 이용해 힙을 초기화
   - 빈도를 기준으로 (빈도, 레이블) 형태의 튜플을 만들어 최소 힙에 삽입
2. 힙 초기화
   - 주어진 빈도와 레이블을 순서대로 힙에 추가
3. 허프만 트리 생성
   - 힙에서 두 개의 최소 빈도 요소를 꺼내어 더한 후 다시 힙에 넣는다.
   - 이 과정을 빈도 수 만큼 반복,  반복에서 두 개의 최소 빈도 요소를 합쳐서 새로운 노드를 만들고, 이 노드를 힙에 삽입
4. 최종 출력
   - 최종적으로 힙에 남아 있는 하나의 요소가 완성된 허프만 트리를 나타낸다.

## 3. 손으로 푼 예제

![KakaoTalk_20240616_143521298.jpg](attachment:KakaoTalk_20240616_143521298.jpg)

## 4. 알고리즘 개요

### 입력 변수
1. freq: 빈도 리스트 (정수 리스트)
 - 각 문자의 빈도를 나타내는 정수 리스트
2. label: 레이블 리스트 (문자열 리스트)
 - 각 문자의 레이블을 나타내는 문자열 리스트

### 출력
 - 각 단계에서 두 개의 최소 빈도 노드를 더하는 과정을 출력
 - 최종적으로 완성된 허프만 트리를 출력

## 5. 코드

In [None]:
import heapq
def make_heap_tree(freq, label):
    n = len(freq)
    h = []
    for i in range(n):
        heapq.heappush(h,(freq[i], label[i]))
    
    for i in range(1, n):
        e1 = heapq.heappop(h)
        e2 = heapq.heappop(h)
        heapq.heappush(h, (e1[0]+e2[0], e1[1]+e2[1]))
        print(e1, "+", e2)
    print(heapq.heappop(h))

## 6. 테스트 코드

In [None]:
import heapq
def make_heap_tree(freq, label):
    n = len(freq)
    h = []
    for i in range(n):
        heapq.heappush(h,(freq[i], label[i]))
    
    for i in range(1, n):
        e1 = heapq.heappop(h)
        e2 = heapq.heappop(h)
        heapq.heappush(h, (e1[0]+e2[0], e1[1]+e2[1]))
        print(e1, "+", e2)
    print(heapq.heappop(h))

label = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H']
freq = [24, 3, 8, 10, 33, 6, 4, 12]
make_heap_tree(freq, label)

## 7. 출력 결과

![image.png](attachment:image.png)

## 8. 복잡도 분석

### 힙 초기화 5. 5 ~ 6줄
 - 힙에 요소 하나를 삽입하는 작업의 시간복잡도는 O(log n)
 - 따라서 n개의 요소를 삽입하는 전체 시간복잡도는 O(n log n)

### 힙에서 요소를 두 개 꺼내고 합친 후 다시 삽입 5. 8 ~ 12줄
 - 힙에서 두 개의 최소 요소를 꺼내는 작업은 각각 O(log n)
 - 두 개의 최소 요소를 더하고, 새로운 요소를 힙에 삽입하는 작업의 시간복잡도는 O(log n)
 - 따라서 하나의 반복에서 이루어지는 전체 작업의 시간복잡도는 O(log n) + O(log n) + O(log n) = O(log n)
 - 이 작업은 n-1번 반복되므로, 전체 시간복잡도는 O(n log n)

### 최종 요소 출력 5. 13줄
 - 힙에서 최종 요소를 꺼내는 작업의 시간복잡도는 O(log n)

따라서 시간 복잡도는  
#### O(nlogn)+O(nlogn)+O(logn)=O(nlogn)
