## 허프만 코드 알고리즘

### 1) 문제 정의
허프만 코드 문제의 정의는 주어진 문자 집합과 각 문자의 빈도(또는 확률)를 이용하여 그 문자를 표현하는 접두사 코드(prefix code)를 생성하는 것입니다. 이 코드는 총 메시지 길이를 최소화하는 방식으로 문자를 이진 코드로 인코딩합니다. 허프만 코드는 압축 알고리즘에서 중요한 역할을 하며, 특히 파일 압축 및 데이터 전송에서 효율성을 극대화하는 데 사용됨

### 2) 알고리즘 설명
이진 트리를 만들고 그 중에서 루트의 값이 가장 빈도 낮은 두 값을 인접하게끔 만들어서 그 합을 루트로 하는 새로운 트리를 만든다

### 3) 손으로 푼 예제
![image.png](attachment:6bcfeeb4-6bae-4a2d-866e-8cc8e68fa3f6.png)


![image.png](attachment:c09d9c0a-53ac-43af-9289-748c13fbe3a2.png)

![image.png](attachment:4087514e-21af-46e2-8c45-730572bfcbfd.png)

### 4) 코드 개요
힙 초기화를 하고 힙에서 최소 요소 두 개를 빼서 합침 후 최종 루트 노드를 만든다

### 5) 알고리즘 코드

In [None]:
import heapq
def tree(freq,label):
    n=len(freq)
    h=[]
    for i in range(n):
        heapq.heappush(h,(freq[i],label[i]))

    for i in range(1,n):
        e1=heapq.heappop(h)
        e2=heapq.heappop(h)
        heapq.heappush(h,(e1[0]+e2[0],e1[0]+e2[1]))
        print(e1,"+",e2)

    print(heapq.heappop(h))

### 6) 수행결과

In [4]:
import heapq
def make_tree(freq,label):
    n=len(freq)
    h=[]
    for i in range(n):
        heapq.heappush(h,(freq[i],label[i]))

    for i in range(1,n):
        e1=heapq.heappop(h)
        e2=heapq.heappop(h)
        heapq.heappush(h,(e1[0]+e2[0],e1[1]+e2[1]))
        print(e1,"+",e2)

    print(heapq.heappop(h))
label=['A','B','C','D','E','F','G','H']
freq=[24,   3,  8,  10, 33, 6,  4,  12]
make_tree(freq,label)

(3, 'B') + (4, 'G')
(6, 'F') + (7, 'BG')
(8, 'C') + (10, 'D')
(12, 'H') + (13, 'FBG')
(18, 'CD') + (24, 'A')
(25, 'HFBG') + (33, 'E')
(42, 'CDA') + (58, 'HFBGE')
(100, 'CDAHFBGE')


### 7) 테스트 코드
![image.png](attachment:20fabd24-7c3e-4959-82aa-ca036c181ff7.png)

### 8) 복잡도 분석
O(nlogn)