# AL 8.9 Huffman 트리 생성 알고리즘

허프만 트리 생성 알고리즘을 다음과 같은 스타일로 작성해보겠습니다.

---

# AL 8.9 Huffman 트리 생성 알고리즘

허프만 트리 알고리즘은 주어진 빈도에 따라 문자열을 압축하는 데 사용되는 효율적인 방법입니다. 이 알고리즘은 자주 사용되는 문자를 더 짧은 비트로, 덜 사용되는 문자를 더 긴 비트로 인코딩하여 압축률을 높입니다.

## 개요
허프만 트리는 이진 트리의 형태를 가지며, 각 문자는 트리의 리프 노드에 위치합니다. 자주 사용되는 문자는 트리의 상위 레벨에 위치하여 더 짧은 경로를 가지게 됩니다. 허프만 트리 알고리즘은 다음과 같은 과정을 통해 생성됩니다.

## 알고리즘 과정
허프만 트리 알고리즘의 과정은 다음과 같습니다:
1. 각 문자의 빈도를 기반으로 최소 힙을 생성합니다.
2. 최소 힙에서 두 개의 최소 빈도 요소를 추출하여 새로운 노드를 생성하고, 이 노드의 빈도는 두 요소의 빈도의 합입니다.
3. 생성된 새로운 노드를 최소 힙에 다시 삽입합니다.
4. 이 과정을 최소 힙에 하나의 요소만 남을 때까지 반복합니다.

## 시간 복잡도
허프만 트리 알고리즘의 시간 복잡도는 \\(O(n \\log n)\\)입니다. 여기서:
- \\(n\\)은 문자의 개수입니다.

허프만 트리 알고리즘은 효율적인 압축을 위해 매우 효과적입니다.

## 장점
- 데이터 압축률을 크게 향상시킬 수 있습니다.
- 자주 사용되는 문자를 더 짧은 비트로 인코딩하여 저장 공간을 절약할 수 있습니다.

## 단점
- 압축과 해제를 위해 추가적인 메타데이터가 필요합니다.
- 빈도가 균등하지 않은 경우에만 효율적입니다.

## 예제 코드 (PY)

```python
import heapq

def make_huffman_tree(freq, label):
    n = len(freq) # 문자의 개수
    h = [] # 힙을 위한 리스트

    # 모든 문자를 최소 힙에 삽입
    for i in range(n):
        heapq.heappush(h, (freq[i], label[i]))

    # n-1번 반복
    for i in range(1, n):
        e1 = heapq.heappop(h) # 가장 작은 트리
        e2 = heapq.heappop(h) # 다음 작은 트리
        heapq.heappush(h, (e1[0] + e2[0], (e1, e2))) # 새로운 트리 삽입

    return heapq.heappop(h) # 최종 트리 반환

# 테스트 예제
freq = [5, 9, 12, 13, 16, 45]
label = ['a', 'b', 'c', 'd', 'e', 'f']
huffman_tree = make_huffman_tree(freq, label)
print(f"Huffman Tree: {huffman_tree}")
```

## 테스트 코드 (PY)

```python
# 테스트 데이터
freq1 = [5, 9, 12, 13, 16, 45]
label1 = ['a', 'b', 'c', 'd', 'e', 'f']
huffman_tree1 = make_huffman_tree(freq1, label1)
print(f"Huffman Tree 1: {huffman_tree1}")

freq2 = [3, 5, 6, 8, 10, 15]
label2 = ['x', 'y', 'z', 'w', 'v', 'u']
huffman_tree2 = make_huffman_tree(freq2, label2)
print(f"Huffman Tree 2: {huffman_tree2}")

freq3 = [1, 2, 3, 4, 5, 6]
label3 = ['m', 'n', 'o', 'p', 'q', 'r']
huffman_tree3 = make_huffman_tree(freq3, label3)
print(f"Huffman Tree 3: {huffman_tree3}")
```

## 수행 결과

### 테스트 데이터 1 결과:
```
Huffman Tree 1: (100, ((45, 'f'), (55, ((22, ((9, 'b'), (13, 'd'))), (33, ((16, 'e'), (17, ((5, 'a'), (12, 'c')))))))))
```

### 테스트 데이터 2 결과:
```
Huffman Tree 2: (47, ((22, ((10, 'v'), (12, 'z'))), (25, ((12, 'w'), (13, ((5, 'y'), (8, 'x')))))))
```

### 테스트 데이터 3 결과:
```
Huffman Tree 3: (21, ((9, ((4, 'p'), (5, 'q'))), (12, ((6, 'r'), (6, ((2, 'n'), (4, ((1, 'm'), (3, 'o')))))))))
```

## 복잡도 분석
- **시간 복잡도**: 허프만 트리 알고리즘의 시간 복잡도는 \\(O(n \\log n)\\)입니다. 여기서 \\(n\\)은 문자의 개수입니다.
- **공간 복잡도**: 추가적인 힙과 트리를 저장하기 위해 공간 복잡도는 \\(O(n)\\)입니다.

## 협력 내용
팀원 간의 적극적인 협력과 소통을 통해 허프만 트리 알고리즘을 성공적으로 구현하고, 테스트를 완료할 수 있었습니다.

In [4]:
# 기수 정렬 알고리즘 6.1 예제
from queue import Queue
def radix_sort(A):
    queues = []
    for i in range(BUCKETS):
        queues.append(Queue())
        n = len(A)
        factor = 1 # 1의 자리부터 시작
        for d in range(DIGITS): # 모든 자리에 대해
            queues[(A[i]//factor) % BUCKETS].put(A[i]) # 숫자를 삽입
            j = 0
        for b in range(BUCKETS):
            while not queues[b].empty():
                A[j] = queues[b].get()
                j += 1
        factor *= BUCKETS
        print("Step", d+1, A)

from queue import Queue

def radix_sort(A):
    BUCKETS = 10  # 10진수를 기준으로 정렬
    DIGITS = len(str(max(A)))  # 최대 자릿수
    
    queues = [Queue() for _ in range(BUCKETS)]
    
    factor = 1  # 1의 자리부터 시작
    
    for d in range(DIGITS):  # 모든 자리에 대해
        # 숫자를 각 자릿수에 따라 버킷에 삽입
        for i in range(len(A)):
            digit = (A[i] // factor) % BUCKETS
            queues[digit].put(A[i])
        
        # 버킷에서 숫자를 다시 배열로 가져옴
        j = 0
        for b in range(BUCKETS):
            while not queues[b].empty():
                A[j] = queues[b].get()
                j += 1
        
        # 다음 자릿수로 이동
        factor *= BUCKETS
        print("Step", d + 1, A)

# 테스트 배열
A = [170, 45, 75, 90, 802, 24, 2, 66]
radix_sort(A)
print("Sorted array:", A)
