## Radix Sort
## 기수 정렬
기수 정렬(Radix Sort) 알고리즘은 가장 오른쪽에 있는 가장 낮은 자릿수(LSD)부터 시작하여,  
각 자릿수를 기준으로 배열을 정렬하는 알고리즘이다.


진법(base)이란 숫자 체계에서 서로 다른 숫자의 개수를 의미한다.  
우리가 일반적으로 사용하는 10진법에서는 0부터 9까지,  
총 10개의 서로 다른 숫자가 존재한다.


기수 정렬은 정수 값을 자릿수(digit) 단위로 나누어,  
현재 자릿수에 해당하는 값에 따라 각각의 다른 버킷(또는 컨테이너)에 분배한 뒤,  
다음 배열로 합치는 과정을 반복한다.  
이 과정을 다음 자릿수로 이동하면서 계속 수행한다.


기수 정렬은 값들을 서로 비교를 하지 않는 알고리즘이며,
기본적으로 음수가 아닌 정수에만 적용된다.  

## Stable Sorting
## 안정적인 정렬

기수 정렬(Radix Sort)은 올바른 결과를 얻기 위해  
각 단게에서 요소들을 안정적인 방식으로 정렬해야 한다.

안정 정렬 알고리즘이란,  
정렬 전후에 동일한 값을 가진 요소들의 상대적인 순서가 유지되는  
정렬 알고리즘을 의미한다.

예를 들어, "K"와 "L"이라는 두 요소가 있고  
"K"가 "L"보다 앞에 있으며,
두 요소 모두 값이 3이라고 가정하자.  
정렬 이후에도 "K"가 여전히 "L"보다 앞에 있다면,  
이 정렬 알고리즘은 안정적이라고 할 수 있다.

일반적인 정렬 알고리즘에서는  
안정성이 결과에 큰 영향을 주지 않는 경우도 있지만,  
기수 정렬의 경우에는 상황이 다르다.

기수 정렬은 각 요소를 한 번에 한 자릿수씩 정렬하므로,  
다음 자릿수로 이동할 때  
이전 자릿수에서 이미 수행된 정렬 결과가  
유지되어야 한다.

따라서 가장 낮은 자릿수부터 정렬을 수행할 때,
각 단계에서 반드시 안정적인 정렬 알고리즘을 사용해야 하며,  
이것이 기수 정렬에서 안정 정렬이 필수적인 이유이다.

## 수동 실행

- 1단계: 정렬되지 않은 배열과 0부터 9까지의 진수에 해당하는 값을 담을 빈 배열로 시작한다.  
my_array = [ 33, 45, 40, 25, 17, 24 ]  
radix_array = [ [], [], [], [], [], [], [], [], [], [] ]

- 2단계: 가장 낮은 자릿수부터 정렬을 시작한다.  
my_array = [ 3`3`, 4`5`, 4`0`, 2`5`, 1`7`, 2`4` ]  
radix_array = [ [], [], [], [], [], [], [], [], [], [] ]

- 3단계: 이제 현재 선택된 숫자에 따라 radix 배열의 요소를 올바른 위치로 이동한다.  
my_array의 시작 부분에서 요소를 가져와 radix 배열의 올바른 위치에 추가한다.  
my_array = []  
radix_array = [ [4`0`], [], [], [3`3`], [2`4`], [4`5`, 2`5`], [], [1`7`], [], [] ]

- 4단계: 요소들을 초기 배열로 다시 옮긴다.  
radix_array를 번 버킷부터 9번 버킷까지 순서대로 순회하면서,  
각 버킷에 들어 있는 값을 그 순서대로 my_array에 다시 넣는다.  
my_array = [ 4`0`, 3`3`, 2`4`, 4`5`, 2`5`, 1`7` ]  
radix_array = [ [], [], [], [], [], [], [], [], [], [] ]

- 5단계: 이제 다음 숫자로 초점을 옮긴다. 45와 25라는 값은 처음과 마찬가지로  
서로 상대적인 순서로 유지되고 있음을 알 수 있다.  
이는 우리가 안정적인 방식으로 정렬하기 때문이다.  
my_array = [ `4`0, `3`3, `2`4, `4`5, `2`5, `1`7 ]  
radix_array = [ [], [], [], [], [], [], [], [], [], [] ]

- 6단계: 선택된 숫자에 따라 기수 배열로 요소를 이동한다.  
my_array = [ ]  
radix_array = [ [], [`1`7], [`2`4, `2`5], [`3`3], [`4`0, `4`5], [], [], [], [], [] ]

- 7단계: radix_array에 담긴 값을 0부터 9까지 버킷 순서로 합쳐서 my_array를 만든다.  
my_array = [ `1`7, `2`4, `2`5, `3`3, `4`0, `4`5 ]  
radix_array = [ [], [], [], [], [], [], [], [], [], [] ]

## Implement Radix Sort in Python
## 기수 정렬을 구현하기 위해 필요한 요소

- 1. 음수가 아닌 정수로 구성된 정렬할 배열
- 2. 현재 자릿수의 값(0~9)에 따라 원소를 분배하기 위한 버킷 2차원 배열(radix_array)
- 3. 정렬되지 않은 배열의 각 값을 확인하여, 현재 자릿수에 해당하는 버킷에 넣는 반복문
- 4. 버킷(radix_array)을 0번부터 9번까지 순서대로 순회하며, 원소들을 다시 배열에 합치는 반복문
- 5. 배열의 최댓값의 자릿수만큼 (더 이상 나눌 자릿수가 없을 때까지) 반복하는 외부 반복문

In [None]:
my_list = [170, 45, 75, 90, 802, 24, 2, 66]
print("원본 배열:", my_list)
radix_array = [[], [], [], [], [], [], [], [], [], []]
max_val = max(my_list)
exp = 1

# 현재 자리로 이동 (예: exp=10이면 10의 자리 기준)
while max_val // exp > 0:
    while len(my_list) > 0:
        val = my_list.pop()
        radix_index = (val // exp) % 10
        radix_array[radix_index].append(val)
    
    for bucket in radix_array:
        while len(bucket) > 0:
            val = bucket.pop()
            my_list.append(val)
    # 그 자리 숫자만 뽑기
    exp *= 10

print(my_list)

원본 배열: [170, 45, 75, 90, 802, 24, 2, 66]
[2, 24, 45, 66, 75, 90, 170, 802]


## Radix Sort Using Other Sorting Algorithms
## 다른 정렬 알고리즘을 사용한 기수 정렬

기수 정렬은 안정적인 정렬 알고리즘이라면 어떤 것이든 함께 구현할 수 있다.  
특정 자릿수를 기준으로 정렬할 때는 계수 정렬이나 버블 정렬과 같은  
안정적인 정렬 알고리즘이면 무엇이든 사용할 수 있다.

In [None]:
def bubble_sort(arr):
    n = len(arr)
    for i in range(n):
        for j in range(0, n - i - 1):
            if arr[j] > arr[j + 1]:
                arr[j], arr[j + 1] = arr[j + 1], arr[j]

def radix_sort_with_bubble_sort(arr):
    max_val = max(arr)
    exp = 1

    while max_val // exp > 0:
        radix_list = [ [],[],[],[],[],[],[],[],[],[] ]

        for num in arr:
            radix_index = (num // exp) % 10
            radix_list[radix_index].append(num)

        # 각 버킷을 Bubble Sort로 정렬
        for bucket in radix_list:
            bubble_sort(bucket)
        
        # 정렬된 버킷들을 0번부터 9번까지 순서대로 원래 배열에 다시 합침
        i = 0
        for bucket in radix_list:
            for num in bucket:
                arr[i] = num
                i += 1

        exp *= 10

my_list = [170, 45, 75, 90, 802, 24, 2, 66]

radix_sort_with_bubble_sort(my_list)

print(my_list)



[2, 24, 45, 66, 75, 90, 170, 802]


## Counting Sort 기반 LSD Radix Sort

기수 정렬은 각 자릿수마다 계수 정렬을 사용해 안정적으로 정렬한다.  
- LSD(Least Significant Digit): 가장 오른쪽 자리부터  
- 안정 정렬(Stable Sort): 같은 값의 상대적 순서 유지

기수 정렬에서 쓰는 계수 정렬은 값 전체가 아니라 현재 자릿수 기준으로 센다.

In [None]:
def counting_sort_by_digit(arr, exp):
    n = len(arr)
    # 정렬 결과를 담을 배열
    output = [0] * n
    # 자릿수 (0 ~ 9) 개수 저장
    count = [0] * 10

    # 현재 자릿수(exp)에 해당하는 숫자 개수 세기
    for num in arr:
        # # 예: exp = 10 이면 → 10의 자리 숫자 추출
        digit = (num // exp) % 10
        count[digit] += 1
    # digit: 0 1 2 3 4 5 6 7 8 9
    # count: 2 0 2 0 1 2 1 0 0 0


    # count[i] = i 이하 자릿수를 가진 원소의 총 개수
    # output 배열에서 들어갈 끝 위치 정보
    for i in range(1, 10):
        count[i] += count[i - 1]
    # count: 2 2 4 4 5 7 8 8 8 8

    # 뒤에서 부터 순회해야 stable sort가 보장
    for i in range(n - 1, -1, -1):
        digit = (arr[i] // exp) % 10
        # count[digit] - 1 이 숫자가 들어가야 할 정확한 위치
        # 예시 count[5] = 7 는 0~5 자릿수 숫자들이 output 배열의 앞에서 7칸을 차지한다
        output[count[digit] - 1] = arr[i]
        count[digit] -= 1
    
    # 결과를 원본 배열에 복사
    # 다음 자릿수 정렬의 입력으로 사용하기 위해
    for i in range(n):
        arr[i] = output[i]

def radix_sort(arr):
    max_val = max(arr)
    exp = 1

    while max_val // exp > 0:
        counting_sort_by_digit(arr, exp)
        exp *= 10

my_list = [170, 45, 75, 90, 802, 24, 2, 66]
radix_sort(my_list)
print(my_list)

[2, 24, 45, 66, 75, 90, 170, 802]


## Radix Sort 코드 설명
- 라딕스 정렬은 숫자를 직접 비교하지 않고 자릿수별로 정렬을 반복한다.
- 1의 자리부터 시작하여 10의 자리, 100의 자리 순서로 정렬한다.
- 각 자릿수 정렬에는 counting sort를 사용한다.

- digit = (num // exp) % 10  
  현재 자릿수(exp)에 해당하는 숫자를 추출한다.

- count 배열은 처음에는 digit의 개수를 저장하고,  
  누적합 이후에는 각 digit이 차지할 자리의 경계를 나타낸다.

- output[count[digit] - 1] 위치에 값을 저장하여  
  digit 그룹의 끝자리부터 채운다.

- 배열을 뒤에서부터 순회하여 같은 digit을 가진 원소들의
  상대적 순서를 유지한다(안정 정렬).

- 모든 자릿수 정렬이 끝나면 배열은 전체 오름차순으로 정렬된다.


## Radix Sort Time Complexity
## 기수 정렬 시간 복잡도

- 라딕스 정렬의 시간 복잡도: $O(d \cdot (n + k))$
- 각 자릿수마다 counting sort를 한 번씩 수행한다.
- 여기서  
  - n은 정렬할 원소의 개수  
  - d는 가장 큰 수의 자릿수 개수  
  - k는 자릿수의 범위 (10진수 기준으로 10)

- 한 자릿수 단계에서
  - 개수 세기와 배열 재배치에 $O(n)$의 시간이 걸리고
  - 누적합 계산에 $O(k)$의 시간이 걸린다.
- 이 과정을 자릿수 개수 d만큼 반복한다.

- 10진수 기준에서는 k가 상수이므로
  - 전체 시간 복잡도는 보통 $O(d \cdot n)$으로 본다.

라딕스 정렬은 비교 정렬이 아니며,  
자릿수별로 안정 정렬을 반복하기 때문에  
n이 크고 자릿수가 제한적인 경우 매우 효율적인 정렬 알고리즘이다.
