## Counting Sort with Python
## 계수 정렬
계수 정렬 알고리즘은 각 값이 나타나는 횟수를 세어 배열을 정렬한다.
계수 정렬은 이전에 살펴본 정렬 알고리즘처럼 값을 비교하지 않으며,
음수가 아닌 정수에 대해서만 바로 적용할 수 있다.

### 계수 정렬이 효율적인 경우
- 값의 범위 k가 데이터의 개수 n보다 작을 때
  계수 정렬은 매우 빠르게 동작한다.


### 작동 방식
- 1. 입력 배열의 최댓값을 기준으로, 각 값의 개수를 저장할 카운팅 배열을 생성한다.
- 2. 정렬해야 할 배열을 처음부터 끝까지 순회한다.
- 3. 각 값에 대해, 해당 값에 대응하는 카운팅 배열의 인덱스를 1씩 증가시켜 등장 횟수를 계산한다.
- 4. 값의 개수를 모두 센 후, 카운팅 배열을 처음부터 끝까지 순회한다.
- 5. 카운팅 배열의 각 인덱스 값만큼, 해당 인덱스에 해당하는 값을 결과 배열에 차례대로 추가한다.

### Conditions for Counting Sort
### 계수 정렬 조건

계수 정렬은 특정 조건을 만족할 때만
효율적으로 사용할 수 있는 정렬 알고리즘이다

### 1. 정수 값
- 계수 정렬은 각 값의 등장 횟수를 세는 방식이다.
- 정수 값은 배열의 인덱스로 직접 사용할 수 있다.
- 서로 다른 값의 개수 k가 데이터 개수 n에 비해 너무 크지 않아야 효율적이다

### 2. 음수가 아닌 값
- 계수 정렬은 카운팅 배열을 사용한다.
- 값 x는 카운팅 배열의 인덱스 x에 대응된다.
- 음수 값이 존대하면 배열 인덱스로 사용할 수 없어 기본 구현에서는 처리할 수 없다.

### 3. 제한된 값의 범위
- 값의 범위 k가 데이터 개수 n보다 크면 카운팅 배열이 원본 배열보다 커지게 된다.
- 이 경우 메모리 사용량이 증가하고 알고리즘의 효율이 떨어진다.

### 수동 실행

- 1단계: 정렬되지 않은 배열로 시작  
myarray = [2, 3, 0, 2, 3, 2]
  
- 2단계: 각 값의 개수를 세기 위한 또 다른 배열을 생선한다. 이 배열을 0부터 3까지의 값을 저장하기 위해 4개의 요소를 갖는다  
myarray = [2, 3, 0, 2, 3, 2]  
count_array = [0, 0, 0, 0]

- 3단계: 카운팅 시작. 첫 번째 요소는 2이므로 인덱스 2에 있는 카운팅 배열 요소를 증가시켜야 한다.  
myarray = [`2`, 3, 0, 2, 3, 2]  
count_array = [0, 0, `1`, 0]

- 4단계 값을 세고 나면 해당 값을 제고하고, 다음 값인 3을 셀 수 있다.  
myarray = [`3`, 0, 2, 3, 2]  
count_array = [0, 0, 1, `1`]

- 5단계: 다음 요소는 0이므로 카운팅 배열에서 인덱스 0을 증가시킨다.  
myarray = [`0`, 2, 3, 2]  
count_array = [1, 0, 1, 1]

- 6단계: 모든 값이 계산될 때까지 이와 같은 과정을 반복한다.  
myarray = []
count_array = [1, 0, 3, 2]

- 7단계: 이제 초기 배열의 요소들을 다시 생성하고 가장 낮은 값부터 가장 높은 값 순으로 정렬한다.  
카운팅 배열의 첫 번째 요소는 값이 0인 요소가 1개 있음을 알려준다. 따라서 값이 0인 요소를 배열에 추가하고,  
카운팅 배열의 인덱스 0에 있는 요소가 감소한다.
myarray = [`0`]  
count_array = [`0`, 0, 3, 2]

- 8단계: 카운팅 배열을 보면 값이 1인 요소를 생성할 필요가 없다는 것을 알 수 있다.  
myarray = [0]  
count_array = [0, `0`, 3, 2]

- 9단계: 값이 2인 요소 3개를 배열의 끝에 추가한다. 이 요소들을 추가할 때마다 배열의 인덱스 2의 요소가 1씩 감소한다.  
myarray = [0, `2`, `2`, `2`]  
count_array = [0, 0, `0`, 2]

- 10단계: 마지막으로 배열의 끝에, 값이 3인 요소 2개를 추가해야 한다.  
myarray = [0, 2, 2, 2, `3`, `3`]  
count_array [0, 0, 0, `0`]

배열 정렬 완료.


## Implement Counting Sort in Python
## 계수 정렬에 필요한 요소

- 1. 정렬할 값이 담긴 배열
- 2. 정수 배열을 매개변수로 받는 'counting_sort' 함수
- 3. 각 값의 등장 횟루를 저장할 카운팅 배열(count_array)
- 4. 입력 배열을 순회하면서, 값 x가 등장할 때마다 'count_array[x]'를 1씩 증가시키는 반복문
- 5. 카운팅 배열을 순회하면서, 각 값이 등장한 횟수만큼 결과 배열(또는 원본 배열)에 값을 채워 넣는 반복문

계수 정렬을 구현하려면, 배열에서 가장 큰 값이 무엇인지 알아야한다. 그래야 카운팅 배열의 크기를 정확하게 만들 수 있다.  
예를 들어, 최댓값이 5라면, 0 ~ 5까지의 모든 음수가 아닌 정수를 세기 위해 카운팅 배열은 총 6개의 요소로 구성되어야 한다.

In [None]:
def counting_sort(arr):
    max_val = max(arr)
    # 값의 범위(0 ~ max_val)만큼 카운팅 배열 생성
    count = [0] * (max_val + 1)

    while len(arr) > 0:
        # 원본 배열의 맨 앞 요소를 꺼낸다
        num = arr.pop(0)
        # 카운팅 배열에 값 num에 해당하는 인덱스의 카운트를 증가
        count[num] += 1

    # count = [0, 1, 3, 3, 1, 1, 2] 배열을 i가 각 인덱스를 순회
    for i in range(len(count)):
        # 순회하면서 인덱스의 요소가 0보다 크면
        while count[i] > 0:
            # arr 배열에 값 i를 배열의 끝에 추가
            arr.append(i)
            # count 배열에 인덱스 i의 요소를 1을 감소
            count[i] -= 1
    return arr

mylist = [4, 2, 2, 6, 3, 3, 1, 6, 5, 2, 3]
mysortedlist = counting_sort(mylist)
print(mysortedlist)

[1, 2, 2, 2, 3, 3, 3, 4, 5, 6, 6]


### 시간 복잡도 분석
arr.pop(0)은 리스트의 맨 앞 요소를 제거하고 모든 요소를 한 칸씩 왼쪽으로 이동한다 O(n)  
이 연산을 배열 길이 만큼 반복한다. 총 n 번  
O(n) × O(n) = O(n²)
이 코드는 계수 정렬의 이론적 장점 (O(n + k))를 전혀 활용하지 못하고 데이터가 많아질수록 느려진다.

### 개선된 계수 정렬

In [None]:
def counting_sort(arr):
    max_val = max(arr)
    count = [0] * (max_val + 1)

    # 원본 배열을 순회하며 등장 횟수 세기
    for num in arr:
        count[num] += 1

    # count = [0, 1, 3, 3, 1, 1, 2] 
    sorted_arr = []
    for value in range(len(count)):
        # value를 count[value]번 반복한 리스트 생성
        sorted_arr.extend([value] * count[value])
    
    return sorted_arr

mylist = [4, 2, 2, 6, 3, 3, 1, 6, 5, 2, 3]
mysortedlist = counting_sort(mylist)
print(mysortedlist)

[1, 2, 2, 2, 3, 3, 3, 4, 5, 6, 6]


### 시간 복잡도 분석
- 1. 카운팅 단계: 배열을 한 번 순회 O(n)
- 2. 결과 생성 단계: count 배열 길이 = 값의 범위 = k  
각 값은 등장 횟수만큼만 처리 O(k)  O(n + k)

개선된 계수 정렬은 원본 배열을 수정하지 않고
각 값의 등장 횟수를 세어 결과 배열을 구성하므로
시간 복잡도는 O(n + k)이다.