# 정렬 알고리즘

정렬(Sorting)이란 데이터를 특정한 기준에 따라서 순서대로 나열하는 것을 말한다 프로그램에서 데이터를 오름차순, 내림차순 등으로 정렬하여 사용하는 경우가 많기에 가장 많이 사용되는 알고리즘 중 하나이다. 정렬 알고리즘으로 데이터를 정렬하면 추후 탐색(Search)가 가능해진다. 정렬 알고리즘은 이진 탐색(Binary Search)의 전처리 과정이기도 하다.

정렬 알고리즘은 굉장히 다양하다. 이 중에서 많이 사용되는 것은 선택 정렬, 삽입 정렬, 퀵 정렬, 계수 정렬이다. 이들에 대해 알아보고 더불어 파이썬에서 제공하는 기본 정렬 라이브러리를 적용하여 좀 더 효과적인 정렬 수행 방법을 알아본다.

보통 정렬부터 공부하면 알고리즘의 효율성을 쉽게 이해할 수 있어 알고리즘 개론서 초반에 정렬 알고리즘을 공부하는 경우가 많다. 또한 일반적으로 문제에서 요구하는 조건에 따라서 적절한 정렬 알고리즘이 공식처럼 사용된다. 상황에 적절하지 못한 정렬 알고리즘을 사용하면 당연히 프로그램은 비효율적으로 동작하며 필요 이상으로 시간을 소모한다. 그래서 정렬 알고리즘을 공부하면 자연스레 알고리즘 효율의 중요성을 이해할 수 있다.

## 선택 정렬

컴퓨터가 데이터를 정렬할 때 어떻게 할지 생각해보자. 데이터가 다수 있을 때, 이 중 가장 작은 데이터를 선택해 맨 앞의 데이터와 바꾸고, 그 다음 작은 데이터를 선택하여 앞에서 두번째 데이터와 바꾸는 과정을 통해 데이터를 오름차순 정렬할 수 있을 것이다. 물론 이 방식은 가장 원시적인 방법으로 매번 가장 작은 것을 선택한다는 의미에서 "선택 정렬(Selection Sort)" 알고리즘이라고 한다.

In [3]:
# 선택 정렬 알고리즘 예제

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

# array를 구성하는 component의 개수만큼 반복문을 진행
for i in range(len(array) - 1):
    # i index부터 마지막 까지의 array를 탐색하여 가장 작은 값을 찾고, i번째 component와 교체한다.
    #     물론 마지막 iteration에서는 정렬이 실행되지 않기 위해서 range 설정을 수정한다.
    
    temp_array = array[i:]
    
    smallest_idx = 0
    
    for j in range(len(temp_array)):
        if temp_array[j] < temp_array[smallest_idx]:
            smallest_idx = j
    
    smallest_idx += i
    
    temp_storage = array[i]
    array[i] = array[smallest_idx]
    array[smallest_idx] = temp_storage

print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 선택 정렬의 시간 복잡도

선택 정렬의 시간 복잡도를 계산해보자.
선택 정렬은 N - 1번만큼 가장 작은 수를 찾아서 맨 앞으로 보내야 한다. 또한 매번 가장 작은 수를 찾기 위한 비교연산이 필요하다. 연산 횟수를 계산하면 아래와 같다.

$$ N + (N - 1) + (N - 2) + ... + 2 \approx (N^2 + N) / 2 $$

이를 Big O 표기법으로 간단히 $O(N^2)$로서 표현할 수 있다.

$O(N^2)$의 시간 복잡도를 지니는 알고리즘은 만약 정렬해야 할 데이터의 수가 100배 늘어나면, 이론적으로 수행 시간은 10000배 늘어난다. 때문에 다른 정렬 알고리즘들과 비교했을 때, 매우 비효율적이라 할 수 있다. 그리고 가장 효율이 뛰어난 것은 파이썬에 내장된 기본 정렬 라이브러리이다. 이 기본 정렬 라이브러리는 내부적으로 c언어 기반이며, 다양한 최적화 technique가 포함되어 있끼에 더욱 빠르게 동작한다.