# 정렬 알고리즘

* 정렬: 데이터를 특정한 기준에 따라서 순서대로 나열하는 것
* 데이터를 정렬해야 이진 탐색(7장) 가능

## 선택 정렬 (Selection Sort)
* 가장 작은 데이터를 선택해 맨 앞의 데이터와 바꾸고
* 그 다음으로 작은 데이터를 선택해 두 번째 데이터와 바꾸고
* 과정을 반복한다.

In [1]:
# 선택 정렬
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(len(array)):
    # 아직 확정되지 않은 영역 중 맨 앞 인덱스
    min_index = i
    for j in range(i + 1, len(array)):
        if array[j] < array[min_index]:
            min_index = j
    # swap
    array[i], array[min_index] = array[min_index], array[i]

print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


**시간 복잡도**
* $N-1$번 가장 작은 수를 찾아 맨 앞으로 보냄
* $N + (N-1) + (N-2) + ... + 2 \simeq \frac{N^2+N}{2}$
* $O(N^2)$, 이중 반복문이 사용되었기 때문. 느리다!

## 삽입 정렬 (Insertion Sort)
* 데이터를 하나씩 확인하며, 각 데이터를 적절한 위치에 삽입하기
* 무조건 모든 원소를 비교하는 선택 정렬과 달리, 필요할 때만 위치를 바꾸기 때문에 더 효율적
* 정렬이 이루어진 원소는 항상 오름차순이므로, **삽입할 데이터보다 작은 데이터**를 만나면 그 위치에서 멈추면 됨

In [2]:
# 삽입 정렬
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(1, len(array)):
    for j in range(i, 0, -1):
        # 자기보다 큰 데이터
        if array[j - 1] > array[j]:
            array[j], array[j - 1] = array[j - 1], array[j]
        # 자기보다 작은 데이터
        else:
            break

print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


**시간 복잡도**
* $O(N^2)$, 선택 정렬과 마찬가지로 반복문이 2번 중첩
* **현재 리스트의 데이터가 거의 정렬된 상태**이면 매우 빠르게 동작

## 퀵 정렬 (Quick Sort)
* 기준 데이터를 설정하고, 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾼 뒤, 리스트를 반으로 나누기
* 피벗 사용 - 큰 숫자와 작은 숫자를 교환하는 기준
  * 여기선 리스트에서 첫 번째 데이터
  * 왼쪽부터 피벗보다 큰 데이터, 오른쪽부터 피벗보다 작은 데이터를 찾은 후 교환 -> 반복
  * 왼쪽, 오른쪽이 엇갈릴 땐 작은 데이터와 피벗을 교환
  * 이동한 피벗 기준으로 분할 -> 왼쪽엔 모두 더 작은, 오른쪽엔 모두 더 큰 데이터
  * 분할된 데이터도 재귀적으로 퀵 정렬 실시

In [6]:
array = [5, 7, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array, start, end):
    if start >= end: # 원소가 1개 이하일 때
        return
    pivot = start # 피벗은 첫 번째 원소
    left = start + 1
    right = end

    while left <= right:
        # 피벗보다 큰 데이터를 찾을 때까지
        while left <= end and array[left] <= array[pivot]:
            left += 1
        # 피벗보다 작은 데이터를 찾을 때까지
        while right > start and array[right] >= array[pivot]:
            right -= 1
        # 엇갈린 경우
        if left > right:
            # 기존 피벗 데이터와, 피벗보다 작은 데이터를 교체
            array[right], array[pivot] = array[pivot], array[right]
        else:
            array[left], array[right] = array[right], array[left]

    # right 위치에 기존 피벗이 있기 때문
    quick_sort(array, start, right - 1)
    quick_sort(array, right + 1, end)

quick_sort(array, 0, len(array) - 1)
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [7]:
# 파이썬의 장점을 살린 퀵 정렬 소스코드
array = [5, 7,9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array):
    if len(array) <= 1:
        return array

    pivot = array[0] # 피벗은 첫 번째 원소
    tail = array[1:] # 피벗을 제외한 리스트
    left_side = [x for x in tail if x <= pivot] # 좌측
    right_side = [x for x in tail if x > pivot] # 우측

    return quick_sort(left_side) + [pivot] + quick_sort(right_side)

print(quick_sort(array))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


**시간 복잡도**
* 평균적으로 $O(N log N)$
* 높이 - 분할이 일어날 때마다 왼쪽, 오른쪽 리스트를 절반씩 분할 -> $log N$
* 밑변 - 데이터 수, $N$
* 단 최악의 경우 (이미 데이터가 정렬되어 있는 경우) 시간 복잡도가 $O(N^2)$
* C++, 파이썬의 기본 정렬은 최악의 경우에도 $O(N log N)$을 보장

## 계수 정렬 (Count Sort)
* 특정한 조건이 부합할 때만 사용할 수 있지만, 매우 빠름
* 데이터의 범위가 제한되어 정수 형태로 표현할 수 있을 때만 사용 가능
* 데이터의 수가 $N$, 최댓값이 $K$일 때 $O(N + K)$ 보장


* 가장 큰-작은 데이터의 범위가 모두 담길 수 있는 리스트 생성
* 데이터를 하나씩 확인하며, 데이터의 값과 동일한 인덱스의 데이터를 1씩 증가
* 리스트의 첫 데이터부터 하나씩 그 값만큼 인덱스를 출력하면 정렬 완료

In [9]:
# 모든 원소의 값이 0보다 크거나 같다
array = [7, 5, 9, 0, 3, 1, 6, 2, 9, 1, 4, 8, 0, 5, 2]
count = [0] * (max(array) + 1)

for a in array:
    count[a] += 1

for i in range(len(count)):
    for _ in range(count[i]):
        print(i, end=" ")


0 0 1 1 2 2 3 4 5 5 6 7 8 9 9 

**시간 복잡도**
* $O(N + K)$
* $N$: 데이터를 하나씩 확인하며 리스트의 인덱스 값을 1씩 증가
* $K$: 리스트의 각 인덱스에 해당하는 값을 확인할 때, 최댓값의 크기만큼 반복 수행


**공간 복잡도**
* 때에 따라서 심각하게 비효율적
* 데이터가 0, 999,999 2개밖에 없어도 리스트의 크기를 1,000,000으로 선언해야 함

## 파이썬의 정렬 라이브러리

* `sorted()`: 퀵 정렬 + 병합 정렬
  * 병합 정렬은 일반적으로 퀵 정렬보다 느리지만, 최악의 경우에도 $O(N log N)$을 보장
* 리스트, 딕셔너리, 집합 등 입력 -> 무조건 리스트 반환
* `list.sort()`로 바로 정렬도 가능 (반환 X)

In [10]:
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]
sorted(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [11]:
array.sort()
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


* `key` 매개변수: 정렬 기준
* `lambda` 함수 사용이 효과적

In [12]:
array = [('바나나', 2), ('사과', 5), ('당근', 3)]
result = sorted(array, key=lambda x:x[1])
print(result)

[('바나나', 2), ('당근', 3), ('사과', 5)]


# [실전] 위에서 아래료

In [14]:
n = int(input())
nums = []
for _ in range(n):
    nums.append(int(input()))
nums.sort(reverse=True)

for i in nums:
    print(i, end=" ")

3
15
27
12
27 15 12 

* $N=500$ 이므로 어떤 정렬 알고리즘을 사용해도 문제없음.

# [실전] 성적이 낮은 순서대로 학생 출력하기

In [15]:
n = int(input())
students = []
for _ in range(n):
    name, score = input().split()
    students.append((name, int(score)))

students.sort(key=lambda x: x[1])

for name, score in students:
    print(name, end=" ")

2
홍길동 95
이순신 77
이순신 홍길동 

* `lambda x: x[1]`로 해결할 수 있다.

# [실전] 두 배열의 원소 교체

In [16]:
n, k = map(int, input().split())
array_a = list(map(int, input().split()))
array_b = list(map(int, input().split()))
array_a.sort()
array_b.sort(reverse=True)

bottom_k = array_a[:k]
top_k = array_b[:k]

for i in range(k):
    if top_k[i] > bottom_k[i]:
        array_a[i], array_b[i] = array_b[i], array_a[i]
    else:
        break

print(sum(array_a))

5 3
1 2 5 4 3
5 5 6 6 5
26


* 최대 `K`회 교체: 배열 A에서 가장 작은 원소가 배열 B에서 가장 큰 원소보다 작을 때에만 교체 수행