# 정렬 알고리즘

- **정렬(Sorting)**이란 데이터를 특정한 기준에 따라 순서대로 나열하는 것
- 일반적으로 문제 상황에 따라 적절한 정렬 알고리즘이 공식처럼 사용

## 선택 정렬
- 처리되지 않은 데이터 중에 가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸는 것을 반복
- 즉 숫자를 오름차순으로 정렬한다고 가정했을 때, 정렬처리 되지 않은 데이터 중 가장 작은 값을 맨 앞의 값과 바꾸는 방식



In [1]:
# 선택 정렬 소스코드

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(len(array)):
    min_index = i    # 가장 작은 원소의 인덱스
    for j in range(i+1, len(array)):
        if array[min_index] > array[j]:
            min_index = j
    
    array[i], array[min_index] = array[min_index], array[i]  # 스와프
    
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


시간 복잡도는 N + (N-1) + (N-2) + ... + 2 이기 때문에 $O(N^2)$

## 삽입 정렬

- 처리되지 않은 데이터를 하나씩 골라 적절한 위치에 삽입
- 선택 정렬에 비해 구현 난이도가 높은 편이지만, 일반적으로 선택 정렬보다 빠름
- 맨 앞에 있는 원소는 정렬되어 있다고 가정하고 나머지 데이터들이 어떤 위치에 들어갈지를 일일히 판단 (삽입된 후엔 그 데이터 또한 정렬 되었다고 가정)


In [2]:
# 삽입 정렬 소스코드

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(1, len(array)):
    for j in range(i, 0, -1):   # 인덱스 i부터 1까지 1씩 감소
        if array[j] < array[j-1]:  # 한칸씩 왼쪽으로 이동
            array[j], array[j-1] = array[j-1], array[j]
        else:
            break
            
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


시간 복잡도는 마찬가지로 2중 for문이라 $O(N^2)$.

보통은 삽입 정렬이 비효율적이나 정렬이 거의 되어 있는 상태에서는 매우 빠르게 동작

## 퀵 정렬
- 기준 데이터를 설정하고 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾸는 방법
- 일반적인 상황에서 가장 많이 사용되는 정렬 알고리즘 중 하나
- 가장 기본적인 퀵 정렬은 첫 번째 데이터를 기준 데이터(Pivot)으로 설정
- 피벗의 값보다 큰 값을 왼쪽에서부터 선택하고, 오른쪽에서부터 피벗의 값보다 작은 값을 선택한 후 두 데이터의 위치를 변경
    - 이후 바꾼 데이터를 제외하고 같은 과정 반복
    - 만약 작은값과 큰 값의 위치가 엇갈리는 경우(크로스 하는 경우) 피벗과 작은데이터의 위치를 서로 변경
    - 그렇게 되면 피벗 값의 왼쪽에 있는 데이터는 모두 피벗보다 작고, 오른쪽은 모두 피벗보다 큼. 이걸 분할했다고 표현하며, 각각의 분할된 데이터별로 같은 정렬을 반복하여 최종 정렬
 
- 이상적인 경우 분할이 절반씩 일어난다면 전체 연산 횟수은 $O(NlogN)$
- 하지만 최악의 경우(이미 정렬된 배열에 대해 퀵 정렬을 수행하는데, 첫 번째 원소를 피벗으로 삼음) $O(N^2)$

In [4]:
# 퀵 정렬 소스코드

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array, start, end):
    if start >= end:  # 원소가 1개인 경우
        return
    
    pivot = start    # 첫번째 원소
    left = start + 1
    right = end
    while left <= right:
        # 피벗보다 큰 데이터를 찾을때까지 반복
        while left <= end and array[left] <= array[pivot]:
            left += 1
        while right > start and array[right] >= array[pivot]:
            right -= 1
        if left > right:    # 엇갈림
            array[right], array[pivot] = array[pivot], array[right]
        else:   # 엇갈리지 않음
            array[left], array[right] = array[right], array[left]
    # 분할 이후 왼쪽 부분과 오른쪽 부분에서 정렬 수행        
    quick_sort(array, start, right - 1)
    quick_sort(array, right + 1, end)
    
quick_sort(array, 0, len(array)-1)
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [5]:
# 퀵 소스코드 : 파이썬 장점을 살린 방식

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array):
    if len(array) <= 1:
        return array
    pivot = array[0]
    tail = array[1:]   # 피벗을 제외한 리스트
    
    left_side = [x for x in tail if x <= pivot]  # 분할된 왼쪽부분
    right_side = [x for x in tail if x > pivot]
    
    return quick_sort(left_side) + [pivot] + quick_sort(right_side)

print(quick_sort(array))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


## 계수 정렬
- 특정한 조건이 부합할 때만 사용할 수 있지만 매우 빠르게 동작
    - 데이터의 크기 범위가 제한되어 정수 형태로 표현 가능할 때 사용가능
    
- 데이터의 개수가 N, 데이터(양수) 중 최댓값이 K일 때 최악의 경우에도 수행시간 $O(N+K)$를 보장.

1. 가장 작은 데이터부터 가장 큰 데이터까지의 범위가 모두 담길 수 있도록 리스트를 생성 (0 1 2 2 2 3 이면 0 0 0 0의 네가지 인덱스를 가진 리스트 생성)
2. 데이터를 하나씩 확인하며 데이터의 값과 동일한 인덱스의 데이터를 1씩 증가
3. 결과를 확인할 때는 리스트의 첫번째 데이터부터 하나씩 그 값만큼 반복하여 인덱스를 출력

In [7]:
# 계수 정렬 소스코드
# 모든 원소의 값은 0보다 크거나 같아야 함
array = [7, 5, 9, 0, 3, 1, 6, 2, 9, 1, 4, 8, 0, 5, 2]
# 모든 범위를 포함하는 리스트 선언
count = [0]*(max(array)+1)

for i in range(len(array)):
    count[array[i]] += 1
    
for i in range(len(count)):
    for j in range(count[i]):
        print(i, end=' ')

0 0 1 1 2 2 3 4 5 5 6 7 8 9 9 

- 때에 따라서 심각한 비효율성 초래 가능
    - 데이터가 0과 999,999로 단 2개만 존재하는 경우
- 중복 값이 여러개 등장할 때 효과적으로 사용 가능

## 정렬 알고리즘 비교
1. 선택 정렬 : 아이디어가 매우 간단
2. 삽입 정렬 : 데이터가 거의 정렬되어 있을 때 가장 빠름
3. 퀵 정렬 : 대부분의 경우 적합
4. 계수 정렬 : 데이터의 크기가 한정되어 있는 경우에만 사용이 가능하지만 매우 빠름

### <문제> 두 배열의 원소 교체

- 동빈이는 두 배열 A와 B를 가지고 있다. 두 배열은 N개의 원소로 구성되며, 배열의 원소는 모두 자연수이다.
- 동빈이는 최대 K번의 바꿔치기 연산을 수행할 수 있는데, 바꿔치기 연산이란 배열 A에 있는 원소 하나와 배열 B에 있는 원소 하나를 골라서 서로 바꾸는 것을 뜻함
- 동빈이의 최종 목표는 배열 A의 모든 원소의 합이 최대가 되도록 하는 것
- 바꿔치기 연산 수행 이후 만들 수 있는 배열 A의 모든 원소의 합의 최댓값을 출력하는 프로그램을 작성

In [10]:
n, k = map(int, input().split())
a = list(map(int, input().split()))
b = list(map(int, input().split()))

a.sort()
b.sort(reverse=True)
for i in range(k):
    if a[0] < b[0]:
        a[0], b[0] = b[0], a[0]
        a.sort()
        b.sort(reverse=True)
    else:
        break
        
sum(a)

5 3
1 2 5 4 3
5 5 6 6 5


26

앞에서 배운 정렬 종류 안따져도 걍 .sort()랑 sorted()로 가능..