- 연속된 데이터를 기준에 따라서 정렬하기 위한 알고리즘

# 1. 기준에 따라 데이터를 정렬
## 1-1. 정렬 알고리즘 개요

- **정렬 (Sorting)**: 데이터를 특정한 기준에 따라서 순서대로 나열하는 것
- 정렬 알고리즘으로 데이터를 정렬하면 이진탐색(Binary Search)이 가능해진다.
     - 정렬 알고리즘은 이진 탐색의 전처리 과정

> - 정렬 알고리즘은 매우 다양
> - 선택 정렬, 삽입 정렬, 퀵 정렬, 계수 정렬만 알아보자
> - +파이썬에서 제공하는 기본 정렬 라이브러리를 적용하여 좀 더 효과적인 정렬 수행 방법도 알아보자

- 정렬 알고리즘을 공부하다보면 자연스럽게 알고리즘 효율의 중요성을 알게된다.

---

## 1-2. 선택 정렬(Selection Sort)
- 가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸고 -> 그 다음 작은 데이터를 선택해 앞에서 두 번째 데이터와 바꾸는 과정을 반복한다면?


In [1]:
#선택정렬 코드소스

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(len(array)):
    min_index = i # 가장 작은 원소의 인덱스
    for j in range(i + 1, len(array)):
        if array[min_index] > array[j]:
            min_index = j
    array[i], array[min_index] = array[min_index], array[i] # 스와프

print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 선택정렬의 시간 복잡도

- 선택정렬의 시간 복잡도: $O(N^2)$

| 데이터의 개수(N) | 선택 정렬 | 퀵 정렬 | 기본 정렬 라이브러리 |
|---|---|---|---|
|N = 100|0.0123초|0.00156초|0.00000753초|
|N = 1,000|0.354초|0.00343초|0.0000365초|
|N = 10,000|15.475초|0.0312초|0.000248초|

- 선택정렬은 기본 정렬 라이브러리를 포함해 뒤에서 다룰 알고리즘과 비교했을 때 매우 비효율적
- 다만, 특정한 리스트에서 가장 작은 데이터를 찾는 일이 코딩 테스트에서 잦으므로 선택 정룔 소스코드 형태에 익숙해지면 좋다
- 따라서 선택 정렬 소스코드를 자주 작성해보면 좋다.

---

## 1-3. 삽입 정렬 (Insertion Sort)

- 데이터를 하나씩 확인하며, 각 데이터를 적절한 위치에 삽입하면 어떨까?
- 삽입 정렬은 필요할 때만 위치를 바꾼다





In [2]:
# 삽입 정렬 소스코드
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(1, len(array)):
    for j in range(i, 0, -1): # 인덱스 i부터 1까지 1씩 감소하며 반복하는 문법
        if array[j] < array[j - 1]: # 한 칸씩 왼쪽으로 이동
            array[j], array[j - 1] = array[j - 1], array[j]
        else: # 자기보다 작은 데이터를 만나면 그 위치에서 멈춤
            break

print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 삽입정렬의 시간 복잡도

- 삽입정렬의 시간 복잡도: $O(N^2)$
- 현재 리스트의 데이터가 거의 정렬되어 있는 상태라면 매우 빠르게 동작
- 최선의 경우 $O(N)$의 시간 복잡도


---

## 1-4. 퀵 정렬 (Quick Sort)

- 지금까지 배운 정렬 알고리즘 중에 가장 많이 사용되는 알고리즘.
- 기준 데이터를 설정하고 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾸면 어떨까?
- 퀵 정렬은 기준을 설정한 다음 큰 수와 작은 수를 교환한 후 리스트를 반으로 나누는 방식으로 동작


- 피벗(Pivot): 큰 숫자와 작은 숫자를 교환할 때, 교환하기 위한 '기준'


In [5]:
# 퀵 정렬 소스코드

array = [5, 7, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array, start, end):
    if start>=end: #원소가 1개인 경우 종료
        return
    
    pivot = start #피벗은 첫 번째 원소
    
    left = start + 1
    right = end
    
    while left <= right:
        
        #피벗보다 큰 데이터를 찾을 때까지 반복
        while left <= end and array[left] <= array[pivot]:
            left += 1
        
        #피벗보다 작은 데이터를 찾을 때까지 반복
        while right > start and array[right] >= array[pivot]:
            right -= 1
            
        if left>right: #엇갈렸다면 작은 데이터와 피벗을 교체
            array[right], array[pivot] = array[pivot], array[right]
        
        else: #엇갈리지 않았다면 작은 데이터와 큰 데이터를 교체
            array[left], array[right] = array[right], array[left]
            
        # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬 수행
        quick_sort(array, start, right - 1)
        quick_sort(array, right + 1, end)
        
        
quick_sort(array, 0, len(array) - 1)
print(array)
    

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [6]:
# 파이썬의 장점을 살린 퀵 정렬 소스코드

array = [5, 7, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array):
    
    #리스트가 하나 이하의 원소만을 담고 있다면 종료
    if len(array) <= 1:
        return array
    
    pivot = array[0] # 피벗은 첫 번째 원소
    tail = array[1:] # 피벗을 제외한 리스트
    
    left_side = [x for x in tail if x<=pivot] # 분할된 왼쪽 부분
    right_side = [x for x in tail if x>pivot] # 분할된 오른쪽 부분
    
    return quick_sort(left_side) + [pivot] + quick_sort(right_side)


print(quick_sort(array))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 퀵 정렬의 시간 복잡도

- 퀵 정렬의 평균 시간 복잡도는 $O(N\log N)$
- 앞의 두 정렬 알고리즘에 비해 매우 빠른 편


|데이터의 개수(N)| $N^2$ (선택정렬, 삽입정렬)| Nlog_2(N) (퀵정렬)|
|---|---|---|
|N = 1,000| 약 1,000,000| 약 10,000|
|N = 1,000,000| 약 1,000,000,000,000| 약 20,000,000|

---

## 1-5 계수 정렬(Count Sort)
- 특정한 조건이 부합할 때만 사용할 수 있지만 매우 빠른 정렬 알고리즘
- 모든 데이터가 양의 정수이면
    - 데이터의 개수가 N, 데이터 중 최댓값이 K일 때, 계수 정렬은 최악의 경우에도 수행시간 $O(N+K)$를 보장.
- 계수 정렬은 데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때만 사용 가능
- 일반적으로 가증 큰 데이터와 가장 작은 데이터의 차이가 1,000,000을 넘지 않을 때 효과적


- 계수 정렬을 이용할 때는 모든 범위를 담을 수 있는 크기의 리스트(배열)을 선언해야 함.

In [8]:
# 계수 정렬 소스코드

# 모든 원소의 값이 0보다 크거나 같다고 가정
array = [7, 5, 9, 0, 3, 1, 6, 2, 9, 1, 4, 8, 0, 5, 2]

# 모든 범위를 포함하는 리스트 선언(모든 값은 0으로 초기화)
count = [0] * (max(array) + 1)


for i in range(len(array)):
    count[array[i]] += 1
    
for i in range(len(count)):
    for j in range(count[i]):
        print(i, end = ' ')

0 0 1 1 2 2 3 4 5 5 6 7 8 9 9 

### 계수 정렬의 시간 복잡도

- 계수 정렬의 시간 복잡도는 $O(N + K)$이다.

### 계수 정렬의 공간 복잡도
- 계수 정렬은 데이터의 크기가 한정되어 있고, 데이터의 크기가 많이 중복되어 있을수록 유리하며 항상 사요할 수 없다.

- 조건만 만족한다면 계수 정렬은 정렬해야 하는 데이터의 개수가 매우 많을 때에도 효과적으로 사용할 수 있다.
- 계수 정렬의 공간 복잡도는 $O(N+K)$이다.

---

## 1-6. 파이썬의 정렬 라이브러리

- 정렬 알고리즘은 매우 많이 연구된 주제
- 정렬 알고리즘 문제는 어느 정도 정해진 답이 있다.


- 파이썬은 기본 정렬 라이브러리인 `sorted()` 함수를 제공한다.
- `sorted()`는 퀵 정렬과 동작 방식이 비슷한 병합 정렬을 기반으로 만들어짐
- 병합 정렬은 일반적으로 퀵 정렬보다 느리지만 최악의 경우에도 시간 복잡도 $O(N \log N)$을 보장한다는 특징이 있다.




In [9]:
# sorted 소스코드

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

result = sorted(array)
print(result)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [10]:
# sort 소스코드

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

array.sort()
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [11]:
# 정렬 라이브러리에서 key를 활용한 소스코드

array = [('바나나', 2), ('사과', 5), ('당근', 3)]

def setting(data):
    return data[1]

result = sorted(array, key=setting)
print(result)

[('바나나', 2), ('당근', 3), ('사과', 5)]


### 정렬 라이브러리의 시간 복잡도

- 정렬 라이브러리는 항상 최악의 경우에도 시간 복잡도 $O(N \log N)$을 보장한다.
- 파이썬은 병합 정렬에 기반한다고 했는데 정확히는 병합 정렬과 삽입 정렬의 아이디어를 더한 하이브리드 방식의 정렬 알고리즘을 사용하고있다.


- 코딩 테스트에서 정렬 알고리즘이 사용되는 경우를 일반적으로 3가지 유형으로 나타낼 수 있다.

> **1. 정렬 라이브러리로 풀 수 있는 문제**
    > - 단순히 정렬 기법을 알고 있는지 물어보는 문제로 기본 정렬 라이브러리의 사용 방법을 숙지하고 있으면 어렵지 않게 풀 수 있다.
    
> **2. 정렬 알고리즘의 원리에 대해서 물어보는 문제**
    > - 선택정렬, 삽입정렬, 퀵정렬 등의 원리를 알고 있어야 문제를 풀 수 있다.
    
> **3. 더 빠른 정렬이 필요한 문제**
    > - 퀵 정렬 기반의 정렬 기법으로는 풀 수 없으며 계수 정렬 등의 다른 정렬 알고리즘을 이용하거나 문제에서 기존에 알려진 알고리즘의 구조적인 개선을 거쳐야 풀 수 있다.


# 실전문제 1. 위에서 아래로

### 문제설명

- 입력으로 주어진 수열이 내림차순으로 정렬된 결과를 공백으로 구분하여 출력


### 문제 해설

- 수의 개수가 500개 이하로 매우 적으며, 모든 수는 1 이상 100,000 이하이므로 어떠한 정렬 알고리즘을 사용해도 문제를 해결할 수 있다.
- 가장 코드가 간결해지는 파이썬의 기본 정렬 라이브러리를 이용하는 것이 효과적

In [12]:
#N을 입력받기
n = int(input())

3


In [13]:
# N개의 정수를 입력받아 리스트에 저장
array = []
for i in range(n):
    array.append(int(input()))

15
27
12


In [15]:
# 파이썬 기본 정렬 라이브러리를 이용하여 정렬 수행
array = sorted(array, reverse = True)

In [16]:
#정렬이 수행된 결과를 출력
for i in array:
    print(i, end= " ")

27 15 12 

# 실전문제 2. 성적이 낮은 순서로 학생 출력하기

### 문제설명

- N명의 학생 정보가 있다. 학생 정보는 학생의 이름과 학생의 성적으로 구분
- 각 학생의 이름과 성적 정보가 주어졌을 때 성적이 낮은 순서대로 학생의 이름을 출력하시오


### 문제해설

- 이 문제에서는 학생의 정보가 최대 100,000개까지 입력될 수 있으므로 최악의 경우 $O(N \log N)$을 보장하는 알고리즘을 이용하거나 $O(N)$을 보장하는 계수 정렬을 이용하면 된다.



In [17]:
# N을 입력 받기

n = int(input())

2


In [18]:
array = []
for i in range(n):
    input_data = input().split()
    
    # 이름은 문자열 그대로, 점수는 정수형으로 변환하여 저장
    array.append((input_data[0], int(input_data[1])))
    


홍길동 95
이순신 77


In [19]:
# 키(Key)를 이용하여, 점수를 기준으로 정렬 ##############################
array = sorted(array, key = lambda student:student[1])

In [20]:
array

[('이순신', 77), ('홍길동', 95)]

In [21]:
for student in array:
    print(student[0], end = ' ')

이순신 홍길동 

# 실전문제 3. 두 배열의 원소 교체

### 문제설명

- 동빈이는 두 개의 배열 A와 B를 가지고 있다.
- 두 배열은 N개의 원소, 모두 자연수
- 최대 K개 A, B 바꿔치기 할 수 있다.
- 목표는 배열 A의 모든 원소의 합이 최대가 되도록 하는 것이다.

### 문제해설

- 문제 해결 기본 아이디어는 매번 배열 A에서 가장 작은 원소를 골라서, 배열 B에서 가장 큰 원소와 교체를 하는 것이다.
- 단, 배열 A에서 가장 작은 원소가 배열 B에서 가장 큰 원소보다 작을 떄에만 교체를 수행해야 함.
- 따라서 배열 A, B 정보가 입력되면 배열 A의 원소를 오름차순, 배열 B를 내림차순으로 정렬한다.
- 그리고 두 배열의 원소를 가장 첫 번째 인덱스부터 A가 작을 때 교체한다.
- 두 배열의 원소가 최대 100,000개까지 입력될 수 있으므로 $O(N \log N)$을 보장하는 정렬 알고리즘을 이용해야 한다.

In [22]:
n, k = map(int, input().split())
a = list(map(int, input().split()))
b = list(map(int, input().split()))

5 3
1 2 5 4 3
5 5 6 6 5


In [23]:
a.sort() # 배열 A는 오름차순
b.sort(reverse = True) # 배열 B는 내림차순

In [24]:
for i in range(k):
    if a[i] < b[i]:
        a[i], b[i] = b[i], a[i]
    else:
        break;

In [25]:
print(sum(a))

26
