<a href="https://colab.research.google.com/github/TaeGongKim/Coding-Test/blob/main/Sorting%20summary.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

- 정렬 : sorting, 데이터를 특정한 기준에 따라서 순서대로 나열
- 이진 탐색의 전처리 과정
- 선택 정렬, 삽입 정렬, 퀵 정렬, 계수 정렬 등..
- 파이썬에서 제공하는 기본 정렬 라이브러리를 적용하여 좀 더 횩과적인 정렬 수행 가능

# 선택 정렬

- selection sort algorithm
- 데이터가 무작위로 여러 개 있을 때, 이 중에서 가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸고, 그다음 작은 데이터를 선택해 앞에서 두 번째 데이터와 바꾸는 과정을 반복

In [1]:
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(len(array)):
  min_index = i
  for j in range(i + 1, len(array)):
    if array[min_index] > array[j]:
      min_index = j

  array[i], array[min_index] = array[min_index], array[i]

print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


- 시간 복잡도 계산
- n + (n-1) + (n-2) + ... + 2 (가장 작은 원소를 찾기 위한 연산 수)
- n * (n + 1) / 2 = (n^2 + n) / 2
- 시간 복잡도는 **O(n^2)**

# 삽입 정렬

- insetion sort
- 데이터를 하나씩 확인하며, 각 데이터를 적절한 위치에 삽입
- 필요할 땜만 위치를 바꾼다. 그래서 데이터가 거의 정렬 되어 있을 때 더욱 효과적
- 특정한 데이터가 적절한 위치에 들어가기 이전에, 그 앞까지의 데이터는 이미 정렬되어 있다고 가정한다.

In [2]:
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(1, len(array)):
  for j in range(i, 0, -1):
    if array[j] < array[j - 1]:
      array[j], array[j - 1] = array[j - 1], array[j]
    else:
      break
  
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


- 삽입 정렬의 시간 복잡도는 O(n^2) 이다.
- 하지만 정렬이 거의 되어 있는 상황에서는 퀵 정렬 알고리즘보다 빠르다.
- 최선의 경우 O(n) 까지 된다.

# 퀵 정렬

- quick sort
- 가장 많이 사용되는 알고리즘
- 기준 데이터를 설정하고 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾼다.
- 이와 비슷하게 많이 사용되는 알고리즘으로 병합 정렬이 있다.
- pivot을 사용하여 기준 잡는다.
- pivot을 설정하고 리스트를 분할하는 방법에 따라 여러 가지 방식으로 퀵 정렬을 구분한다.
- 가장 대표적인 분할 방식이 호어 분할 (Hoare Partition)은 "리스트에서 첫 번째 데이터를 Pivot으로 정한다"는 규칙이 있다.

In [3]:
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array, start, end):
  # 원소가 1개인 경우 종료
  if start >= end:
    return
  pivot = start
  left = start + 1
  right = end
  while left <= right:
    # pivot보다 큰 데이터를 찾을 때까지 반복
    while left <= end and array[left] <= array[pivot]:
      left += 1
    # pivot보다 작은 데이터를 찾을 때까지 반복
    while right > start and array[right] >= array[pivot]:
      right -= 1
    # 엇갈렸다면 작은 데이터와 pivot을 교체
    if left > right:
      array[right], array[pivot] = array[pivot], array[right]
    else:
      array[left], array[right] = array[right], array[left]
  quick_sort(array, start, right - 1)
  quick_sort(array, right + 1, end)

quick_sort(array, 0, len(array) - 1)
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [4]:
# 파이썬의 장점을 살려 짧게 작성한 퀵 정렬 소스코드
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array):
  if len(array) <= 1:
    return array
  
  pivot = array[0]
  tail = array[1:]

  left_side = [x for x in tail if x <= pivot]
  right_side = [x for x in tail if x > pivot]

  return quick_sort(left_side) + [pivot] + quick_sort(right_side)

print(quick_sort(array))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


- 퀵 정렬의 평균 시간 복잡도는 **O(NlogN)**
- 최선의 경우 : 분할이 일어날 때마다 정확히 절반씩 분할될때 -> logN
- 최악인 경우 : 이미 정렬되어 있는 경우 -> N^2


# 계수 정렬

- Count Sort
- 특정한 조건이 부합할 때만 사용할 수 있지만 매우 빠른 정렬 알고리즘
- 데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때만 사용 가능하다.
- 일반적으로 가장 큰 데이터와 가장 작은 데이터의 차이가 1,000,000을 넘지 않을 때 효과적으로 사용 할 수 있다.
- 모든 범위를 담을 수 있는 크기의 리스트를 선언해야 하기 때문에 위와 같은 제약이 생긴다.
- 모든 범위를 담는 리스트를 만들어 정렬하고자 하는 배열의 값을 기록하고 하나하나 출력한다.

In [6]:
array = [7, 5, 9, 0, 3, 1, 6, 2, 9, 1, 4, 8, 0, 5, 2]
count = [0] *(max(array) + 1)

for i in range(len(array)):
  count[array[i]] += 1

for i in range(len(count)):
  for j in range(count[i]):
    print(i, end = ' ')

0 0 1 1 2 2 3 4 5 5 6 7 8 9 9 

- 시간 복잡도는 데이터의 개수 n, 최대값의 크기를 k라 하면 O(n + k)로 계산된다.
- 저장 공간 낭비가 심하기 때문에 데이터의 크기가 한정되어 있고, 데이터의 크기가 많이 중복되어 있을수록 유리하다.

# 파이썬의 정렬 라이브러리

- O(NlogN)을 보장한다.

In [7]:
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

result = sorted(array)
print(result)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [8]:
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

array.sort()
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [9]:
# key를 매개변수로 사용할 수 있다.
# key 값으로는 하나의 함수가 들어가야 하며, 이는 정렬 기준이 된다.
array = [('바나나', 2), ('사과', 5), ('당근', 3)]

def setting(data):
  return data[1]

result = sorted(array, key = setting)
print(result)

[('바나나', 2), ('당근', 3), ('사과', 5)]


# 결론
- 문제에서 별도의 요구가 없다면 단순히 정렬해야 하는 상황에서는 기본 정렬 라이브러리르 사용!
- 데이터의 범위가 한정되어 있으며 더 빠르게 동작해야 할 때는 계수 정렬을 사용하자!!

- 정렬 라이브러리로 풀 수 있는 문제 : 단순히 정렬 기법을 알고 있는지 물어보는 문제
- 정렬 알고리즘의 원리에 대해서 물어보는 문제 : 선택 정렬, 삽입 정렬, 퀵 정렬 등의 원리를 알고 있어야 풀 수 있는 문제
- 더 빠른 정렬이 필요한 문제 : 퀵 정렬 기반의 정렬 기법으로는 풀 수 없으며 계수 정렬 등의 다른 정렬 알고리즘을 이용하거나 문제에서 기존에 알려진 알고리즘의 구조적인 개선을 거쳐야 풀 수 있다.

# 연습 문제

In [16]:
# 위에서 아래로
n = int(input())
data = []

for _ in range(n):
  data.append(int(input()))

answer = sorted(data, reverse = True)

for i in answer:
  print(i, end = ' ')

3
15
27
12
27 15 12 

In [20]:
# 성적이 낮은 순서로 학생 출력하기
n = int(input())
data = []

for _ in range(n):
  data.append(list(input().split()))

answer = sorted(data, key = lambda x : x[1])

for student in answer:
  print(student[0], end = ' ')

2
홍길동 95
이순신 77
이순신 홍길동 

In [22]:
# 두 배열의 원소 교체
n, k = map(int, input().split())
a = list(map(int, input().split()))
b = list(map(int, input().split()))

sorted_a = sorted(a)
sorted_b = sorted(b, reverse = True)

for i in range(k):
  if sorted_a[i] < sorted_b[i]:
    sorted_a[i], sorted_b[i] = sorted_b[i], sorted_a[i]
  else:
    break

print(sum(sorted_a))

5 3
1 2 5 4 3
5 5 6 6 5
26
