# 5. 간단하면서 기본적인 정렬 알고리즘: 선택 정렬과 삽입 정렬

## 선택 정렬
- 리스트에서 N번 만큼 가장 작은 수를 찾아 맨 앞으로 보내는 정렬
- 아이디어가 매우 간단하다.
- 시간복잡도
  - N + (N-1) + ... + 3 + 2의 연산횟수를 가지므로 (N^2 + N - 2)의 연산횟수를 가진다고 표현 가능하다.
  - 이를 빅오 표기법에 따라 O(N^2)의  시간 복잡도로 나타낸다.
- 공간복잡도는 O(N)이다.

In [3]:
# 선택 정렬 구현
import random

array = [random.randint(0,100) for i in range(10)]
print('정렬 전 데이터 : ', array)

for i in range(len(array)):
  min_index = i # 처음은 i를 가장 작은 원소의 인덱스로 지정
  for j in range(i + 1, len(array)): # i + 1인덱스이상부터 len(array)미만 횟수만큼 비교
    if array[min_index] > array[j]:
      min_index = j # 현재의 최소 인덱스 원소보다 j 인덱스 원소의 값이 작다면 최소 인덱스를 j로 바꿔준다.
  array[i], array[min_index] = array[min_index], array[i] # 인덱스 i의 원소와 인덱스 두번째 for 문에서 도출한 min_index의 값을 바꿔준다.

print('정렬 후 데이터 : ', array)

정렬 전 데이터 :  [87, 38, 50, 53, 80, 58, 65, 64, 74, 49]
정렬 후 데이터 :  [38, 49, 50, 53, 58, 64, 65, 74, 80, 87]


## 삽입 정렬
- 처리되지 않은 데이터를 하나씩 골라 적절한 위치에 삽입하는 정렬
- 선택 정렬에 비해 구현 난이도가 높지만, 시간 복잡도가 낮아 효율적이다.
- 시간 복잡도
  - 삽입 정렬의 시간 복잡도는 기본적으로는 O(N^2)이다.
  - 하지만 리스트가 거의 정렬되어 있다면 else : break에 의해 두번째 for문을 거의 실행하지 않으므로 최선의 경우 O(N)의 시간 복잡도를 가지는 가장 빠른 정렬이다.
- 공간복잡도는 O(N)이다.

In [None]:
# 삽입 정렬 구현

array = [random.randint(0,100) for i in range(10)]
print('정렬 전 데이터 : ', array)

for i in range(1, len(array)):
  for j in range(i, 0, -1): # 인덱스 i부터 1까지 1씩 감소하며 반복하므로 i가 3일때는 j가 3부터 시작해서 1까지 감소하며 반복
    if array[j] < array[j-1]: # 낮은 인덱스의 값이 더 크다면
      array[j], array[j-1] = array[j-1], array[j] # 낮은 인덱스의 값을 높은 인덱스(j)의 값과 바꿔준다.
    else: # 낮은 인덱스의 값이 더 작다면
      break # if문을 빠져나온다.

print('정렬 후 데이터 : ', array)

정렬 전 데이터 :  [61, 6, 33, 15, 43, 52, 92, 81, 25, 85]
정렬 후 데이터 :  [6, 15, 25, 33, 43, 52, 61, 81, 85, 92]


# 6. 더 빠른 정렬 알고리즘: 퀵 정렬과 계수 정렬


## 퀵 정렬
- 피벗 데이터를 설정하고 피벗보다 큰 데이터와 작은 데이터의 위치를 바꾸는 정렬
- 대부분의 경우에 가장 적합하며, 충분히 빠르다.
- 보통 피벗 데이터는 첫 번째 데이터로 한다.
- 동작 방법
  - (1)왼쪽에서부터 피벗보다 큰 데이터와 (1)오른쪽에서부터 기준보다 작은 데이터를 선택해 (1)과 (2)의 위치를 바꿔준다.
  - 만약 (1)과 (2)의 위치가 서로 엇갈린다면 피벗과 (2)의 위치를 서로 바꿔준다.
  - 이제 피벗을 기준으로 왼쪽은 작은 데이터 오른쪽은 큰 데이터로 분할이 이루어졌다.
  - 다시 첫 번째 데이터를 피벗으로 설정하고 위의 과정을 재귀적으로 반복한다.
- 이상적인 경우 분할이 절반씩 일어난다면 O(NlogN)의 시간 복잡도를 기대할 수 있지만 최악의 경우 O(N^2)의 시간 복잡도를 가진다.
- 공간복잡도는 O(N)이다.

In [None]:
# 퀵 정렬 구현

array = [random.randint(0,100) for i in range(10)]
print('정렬 전 데이터 : ', array)

def quick_sort(array, start, end):
  if start >= end: # 분할할 것이 남아있지 않은 경우(원소가 1개인 경우) 종료
    return
  pivot = start # 피벗은 첫번째 원소
  left = start + 1
  right = end
  while(left <= right): # 왼쪽과 오른쪽이 엇갈리기 전까지 계속 반복
    while(left <= end and array[left] <= array[pivot]): # 왼쪽 데이터가 끝에 도달하기 전이고 피벗의 크기보다 작다면
      left += 1 # 왼쪽 데이터를 인덱스+1의 데이터로 바꾼다
    while(right > start and array[right] >= array[pivot]): # 오른쪽 데이터가 처음에 도달하기 전이고 피벗의 크기보다 크다면
      right -= 1 # 오른쪽 데이터를 인덱스-1의 데이터로 바꾼다.
    if(left > right): # while문을 빠져나왔으므로 여기서는 왼쪽 데이터가 피벗보다 크고 오른쪽 데이터가 피벗보다 작은 상태에서 왼쪽이 오른쪽보다 커서 엇갈린 경우 if문 실행
      array[right], array[pivot] = array[pivot], array[right] # 왼쪽과 오른쪽이 엇갈렸으므로 피벗과 오른쪽 데이터의 위치를 바꿔주는데 이때 분할이 완료된 것이다.
    else:
      array[left], array[right] = array[right], array[left] # 왼쪽과 오른쪽이 엇갈리지 않았으므로 왼쪽과 오른쪽 데이터를 서로 바꿔준다.

  # while문을 빠져나왔을 때는 왼쪽과 오른쪽이 서로 엇갈려 분할이 완료되었을 때이다.
  quick_sort(array, start, right - 1) # 피벗과 오른쪽의 위치가 서로 바뀌었으므로 right-1은 피벗보다 -1의 위치를 나타내고, 따라서 이 코드는 피벗 기준으로 왼쪽에 다시 퀵정렬 수행을 의미한다.
  quick_sort(array, right + 1, end) # 마찬가지로 피벗 기준으로 오른쪽에 다시 퀵정렬 수행을 의미한다.

quick_sort(array, 0, len(array) - 1)
print('정렬 후 데이터 : ', array)

정렬 전 데이터 :  [24, 87, 79, 44, 18, 86, 77, 6, 17, 37]
정렬 후 데이터 :  [6, 17, 18, 24, 37, 44, 77, 79, 86, 87]


In [None]:
# 퀵 정렬 구현(보다 간단한 방식)

array = [random.randint(0,100) for i in range(10)]
print('정렬 전 데이터 : ', array)

def quick_sort(array):
  if len(array) <= 1: # 분할할 것이 남아있지 않은 경우(원소가 1개인 경우) 종료
    return array
  pivot = array[0] # 피벗은 첫번째 원소
  tail = array[1:] # 피벗을 제외한 나머지 리스트

  left_side = [x for x in tail if x <= pivot] # 분할된 왼쪽 부분
  right_side = [x for x in tail if x > pivot] # 분할된 오른쪽 부분

  return quick_sort(left_side) + [pivot] + quick_sort(right_side) # 분할 후 왼쪽과 오른쪽 부분에 각각 퀵정렬 수행하고 그 사이에 피벗을 넣어 리스트 반환

print('정렬 후 데이터 : ', quick_sort(array))

정렬 전 데이터 :  [5, 86, 8, 55, 81, 10, 74, 32, 86, 6]
정렬 후 데이터 :  [5, 6, 8, 10, 32, 55, 74, 81, 86, 86]


## 계수 정렬
- 특정한 조건이 부합될 때만 사용할 수 있지만 매우 빠르게 동작하는 정렬
- 데이터의 크기 범위가 제한되어 데이터가 정수 형태로 표현 가능할 때 사용가능하다.
- 데이터 개수가 N, 데이터 최댓값이 K일 때, 최악의 경우에도 O(N+K)의 시간복잡도를 보장한다.
- 동작 방법
  - 가장 작은 데이터부터 가장 큰 데이터까지의 범위가 모두 담기도록 리스트를 생성 ex) 범위가 1~9라면 길이가 9인 리스트 생성
  - 데이터를 하나씩 확인하며 데이터 값과 동일한 인덱스의 Count를 1씩 증가시킨다.
  - 최종 리스트에는 각 데이터가 몇 번 등장했는지 횟수가 기록된다.
  - 리스트의 첫 번째 인덱스부터 Count만큼 각 인덱스를 출력하면 데이터가 정렬된 형태로 출력된다.
- 계수 정렬은 데이터 개수N에 비해 범위 K가 지나치게 크면 심각한 비효율성을 초래할 수 있다. 따라서 동일한 값을 가지는 데이터가 여러 개 등장한 경우 효율적이다.


In [None]:
# 계수 정렬 구현
# 모든 원소의 값이 0보다 크거나 같다고 가정

array = [random.randint(0,10) for i in range(20)]
print('정렬 전 데이터 : ', array)

count = [0] * (max(array) + 1) # 모든 데이터의 범위가 모두 담기도록 리스트 생성

for i in range(len(array)):
  count[array[i]] += 1 # array의 데이터 = count의 index인 경우 count의 value에 +1 해준다.

print ('정렬 후 데이터 :', end=' ')

for i in range(len(count)): # count의 길이만큼 반복
  for j in range(count[i]): # count의 각 인덱스에 해당하는 value값 즉 카운팅 된 만큼 데이터 i를 출력하여 준다.
    print(i, end=' ')

정렬 전 데이터 :  [1, 9, 2, 1, 9, 9, 10, 9, 7, 8, 9, 2, 7, 2, 0, 7, 3, 8, 5, 10]
정렬 후 데이터 : 0 1 1 2 2 2 3 5 7 7 7 8 8 9 9 9 9 9 10 10 

# 7. 정렬 알고리즘 비교 및 기초 문제 풀이


- 대부분의 프로그래밍 언어에서 지원하는 표준 정렬 라이브러리는 최악의 경우에도 O(NlogN)을 보장하도록 설계되어 있다.

## 선택 정렬과 기본 라이브러리 수행 시간 비교

In [4]:
# 선택 정렬의 수행 시간
from random import randint
import time

# 배열에 10,000개의 정수를 삽입
array = [random.randint(1,100) for i in range(10000)]

# 선택 정렬 프로그램 성능 측정
start_time = time.time()

# 선택 정렬 프로그램 소스코드
for i in range(len(array)):
  min_index = i # 처음은 i를 가장 작은 원소의 인덱스로 지정
  for j in range(i + 1, len(array)):
    if array[min_index] > array[j]:
      min_index = j
  array[i], array[min_index] = array[min_index], array[i]

# 측정 종료
end_time = time.time()
# 수행 시간 출력
print('선택 정렬 수행 시간 : ', end_time - start_time)

선택 정렬 수행 시간 :  9.172569274902344


In [5]:
# 기본 정렬 라이브러리 수행 시간

# 배열에 10,000개의 정수를 삽입
array = [random.randint(1,100) for i in range(10000)]

# 기본 정렬 라이브러리 성능 측정
start_time = time.time()

# 기본 정렬 라이브러리 사용
array.sort()

# 측정 종료
end_time = time.time()
# 수행 시간 출력
print('기본 정렬 라이브러리 수행 시간 : ', end_time - start_time)

기본 정렬 라이브러리 수행 시간 :  0.0020215511322021484


- 선택 정렬은 O(N^2)의 시간복잡도를 가지고 기본 정렬은 O(NlogN)의 시간 복잡도를 가지므로, 둘의 수행 시간 차이가 생긴다.

## 두 배열의 원소 교체

In [16]:
# 입력
n, k = map(int, input().split()) # N과 K를 입력 받기
a = list(map(int, input().split())) # 배열 A의 모든 원소 입력 받기
b = list(map(int, input().split())) # 배열 B의 모든 원소 입력 받기

# 시간 측정 시작
start_time = time.time()

# 소스코드 구현

def change(k, a, b):
  a.sort()
  b.sort()
  for i in range(k):
    a[i], b[-i] = b[-i], a[i]
  return sum(a)

change(k, a, b)

# 측정 종료
end_time = time.time()

# 수행 시간 출력
print('소스코드 수행 시간 : ', end_time - start_time)

5 3
1 2 5 4 3
5 5 6 6 5
소스코드 수행 시간 :  0.00033545494079589844


# 새 섹션