### 정렬(Sort)

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/8/8e/Merge_sort_animation.gif/220px-Merge_sort_animation.gif" width="400">

- 여러 데이터를 작은 값부터 큰 값으로 또는 큰 값부터 작은 값으로 순서에 맞게 정리하는 것
    - 오름차순(Ascending sort)
    - 내림차순(Descending sort)

<!-- 표만들때 :--(왼쪽정렬) --:(오른쪽정렬) :--:(중앙정렬)-->
|종류|평균|최선|최악|
|:--|:--:|--:|:--|
|선택정렬|$O(n^2)$|$O(n^2)$|$O(n^2)$|
|삽입|$O(n^2)$|$O(n^2)$|$O(n^2)$|
|버블|$O(n^2)$|$O(n)$|$O(n^2)$|
|합병|$O(n log n)$|$O(n log n)$|$O(n log n)$|
|퀵|$O(n log n)$|$O(n log n)$|$O(n^2)$|
|힙|$O(n log n)$|$O(n log n)$|$O(n log n)$|
|쉘|$O(n^{1.25})$|$O(n^{1.25})$|$O(n^{1.25})$|
|기수|$O(dn)$|$O(dn)$|$O(dn)$|

#### 선택정렬

- 여러 데이터 중 가장 작은 값을 뽑는 과정을 반복하여 정렬

In [2]:
def findMindIdx(ary):
    minIdx = 0 # 맨 처음 값을 최소라고 가정
    for i in range(1, len(ary)):
        if ary[minIdx] > ary[i]:
            minIdx = i

    return minIdx

In [3]:
testAry = [55, 88, 22, 33, 77]
minPos = findMindIdx(testAry)

print(f'최소값 인덱스 : {minPos}')
print(f'최소값 : {testAry[minPos]}')

최소값 인덱스 : 2
최소값 : 22


In [9]:
## 변수 선언
#[('아빠', 188), ('할머니', 162), ..., ('동생', 105)]
before = [188, 162, 168, 120, 50, 150, 177, 105]
after = []

## 메인 코드
print(f'정렬 전 -> {before}')

for _ in range(len(before)): # 8번
    minPos = findMindIdx(before)
    after.append(before[minPos])
    del(before[minPos])

print(f'정렬 후 -> {after}')

정렬 전 -> [188, 162, 168, 120, 50, 150, 177, 105]
정렬 후 -> [50, 105, 120, 150, 162, 168, 177, 188]


#### 데이터 교환에서 가장 중요한 swap
- 변수가 두 개 있을때 하나의 값을 다른 곳으로 할당할려면 임시 변수가 필요

    ```python
    def swap(x, y):
        temp = x
        x = y
        y = temp
    ```

#### 변수 하나로 선택정렬

In [21]:
def sortSelection(ary):
    n = len(ary)
    for i in range(0, n-1):
        minIdx = i
        for j in range(i+1, n):
            if ary[minIdx] > ary[j]:
                minIdx = j

            tmp = ary[i]
            ary[i] = ary[minIdx]
            ary[minIdx] = tmp

        print(f'정렬 중 => {ary}')
    
    return ary

dataAry = [188, 162, 168, 120, 50, 150, 177, 105]

print(f'정렬 전 -> {dataAry}')
dataAry = sortSelection(dataAry)
print(f'정렬 후 -> {dataAry}')

정렬 전 -> [188, 162, 168, 120, 50, 150, 177, 105]
정렬 중 => [105, 188, 162, 168, 120, 150, 177, 50]
정렬 중 => [105, 50, 188, 162, 168, 150, 177, 120]
정렬 중 => [105, 50, 120, 188, 162, 150, 177, 168]
정렬 중 => [105, 50, 120, 150, 188, 162, 177, 168]
정렬 중 => [105, 50, 120, 150, 162, 188, 177, 168]
정렬 중 => [105, 50, 120, 150, 162, 168, 188, 177]
정렬 중 => [105, 50, 120, 150, 162, 168, 177, 188]
정렬 후 -> [105, 50, 120, 150, 162, 168, 177, 188]


#### 삽입 정렬
- 기존 데이터 중에 자신의 위치를 찾아 데이터를 삽입하는 정렬 방식

- 삽입될 위치를 찾는 함수

In [None]:
def findInsertIdx(ary, data):
    findIdx = -1 # 초깃값-> 없는 위치로 (배열의 인덱스 0보다 앞)
    for i in range(0, len(ary)):
        if ary[i] > data:
            findIdx = i
            break
    
    if findIdx == -1: # 큰 값을 못 찾음 -> 제일 마지막 위치
        return len(ary)
    else:
        return findIdx


In [22]:
testAry = []
print(f'삽입할 위치 -> {findInsertIdx(testAry, 55)}')

삽입할 위치 -> 0


In [16]:
testAry = [33, 77, 88]
print(f'삽입할 위치 -> {findInsertIdx(testAry, 55)}')

삽입할 위치 -> 1


In [17]:
testAry =  [33, 55, 77, 88]
print(f'삽입할 위치 -> {findInsertIdx(testAry, 100)}')

삽입할 위치 -> 4


- 삽입 정렬 구현

In [18]:
# 변수
before = [188, 162, 168, 120, 50, 150, 177, 105]
after = []

# 메인코드
print(f'정렬 전 -> {before}')
for i in range(len(before)):
    data = before[i]
    insPos = findInsertIdx(after, data)
    after.insert(insPos, data)
    print(f'정렬 중 => {after}')

print(f'정렬 후 -> {after}')

정렬 전 -> [188, 162, 168, 120, 50, 150, 177, 105]
정렬 중 => [188]
정렬 중 => [162, 188]
정렬 중 => [162, 168, 188]
정렬 중 => [120, 162, 168, 188]
정렬 중 => [50, 120, 162, 168, 188]
정렬 중 => [50, 120, 150, 162, 168, 188]
정렬 중 => [50, 120, 150, 162, 168, 177, 188]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
정렬 후 -> [50, 105, 120, 150, 162, 168, 177, 188]


- 변수 하나로 삽입 정렬

In [None]:
def sortInsertion(ary):
    n = len(ary)
    for end in range(1, n): # end -> 1.... n-1
        for cur in range(end, 0, -1): # cur -> 거꾸로
            if ary[cur - 1] > ary[cur]:
                # tmp = ary[cur]
                # ary[cur] = ary[cur - 1]
                # ary[cur - 1] = tmp
                # tmp 변수 만들지 않고 바로 변경 가능할 로직(파이썬에 존재)
                ary[cur - 1], ary[cur] = ary[cur], ary[cur - 1]

        print(f'정렬 중 => {ary}')
    
    return ary

dataAry = [188, 162, 168, 120, 50, 150, 177, 105]

# 메인코드
print(f'정렬 전 -> {dataAry}')
dataAry = sortInsertion(dataAry)
print(f'정렬 후 -> {dataAry}')

정렬 전 -> [188, 162, 168, 120, 50, 150, 177, 105]
정렬 중 => [162, 188, 168, 120, 50, 150, 177, 105]
정렬 중 => [162, 168, 188, 120, 50, 150, 177, 105]
정렬 중 => [120, 162, 168, 188, 50, 150, 177, 105]
정렬 중 => [50, 120, 162, 168, 188, 150, 177, 105]
정렬 중 => [50, 120, 150, 162, 168, 188, 177, 105]
정렬 중 => [50, 120, 150, 162, 168, 177, 188, 105]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
정렬 후 -> [50, 105, 120, 150, 162, 168, 177, 188]


#### 버블 정렬

- 앞 뒤 데이터를 비교해서 큰 값을 뒤로 보내면서 정렬하는 방식 (뒤에서부터 고정됨)
- 정렬하는 모양이 거품처럼 생김

In [5]:
import random

In [9]:
# 함수 정의
def sortBubble(ary):
    n = len(ary)
    for end in range(n-1, 0, -1):
        for cur in range(0, end):
            if (ary[cur] > ary[cur+1]):
                ary[cur], ary[cur+1] = ary[cur+1], ary[cur]
        
        print(f'정렬 중 => {ary}')
    
    return ary

# dataAry = [188, 162, 168, 120, 50, 150, 177, 105]
dataAry = [random.randint(50, 190) for _ in range(random.randint(8, 20))]
# dataAry = [50, 105, 120, 188, 150, 162, 168, 177]


print(f'정렬 전 -> {dataAry}')
dataAry = sortBubble(dataAry)
print(f'정렬 후 -> {dataAry}')

정렬 전 -> [108, 117, 66, 73, 186, 68, 50, 59, 57, 84, 67, 94, 149, 121, 175, 63, 112, 108, 104]
정렬 중 => [108, 66, 73, 117, 68, 50, 59, 57, 84, 67, 94, 149, 121, 175, 63, 112, 108, 104, 186]
정렬 중 => [66, 73, 108, 68, 50, 59, 57, 84, 67, 94, 117, 121, 149, 63, 112, 108, 104, 175, 186]
정렬 중 => [66, 73, 68, 50, 59, 57, 84, 67, 94, 108, 117, 121, 63, 112, 108, 104, 149, 175, 186]
정렬 중 => [66, 68, 50, 59, 57, 73, 67, 84, 94, 108, 117, 63, 112, 108, 104, 121, 149, 175, 186]
정렬 중 => [66, 50, 59, 57, 68, 67, 73, 84, 94, 108, 63, 112, 108, 104, 117, 121, 149, 175, 186]
정렬 중 => [50, 59, 57, 66, 67, 68, 73, 84, 94, 63, 108, 108, 104, 112, 117, 121, 149, 175, 186]
정렬 중 => [50, 57, 59, 66, 67, 68, 73, 84, 63, 94, 108, 104, 108, 112, 117, 121, 149, 175, 186]
정렬 중 => [50, 57, 59, 66, 67, 68, 73, 63, 84, 94, 104, 108, 108, 112, 117, 121, 149, 175, 186]
정렬 중 => [50, 57, 59, 66, 67, 68, 63, 73, 84, 94, 104, 108, 108, 112, 117, 121, 149, 175, 186]
정렬 중 => [50, 57, 59, 66, 67, 63, 68, 73, 84, 94, 104, 108, 1

##### 버블 정렬 중
- 데이터가 거의 정렬이 되고, 한 두 개의 데이터가 튀었을 때 개선 방법
- 한 사이클을 마쳤을 때 모두 정렬이 되면 더 이상 반복문을 처리하지 않고 빠져나감

In [10]:
## 버블소트 개선함수
def sortBubbleA(ary):
    n = len(ary)

    for end in range(n-1, 0, -1):
        changYN = False
        # print(f'# 사이클 -> {ary}')
        for cur in range(0, end):
            if ary[cur] > ary[cur + 1]:
                ary[cur], ary[cur+1] = ary[cur+1], ary[cur]
                changYN = True

        print(f'정렬 중 => {ary}')

        if not changYN:
            break
    return ary

# 전역 변수
dataAry = [50, 105, 120, 188, 150, 162, 168, 177]

print(f'정렬 전 -> {dataAry}')
dataAry = sortBubbleA(dataAry)
print(f'정렬 후 -> {dataAry}')

정렬 전 -> [50, 105, 120, 188, 150, 162, 168, 177]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
정렬 후 -> [50, 105, 120, 150, 162, 168, 177, 188]


- 다른 정렬은 데이터가 거의 정렬이 다 되어 있어도 횟수만큼 동작 $O(n^2)$
- 버블 정렬은 데이터가 거의 정렬되어있으면 반복획수를 줄일 수 있음 $O(n)$

#### 퀵 정렬