#### 정렬 Sort

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/8/8e/Merge_sort_animation.gif/220px-Merge_sort_animation.gif" width="400">

- 여러 데이터를 작은 값부터 큰 순으로 또는 큰 값부터 작은 순으로 순서에 맞게 정리하는 것
    - 오름차순(Ascending sort)
    - 내림차순(Descending sort)

<!-- 표만들때 ':--'(왼쪽정렬) '--:'(오른쪽정렬) ':--:'(중앙정렬) -->

|종류|평균|최선|최악|
|:--|:--|:--|:--|
|선택정렬|$O(n^2)$|$O(n^2)$|$O(n^2)$|
|삽입정렬|$O(n^2)$|$O(n^2)$|$O(n^2)$|
|버블|$O(n^2)$|$O(n)$|$O(n^2)$|
|합병|$O(n log n)$|$O(n log n)$|$O(n log n)$|
|퀵|$O(n log n)$|$O(n log n)$|$O(n^2)$|
|힙|$O(n log n)$|$O(n log n)$|$O(n log n)$|
|쉘|$O(n^{1.25})$|$O(n^{1.25})$|$O(n^{1.25})$|
|기수|$O(dn)$|$O(dn)$|$O(dn)$|


#### 선택정렬

- 여러 데이터중 가장 작은 값을 뽑는 과정을 반복하여 정렬하는 방식

In [4]:
def findMinIdx(ary):
    minIdx = 0 # 맨 처음값을 최소라고 가정
    for i in range(1, len(ary)):
        if ary[minIdx] > ary[i]:
            minIdx = i

    return minIdx

In [8]:
testAry = [55, 88, 33, 22, 77]
minPos = findMinIdx(testAry)

print(f'최소값 인덱스 : {minPos}')
print(f'최소값 : {testAry[minPos]}')

최소값 인덱스 : 3
최소값 : 22


In [9]:
## 변수 선언
before = [188, 162, 168, 120, 50, 150, 177, 105]
after = []

## 메인코드
print(f'정렬 전 -> {before}')

for _ in range(len(before)): # 8번
    minPos = findMinIdx(before)
    after.append(before[minPos])
    del(before[minPos])

print(f'정렬 후 -> {after}')

정렬 전 -> [188, 162, 168, 120, 50, 150, 177, 105]
정렬 후 -> [50, 105, 120, 150, 162, 168, 177, 188]


##### 데이터 교환에서 가장 중요한 swap
- 변수가 두개 있을때 하나의 값을 다른 곳으로 할당하려면 임시변수가 필요

    ```python
    def swap(x, y):
        temp = x
        x = y
        y = temp
    ```

##### 변수 하나로 선택정렬

In [4]:
def sortSelection(ary):
    count = 0
    n = len(ary) # n=8
    for i in range(0, n-1): # range(0,7) i = 0~6 
        minIdx = i
        for j in range(i+1, n): # range(1,8) j = 1~7
            if ary[minIdx] > ary[j]: # if ary[0] > ary[1] ~ ary[0] > ary[7] // ary[6] > ary[1] ~ ary[6] > ary[7]
                minIdx = j # minIdx = 1
                count += 1
        
        tmp = ary[i]
        ary[i] = ary[minIdx]
        ary[minIdx] = tmp

        print(f'정렬 중 => {ary}')
        count += 1

    print(f'중복처리 횟수 = {count}')
    return ary

dataAry = [188, 162, 168, 120, 50, 150, 177, 105]

print(f'정렬 전 -> {dataAry}')
dataAry = sortSelection(dataAry)
print(f'정렬 후 -> {dataAry}')

정렬 전 -> [188, 162, 168, 120, 50, 150, 177, 105]
정렬 중 => [50, 162, 168, 120, 188, 150, 177, 105]
정렬 중 => [50, 105, 168, 120, 188, 150, 177, 162]
정렬 중 => [50, 105, 120, 168, 188, 150, 177, 162]
정렬 중 => [50, 105, 120, 150, 188, 168, 177, 162]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
중복처리 횟수 = 16
정렬 후 -> [50, 105, 120, 150, 162, 168, 177, 188]


#### 삽입정렬
- 기존 데이터 중에 자신의 위치를 찾아 데이터를 삽입하는 정렬방식

- 삽입될 위치를 찾는 함수

In [11]:
def findInsertIdx(ary, data):
    findIdx = -1 # 배열의 인덱스 앞(인덱스 0보다 앞을 의미)
    for i in range(0, len(ary)):
        if ary[i] > data:
            findIdx = i
            break
    
    if findIdx == -1: # 큰값을 못찾음. 제일 마지막 위치
        return len(ary)
    else:
        return findIdx

In [12]:
testAry = []
print(f'삽입위치 인덱스 -> {findInsertIdx(testAry, 55)}')

삽입위치 인덱스 -> 0


- 삽입정렬 구현

In [14]:
# 변수
before = [188, 162, 168, 120, 50, 150, 177, 105]
after = []

# 메인코드
print(f'정렬 전 -> {before}')
for i in range(len(before)):
    data = before[i]
    insPos = findInsertIdx(after, data)
    after.insert(insPos, data)
    print(f'정렬 중 => {after}')

print(f'정렬 후 -> {after}')

정렬 전 -> [188, 162, 168, 120, 50, 150, 177, 105]
정렬 중 => [188]
정렬 중 => [162, 188]
정렬 중 => [162, 168, 188]
정렬 중 => [120, 162, 168, 188]
정렬 중 => [50, 120, 162, 168, 188]
정렬 중 => [50, 120, 150, 162, 168, 188]
정렬 중 => [50, 120, 150, 162, 168, 177, 188]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
정렬 후 -> [50, 105, 120, 150, 162, 168, 177, 188]


##### 변수 하나로 삽입정렬

In [None]:
def sortInsertion(ary):
    n = len(ary)
    for end in range(1, n): # end -> 1... n-1
        for cur in range(end, 0, -1): # cur -> 거꾸로
            if ary[cur - 1] > ary[cur]:
                # tmp = ary[cur]
                # ary[cur] = ary[cur-1]
                # ary[cur - 1] = tmp
                
                ary[cur - 1], ary[cur] = ary[cur], ary[cur - 1]

        print(f'정렬 중 => {ary}')
    
    return ary

dataAry = [188, 162, 168, 120, 50, 150, 177, 105]

print('정렬 전 =>', dataAry)
dataAry = sortInsertion(dataAry)
print('정렬 후 =>', dataAry)

정렬 전 => [188, 162, 168, 120, 50, 150, 177, 105]
정렬 중 => [162, 188, 168, 120, 50, 150, 177, 105]
정렬 중 => [162, 168, 188, 120, 50, 150, 177, 105]
정렬 중 => [120, 162, 168, 188, 50, 150, 177, 105]
정렬 중 => [50, 120, 162, 168, 188, 150, 177, 105]
정렬 중 => [50, 120, 150, 162, 168, 188, 177, 105]
정렬 중 => [50, 120, 150, 162, 168, 177, 188, 105]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
정렬 후 => [50, 105, 120, 150, 162, 168, 177, 188]


#### 버블 정렬

- 앞뒤 데이터를 비교해서 큰 값을 뒤로 보내면서 정렬하는 방식
- 거품처럼 생겼다고 버블 정렬

In [33]:
# 함수 정의
def sortBubble(ary):
    n = len(ary)
    for end in range(n-1, 0, -1): # 거꾸로
        for cur in range(0, end):
            if ary[cur] > ary[cur + 1]:
                ary[cur], ary[cur + 1] = ary[cur + 1], ary[cur] # swap 기능을 포함

        print(f'정렬 중 => {ary}')

    return ary

dataAry = [188, 162, 168, 120, 50, 150, 177, 105]

print('정렬 전 =>', dataAry)
dataAry = sortBubble(dataAry)
print('정렬 후 =>', dataAry)

정렬 전 => [188, 162, 168, 120, 50, 150, 177, 105]
정렬 중 => [162, 168, 120, 50, 150, 177, 105, 188]
정렬 중 => [162, 120, 50, 150, 168, 105, 177, 188]
정렬 중 => [120, 50, 150, 162, 105, 168, 177, 188]
정렬 중 => [50, 120, 150, 105, 162, 168, 177, 188]
정렬 중 => [50, 120, 105, 150, 162, 168, 177, 188]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
정렬 후 => [50, 105, 120, 150, 162, 168, 177, 188]


##### 버블 정렬 중
- 데이터가 거의 정렬이 되고, 한 두개가 데이터가 튀었을 때 개선방법 
- 한 사이클을 마쳤을 때 모두 정렬이 되면 더 이상 반복문을 처리하지 않고 탈출

In [31]:
## 버블소트 개선함수
def sortBubbleA(ary):
    n = len(ary)

    for end in range(n-1, 0, -1):
        changeYn = False
        for cur in range(0, end):
            if ary[cur] > ary[cur + 1]:
                ary[cur], ary[cur + 1] = ary[cur + 1], ary[cur]
                changeYn = True
        
        print(f'정렬 중 => {ary}')

        if not changeYn:
            break
    
    return ary

dataAry = [50, 105, 120, 188, 150, 162, 168, 177]

print('정렬 전 =>', dataAry)
dataAry = sortBubbleA(dataAry)
print('정렬 후 =>', dataAry)


정렬 전 => [50, 105, 120, 188, 150, 162, 168, 177]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
정렬 중 => [50, 105, 120, 150, 162, 168, 177, 188]
정렬 후 => [50, 105, 120, 150, 162, 168, 177, 188]


- 다른 정렬은 데이터가 거의 정렬이 다 되어있어도 횟수만큼 동작한다 $O(n^2)$
- 버블 정렬은 데이터가 거의 정렬되어 있으면 반복횟수를 줄일 수 있다 $O(n)$

#### 퀵 정렬
- 전체 데이터에서 기준값을 잡고, 기준값보다 작은값은 왼쪽 그룹으로, 큰값은 오른쪽 그룹으로 나누는 작업을 반복해서 정렬하는 방식

In [23]:
# 함수정의
count = 0

def sortQuick(ary):
    global count
    n = len(ary)

    if n <= 1: # 정렬할 리스트 개수가 1개 이하면
        return ary
    
    pivot = ary[n // 2] # 중간값을 기준으로 설정
    leftAry, rightAry = [], []

    for num in ary:
        if num < pivot: # 기준값보다 작으면 왼쪽 그룹
            leftAry.append(num)
            count += 1
        elif num > pivot: # 크면 오른쪽 그룹
            rightAry.append(num)
            count += 1

    return sortQuick(leftAry) + [pivot] + sortQuick(rightAry) # 재귀호출

# 변수
dataAry = [188, 162, 168, 120, 50, 150, 177, 105]

# 메인코드
print('정렬 전 =>', dataAry)
dataAry = sortQuick(dataAry)
print('정렬 후 =>', dataAry)
print('처리횟수:', count)

정렬 전 => [188, 162, 168, 120, 50, 150, 177, 105]
정렬 후 => [50, 105, 120, 150, 162, 168, 177, 188]
처리횟수: 19


- 중복값을 고려한 퀵 정렬

In [16]:
def sortQuickD(ary):
    n = len(ary)
    
    if n <= 1: return ary

    pivot = ary[n // 2]
    leftAry, midAry, rightAry = [], [], []

    for num in ary:
        if num < pivot:
            leftAry.append(num)
        elif num > pivot:
            rightAry.append(num)
        else:
            midAry.append(num)

    return sortQuickD(leftAry) + midAry + sortQuickD(rightAry)

# 변수
dataAry = [120, 120, 188, 150, 168, 50, 50, 162, 105, 120, 177, 50]

# 메인코드
print('정렬 전 =>', dataAry)
dataAry = sortQuickD(dataAry)
print('정렬 후 =>', dataAry)

정렬 전 => [120, 120, 188, 150, 168, 50, 50, 162, 105, 120, 177, 50]
정렬 후 => [50, 50, 50, 105, 120, 120, 120, 150, 162, 168, 177, 188]


- 퀵정렬 일반 구현

In [22]:
count = 0

def sortQuickN(ary, start, end):
    global count
    if end <= start: return # 재귀호출 종료 조건

    low = start; high = end

    pivot = ary[(low + high) // 2] # 리스트 중간값을 기준으로
    while low <= high:
        while ary[low] < pivot:
            low += 1
        while ary[high] > pivot:
            high -= 1
        if low <= high:
            ary[low], ary[high] = ary[high], ary[low]
            low, high = low + 1, high - 1

            count += 1

    sortQuickN(ary, start, low - 1) # 왼쪽 그룹 다시 정렬(재귀호출)
    sortQuickN(ary, low, end) # 오른쪽 그룹 다시 정렬(재귀호출)

# 변수
dataAry = [188, 150, 168, 162, 105, 120, 177, 50]

# 메인
print('정렬 전 =>', dataAry)
sortQuickN(dataAry, 0, len(dataAry)-1)
print('정렬 후 =>', dataAry)
print('처리횟수:', count)

정렬 전 => [188, 150, 168, 162, 105, 120, 177, 50]
정렬 후 => [50, 105, 120, 150, 162, 168, 177, 188]
처리횟수: 9


##### 퀵정렬
- 최악의 경우는 $O(n^2)$ 이지만, 평균적으로 $O(n log n)$ 연산 수를 가짐
- 만약 n이 100만개일 경우 (1,000,000)
    - 선택정렬, 삽입정렬 = 1조번 처리 (1,000,000,000,000)
    - 퀵정렬 = 약 2000만번 처리 (20,000,000)

#### 정렬 응용예
- 이진 탐색(Binary search)[이진 트리사용] 검색 알고리즘에서 활용
- 데이터 분석 : 최소값, 최대값, 중앙값, 분위수 계산시 사용
- 데이터베이스 SQL문 : ORDER BY 사용시 내림차순, 오름차순 사용
- 파일 정리, 로그 정리
- 그래픽 이미지처리 : 이미지 픽셀 밝기순 정렬, 히스토그램 생성
- 네트워크 패킷 처리
- 인공지능 머신러닝 : KNN 정렬사용
- 쇼핑몰 : 가격 순으로 정렬