# Sorting
- 참고
https://github.com/TheAlgorithms/Python/blob/master/sorts/quick_sort.py

#### 버블정렬
: 거품처럼 하나씩 비교하여 정렬하는 알고리즘 <br>
: in-place 알고리즘 <br>
: stable한 알고리즘(중복 데이터의 경우 순서 유지)
- worst case: O(n^2) 정렬이 하나도 안되어있는 경우
- average case: O(n^2)
- best case: O(n) 정렬되어 있는 경우
- 장점: in-place 알고리즘이기 때문에 메모리 절약 가능 
- 단점: 자료의 개수가 많아지면 성능 저하

In [45]:
def bubbleSort(array):
    arrLen = len(array)
    for i in range(arrLen-1):
        for j in range(arrLen-1-i):
               if(array[j] > array[j+1]):
                   array[j], array[j+1] = array[j+1], array[j]
    return array;

In [46]:
arr = [2,3,5,1]
arr = bubbleSort(arr)
print(arr)

[1, 2, 3, 5]


#### 삽입 정렬
: 왼쪽에서부터 오른쪽으로 이동하면서 정렬해나가는 알고리즘 <br>
: 항상 두번째 요소를 왼쪽 요소와 비교하여 정렬<br>
- worst case O(n^2): 정렬이 하나도 안되어있는 경우
- average case O(n^2)
- best case O(n): 정렬되어 있는 경우
- 장점: in-place 알고리즘으로 메모리 절약, stable 알고리즘
- 단점: 자료의 개수가 많아지면 성능 저하

In [62]:
def insertSort(arr):
    arrLen = len(arr)
    for i in range(1,arrLen):
        thisData = arr[i]
        properIdx = 0
        for j in range(i-1,-1,-1):
            if arr[j] > thisData:
                arr[j+1] = arr[j]
            else:
                properIdx = j+1
                break
        arr[properIdx] = thisData
    return arr

In [63]:
arr = [2,3,5,1]
arr = insertSort(arr)
print(arr)

[1, 2, 3, 5]


#### 선택정렬
① 데이터에서 최소값 탐색<br>
② 그 값을 맨 앞에 위치한 값과 교환<br>
③ 그 값을 제외한 값 중 최소값 탐색<br>
④ 그 값을 두번째 위치한 값과 교환<br>
⑤ 반복
- worst case O(n^2): 정렬이 하나도 되어있지 않는 경우
- average case O(n^2)
- best case O(n^2): 정렬이 모두 되있는 경우
- 장점: in-place 알고리즘이기 때문에 메모리 절약 가능
- 단점: 최선의 경우에도 각 단계에서 최소값을 모두 알아야 하기 때문에 최악의 경우와 동일한 시간복잡도를 가짐(unstable한 알고리즘)

In [79]:
def selSort(arr):
    arrLen = len(arr)
    minNum = 0
    
    for i in range(arrLen):
        min = i
        
        for j in range(i, arrLen):
            if arr[min] > arr[j]:
                min = j
                
        arr[i], arr[min] = arr[min], arr[i]
        
    return arr    
        

In [80]:
arr = [5,4,3,2,1]
arr = insertSort(arr)
print(arr)

[1, 2, 3, 4, 5]


#### 퀵 정렬
① 배열 중 하나의 값을 피봇으로 선정<br>
② 피봇보다 작은 값들로 구성된 배열과 큰 값으로 구성된 배열로 분할<br>
③ 배열의 크기가 0이나 1이 될 때까지 이를 재귀적으로 반복<br>
- worst case: O(n^2)
- average case: O(nlogn)
- best case: O(nlogn)
- 장점: 다른 O(nlogn) 알고리즘보다 빠르게 동작
- 단점: 피봇에 따라 시간복잡도가 크게 달라진다.(unstable)

In [82]:
def quickSort(arr):
    # 배열의 값이 1개보다 작아지면 재귀 중단
    if(arr < 1): return arr
    
    # 피봇값을 갱신하고 more과 less를 초기화
    pivot = arr.pop()
    more = []
    less = []
    
    for element in arr:
        (more if element > piovt else less).append(element)
        
    return quickSort(less) + [pivot] + quickSort(more)
    

In [84]:
arr = [7,2,5,1,9,1,5,2]
arr = insertSort(arr)
print(arr)

[1, 1, 2, 2, 5, 5, 7, 9]


#### 힙 정렬
① 데이터를 잘게 쪼갬<br>
② 둘씩 크기 비교<br>
③ 쪼갠 데이터를 합침<br>
④ 더이상 합칠 데이터가 없을 때까지 반복<br>
- worst case: O(nlogn)
- average case: O(nlogn)
- best case: O(nlogn)

In [1]:
# unsorted: 정렬이 되지 않은 배열, index: 인덱스, heap_size: 크기
def heapify(unsorted, index, heap_size):
    largest = index
    
    left_index = 2 * index
    right_index = 2 * index + 1
    
#  자식노드가 범위안에 드는지 확인, 자식노드가 부모노드보다 큰지 확인
#  자식노드가 부모노드보다 크다면 인덱스 스위치

    if left_index < heap_size and unsorted[left_index] > unsorted[largest]:
        largest = left_index
    if right_index < heap_size and unsorted[right_index] > unsorted[largest]:
        largest = right_index
    
#  부모노드의 인덱스 값이 바뀌면 자식노드의 값과 스위치
    if largest != index:
        unsorted[largest], unsorted[index] = unsorted[index], unsorted[largest]
        # 재귀함수
        heapify(unsorted, largest, heap_size)


In [5]:
def heap_sort(unsorted):
    # 리스트의 전체 길이를 저장
    n = len(unsorted)
    
    # 이진트리를 구하기 때문에 전체 크기의 절반 만큼 반복
    # for문을 거꾸로 돌아감
    # 이진트리의 가장 아래부터 heapify를 실행하여 힙 구조 형성
    
    for i in range(n//2, -1, -1 ):
        heapify(unsorted, i, n)
        
    # 마지막 노드부터 루트노드를 기준으로 값을 스위치하면서 정렬
    for i in range(n-1, 0, -1):
        unsorted[0], unsorted[i] = unsorted[i], unsorted[0]
        heapify(unsorted, 0, i)
        
    return unsorted

In [6]:
arr = [7,4,9,2,1,3,8]
heap_sort(arr)

[1, 2, 3, 4, 7, 8, 9]

#### 합병정렬
: 분할 정복 방법(divide and conquer)<br>
: 문제를 작은 2개의 문제로 분리하고 각각을 해결한 다음, 결과를 모아 원래의 문제 해결
: 순환 호출을 이용하여 구현<br>

① 리스트의 길이가 0 또는 1이면 이미 정렬된 것으로 본다.<br>
② 그렇지 않은 경우 리스트를 절반으로 잘라 비슷한 크기의 리스트로 나눈다.<br>
③ 각 부분의 리스트를 재귀적으로 합병정렬을 이용해 정렬한다.<br>
④ 두 부분 리스트를 다시 하나의 정렬된 리스트로 합병한다.<br>
- 단점: in-place 정렬이 아니기 때문에 임시 배열 필요<br>
- 장점: 데이터 분포의 영향을 덜 받고, 입력 데이터에 관계 없이 정렬 시간이 O(nlogn)으로 동일<br>

- worst case: O(nlogn)
- average case: O(nlogn)
- best case: O(nlogn)

In [20]:
def merge(leftArr, rightArr):
#     결합할 배열 생성
    result = []
    i = 0    # 왼쪽 배열에서 움직일 인덱스
    j = 0    # 오른쪽 배열에서 움직일 인덱스
    
#     왼쪽 배열과 오른쪽 배열의 길이 저장
    leftLen = len(leftArr)
    rightLen = len(rightArr)
    
#     분할 정렬된 Arr의 합병
    while((i < leftLen) and (j < rightLen)):
        if leftArr[i] < rightArr[j]:
            result.append(leftArr[i])
            i += 1
        else:
            result.append(rightArr[j])
            j += 1
            
#   만약 왼쪽 배열이 다 result에 들어가고 오른쪽 배열의 값만 남았을 경우
    if(i >= leftLen):
        for k in range(j,rightLen):
            result.append(rightArr[k])
#   만약 오른쪽 배열이 다 result에 들어가고 왼쪽 배열의 값만 남았을 경우          
    else:
        for k in range(i, leftLen):
            result.append(leftArr[k])
    
    return result
    
    

In [21]:
def mergeSort(arr):
    if len(arr) <= 1:
        return arr
    
#     주어진 배열을 절반으로 나누기 위해 인덱스 설정
    mid = len(arr) // 2
    leftArr = arr[:mid]
    rightArr = arr[mid:]
    
#     왼쪽 오른쪽 배열을 divide
    leftArr = mergeSort(leftArr)
    rightArr = mergeSort(rightArr)
    
#     양쪽 배열을 conqure
    return merge(leftArr, rightArr)

In [22]:
arr = [6,2,4,0,1,8]
mergeSort(arr)

[0, 1, 2, 4, 6, 8]

#### 셸 정렬
: 삽입 정렬을 보완한 알고리즘<br>
: 삽입 정렬의 최대 문제점은 요소들이 삽입될 때 이웃한 위치로만 이동하는 것<br>
: 즉, 삽입되어야 할 위치가 멀리 있다면 이동하는데 많은 시간 소요<br>
: 삽입정렬과 다르게 셸 정렬은 전체 리스트를 한번에 정렬하지 않음<br>

① 리스트를 간격에 의해 분류 (간격의 초기값 = (리스트의 원소 개수) / 2)<br>
② 일정 간격에 의해 분류된 부분 리스트 생성<br>
③ 각각의 부분 리스트를 삽입 정렬을 이용하여 정렬<br>
④ 부분 리스트를 모두 정렬하면 다시 전체 리스트를 더 작은 간격에 의해 분류<br>
⑤ 1~3 과정 반복<br>
⑥ 부분 리스트의 간격이 1이 될 때까지 반복<br>

- 단점: 간격이 잘못 설정된 경우 성능저하 초래<br>
- 장점: 부분 리스트는 어느정도 정렬이 된 상태이기 때문에 삽입정렬보다 빠르게 수행됨<br>
알고리즘이 간단함<br>

- worst case: O(n^2)<br>
- average case: O(n^1.5)<br>
- worst case: O(n)<br>

In [25]:
def shellSort(arr):
#     배열의 길이 저장
    n = len(arr)
#     간격 설정
    gap = n // 2
    
    while gap > 0:
        for i in range(gap, n):
            temp = arr[i]
            
#           해당 간격의 전 요소와 비교
            j = i - gap
#           그 전 요소가 존재하고 그 다음 요소보다 크면 자리를 바꿔주고 또 그 이전 요소 탐색 후 비교 반복 
            while j >= 0 and arr[j] > temp:
                arr[j + gap] = arr[j]
                j -= gap
#           바뀐 자리에 삽입
            arr[j + gap] = temp
#       간격(gap) 재설정
        gap //= 2
        
    return arr

In [26]:
arr = [4,2,8,1,0,6]
shellSort(arr)

[0, 1, 2, 4, 6, 8]