# 정렬

파이썬은 Timsort (삽입정렬 + 병합정렬) -> $O(NlogN)$

1. 창안자인 Tim Peters의 이름을 따서 팀정렬(Tim sort)알고리즘이라 부른다 
2. 2001년 만들어진 알고리즘으로 파이썬을 위해 C 언어로 구현되었다.
3.  Python뿐만 아니라 Java SE 7, Android, Google chrome (V8), swift 등에서 표준 정렬 알고리즘으로 채택되었다. 

Timsort 알고리즘의 특징
1. '실제 데이터는 대부분 이미 정렬돼 있을 것이다' 라는 가정에 기반한 정렬 알고리즘.
2. 삽입정렬과 병합정렬을 적절히 조합한 알고리즘.
3. 현업에서 병합정렬, 퀵정렬 보다 더 널리 쓰이는 정렬알고리즘이다. 

![image.png](attachment:image.png)

> 출처 https://questionet.tistory.com/61

## 삽입정렬
* 삽입 정렬은 두 번째 인덱스부터 시작
* 해당 인덱스(key 값) 앞에 있는 데이터(B)부터 비교해서 key 값이 더 작으면, B값을 뒤 인덱스로 복사
* 이를 key 값이 더 큰 데이터를 만날때까지 반복, 그리고 큰 데이터를 만난 위치 바로 뒤에 key 값을 이동
* 카드 게임할 때 정렬하는 거랑 비슷

https://visualgo.net/en/sorting

<img src="https://upload.wikimedia.org/wikipedia/commons/9/9c/Insertion-sort-example.gif" />

**시간복잡도**
* 반복문이 두 개 $O(n^2)$
  - 최악의 경우, <font size=5em>$\frac { n * (n - 1)}{ 2 }$</font>
* 완전 정렬이 되어 있는 상태라면 최선은 $O(n)$

**공간복잡도**
- 삽입 정렬은 별도의 추가 공간을 사용하지 않고 주어진 배열이 차지하고 있는 공간 내에서 값들의 위치만 바꾸기 때문에 O(1)의 공간 복잡도를 가진다.

> 출처: https://www.dalecoding.com/algorithms/insertion-sort

In [46]:
arr = [9, 3, 2, 5]

In [47]:
def insertion_sort(arr):
    for end in range(1, len(arr)): # 두 번째 인덱스부터 시작
        for i in range(end, 0, -1):
            if arr[i-1] > arr[i]: # 현재 확인하는 숫자보다 앞의 숫자가 더 크다면 swap
                arr[i-1], arr[i] = arr[i], arr[i-1]
            print(end, arr)

In [48]:
insertion_sort(arr)
print(f"정렬 결과: {arr}")

1 [3, 9, 2, 5]
2 [3, 2, 9, 5]
2 [2, 3, 9, 5]
3 [2, 3, 5, 9]
3 [2, 3, 5, 9]
3 [2, 3, 5, 9]
정렬 결과: [2, 3, 5, 9]


In [49]:
# 최적화
def insertion_sort(arr):
    for end in range(1, len(arr)):
        i = end
        while i > 0 and arr[i - 1] > arr[i]:
            arr[i - 1], arr[i] = arr[i], arr[i - 1]
            i -= 1

## 선택정렬

* 다음과 같은 순서를 반복하며 정렬하는 알고리즘
  1. 주어진 데이터 중, 최소값을 찾음
  2. 해당 최소값을 데이터 맨 앞에 위치한 값과 교체함
  3. 맨 앞의 위치를 뺀 나머지 데이터를 동일한 방법으로 반복함

https://visualgo.net/en/sorting

<img src="https://upload.wikimedia.org/wikipedia/commons/9/94/Selection-Sort-Animation.gif" width=100>

**시간복잡도**
* 반복문이 두 개 O($n^2$)
  - 실제로 상세하게 계산하면, <font size=5em>$\frac { n * (n - 1)}{ 2 }$</font>
 
**공간복잡도**
- 추가공간을 사용하지 않고 주어진 배열이 차지하고 있는 공간 내에서 값들의 위치만 바꾸기 때문에 $O(1)$의 공간복잡도를 가진다.

In [52]:
arr = [7, 6, 21, 3, 8, 1, 14]

In [51]:
def selection_sort(arr):
    for i in range(len(arr) - 1):
        min_idx = i
        for j in range(i + 1, len(arr)):
            if arr[j] < arr[min_idx]:
                min_idx = j
        arr[i], arr[min_idx] = arr[min_idx], arr[i]

In [53]:
selection_sort(arr)
print(arr)

[1, 3, 6, 7, 8, 14, 21]


## 버블정렬
- 두 인접한 데이터를 비교해서, 앞에 있는 데이터가 뒤에 있는 데이터보다 크면, 자리를 바꾸는 정렬 알고리즘

n번의 라운드로 이뤄져 있으며, 각 라운드마다 배열의 아이템을 한 번씩 쭉 모두 살펴본다.   
연달아 있는 아이템 2개의 순서가 잘못돼 있는 것을 발견하면, 두 아이템을 맞바꾼다.   

https://visualgo.net/en/sorting

<img src="https://upload.wikimedia.org/wikipedia/commons/c/c8/Bubble-sort-example-300px.gif" width=600/>

**시간복잡도**
* 반복문이 두 개 O($n^2$)
  - 최악의 경우, <font size=5em>$\frac { n * (n - 1)}{ 2 }$</font>
* 완전 정렬이 되어 있는 상태라면 최선은 O(n)

In [2]:
def bubble_sort(arr):
    for i in range(1, len(arr)): # n-1번의 라운드
        for j in range(0, len(arr)-1):
            if arr[j] > arr[j+1]: # 앞의 수가 뒤의 수보다 크다면
                arr[j], arr[j+1] = arr[j+1], arr[j] # swap

In [3]:
arr = [1, 9, 3, 2]
bubble_sort(arr)
print(arr)

[1, 2, 3, 9]


**추가 최적화**   
이전 패스에서 앞뒤 자리 비교(swap)가 있었는지 여부를 체크하는 대신 마지막으로 앞뒤 자리 비교가 있었던 index를 기억해두면 다음 패스에서는 그 자리 전까지만 정렬해도 된다. 따라서 한 칸씩 정렬 범위를 줄여나가는 대신 한번에 여러 칸씩 정렬 범위를 줄여나갈 수 있다.

> 출처: https://www.daleseo.com/sort-bubble/

In [5]:
# 최적화 버블 정렬
def bubble_sort(arr):
    end = len(arr) - 1
    while end > 0:
        last_swap = 0
        for i in range(end):
            if arr[i] > arr[i + 1]:
                arr[i], arr[i + 1] = arr[i + 1], arr[i]
                last_swap = i
        end = last_swap

## 퀵정렬
* <font color='#BF360C'>정렬 알고리즘의 꽃</font>
* 병합 정렬과 마찬가지로 분할 정복 알고리즘
* 기준점(pivot)을 정해서, 기준점보다 작은 데이터는 왼쪽(left), 큰 데이터는 오른쪽(right)으로 파티셔닝하면서 쪼개 나간다.
* 각 왼쪽(left), 오른쪽(right)은 재귀를 통해 다시 동일 함수를 호출하여 위 작업을 반복함
* 왼쪽(left) + 기준점(pivot) + 오른쪽(right)과 같이 피벗을 기준으로 좌우를 나누는 특징 때문에 **파티션 교환 정렬**이라고 불린다.

http://www-scf.usc.edu/~zhan468/public/Notes/sorting.html
<img src="https://upload.wikimedia.org/wikipedia/commons/9/9c/Quicksort-example.gif?20110419161403" width=500/>

**시간복잡도**
* <font color='#BF360C'>병합정렬과 유사, 시간복잡도는 O(n log n)</font>
  - 단, 최악의 경우 
    - 맨 처음 pivot이 가장 크거나, 가장 작으면
    - 모든 데이터를 비교하는 상황이 나옴
    - O($n^2$)

In [6]:
# 로무토 파티션: 항상 맨 오른쪽의 피벗을 택하는 단순한 방식(토니 호어가 고안한 최초의 퀵 정렬보다 훨씬 더 간결하고 이해하기 쉽다)
def partition(lo, hi):
    pivot = arr[hi] # 맨 오른쪽 값
    left = lo
    for right in range(lo, hi):
        if arr[right] < pivot: # 오른쪽 포인터의 값이 피벗보다 작으면 서로 스왑하는 형태
            arr[left], arr[right] = arr[right], arr[left]
            left += 1
    arr[left], arr[hi] = arr[hi], arr[left]
    return left # pivot의 위치 (pivot을 기준으로 왼쪽은 pivot보다 작은 값, 오른쪽은 pivot보다 큰 값 정렬)

In [7]:
def quick_sort(arr, lo, hi):
    if lo < hi: # 계속 분할하면서 정복 진행(서로 위치가 역전할 때까지 계속 재귀로 반복)
        pivot = partition(lo, hi)
        quick_sort(arr, lo, pivot-1) # pivot의 왼쪽
        quick_sort(arr, pivot+1, hi) # pivot의 오른쪽

In [32]:
arr = [2, 8, 7, 1, 3, 5, 6, 4]

In [14]:
# partition(0, len(arr)-1)
# print(arr)

[2, 1, 3, 4, 7, 5, 6, 8]


In [18]:
quick_sort(arr, 0, len(arr)-1)
print(arr)

[1, 2, 3, 4, 5, 6, 7, 8]


## 병합정렬
- 병합 정렬은 분할 정복 (Divide and Conquer) 기법과 재귀 알고리즘을 이용해서 정렬 알고리즘입니다. 즉, 주어진 배열을 원소가 하나 밖에 남지 않을 때까지 계속 둘로 쪼갠 후에 다시 크기 순으로 재배열 하면서 원래 크기의 배열로 합칩니다.

  1. 리스트를 절반으로 잘라 비슷한 크기의 두 부분 리스트로 나눈다.
  2. 각 부분 리스트를 재귀적으로 합병 정렬을 이용해 정렬한다.
  3. 두 부분 리스트를 다시 하나의 정렬된 리스트로 합병한다.

https://visualgo.net/en/sorting

<img src="https://upload.wikimedia.org/wikipedia/commons/c/cc/Merge-sort-example-300px.gif" width=500/>

**시간복잡도**
- 알고리즘을 큰 그림에서 보면 분할(split) 단계와 방합(merge) 단계로 나눌 수 있으며, 단순히 중간 인덱스를 찾아야 하는 분할 비용보다 모든 값들을 비교해야하는 병합 비용이 크다.
- 예제에서 보이는 것과 같이 8 -> 4 -> 2 -> 1 식으로 전반적인 반복의 수는 점점 절반으로 줄어들 기 때문에 $O(logN)$ 시간이 필요하며, 각 패스에서 병합할 때 모든 값들을 비교해야 하므로 O(N) 시간이 소모됩니다. 따라서 총 시간 복잡도는 $O(NlogN)$

**공간복잡도**
- $O(N)$
    - 두 개의 배열을 병합할 때 병합 결과를 담아 놓을 배열이 추가로 필요하다.
    - 다른 정렬 알고리즘과 달리 인접한 값들 간에 상호 자리 교대(swap)이 일어나지 않는다.
    
> 출처: https://www.dalecoding.com/algorithms/merge-sort

In [60]:
arr = [6, 5, 3, 1, 8, 7, 2, 4]

In [61]:
def merge_sort(arr):
    if len(arr) < 2:
        return arr

    mid = len(arr) // 2
    low_arr = merge_sort(arr[:mid])
    high_arr = merge_sort(arr[mid:])

    merged_arr = []
    l = h = 0
    while l < len(low_arr) and h < len(high_arr):
        if low_arr[l] < high_arr[h]:
            merged_arr.append(low_arr[l])
            l += 1
        else:
            merged_arr.append(high_arr[h])
            h += 1
    merged_arr += low_arr[l:]
    merged_arr += high_arr[h:]
    return merged_arr

In [62]:
# 최적화
def merge_sort(arr):
    def sort(low, high):
        if high - low < 2:
            return
        mid = (low + high) // 2
        sort(low, mid)
        sort(mid, high)
        merge(low, mid, high)

    def merge(low, mid, high):
        temp = []
        l, h = low, mid

        while l < mid and h < high:
            if arr[l] < arr[h]:
                temp.append(arr[l])
                l += 1
            else:
                temp.append(arr[h])
                h += 1

        while l < mid:
            temp.append(arr[l])
            l += 1
        while h < high:
            temp.append(arr[h])
            h += 1

        for i in range(low, high):
            arr[i] = temp[i - low]

    return sort(0, len(arr))

In [59]:
merge_sort(arr)
print(arr)

[1, 3, 5, 6]


# 큐 -> 스택
https://leetcode.com/problems/implement-stack-using-queues/

# 스택 2개 -> 큐

# 소수 문제

# 길찾기 문제

# 0이나 7의 개수 구하기

# 팩토리얼 0

# 피보나치

# DFS, BFS

# 달팽이 문제

# 배열 돌리기

# 이진 검색 트리