# 정렬

정렬 알고리즘에서는 리스트의 두 원소를 switch해야 하는 경우가 많은데, python에서는 다음과 같이 간단하게 리스트 `a`의 `i`번째 원소와 `j`번째 원소를 switch할 수 있다.
```
a[i], a[j] = a[j], a[i]
```

In [159]:
a = list(range(10))
a[2], a[3] = a[3], a[2]
print(a)

[0, 1, 3, 2, 4, 5, 6, 7, 8, 9]


## 2750번 : 기본 정렬

평균적 시간 복잡도가 $O(n^2)$인 기본 정렬 방식으로는 선택정렬, 버블정렬, 삽입정렬 방식이 있다.  
재귀적 구조를 쓰지 말고 일반적인 반복문으로 짜도록 하자.

#### 선택정렬

- 최대 원소를 찾아서 리스트의 맨 뒤에 있는 원소와 스위치 해준다.
- 맨 뒤에 있는 원소를 제외한 나머지 리스트에서 같은 작업을 반복한다.

In [74]:
def selectSort(a : list, n : int) :
    for length in range(n, 1, -1) :
        largestIdx = 0
        for i in range(1, length) :
            if a[i] > a[largestIdx] :
                largestIdx = i
        a[length -1] , a[largestIdx] = a[largestIdx] , a[length -1]

    

In [163]:
n = int(input())
a = []
for i in range(n) :
    a.append(int(input()))

selectSort(a, n)

for elem in a :
    print(elem)

2
8
14
87
97


In [164]:
n = 2000
import random
a = [random.randrange(1,1000000, 1) for i in range(n)]
a == sorted(a)

False

In [165]:
selectSort(a, n)
a == sorted(a)

True

#### 버블정렬

- 가장 큰 원소를 리스트의 맨 뒤로 보내는 것은 선택정렬 방식과 비슷하다.
- 그러나 가장 큰 원소를 리스트의 맨 뒤로 보내는 방식이 다르다.
- 한칸씩 옮겨가면서 이웃한 두 원소의 크기를 비교하고 크기가 반대로 되어 있으면 스위치 해준다.

In [80]:
def bubbleSort(a : list, n : int) :
    for length in range(n, 1, -1) :
        for j in range(length-1) :
            if a[j] > a[j+1] :
                a[j], a[j+1] = a[j+1], a[j]
            else :
                pass

In [81]:
n = int(input())
a = []
for i in range(n) :
    a.append(int(input()))

bubbleSort(a, n)

for elem in a :
    print(elem)

4
5
6
11
12
87
98
778


In [172]:
n = 2000
import random
a = [random.randrange(1,1000000, 1) for i in range(n)]
a == sorted(a)

False

In [173]:
bubbleSort(a, n)
a == sorted(a)

True

#### 삽입정렬

- 선택정렬과 버블정렬은 정렬되지 않은 리스트의 길이를 하나씩 줄여나가는 방식이었다.
- 삽입정렬은 정렬이 된 리스트의 길이를 하나씩 늘려나가는 방식이다.
- 이미 정렬이 된 원소들과 삽입해야 할 원소들의 크기를 비교하면서 삽입 위치를 탐색한다.
- 이때 삽입해야 할 원소와 위치가 가까운 원소부터 시작해서 리스트의 맨 처음 원소 방향으로 한 칸씩 이동하며 비교한다.

In [90]:
def insertSort(a : list, n) :
    for last in range(1, n) :
        j = last -1 
        item = a[last]
        while j >= 0 and a[j] > item :
            a[j+1] = a[j]
            j -= 1
        a[j+1] = item    

In [91]:
n = int(input())
a = []
for i in range(n) :
    a.append(int(input()))

insertSort(a, n)

for elem in a :
    print(elem)

3
4
5
6
8
11
21
79


In [180]:
n = 2000
import random
a = [random.randrange(1,1000000, 1) for i in range(n)]
a == sorted(a)

False

In [181]:
insertSort(a, n)
a == sorted(a)

True

## 2751번 : 고급 정렬

평균적 시간 복잡도가 $O(n\log n)$인 고급 정렬 방식으로는 병합정렬, 퀵정렬, 힙정렬, 셸정렬 등이 있다.


#### 병합정렬

- 재귀적 구조의 정렬 방식. 함수 argument로 시작지점과 끝지점의 index가 필요하다.
- 크기가 큰 문제와 작은 문제의 관계가 뒷쪽에 위치한다.
- 크기가 작은 문제를 해결하고 그 둘의 관계를 처리하는 `merge`함수를 만들어주어야 한다.
- `merge`는 정렬된 두 개의 작은 리스트를 하나의 정렬된 리스트로 병합하는 작업이다. 

In [103]:
def mergeSort(a : list, start : int, end : int) :
    if start < end :
        m = (start + end) // 2  
        mergeSort(a, start, m)
        mergeSort(a, m+1, end)
        merge(a, start, end, m)
    else :
        pass

def merge(a : list, start : int, end : int, m : int) :
    tmplist = []
    i = start ; j = m+1
    while i <= m and j <= end :
        if a[i] < a[j] :
            tmplist.append(a[i])
            i+= 1
        else :
            tmplist.append(a[j])
            j+= 1
    while i <= m :
        tmplist.append(a[i])
        i+= 1
    while j <= end :
        tmplist.append(a[j])
        j+= 1
    a[start:end+1] = tmplist

In [104]:
n = int(input())
a = []
for i in range(n) :
    a.append(int(input()))

mergeSort(a, 0, n-1)

for elem in a :
    print(elem)

1
5
6
6
21
25
33
45
87


In [208]:
n = 30000
import random
a = [random.randrange(1,1000000, 1) for i in range(n)]
a == sorted(a)

False

In [209]:
mergeSort(a, 0, n-1)
a == sorted(a)

True

#### 퀵 정렬

- 재귀적 구조의 정렬 방식.  함수 argument로 시작지점과 끝지점의 index가 필요하다.
- 크기가 큰 문제와 작은 문제의 관계가 앞쪽에 위치한다.
- 크기가 작은 문제를 해결하고 그 둘의 관계를 처리하는 `partition`함수를 만들어주어야 한다.
- `partition`은 기준이 되는 원소(리스트의 맨 뒤 원소)보다 작은 원소들은 앞쪽으로, 큰 원소들은 뒷쪽으로 나누어주고  
기준이 되는 원소는 그 사이에 위치하게끔 만들어주는 작업이다. 

In [210]:
def quickSort(a : list, start : int, end : int) :
    if start < end :
        m = partition(a, start, end)
        quickSort(a, start, m-1)
        quickSort(a, m+1, end)
    else :
        pass

In [211]:
def partition(a : list, start : int, end : int) :
    item = a[end]
    i = start -1 
    for j in range(start, end) :
        if a[j] < item :
            i += 1
            a[i], a[j] = a[j], a[i]
        else :
            pass
    a[i+1], a[end] = a[end], a[i+1]
    return i+1

In [212]:
n = int(input())
a = []
for i in range(n) :
    a.append(int(input()))

quickSort(a, 0, n-1)

for elem in a :
    print(elem)


1
3
8
9
22
45
63
79
84
2897


In [239]:
n = 30000
import random
a = [random.randrange(1,1000000, 1) for i in range(n)]
a == sorted(a)

False

In [240]:
quickSort(a, 0, n-1)
a == sorted(a)

True

#### 셸 정렬

- 셸 정렬은 반복적으로 삽입 정렬을 시행하는 방식이다. (어느 정도 정렬이 된 리스트가 주어질 경우 삽입 정렬은 상당히 효율적)
- gap sequence를 도입하여 수열 $1,\cdots,n$에서 gap만큼 떨어진 부분수열을 활용해 해당 부분에서만 삽입정렬을 시행한다.
- gap sequence는 처음에는 큰 갭을 사용하다가 점차 줄어들면서 마지막에 gap이 1이 되게끔 만든다.
- gap이 1이 된다는 것은 마지막 단계에서는 삽입 정렬과 정확히 같은 작업을 하게 된다는 것을 의미한다.

셸 정렬에서 gap sequence를 만드는 방법은 여러 가지가 있다.  반드시 지켜야 할 사항은 gap sequence의 마지막 원소는 1이어야 한다는 것이다.  
여기서는 다음과 같은 방식으로 만들도록 하겠다.
1. 1을 첫번째 원소 $h_1$으로 만든다.
2. $h_{k+1} = 3h_k+1$을 활용해 수열 $h_k$를 construct한다.
3. $h_k < n/5$가 되면 수열의 construction을 마친다.
4. Gap sequence는 점점 작아지면서 마지막에 1이 나와야 하므로 $h_k$를 reverse해준다. 

In [258]:
a = [1,2,3,4,5]
a.reverse()
print(a)

[5, 4, 3, 2, 1]


In [260]:
def shellSort(a : list, n : int) :
    for gap in gapSeq(n) :
        gapInsertSort(a, n, gap)
        


In [261]:
def gapSeq(n : int) :
    seq = [1]
    gap = 1
    while gap < n / 5 :
        gap *= 3
        gap += 1
        seq.append(gap)
    seq.reverse()
    return seq

In [262]:
def gapInsertSort(a : list, n : int, gap : int) :
    for head in range(gap) :
        for last in range(head + gap, n, gap) :
            j = last - gap
            item = a[last]
            while j >= head and a[j] > item :
                a[j+gap] = a[j]
                j -= gap 
            a[j+gap] = item 

In [263]:
n = int(input())
a = []
for i in range(n) :
    a.append(int(input()))

shellSort(a, n)

for elem in a :
    print(elem)

5
8
9
32
32
64
97
889
4567
10002


In [277]:
n = 30000
import random
a = [random.randrange(1,1000000, 1) for i in range(n)]
a == sorted(a)

False

In [278]:
shellSort(a, n)
a == sorted(a)

True