# 단순 선택 정렬

가장 작은 원소를 선택해 정렬되지 않은 영역 중 가장 작은 인덱스와 교환하는 방식의 정렬이다.<br/>
이웃하지 않은 원소끼리 비교를 진행하므로 **안정적이지 않은 정렬**이다.

In [5]:
# 단순 선택 정렬 - 내가 짠 코드 (min index 찾기 직접 구현)

def selection_sort(a):
    n = len(a)
    # 정렬
    for i in range(n - 1):
        # min index 찾기
        min = i
        for j in range(i, n):
            if a[min] > a[j]:
                min = j
        
        a[i], a[min] = a[min], a[i]

a = [6, 4, 8, 3, 1, 9, 7]
selection_sort(a)
print(a)

[1, 3, 4, 6, 7, 8, 9]


In [7]:
def selection_sort(a):
    n = len(a)
    for i in range(n - 1):
        min = i
        for j in range(i + 1, n):
            if a[j] < a[min]:
                min = j
        a[i], a[min] = a[min], a[i]

a = [6, 4, 8, 3, 1, 9, 7]
selection_sort(a)
print(a)

[1, 3, 4, 6, 7, 8, 9]


# 단순 삽입 정렬

- 주목한 원소보다 더 앞쪽에서 알맞은 위치로 삽입하여 정렬하는 알고리즘이다. 카드를 한 줄로 늘어놓을 때 사용하는 방법과 비슷한 알고리즘이다.<br/>
    - 단순 선택 정렬과 비슷해보이지만, 가장 작은 원소를 골라서 정렬하지 않는다는 점이 다르다.<br/><br/>
- 단순 삽입 정렬은 두 번째 원소, 즉 정렬되지 않은 영역의 첫 번째 원소부터 주목하여 진행한다.<br/>
    - 첫 번째 원소는 정렬되었다고 가정하여 시작하기 때문이다.

In [8]:
# 삽입 정렬 - 내가 짠 코드 

# n-1번 반복하기 때문에 1부터 n-1까지로 범위를 지정했다. 만약 index가 0부터 시작하면 range(n-1)까지 반복했을 때 n-1번 반복이다.
# 하지만 1부터 시작하여 n-1번 반복하기 위해서는 범위를 range(1, n)과 같이 지정해야 한다.

def insertion_sort(a):
    n = len(a)
    for unsorted in range(1, n):
        for j in range(unsorted):
            if a[j] > a[unsorted]:
                a[j], a[j + 1:unsorted + 1] = a[unsorted], a[j:unsorted]
    
a = [6, 4, 3, 7, 1, 9, 8]        
insertion_sort(a)
print(a)

[1, 3, 4, 6, 7, 8, 9]


**내가 짠 코드의 개선**<br/>
<br/>
내가 짠 코드는 비교를 n번 수행하고, 또 자리를 옮기면서 다시 n번 반복문을 수행해야 한다. 따라서 비효율적이다. 비교하면서 바로 교환을 수행하면 한꺼번에 n-1개를 뒤로 미룰 필요가 없다.

In [12]:
# 삽입 정렬 - 내가 짠 코드 개선

def insertion_sort(a):
    n = len(a)
    for u in range(1, n):
        tmp = a[u]
        i = u - 1
        while tmp < a[i] and i >= 0:
            a[i + 1] = a[i]
            i -= 1
        a[i + 1] = tmp
            
a = [6, 4, 3, 7, 1, 9, 8]        
insertion_sort(a)
print(a)

[1, 3, 4, 6, 7, 8, 9]


**내가 짠 코드의 개선 2**<br/>
<br/>
인덱스에 신경써서 코드를 짜면 보수가 수월해진다. 인덱스에 신경써서 다시 짜기

특히 반복문을 돌릴 때 내가 필요한 게 개수/횟수인지 또는 인덱스인지를 잘 생각해보기

In [None]:
# 삽입 정렬 - 내가 짠 코드 개선 2

def insertion_sort(a):
    n = len(a)
    for u in range(1, n):
        tmp = a[u]
        i = u - 1
        while tmp < a[i] and i >= 0:
            a[i + 1] = a[i]
            i -= 1
        a[i + 1] = tmp
            
a = [6, 4, 3, 7, 1, 9, 8]        
insertion_sort(a)
print(a)

In [9]:
# 삽입 정렬

def insertion_sort(a):
    n = len(a)
    for i in range(1, n):
        j = i
        tmp = a[i]
        while j > 0 and a[j - 1] > tmp:
            a[j] = a[j - 1]
            j -= 1
        a[j] = tmp

a = [6, 4, 3, 7, 1, 9, 8]        
insertion_sort(a)
print(a)

[1, 3, 4, 6, 7, 8, 9]


### 버블 정렬, 단순 선택 정렬, 단순 삽입 정렬은 모두 $O(n^2)$의 시간 복잡도를 갖는다.

# 이진 삽입 정렬

삽입 정렬은 앞에 정렬된 영역이 늘어나고, 또 정렬된 영역 내에서 정렬되지 않은 원소의 위치를 찾아야 한다. 따라서 정렬된 영역에서의 검색을 이진 검색 방법을 사용하여 검색하면 정렬된 영역의 검색 시간을 줄일 수 있다.

단순 삽입 정렬은 배열 원소 수가 많아지면 원소 삽입에 필요한 비교, 교환 비용이 커진다. 그러나 이진 검색법을 사용하여 삽 정렬을 하면 이미 정렬을 마친 배열을 제외하고 원소를 삽입해야 할 위치를 검사하므로 비용을 줄일 수 있다.

In [24]:
# 이진 삽입 정렬 알고리즘 - 내가 짠 코드

def binary_insertion_sort(a):
    n = len(a)
    for i in range(1, n):
        j = i # 0 ~ i - 1까지는 sorted 영역
        tmp = a[i] # unsorted 영역의 첫 번째 원소
        
        pl = 0
        pr = i - 1
        while True:
            pc = (pl + pr) // 2
            if a[pc] < tmp:
                pl = pc + 1
            elif a[pc] > tmp:
                pr = pc - 1
            elif a[pc] == tmp:
                break
            if pr < pl:
                break
                
        pd = pc + 1 if pl <= pr else pr + 1
        
        for j in range(i, pd, -1):
            a[j] = a[j - 1]
        a[pd] = tmp
        
arr = [6, 4, 3, 7, 1, 9, 8]
binary_insertion_sort(arr)
print(arr)

[1, 3, 4, 6, 7, 8, 9]


In [8]:
# 이진 삽입 정렬 알고리즘 구현하기

def binary_insertion_sort(a):
    n = len(a)
    for i in range(1, n):
        key = a[i]
        pl = 0
        pr = i - 1
    
        while True:
            pc = (pl + pr) // 2
            if a[pc] == key:
                break
            elif a[pc] < key:
                pl = pc + 1
            else:
                pr = pc - 1
            if pl > pr:
                break
        pd = pc + 1 if pl <= pr else pr + 1
    
        for j in range(i, pd, -1):
            a[j] = a[j - 1]
        a[pd] = key

arr = [6, 4, 3, 7, 1, 9, 8]
binary_insertion_sort(arr)

print(arr)

[1, 3, 4, 6, 7, 8, 9]


### 파이썬 단순 삽입 정렬 라이브러리 : bisect 모듈의 insort()

```python
import bisect

bisect.insort(a, x, low, high)
```

```bisect()``` 함수를 호출하면 ```a```가 이미 정렬된 상태를 유지하면서 ```a[low] ~ a[high]``` 사이에 x를 삽입한다. 만약 a안에 x와 같은 값을 갖는 원소가 여러개 존재하면 가장 오른쪽에 삽입한다.

In [26]:
import bisect

def binary_insertion_sort(a):
    for i in range(1, len(a)):
        bisect.insort(a, a.pop(i), 0, i)

arr = [6, 4, 3, 7, 1, 9, 8]
binary_insertion_sort(arr)

print(arr)

[1, 3, 4, 6, 7, 8, 9]
