### 거품정렬이란?
배열의 제일 뒤에서 역순으로 앞으로 이동하며 큰 수부터 작은 수로 정렬하는 알고리즘을 거품정렬 알고리즘이라 한다.

배열 내의 인접한 값들을 서로 비교하며 비교하여 큰 값을 뒤로 보내는 작업을 수행하고, 제일 큰 값을 뒤로 정렬하고 나면 탐색하는 범위가 하나 줄어들고 그 다음으로 큰 값을 제일 뒤에서 하나 앞으로 옮기는 작업을 연이어 수행해준다. 

### 특징
1. 큰 값을 뒤에서 앞으로 쌓아가며 정렬하기 때문에 정렬 범위가 하나씩 줄어든다.
2. 제일 작은 값을 앞에서 정렬하는 선택정렬과는 정렬 방향이 반대방향이다.
3. 선택정렬과 비교하여 자리 변경이 더 많이 일어나며 필요없는 과정이 반복되기 때문에 최적화가 필요하다.


In [15]:
import random

# bubble sort
def bubble_sort(array):
    length = len(array)-1

    for i in range(length, 0, -1):
        # 자기 자신과 비교할 필요가 없기 때문에 0부터 시작
        for j in range(1, i+1):
            if array[j-1] > array[j]:
                array[j-1], array[j] = array[j], array[j-1]

    return array

bubble = random.sample(range(0, 10), 10)
print(bubble)
print(bubble_sort(bubble))

[1, 5, 6, 9, 2, 8, 3, 4, 0, 7]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 복잡도
1. 배열 안에서 값들의 위치를 변경하기 때문에 공간 복잡도는 O(1)을 가진다.
2. 맨 앞에서 모든 인덱스에 접근하기 때문에 O(N)의 시간을 소모하며, 또 다른 루프에서 서로의 값들을 비교하기 때문에 O(N)의 시간이 더 보소되어 총 O(N^2)의 시간 복잡도를 가진다.
3. 이미 완료된 배열인 경우에는 O(N)의 시간 복잡도를 가진다.

### 최적화
이전 loop에서 앞뒤 자리 변경이 한 번도 일어나지 않았다면 정렬되지 않은 값이 하나도 없었다고 할 수 있다. 따라서 이러한 경우 loop를 수행하지 않아도 된다.

```text
origin: [1, 2, 3, 5, 4]
-----------------------
    loop 1: [1, 2, 3, 4, 5] 변경 있음
    loop 2: [1, 2, 3, 4, 5] 변경 없음
-----------------------
탐색을 멈춰도 무관
```


In [19]:
import random

# bubble sort 최적화
def bubble_sort(array):
    length = len(array)-1

    for i in range(length, 0, -1):
        switch = False

        for j in range(1, i+1):
            if array[j-1] > array[j]:
                array[j-1], array[j] = array[j], array[j-1]
                switch = True
        
        # 만약 이전까지 loop를 돌며 한 번이라도 변경이 이뤄지지 않았다면 
        # 더 이상 반복분을 돌 필요가 없음
        if not switch:
            break

    return array

bubble = random.sample(range(0, 10), 10)
print(bubble)

print(bubble_sort(bubble))



[4, 7, 9, 5, 2, 6, 1, 0, 8, 3]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 선택 정렬이란?
정렬 알고리즘에서 가장 직관적이고 쉽게 구현이 가능한 정렬이다.

거품 정렬과 많이 유사하며 정해진 위치에 탐색하며 얻을 조건에 만족하는 값을 해당 위치로 옮기며 앞에서부터 뒤로 순차적으로 정렬하는 알고리즘이다.

거품 정렬과 동일하게 인접한 2개의 값을 비교하여 정해진 위치에 옮겨질 가장 작은 값을 찾고 1 loop에서 탐색이 완료 되었다면 1 loop 마지막에 해당 위치에 정해진 작은 값은 옮긴다.

거품 정렬은 뒤에서 하나씩 탐색 범위가 줄었다면 선택 정렬은 앞에서 부터 탐색 범위가 순차적으로 줄어든다.

### 특징
1. 선택 정렬은 정렬된 값을 배열의 맨 앞 부터 하나씩 채워나가게 된다. 따라서 뒤에 있는 Index로 갈수록 비교 범위가 하나씩 줄어든다.
2. 입력 배열이 정렬이 되어 있건 말건 이미 동일한 연산량을 가지고 있기 떄문에 시간복잡도는(O(N^2))를 가진다.


### 복잡도
1. 별도의 추가 공간을 사용하지 않기 때문에 O(1)의 공간 복잡도를 가진다.
2. loop문을 통해 모든 인덱스에 접근해야하기 때문에 O(N)의 시간을 소요하며 거품정렬과 마찬가지로 다른 인덱스와 비교해야하기 때문에 O(N)의 시간이 더 소모되어 최종적으로 선택 정렬은 O(N^2)의 시간 복잡도를 가진다.

In [26]:
import random

# 선택 정렬
def select_sort(array):
    length = len(array)-1

    for i in range(length):
        min_idx = i
        for j in range(i+1, length+1):
            if array[min_idx] > array[j]:
                min_idx = j
        array[min_idx], array[i] = array[i], array[min_idx]

    return array

select = random.sample(range(0, 10), 10)
print(select)

print(select_sort(select))

[1, 0, 7, 3, 8, 6, 9, 4, 2, 5]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 삽입정렬이란?
선택, 거품 정렬과 동일한 시간복잡도 O(N^2)를 가지고 있다.

최선의 경우에는 O(N)이라는 효율성을 가지기 때문에 선택, 거품정렬보다 더 효율적인 알고리즘이다.

다른 정렬 알고리즘의 일부분으로 사용되기 때문에 좋은 정렬 알고리즘이다.

### 특징
1. 선택, 거품 정렬은 Loop가 진행될 수록 탐색 범위가 줄어드는 반면 삽입 정렬을 오히려 넓어 진다.

## 복잡도
1. 별도의 추가 공간을 사용하지 않기 때문에 O(1)의 공간 복잡도를 가진다.
2. 전체를 loop개수인 O(N)시간복잡도를 가지며, 새롭게 추가된 값과 기존 값을 비교해야하기 때문에 다시 O(N)이 추가 되어 총 O(N^2)의 시간 복잡도를 가진다.
3. 최적화를 진행할 경우 O(N)까지도 향상이 가능하다.

In [36]:
import random

# 삽입정렬
def insertion_sort(array):
    length = len(array)

    for end in range(length):
        for i in range(end, 0, -1):
            if array[i] < array[i-1]:
                array[i-1], array[i] = array[i], array[i-1]

    return array

insertion = random.sample(range(0, 10), 10)
print(insertion)

print(insertion_sort(insertion))


[6, 2, 5, 3, 0, 7, 9, 8, 1, 4]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 최적화
기존에 있던 값들은 이전 loop에서 이미 모두 정렬 되었다는 것을 감안하면 이후의 작업은 더 이상 진행할 필요가 없기 때문에 이를 활용하여 최적화가 가능하다.

In [42]:
import random

# insertion sort 최적화
def insertion_sort(array):
    length = len(array)

    for end in range(1, length):
        i = end
        while i > 0 and array[i-1] > array[i]:
            array[i-1], array[i] = array[i], array[i-1]
            i -= 1
    return array

insertion = random.sample(range(0, 10), 10)
print(insertion)

print(insertion_sort(insertion))

[5, 9, 6, 7, 0, 8, 1, 2, 3, 4]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 최적화2
switch작업 없이 단순히 값들을 옮기는 것만으로 삽입 정렬을 구현할 수 있다. 앞의 값 정렬 범위에 추가시킨 값보다 큰 경우 값을 뒤로 밀다가 최초로 작은 값을 만나는 순간 그 뒤에 추가된 값을 꼽으면 된다.

In [43]:
import random

def insertion_sort(array):
    length = len(array)

    for end in range(length):
        to_insert = array[end]
        i = end
        while i > 0 and array[i-1] > to_insert:
            array[i] = array[i-1]
            i -= 1
        array[i] = to_insert

    return array

insertion = random.sample(range(0, 10), 10)
print(insertion)

print(insertion_sort(insertion))

[7, 8, 6, 0, 9, 5, 1, 3, 2, 4]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 퀵 정렬이란?
가장 유명한 알고리즘인 퀵정렬에 대해 복습하려고 한다.

분할 정복기법과 재기 알고리즘을 통해 배열을 정렬하는 알고리즘이다.

다른 원소와의 비교만으로 정렬을 수행하는 비교 정렬에 속하며, 피벗을 어떤식으로 잡느냐에 따라 효율이 달라지기 때문에 불안정 정렬에 속한다.

### 특징
1. 파이썬의 list.sort()함수나 자바의 Arrays.sort()처럼 기본적으로 제공되는 내장 정렬 함수는 대부분 퀵 정렬을 기본으로 한다.

### 복잡도
1. pivot 값을 기준으로 동일한 개수의 작은 값들과 큰 값들이 분할되어 나눠지면 O(nlog(n))의 시간 복잡도를 가진다.
2. pivot 값을 기준으로 분할했을 때 값들이 한 편으로 크게 치우치게 되면, 퀵 정렬은 성능은 저하되게 되며, 최악의 경우 한 편으로만 모든 값이 몰리게 되어 O(n^2)시간복잡도를 보이게 된다.

In [51]:
import random

def quick_sort(array):
    if len(array) <= 1:
        return array
    pivot = array[len(array) // 2]
    low_array, equal_array, high_array = [], [], []

    for num in array:
        if num > pivot:
            high_array.append(num)
        elif num < pivot:
            low_array.append(num)
        else:
            equal_array.append(num)

    return quick_sort(low_array) +equal_array + quick_sort(high_array)

quick = random.sample(range(0, 10), 10)
print(quick)

print(quick_sort(quick))

[3, 8, 0, 5, 7, 6, 4, 9, 1, 2]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 최적화
매번 재귀가 호출될 때마다 새로운 리스트를 생성하여 리턴하기 때문에 메모리 사용 측면에서 비효율적이다. 큰 사이즈의 입력 데이터를 다뤄야하는 상용코드에서는 치명적인 단점이기 때문에 in-place정렬을 선호한다.

In [57]:
import random

def quick_sort(array):
    def sort(low, high):
        if low >= high:
            return 

        mid = partition(low, high)
        sort(low, mid-1)
        sort(mid, high)

    def partition(low, high):
        pivot = array[(low+high) // 2]
        while low <= high:
            while array[low] < pivot:
                low += 1
            while array[high] > pivot:
                high -= 1
            if low <= high:
                array[low], array[high] = array[high], array[low]
                low, high = low +1, high -1
        return low
    
    return sort(0, len(array)-1)


quick = random.sample(range(0, 10), 10)
print(quick)
quick_sort(quick)
print(quick)

[2, 6, 7, 0, 8, 5, 9, 4, 1, 3]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 병합정렬이란?
퀵정렬과 동일하게 분할정복과 재귀 알고리즘으로 구현되는 알고리즘이다.

퀴정렬과 마찬가지로 빠른 정렬로 분류 되어 많이 사용되고 pivot 값을 잘못 선정하면 효율이 떨어지는 불안정한 퀵정렬과 달리 병합정렬은 안정 정렬에 속한다.

### 특징
1. 분할 단계와 병합 단계로 나눌 수 있으며, 단순히 중간 인덱스를 찾아야하는 분할 비용보다 모든 값들을 비교해야하는 병합 비용이 더 크다.
2. 8->4->2->1식으로 반복의 수가 절반으로 줄기 때문에 O(logN)시간이 필요하여, 각 패스에서 병합할때 모든 값들을 비교해야하므로 O(N)시간이 소모된다. 따라서 총 시간 복잡도는 O(NlogN)이다.
3. 두 개의 배열을 병합 할 때 병합 결과를 담아 놓을 배열이 추가로 필요하다. 따라서 공간복잡도는 O(N)이다.

In [61]:
import random

def merge_sort(array):
    if len(array) < 2:
        return array
    
    mid = len(array) // 2
    low_array = merge_sort(array[:mid])
    high_array = merge_sort(array[mid:])

    merge_array = []

    l = h = 0
    while l < len(low_array) and h < len(high_array):
        if low_array[l] < high_array[h]:
            merge_array.append(low_array[l])
            l += 1
        else:
            merge_array.append(high_array[h])
            h += 1
    merge_array += low_array[l:]
    merge_array += high_array[h:]

    return merge_array

merge = random.sample(range(0, 10), 10)
print(merge)

print(merge_sort(merge))


[4, 9, 6, 7, 5, 2, 3, 8, 0, 1]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [64]:
import random

def merge_sort(array):
    if len(array) < 2:
        return array
    merge_array = []

    mid = len(array) // 2
    low_array = merge_sort(array[:mid])
    high_array = merge_sort(array[mid:])

    l = h = 0
    while l < len(low_array) and h < len(high_array):
        if low_array[l] < high_array[h]:
            merge_array.append(low_array[l])
            l += 1
        else:
            merge_array.append(high_array[h])
            h += 1

    merge_array += low_array[l:]
    merge_array += high_array[h:]
    return merge_array

merge = random.sample(range(0, 10), 10)
print(merge)

print(merge_sort(merge))

[2, 6, 1, 4, 5, 7, 0, 9, 8, 3]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [72]:
import random

def merge_sort(array):
    def sort(low, high):
        if high - low < 2:
            return
        
        mid = (low+high) // 2
        sort(low, mid)
        sort(mid, high)
        merge(low, mid, high)

    def merge(low, mid, high):
        temp = []
        l, h = low, mid

        while l < mid and h < high:
            if array[l] < array[h]:
                temp.append(array[l])
                l += 1
            else:
                temp.append(array[h])
                h += 1
        
        while l < mid:
            temp.append(array[l])
            l += 1
        while h < high:
            temp.append(array[h])
            h += 1

        for i in range(low, high):
            array[i] = temp[i - low]
    return sort(0, len(array)-1)



merge = random.sample(range(0, 10), 10)
print(merge)
merge_sort(merge)

print(merge)

[0, 9, 8, 6, 2, 4, 3, 7, 5, 1]
[0, 2, 3, 4, 5, 6, 7, 8, 9, 1]
