# 낙서장

### 거품 정렬이란?
Bubble Sort란? 뒤에서 앞으로 제일 큰 값을 순차적으로 위치시키며 탐색 범위를 하나씩 줄여 나가며 전체를 정렬시키는 구조를 가진 정렬을 말한다.

### 특징
1. 정렬의 범위가 하나씩 줄어든다.
2. 선택 정렬과 정렬 방향이 반대이다.
3. 필요 없는 과정이 있어 최적화가 필요하다.

### 복잡도
1. 추가 공간을 사용하지 않기 때문에 공간 복잡도는 0(1)이다.
2. 모든 인덱스에 접근하기 때문에 0(N)시간을 소모하며, 비교 및 자리교대를 위해 O(N)을 필요로 한다.
3. 결과적으로 0(N^2)의 시간 복잡도를 가진다.

In [4]:
# 일반
import random

def bubble_sort(array):
    length = len(array)-1

    for i in range(length, 0, -1):
        for j in range(1, i+1):
            if array[j-1] > array[j]:
                array[j-1], array[j] = array[j], array[j-1]
    return array

bubble = random.sample(range(0,10),10)
print(bubble_sort(bubble))


[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 최적화
이전 loop에서 앞 뒤 자리 변경이 한 번도 일어나지 않았다면 정렬되는 값이 하나도 없기 때문에 이후 정렬을 수행하지 않아도 된다.

In [5]:
import random

def bubble_sort(array):
    length = len(array)-1

    for i in range(length):
        switch = False
        for j in range(length-i):
            if array[j] > array[j+1]:
                array[j], array[j+1] = array[j+1], array[j]
                switch = True
        if not switch:
            break
    return array

bubble = random.sample(range(0,10),10)
print(bubble_sort(bubble))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 선택 정렬이란?
선택 정렬은 거품 정렬과 매우 유사하다. 순서가 정해지며 원소를 넣을 위치도 정해진다. 그 정해진 위치에 어떤 원소를 넣을지 탐색하며 정렬하는 것이 선택 정렬이다.

거품 정렬은 앞에서 서로 인접한 두 개의 요소를 비교하여 가장 큰 값부터 뒤로 보냈다면 선택 정렬은 앞에서 부터 작은 값을 순차적으로 나열하는 방식의 알고리즘이다.

### 특징
1. 정렬할 값을 배열의 맨 앞부터 하나씩 채워나가기 때문에, 탐색 범위가 하나씩 줄어드는 구조를 가지고 있다.
2. 시간복잡도가 비 효율적이다.

### 복잡도
1. 선택 정렬은 별도의 추가 공간을 사용하지 않고 주어진 배열이 차지하고 있는 공간 내에서 값들의 위치만 바꾸기 때문에 O(1)의 공간 복잡도를 가진다.
2. 모든 인덱스에 접근하기 때문에 O(N)의 시간을 소모하며, 다른 인덱스와 비교하며 자리를 변경하기 때문에 O(N)의 시간을 필요로 한다.
3. 결과적으로 버블정렬과 마찬가지로 O(N^2)의 시간복잡도를 가지며 비 효율적이다.

In [14]:
import random

def selection_sort(array):
    length = len(array)-1

    for i in range(length):
        min_idx = i
        for j in range(i+1, length):
            if array[min_idx] > array[j]:
                min_idx = j
        array[min_idx], array[i] = array[i], array[min_idx]
    return array

selection = random.sample(range(0, 10), 10)
print(selection)
print(selection_sort(selection))

[1, 6, 5, 0, 2, 9, 3, 4, 7, 8]
[0, 1, 2, 3, 4, 5, 6, 7, 9, 8]


### 삽입 정렬이란?
선택, 버블 정렬과 더블어 O(N^2)의 시간복잡도를 가지지만 최선의 경우 O(N)의 시간 복잡도를 가질 수 있는 삽입 정렬을 알아보자

삽입 정렬은 정렬 범위를 1칸씩 확장해나가며 새롭게 정렬 범위에 들어온 값을 기존 값들과 비교하여 알맞은 자리에 넣어주는 알고리즘이다.

### 특징
1. 선택, 거품 정렬은 반복될 수록 탐색 범위가 줄어드는 반면 삽입 정렬은 오히려 점위가 넓어진다.

### 복잡도
1. 삽입 정렬은 별도의 추가 공간을 사용하지 않고 주어진 배열이 차지하고 있는 공간 내에서 값들의 위치만 변경되기 때문에 O(1)의 공간 복잡도를 가진다.
2. 기본적으로 O(N)의 시간을 소모하며 새롭게 추가된 원소와 기존의 값들을 비교하여 자리를 변경하기 때문에 O(N)의 시간이 필요하여 총 O(N^2)의 시간복잡도를 가진다.
3. 최적화를 통해 O(N)까지도 시간 복잡도를 향상시킬 수 있다.

In [24]:
import random

def insertion_sort(array):
    for end in range(len(array)):
        for i in range(end, 0, -1):
            if array[i-1] > array[i]:
                array[i-1], array[i] = array[i], array[i-1]

    return array

insertion = random.sample(range(0, 10), 10)
print(insertion)
print(insertion_sort(insertion))

[6, 2, 7, 3, 8, 1, 5, 0, 9, 4]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [27]:
import random

def insertion_sort(array):

    for end in range(len(array)):
        i = end
        while i > 0 and array[i-1] > array[i]:
            array[i-1], array[i] = array[i], array[i-1]
            i -= 1

    return array

insertion = random.sample(range(0, 10), 10)
print(insertion)
print(insertion_sort(insertion))

[8, 5, 1, 6, 4, 2, 9, 0, 3, 7]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [29]:
import random

def insertion_sort(array):

    for end in range(len(array)):
        to_insert = array[end]
        i = end
        while i > 0 and array[i-1] > to_insert:
            array[i] = array[i-1]
            i -= 1
        array[i] = to_insert

    return array

insertion = random.sample(range(0, 10), 10)
print(insertion)
print(insertion_sort(insertion))

[5, 7, 0, 8, 3, 9, 6, 1, 4, 2]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 퀵 정렬이란?
알고리즘에서 가장 유용하며 유명한 퀵 정렬을 복습해 보겠다.

병합 정렬과 마찬가지로 퀵 정렬도 분할 정복기법과 재귀 알고리즘을 사용하여 정렬을 한다.

피벗(pivot)을 어떻게 정하냐에 따라 효율이 달라지기 때문에 불안정 정렬에 속한다.

### 특징
1. 파이썬의 list.sort()나 자바의 Arrays.sort()의 정렬 함수가 퀵정렬을 기본으로 한다.
2. 일반적으로 원소의 개수가 적어질 수록 나쁜 중간값이 선택될 확률이 높기 때문에 원소의 개수에 따라 퀵 정렬에 다른 정렬을 혼합해서 쓰는 경우가 많다.
3. 병합 정렬과 동일하게 분할 정복과 재귀 알고리즘을 사용한다.
4. 병합 정렬은 정 중앙을 기준으로 단순 분할 후 병합하는 연산이라면 퀵 정렬은 분할 시점부터 비교 연산이 많이 일어나기 때문에 병합에 들어가는 비용이 적다.

### 복잡도
1. 퀵 정렬은 pivot값을 어떻게 선택하느냐에 따라 크게 달라질 수 있다. 이상적인 경우에는 pivot 값을 기준으로 동일한 개수의 작은 값들과 큰 값들이 분할되어 병합 정렬과 마찬가지로 O(nlog(n))의 시간 복잡도를 가진다.
2. pivot값을 기준으로 분할 했을 때 값들이 한 편으로 크게 치우치게 되면 퀵 정렬은 성능은 저하되게 되며, 최악의 경우 한 편으로만 모든 값이 몰리게 되어 O(n^2)의 시간 복잡도를 보인다.

In [34]:
import random

def quick_sort(array):
    length = len(array)

    if length < 2:
        return array
    
    pivot = array[length// 2]
    less_array, equal_array, larger_array = [], [], []

    for num in array:
        if num > pivot:
            larger_array.append(num)
        elif num < pivot:
            less_array.append(num)
        else:
            equal_array.append(num)

    return quick_sort(less_array) + equal_array + quick_sort(larger_array)

quick = random.sample(range(0, 10), 10)
print(quick)
print(quick_sort(quick))

[4, 7, 3, 2, 1, 8, 9, 0, 5, 6]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 최적화
위의 코드는 재귀 호출될 때마다 새로운 리스트를 생성하여 리턴하기 때문에 메모리 사용 측면에서 비효율적이다.

큰 사이즈의 입력 데이터를 다뤄야하는 상용 코드에서는 이러한 단점은 치명적으로 작용할 수 있다. 그렇기 때문에 추가 메모리 사용이 적은 in-place정렬을 선호한다.

In [1]:
import random

def quick_sort(array):
    def sort(low, high):
        if high <= low:
            return
        
        mid = partition(low, high)
        sort(low, mid-1)
        sort(mid, high)

    def partition(low, high):
        pivot = array[(low+high) // 2]
        while low <= high:
            while array[low] < pivot:
                low += 1
            while array[high] > pivot:
                high -= 1
            
            if low <= high:
                array[low], array[high] = array[high], array[low]
                low, high = low + 1, high -1
        return low

    return sort(0, len(array)-1)

quick = random.sample(range(0, 10), 10)
quick_sort(quick)
print(quick)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 병합 정렬
합병 정렬이라고도 하며, 퀵 정렬과 동일하게 분할 정복과 재귀 알고리즘을 사용하여 정렬을 한다.

퀵 정렬과 마찬가지로 빠른 정렬로 분류되며 많이 사용되고 언급되는 정렬 방식이다. pivot을 어떻게 정하느냐에 따라 효율이 달라지는 불안정 정렬인 퀵 정렬과는 반대로 안정 정렬에 속한다.

In [7]:
import random

def merge_sort(array):
    length = len(array)

    if length < 2:
        return array
    
    mid = length // 2
    low_array = merge_sort(array[:mid])
    high_array = merge_sort(array[mid:])

    merged_array = []

    l, h = 0, 0
    while l < len(low_array) and h < len(high_array):
        if low_array[l] < high_array[h]:
            merged_array.append(low_array[l])
            l += 1
        else:
            merged_array.append(high_array[h])
            h += 1
    merged_array += low_array[l:]
    merged_array += high_array[h:]
    return merged_array

merge = random.sample(range(0, 10), 10)
print(merge)
print(merge_sort(merge))

[9, 5, 4, 7, 6, 2, 8, 1, 3, 0]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 최적화
병합 결과를 담을 새로운 배열을 매번 생성해서 리턴하지 않고, 인덱스 접근을 이용해 입력 배열을 계속해서 업데이트하면 메모리 사용량을 대폭 줄일 수 있다.

In [8]:
import random
def merge_sort(array):
    def sort(low, high):
        if high - low < 2:
            return
        
        mid = (low + high) // 2
        sort(low, mid-1)
        sort(mid, high)
        merge(low, mid, high)
        
    def merge(low, mid, high):
        temp = []
        l, h = low, mid

        while l < mid and h < high:
            if array[l] < array[h]:
                temp.append(array[l])
                l += 1
            else:
                temp.append(array[h])
                h += 1

        while l < mid:
            temp.append(array[l])
            l += 1
        while h < high:
            temp.append(array[h])
            h += 1
        
        for i in range(low, high):
            array[i] = temp[i - low]

    return sort(0, len(array))

merge = random.sample(range(0, 10), 10)
print(merge)
merge_sort(merge)
print(merge)

[3, 7, 9, 5, 2, 0, 1, 4, 8, 6]
[0, 1, 3, 4, 5, 6, 7, 8, 9, 2]
