## 버블 정렬

- 인접한 요소와 지속적으로 비교
- 반복문이 두 개 $O(n^2)$
  - 최악의 경우, $\frac { n * (n - 1)}{ 2 }$
- 완전 정렬이 되어 있는 상태라면 최선은 O(n)

In [3]:
import random

data_list = random.sample(range(100),50)

def bubble_sort(data):
    for index in range(len(data)-1):
        swap = False
        for index2 in range(len(data) - index -1):
            if data[index2] > data[index2 +1]:
                data[index2],data[index2 +1] = data[index2 +1], data[index2]
                swap = True
        if not swap:
            break


bubble_sort(data_list)
data_list

[1,
 2,
 3,
 5,
 8,
 9,
 10,
 12,
 13,
 14,
 15,
 16,
 19,
 20,
 22,
 24,
 25,
 27,
 32,
 33,
 36,
 37,
 40,
 43,
 44,
 45,
 46,
 47,
 48,
 51,
 53,
 57,
 58,
 63,
 64,
 65,
 68,
 70,
 73,
 75,
 76,
 77,
 78,
 83,
 86,
 89,
 90,
 97,
 98,
 99]

## 선택 정렬

- 방법
    1. 주어진 데이터 중, 최솟값을 찾음
    2. 해당 최소값을 데이터 맨 앞에 위치한 값과 교체
    3. 맨 앞의 위치를 뺀 나머지 데이터를 동일한 방법으로 반복
- 시간복잡도
    - 반복문이 두개임으로 $O(n^2)$
        - 상세히 계산하면 $\frac {n(n-1)}{2}$

In [4]:
data_list = random.sample(range(100),10)

def selection_sort(data):
    for stand in range(len(data)-1):
        lowest = stand
        for index in range(stand +1, len(data)):
            if data[lowest] > data[index]:
                lowest = index
        data[lowest], data[stand] = data[stand], data[lowest]
    return data

selection_sort(data_list)

[0, 4, 39, 44, 47, 52, 66, 74, 92, 97]

## 삽입 정렬

- 방법
    - 삽입 정렬은 두 번째 인덱스부터 시작
    - 해당 인덱스(key 값) 앞에 있는 데이터(B)부터 비교해서 key 값이 더 작으면, B값을 뒤 인덱스로 복사
    - 이를 key 값이 더 큰 데이터를 만날때까지 반복, 그리고 큰 데이터를 만난 위치 바로 뒤에 key 값을 이동

- 시간 복잡도
    - 반복문이 두개임으로 $O(n^2)$
        - 상세히 계산하면 $\frac {n(n-1)}{2}$
    - 최선의 경우 $O(n)$

In [None]:
def insertion_sort(data):
    for index in range(len(data) - 1):
        for index2 in range(index + 1, 0, -1):
            if data[index2] < data[index2 - 1]:
                data[index2], data[index2 - 1] = data[index2 - 1], data[index2]
            else:
                break
    return data

## 퀵정렬

- 기준점을 정해서 기준점보다 작은 데이터는 왼쪽, 큰데이터는 오른쪽으로 모으는 함수를 작성
- 각 왼쪽, 오른쪽은 재귀용법을 사용해서 다시 동일함수를 호출하여 위 작업을 반복함
- 함수는 왼쪽(left) + 기준점(pivot) + 오른쪽(right)를 리턴함
    - 첫번쨰 피벗은 첫번째 인덱스를 기준
- 시간복잡도는 $O(n \log n)$
- 최악의 경우 (맨 처음 pivot이 최대값이거나 최솟값인 경우) $O(n^2)$

In [9]:
def qsort(data):
    if len(data) <= 1:
        return data
    left,right = list(),list()
    pivot = data[0]
    for index in range(1,len(data)):
        if pivot > data[index]:
            left.append(data[index])
        else:
            right.append(data[index])
    return qsort(left) + [pivot] + qsort(right)
# list compreshion
def qsort_com(data):
    if len(data) <= 1:
        return data
    pivot = data[0]
    left = [item for item in data if pivot > item]
    right = [item for item in data if pivot < item]
    return qsort(left) + [pivot] + qsort(right)
qsort_com(random.sample(range(100),20))

[0, 7, 13, 17, 24, 27, 28, 30, 41, 51, 52, 58, 60, 63, 64, 80, 83, 86, 91, 96]

## 병합 정렬 (merge sort)

- 재귀용법을 활용한 정렬 알고리즘
    - 리스트를 절반으로 잘라 비슷한 크기의 두분 리스트로 나눔
    - 각 부분 리스트를 재귀적으로 합병 정렬을 이용해 정렬
    - 두 부분 리스트를 다시 하나의 정렬된 리스트로 합병

- 복잡도
    - 각 단계 별로 $O(n)$
    - 항상 $\log_2 n$개 만큼 만들어짐. 시간 복잡도는 결국 $O(\log n)$
    - 따라서 단계 별 시간 복잡도는 $O(n \log n)$

In [11]:
def split(data):
    medium = int(len(data) / 2)
    left = data[:medium]
    right = data[medium:]
    print(left,right)

def mergesplit(data):
    medium = int(len(data) /2)
    left = mergesplit(data[:medium])
    right = mergesplit(data[medium:])
    return merge(left,right)

def merge(left,right):
    merged = list()
    left_point,right_point = 0,0

    # left right 둘다 남아있을떄
    while len(left) > left_point and len(right) > right_point:
        if left[left_point] > right[right_point]:
            merged.append(right[right_point])
            right_point += 1
        else:
            merged.append(left[left_point])
            left_point += 1
    # left 만 남아있을때
    while len(left) > left_point:
        merged.append(left[left_point])
        left_point += 1
    # right 만 남아있을때
    while len(right) > right_point:
        merged.append(right[right_point])
        right_point += 1
    return merged
data_list= [0,1,2,3]
split(data_list)

[0, 1] [2, 3, 4]
