# 01_정렬
2020.04.09 ~ 2020.04.10  
그동안 배웠던 정렬 알고리즘들 정리

## 1. 버블정렬

<img src="https://img1.daumcdn.net/thumb/R800x0/?scode=mtistory2&fname=https%3A%2F%2Ft1.daumcdn.net%2Fcfile%2Ftistory%2F275F9A4A545095BD01"/>

### flow
1. 배열을 순회하며 어떤 요소가 바로 뒤의 요소보다 큰지 작은지 따짐
2. 배열의 처음부터 시작해서 뒤의 요소와 비교
3. 크면 지금 순회하고 있는 요소와 바로 뒤의 요소의 위치를 바꿈
4. 작거나 같으면 냅두고 다음 요소와 그 바로 뒤의 요소를 비교 
5. 이러면 자연스럽게 큰 원소가 뒤로 가게 된다는 아이디어
5. 배열 원소가 n개일 때 n-1번의 비교를 수행하면 오름차순으로 정렬된 배열이 나옴

### feature
- 수행시간 : `O(n^2)` : n-1 번의 비교에서(n-1) * 배열의 첫 요소부터 정렬이 완료되지 않은 요소까지 비교(약 n)
- 정렬이 이미 된 원소들의 경우 검토할 필요가 없음
- 순서 바꾸기가 배열을 순회하면서 한번도 실행되지 않았을 경우에는 이미 정렬된 상태의 배열임(굳이 다음 비교를 수행할 필요가 없음)

### code

In [1]:
def bubble_sort(arr):
    # 기억 1. n-1번의 비교
    for idx in range(len(arr)-1):
        swap = False
        
        # 기억 2. 이미 정렬된 맨 뒤의 배열은 비교 안해도됨(len(arr)-비교횟수-1)
        for idx2 in range(len(arr)-idx-1):
            if arr[idx2] > arr[idx2+1]:
                arr[idx2], arr[idx2+1] = arr[idx2+1], arr[idx2]
                swap = True
                
        # 기억 3. 이미 정렬된 배열이라고 판단이 났다면 비교 자체를 그냥 끝내도 됨
        if not swap:
            break
        print(arr)
    return arr

In [2]:
test_arr = [10,2,5,3,1,6,4,8,7]

# 과정까지
print(bubble_sort(test_arr))

[2, 5, 3, 1, 6, 4, 8, 7, 10]
[2, 3, 1, 5, 4, 6, 7, 8, 10]
[2, 1, 3, 4, 5, 6, 7, 8, 10]
[1, 2, 3, 4, 5, 6, 7, 8, 10]
[1, 2, 3, 4, 5, 6, 7, 8, 10]


## 2. 선택정렬
<img src="https://img1.daumcdn.net/thumb/R800x0/?scode=mtistory2&fname=https%3A%2F%2Ft1.daumcdn.net%2Fcfile%2Ftistory%2F256B9C34545081D835"/>

### flow
1. 배열의 순회를 시작하면서 맨 앞값부터 `stand(기준값)`으로 설정
2. `stand`를 제외한 배열의 나머지 요소들중 가장 작은 값을 찾음
3. 찾은 가장 작은 값을 `stand`의 위치와 바꿔줌 
4. 배열의 마지막 요소를 제외하고 모든 값이 한번씩 `stand`가 되었다면 끝남

### feature
- 수행시간 : `O(n^2)` : stand값을 계속 순회(n-1) * 남은 배열 모두 순회하며 최소값 찾기(약 n)
- 배열 요소 n개 중 n-1번 stand순회 발생
- 값을 비교하여 뒤로 보냈던 버블정렬과는 반대로, 뒤의 값 중 값을 골라서 앞에 위치시킴 
- 최소값을 "선택"해서 정렬

### code

In [3]:
def selection_sort(arr):
    # 기억 1. stand는 배열 요소의 n-1번째까지
    for stand in range(len(arr)-1):
        lowest = stand
        # 기억 2. 순회하며 최소값을 찾아내고
        for idx in range(stand+1, len(arr)):
            if arr[idx] < arr[lowest]:
                lowest = idx
        # 기억 3. 순회가 끝나고 swap
        arr[lowest], arr[stand] = arr[stand], arr[lowest]
        print(arr)
    return arr

In [4]:
test_arr = [10,2,5,3,1,6,4,8,7]

print(selection_sort(test_arr))

[1, 2, 5, 3, 10, 6, 4, 8, 7]
[1, 2, 5, 3, 10, 6, 4, 8, 7]
[1, 2, 3, 5, 10, 6, 4, 8, 7]
[1, 2, 3, 4, 10, 6, 5, 8, 7]
[1, 2, 3, 4, 5, 6, 10, 8, 7]
[1, 2, 3, 4, 5, 6, 10, 8, 7]
[1, 2, 3, 4, 5, 6, 7, 8, 10]
[1, 2, 3, 4, 5, 6, 7, 8, 10]
[1, 2, 3, 4, 5, 6, 7, 8, 10]


## 3. 삽입정렬
<img src="https://img1.daumcdn.net/thumb/R800x0/?scode=mtistory2&fname=https%3A%2F%2Ft1.daumcdn.net%2Fcfile%2Ftistory%2F2569FD3854508BE811"/>

### flow
1. 배열의 앞에서부터 시작되는 정렬 영역을 배열을 순회하며 더 커지게 하는 알고리즘임
2. 처음에 배열을 순회하며 두번째 요소가 첫번째 요소보다 큰지 작은지 검사 => 작으면 앞으로 이동함(정렬된 가장 작은 배열)
3. 그 다음 요소로 넘어가서 바로 앞부터 시작되는 정렬된 요소와 비교를 시작 => 정렬된 부분 중 자신보다 작은 값을 만날때까지 반복
4. 정렬부분 뒤의 요소들이 앞으로 넘어오면서 자기 자리를 찾아가는 아이디어

### feature
- 수행시간 : `O(n^2)` : 값을 계속 순회(n-1) * 정렬된 부분 바로 뒤의 원소를 앞의 정렬 부분과 계속 비교(약 n)

### code

In [5]:
def insertion_sort(arr):
    for idx in range(len(arr)-1):
        # 기억1. 정렬영역보다 1큰 요소부터 정렬영역의 맨 앞까지 하나씩 감소하며 비교하는데
        for idx2 in range(idx+1, 0 ,-1):
            # 기억2. 정렬영역에 있는 요소중에 더 큰 요소를 만나면 스왑함
            if arr[idx2] < arr[idx2-1]:
                arr[idx2], arr[idx2-1] = arr[idx2-1], arr[idx2]
            # 기억3. 정렬영역에 있는 요소 중에 더 작은 요소를 만나면 비교를 멈춤
            else:
                break
        print(arr)
    return arr  

In [6]:
test_arr = [10,2,5,3,1,6,4,8,7]

print(insertion_sort(test_arr))

[2, 10, 5, 3, 1, 6, 4, 8, 7]
[2, 5, 10, 3, 1, 6, 4, 8, 7]
[2, 3, 5, 10, 1, 6, 4, 8, 7]
[1, 2, 3, 5, 10, 6, 4, 8, 7]
[1, 2, 3, 5, 6, 10, 4, 8, 7]
[1, 2, 3, 4, 5, 6, 10, 8, 7]
[1, 2, 3, 4, 5, 6, 8, 10, 7]
[1, 2, 3, 4, 5, 6, 7, 8, 10]
[1, 2, 3, 4, 5, 6, 7, 8, 10]


## 4. 퀵정렬
<img src="https://img1.daumcdn.net/thumb/R800x0/?scode=mtistory2&fname=https%3A%2F%2Ft1.daumcdn.net%2Fcfile%2Ftistory%2F271D2B3354545F7A13" width="600" height="700" />

### flow
1. 배열 요소 중에 기준점을 하나 정한다. 보통 맨 앞이나 뒤를 기준점으로 잡는다.
2. 기준점을 하나 정했으면 기준점보다 작은 데이터는 기준점의 왼쪽으로, 큰 데이터는 오른쪽으로 보내서 배열을 재배열
3. 나눠진 왼쪽 부분과 오른쪽 부분에 대해 다시 재귀적으로 기준점을 하나 정해서 왼쪽과 오른쪽을 나눈다
4. 정렬될때까지 반복한다. 그렇게 쪼개고 쪼개다가 쪼갤 배열의 요소가 하나만 남았을 때 호출을 멈춘다

### feature
- 분할 정복으로 풀린다고 할 수 있다 => 뭐 재귀가 분할정복인거지만
- 수행시간 `O(nlogn)` :  재귀 단계가 logn개(배열 요소가 n개일때), 비교는 n-1번 이루어지므로 n-1 * logn = O(nlogn)

### code

In [7]:
def quick_sort(arr):
    # 기억 1. 피벗 지정하고 쪼갤 원소가 하나밖에 안남았을 때 왼쪽 오른쪽 못나눔 => 종료
    # 두개만 남아도 수행할 수 있음 
    if len(arr) <= 1:
        return arr
    
    pivot = arr[0]
    left = [elem for elem in arr[1:] if pivot>elem]
    right = [elem for elem in arr[1:] if pivot<=elem]
    # 기억 2. 분할정복, 재귀함수를 사용한다
    return quick_sort(left) + [pivot] + quick_sort(right)

In [8]:
test_arr = [10,2,5,3,1,6,4,8,7]

print(quick_sort(test_arr))

[1, 2, 3, 4, 5, 6, 7, 8, 10]


## 5. 병합정렬
<img src="https://www.geeksforgeeks.org/wp-content/uploads/Merge-Sort-Tutorial.png"/>

### flow
1. 배열을 계속 절반씩 나눈다(하나의 배열을 두개로) 절반을 나눈 배열들을 또 절반을 나눈다 재귀적으로 더이상 나눌수 없을 때까지
2. 더이상 나눌 수 없는 상태까지 나눈 배열의 요소들은 하나씩일텐데, 그 상태에서 다시 병합을 시도한다
3. 두개의 배열을 차차 하나로 합치는데, 이때 정렬된 상태로 배열을 합친다
4. 다시 원 배열이 될때까지 배열을 합치면 그 배열은 정렬된 상태로 리턴된다

### feature
- 이것도 분할 정복으로 풀린다고 할 수 있다 => 하나일때까지 나누고 합치면서 다시 정렬 => 정렬에 관해서는 작은 배열들을 상향식으로 정렬하고 있어서
- 다시 배열을 합칠 때 두개의 배열을 놓고 두개 배열의 원소들을 순회하면서 조건부로 합치는 배열에 넣어준다
- 병합을 진행하는 배열들은 모두 정렬되어있다. 심지어 1개짜리도 원소가 1개니까 그 자체로 정렬되있는거임
- 수행시간 `O(nlogn)` :  배열을 하나짜리 배열로 나누고 합치는데까지 logn번(배열 요소가 1개일때까지) + 그 단계에서 배열의 모든 원소를 훑으므로 n을 곱함

### code

In [9]:
# 함수 1) 나눠진걸 합치는 병합함수

def merge_sort_merge(left,right):
    merged = []
    
    # 기억3. 갈라진 배열을 다시 합칠때는 각 배열들의 원소를 순회하는데
    # 이때 조건에 맞게 그 배열들의 요소를 결과 배열에 합치면서 병합을 진행한다
    
    # 요 포인트라는 변수들은 지금 왼쪽 오른쪽 배열에서 몇개까지 정렬이 끝났는지 표시함
    # 배열의 길이가 포인트 변수보다 클 경우는 아직 정렬해야할 원소가 남았다는 것이고
    # 작을 경우는 이미 다 정렬했다는 것
    left_point, right_point = 0, 0
    
    # 조건1: 양쪽 배열 모두 남은 원소가 있을 때
    while (len(left) > left_point) and (len(right) > right_point):
        # 양쪽 배열 모두 살아있을 때는 정렬해야할 인덱스해서 큰 값을 결과 배열에 먼저 넣는다(그래야 정렬되기 때문)
        if left[left_point] > right[right_point]:
            merged.append(right[right_point])
            right_point +=1
        else:
            merged.append(left[left_point])
            left_point += 1
            
    # 기억4. 만약 한쪽 배열 원소가 다 소진되었다면, 남은 쪽의 원소들을 모두 합치면 된다
    # 왜냐면 합치는 배열들은 모두 "정렬되었다는" 가정을 바탕으로 존재하기 때문이다
    
    # 조건2 : 왼쪽만 남은 경우
    while len(left) > left_point:
        merged.append(left[left_point])
        left_point += 1
        
    # 조건 3 : 오른쪽만 남은 경우
    while len(right) > right_point:
        merged.append(right[right_point])
        right_point += 1
        
    return merged

In [10]:
# 함수 2) 원래 하나였던 배열을 나누는 분할함수

def merge_sort_split(arr):
    # 기억1. 배열의 원소가 하나가 남을때까지 분할한다
    if len(arr) <= 1:
        return arr
    medium = len(arr)//2
    left, right = merge_sort_split(arr[:medium]), merge_sort_split(arr[medium:])
    
    # 기억2. 배열의 원소가 하나가 남을때까지 분할이 된 후, 병합이 시작된다(split함수 호출 후 return문이 실행되므로)
    return merge_sort_merge(left,right)

In [11]:
test_arr = [10,2,5,3,1,6,4,8,7]

print(merge_sort_split(test_arr))

[1, 2, 3, 4, 5, 6, 7, 8, 10]


## 6. 계수 정렬
<img width="900" height="300" src="https://s3.ap-northeast-2.amazonaws.com/yaboong-blog-static-resources/algo/counting-sort-stable.png"/>
정렬할 배열에 들어갈 숫자의 범위가 정해진 경우(어떤 수를 넘지 않는 경우) 유용한 정렬 방법

### flow
1. 별건 없음. 정렬할 배열에 들어갈 수 있는 수의 범위를 인덱스로 몽땅 가지고 있는 큰 배열을 하나 선언(+0으로 몽땅 초기화)
2. 배열을 순회하면서 그 수와 동일한 인덱스에 해당하는 큰 배열의 값을 1 증가시켜줌 
3. 마지막엔 큰 배열을 순회하면서 1이상인 수들의 인덱스를 모아놓은 배열을 리턴하면 그게 정렬된 배열임

### features
- 수행시간 `O(n)` : 배열을 몇 번(두번)순회만 하면 정렬된 배열이 뙇 나오므로 n. 나름 정렬 알고리즘 중에는 빠른 편임. 
- 범위가 정해진 수의 정렬에는 무족권 써야함 젤빠름 ㄹㅇ

### code

In [12]:
# 정렬되지 않은 배열에 들어갈 수 있는 최대가 인자로 주어진다 가정하자

def counting_sort(max_val,arr):
    count = [0]*(max_val+1)
    for num in arr:
        count[num] += 1
    result = []
    for idx in range(max_val+1):
        if count[idx] > 0:
            result += [idx]*count[idx]
            
    return result

In [13]:
test_arr = [10,2,5,3,1,6,4,8,7]

print(counting_sort(10, test_arr))

[1, 2, 3, 4, 5, 6, 7, 8, 10]


## 참고)비교횟수의 하한

갓찬수갓고리즘 - 비교횟수하한 참고  
어떤 정렬에 대해 최소 몇번 이상의 비교는 해야 결과가 나오냐는 것 

- 정렬 가능한 방법은 정렬할 원소의 퍼뮤테이션
- 퍼뮤테이션을 만들기 위한 비교는 반드시 해야한다(결정트리의 리프에 도달하지 못한다)

### 정렬할 n개 값에 대한 결정트리
![결정트리](../_img/limit.jpg)

- 이 경우 결정트리의 리프노드는 n!
- 정답은 n!개의 경우 중에 하나
- 비교는 루트서부터 정답 리프까지 h번 비교(어떤 알고리즘도 입력에 대해서는 h번 비교해야함)
- h는 최소 얼마?
    - h의 하한은 적을수록 좋다. 가장 적게 만들려면
    - 힙에서 n개의 리프를 가진다면 h>=log(n+1)
    - 이경우에는 h>=log2n!
    - n! = n * n-1 * n-2 ... * 1
    - n/2까지 n/2를 곱해준다 => n! >= (n/2)^(n/2) nlogn개 이상의 비교가 필요
    - h >= log2n! >= log2(n/2)^(n/2) >= (n/2)log2(n/2)
    - **모든 정렬 알고리즘은 최소 O(nlogn)번의 비교가 필요**
    - **항상 O(nlogn)에 해결하는 머지소트와 힙소트는 최적 정렬 알고리즘!**
