#Chapter09 정렬



*   제자리 정렬 : 정렬할 항목의 수에 비해 아주 작은 저장 공간을 더 사용하는 정렬 알고리즘
*   안정적 정렬 : 데이터 요소의 상대적인 순서를 보존



###9.1 2차 정렬

- **거품 정렬**

 인접한 두 항목을 비교하여 정렬하는 방식
 
 시간복잡도 : O(n²)

In [None]:
def bubble_sort(seq):
    length = len(seq) - 1
    for num in range(length, 0, -1):
        for i in range(num):
            if seq[i] > seq[i+1]:
                seq[i], seq[i+1] = seq[i+1], seq[i]  # 앞에 수가 더 크면 바로 뒤랑 바꿔줌
        print(seq)
    return seq

def test_bubble_sort():
    seq = [4,5,2,1,6,2,7,10,13,8]
    assert(bubble_sort(seq) == sorted(seq))
    print("테스트 통과!")
    
    
if __name__ == "__main__":
    test_bubble_sort()



*   **선택 정렬**

 먼저 리스트에서 가장 작거나 큰 항목을 찾아서 첫 번째 항목과 위치를 바꾼 후, 그 다음 항목을 찾아서 두 번째 항목과 위치를 바꾸는 식으ㅗ 리스트 끝에 도달할 때까지 이 과정을 반복한다
 
 시간복잡도 : O(n²)



In [None]:
def selection_sort(seq):
    length = len(seq)
    for i in range(length-1):
        min_j = i
        for j in range(i+1, length):
            if seq[min_j] > seq[j]:
                min_j = j
        seq[i], seq[min_j] = seq[min_j], seq[i]
        print(seq)
    return seq

def test_selection_sort():
    seq = [11, 3, 28, 43, 9, 4]
    assert(selection_sort(seq) == sorted(seq))
    print("테스트 통과!")


if __name__ == "__main__":
    test_selection_sort()

*   **삽입 정렬**

 배열 맨 처음 정렬된 부분에, 정렬되지 않은 다음 항목을 반복적으로 삽입하는 방식

 미리 정렬된 리스트에 새 항목을 추가할 때 좋다

 시간복잡도 : O(n²)

In [None]:
def insertion_sort(seq):
    for i in range(1, len(seq)):
        j = i
        while j > 0 and seq[j-1] > seq[j]:      # 뒤에서 앞으로 비교해가며 앞에꺼보다 작으면 바꿈
            seq[j-1], seq[j] = seq[j], seq[j-1]
            j -= 1
        print(seq)
    return seq

def insertion_sort_rec(seq, i=None):
    if i is None:
        i = len(seq) - 1
    if i == 0:
        return i
    insertion_sort_rec(seq, i-1)
    j = i
    while j > 0 and seq[j-i] > seq[j]:
        seq[j-1], seq[j] = seq[j], seq[j-1]
        j -= 1
    return seq

def test_insertion_sort():
    seq = [11, 3, 28, 43, 9, 4]
    assert(insertion_sort(seq) == sorted(seq))
    assert(insertion_sort_rec(seq) == sorted(seq))
    print("테스트 통과!")


if __name__ == "__main__":
    test_insertion_sort()


- **놈 정렬**

 앞으로 이동하며 잘못 정렬된 값을 찾은 후, 올바른 위치로 값을 교환하며 다시 뒤로 이동한다

 시간복잡도 : O(n²)


In [None]:
def gnome_sort(seq):
    i = 0
    while i < len(seq):
        if i == 0 or seq[i-1] <= seq[i]:    # 뒤 숫자가 앞 숫자보다 클 때
            i += 1                          # i 1증가
        else:
            seq[i], seq[i-1] = seq[i-1], seq[i] # 뒤 숫자가 앞 숫자보다 작을 때
            i -= 1                              # i 1감소
        print(seq)
    return seq

def test_gnome_sort():
    seq = [5,3,2,4]
    assert(gnome_sort(seq) == sorted(seq))
    print("테스트 통과")


if __name__ == "__main__":
    test_gnome_sort()

###9.2 선형 정렬

- **카운터 정렬**

 작은 범위의 정수를 정렬할 때 유용하며, 숫자의 발생 횟수를 계산하는 누적 카운트를 사용

 누적 카운트를 갱신하여 순서대로 숫자를 직접 배치하는 방식

 시간복잡도 : O(n+k)

In [None]:
# 각 숫자의 간격이 크다면, 비효율적인 방법
from collections import defaultdict

def count_sort_dict(a):
    b, c = [], defaultdict(list)    # 기본 value값이 list형인 dictionary
    for x in a:
        c[x].append(x)   # x만큼 c[x]에 append
    print(c)
    for k in range(min(c), max(c) + 1):
        b.extend(c[k])
        print(b)
    return b

def test_count_sort():
    seq = [3,5,2,6,8,1,0,3,5,6,2,5,4,1,5,3]
    assert(count_sort_dict(seq) == sorted(seq))
    print("테스트 통과!")


if __name__ == "__main__":
    test_count_sort()

###9.3 로그 선형 정렬

In [None]:
seq1 = [5,2,4,1]
seq1.sort()     # seq1가 바뀜
print(seq1)

seq2 = [5,2,4,1]
sorted(seq2)    # seq2가 바뀌진 않음
print(seq2)

- **병합 정렬**

 리스트를 반으로 나누어 정렬되지 않은 리스트를 만든 후, 정렬되지 않은 두 리스트의 크기가 1이 될 때까지, 계속 리스트를 반으로 나누어 병합 정렬 알고리즘울 호출하여 리스트를 정렬하고 병합한다

 시간복잡도 : O(n log n)

In [None]:
import sys
import os
os.chdir("/content/drive/MyDrive/test")
sys.path.append(os.chdir)

"""
    병합 정렬을 구현하는 여러가지 방법이 있다.
        --> 시간복잡도: 최악/최선/평균일 때 모두 O(nlogn)
        --> 공간복잡도: 배열인 경우 O(n)이며, 일반적으로 제자리 정렬(in-place)이 아니다.
        --> 배열이 큰 경우 효율적이다.
        --> 병합 정렬의 병합 함수를 사용하여, 두 배열을 병합한다.
        --> 두 파일인 경우에도 병합 가능하다.
        가) pop() 메서드를 사용하여 다음과 같이 구현할 수 있다.
           (각 두 배열은 정렬되어 있다.)
            def merge(left, right):
                if not left or not right: return left or right # 아무것도 병합하지 않는다.
                result = []
                while left and right:
                    if left[-1] >= right[-1]:
                        result.append(left.pop())
                    else:
                        result.append(right.pop())
                result.reverse()
                return (left or right) + result
            >>> l1 = [1, 2, 3, 4, 5, 6, 7]
            >>> l2 = [2, 4, 5, 8]
            >>> merge(l1, l2)
            [1, 2, 2, 3, 4, 4, 5, 5, 6, 7, 8]
        나) 제자리 정렬을 구현하는 경우, 한 배열의 끝에 0이 채워져 있고, 
           다른 배열에는 첫 배열에서 끝에 0이 채워진 크기만큼의 요소가 있다.
           (각 두 배열은 정렬되어 있다.)
            >>> l1 = [1, 2, 3, 4, 5, 6, 7, 0, 0, 0, 0]
            >>> l2 = [2, 4, 5, 8]
            >>> merge_two_arrays_inplace(l1, l2)
            [1, 2, 2, 3, 4, 4, 5, 5, 6, 7, 8]
        다) 정렬된 파일은 다음과 같이 병합(파일을 로딩할 충분한 RAM이 필요).
            >>> list_files = ["1.dat", "2.dat", "3.dat"]
            >>> merge_files(list_files)
            [1, 1, 2, 3, 3, 3, 4, 5, 5, 5, 6, 7, 8]
"""


def merge_sort(seq):
    """
    1) pop()을 이용한 병합 정렬
    """
    if len(seq) < 2:
        return seq
    mid = len(seq) // 2
    left, right = seq[:mid], seq[mid:]
    if len(left) > 1:
        left = merge_sort(left)
    if len(right) > 1:
        right = merge_sort(right)

    res = []
    while left and right:
        if left[-1] >= right[-1]:
            res.append(left.pop())
        else:
            res.append(right.pop())
    res.reverse()
    return(left or right) + res


def merge_sort_sep(seq):
    """
    2) 두 함수로 나누어서 구현한다. 한 함수에서는 배열을 나누고,
       또 다른 함수에서는 배열을 병합한다.
    """
    if len(seq) < 2:
        return seq
    mid = len(seq) // 2
    left = merge_sort_sep(seq[:mid])
    right = merge_sort_sep(seq[mid:])
    return merge(left, right)


def merge(left, right):
    if not left or not right:
        return left or right
    result = []
    i, j = 0, 0
    while i < len(left) and j < len(right):
        if left[i] <= right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    if left[i:]:
        result.extend(left[i:])
    if right[j:]:
        result.extend(right[j:])
    # print(result)
    return result


def merge_2n(left, right):
    """
    3) 각 두 배열은 정렬된 상태다.
    시간복잡도는 O(2n)이다.
    """
    if not left or not right:
        return left or right
    result = []
    while left and right:
        if left[-1] >= right[-1]:
            result.append(left.pop())
        else:
            result.append(right.pop())
    result.reverse()
    return (left or right) + result


def merge_two_arrays_inplace(l1, l2):
    """
    4) 제자리 정렬로 구현한다.
    """
    if not l1 or not l2:
        return l1 or l2
    p2 = len(l2) - 1
    p1 = len(l1) - len(l2) - 1
    p12 = len(l1) - 1
    while p2 >= 0 and p1 >= 0:
        item_to_be_merged = l2[p2]
        item_bigger_array = l1[p1]
        if item_to_be_merged < item_bigger_array:
            l1[p12] = item_bigger_array
            p1 -= 1
        else:
            l1[p12] = item_to_be_merged
            p2 -= 1
        p12 -= 1
    return l1


def merge_files(list_files):
    """
    5) 파일을 병합한다.
    """
    result = []
    final = []
    for filename in list_files:
        aux = []
        with open(filename, "r") as file:
            for line in file:
                aux.append(int(line))
        result.append(aux)
    final.extend(result.pop())
    for l in result:
        final = merge(l, final)
    return final


def test_merge_sort():
    seq = [3, 5, 2, 6, 8, 1, 0, 3, 5, 6, 2]
    seq_sorted = sorted(seq)
    assert(merge_sort(seq) == seq_sorted)  # 1
    assert(merge_sort_sep(seq) == seq_sorted)  # 2

    l1 = [1, 2, 3, 4, 5, 6, 7]
    l2 = [2, 4, 5, 8]
    l_sorted = [1, 2, 2, 3, 4, 4, 5, 5, 6, 7, 8]
    assert(merge_2n(l1, l2) == l_sorted)  # 3

    l1 = [1, 2, 3, 4, 5, 6, 7, 0, 0, 0, 0]
    l2 = [2, 4, 5, 8]
    l_sorted = [1, 2, 2, 3, 4, 4, 5, 5, 6, 7, 8]
    assert(merge_two_arrays_inplace(l1, l2) == l_sorted)  # 4

    list_files = ["a.dat", "b.dat", "c.dat"]
    l_sorted = [1, 1, 2, 3, 3, 3, 4, 5, 5, 5, 6, 7, 8]
    assert(merge_files(list_files) == l_sorted)  # 5
    print("테스트 통과!")


if __name__ == "__main__":
    test_merge_sort()