# 정렬 알고리즘

정렬 알고리즘의 안정성
- 안정적인 정렬 : 값이 같은 원소의 순서가 정렬이 된 이후에도 원래의 순서를 유지하는 정렬 알고리즘
- 안정적이지 않은 정렬 : 값이 같은 원소의 순서가 정렬이 된 이후에도 원래의 순서를 유지하지 않는 정렬 알고리즘
<br/>
<br/>

내부 정렬과 외부 정렬
- 내부 정렬 : 정렬할 모든 데이터를 하나의 배열에 저장할 수 있는 경우에 사용하는 알고리즘
- 외부 정렬 : 정렬할 데이터가 많아서 하나의 배열에 저장할 수 없는 경우에 사용하는 알고리즘

## 버블 정렬

버블 정렬은 액체 속의 공기 방울이 가벼워서 위로 보글보글 올라오는 모습에서 착안하여 붙인 이름이다. 끝에서부터 바로 앞의 원소와 크기를 비교하여 작은 원소를 앞으로 보내 더이상 비교할 부분이 없을 때까지 비교한다.

**버블 정렬 알고리즘**
1. 가장 마지막 원소를 비교 원소로 두고 앞의 원소를 비교
2. 만약 앞의 원소가 작으면 교환, 비교 원소 인덱스 업데이트
3. 만약 앞의 원소가 더 크면 비교 원소 인덱스 업데이트

- 이중 반복문 필요
    1. 모두 정렬될 때까지 반복 : for문 range로
    2. 하나의 원소가 정렬될 때까지 반복 : 비교 인덱스가 i보다 클 때까지 반복

In [34]:
# 버블 정렬 알고리즘 - 내가 짠 코드 (똑같다!)

def bubble_sort(arr):
    cnt = 0
    length = len(arr)
    for i in range(length):
        for j in range(length - 1, i, -1):
            cnt += 1
            if arr[j - 1] > arr[j]:
                arr[j], arr[j - 1] = arr[j - 1], arr[j]
    
    print(cnt)
    
a = [9, 1, 3, 4, 6, 7, 8]
bubble_sort(a)
print(a)

21
[1, 3, 4, 6, 7, 8, 9]


In [3]:
# 버블 정렬 알고리즘

def bubble_sort(arr):
    """버블 정렬 알고리즘"""
    n = len(arr)
    for i in range(n - 1):
        for j in range(n-1, i, -1):
            if arr[j] < arr[j - 1]:
                arr[j], arr[j - 1] = arr[j - 1], arr[j]

arr = [1, 3, 9, 2, 4]
bubble_sort(arr)
print(arr)

[1, 2, 3, 4, 9]


In [8]:
# 버블 정렬 알고리즘

def bubble_sort(arr):
    """버블 정렬 (정렬 과정을 출력)"""
    n = len(arr)
    ccnt = 0 # 비교 횟수
    scnt = 0 # 교환 횟수
    for i in range(n - 1):
        print(f'패스 {i + 1}')
        for j in range(n-1, i, -1):
            for m in range(0, n - 1):
                print(f'{arr[m]:2}' + ('  ' if m != j - 1 else
                                       ' +' if arr [j - 1] > arr[j] else ' -'),
                                        end = '')
            print(f'{arr[n - 1]:2}')
            ccnt += 1
            if arr[j] < arr[j - 1]:
                scnt += 1
                arr[j], arr[j - 1] = arr[j - 1], arr[j]
        
        for m in range(0, n - 1):
            print(f'{arr[m]:2}', end = '  ')
        print(f'{arr[n - 1]:2}')
    print(f'비교를 {ccnt}번 했습니다.')
    print(f'교환을 {scnt}번 했습니다.')
arr = [6, 4, 3, 7, 1, 9, 8]
bubble_sort(arr)
print(arr)

패스 1
 6   4   3   7   1   9 + 8
 6   4   3   7   1 - 8   9
 6   4   3   7 + 1   8   9
 6   4   3 + 1   7   8   9
 6   4 + 1   3   7   8   9
 6 + 1   4   3   7   8   9
 1   6   4   3   7   8   9
패스 2
 1   6   4   3   7   8 - 9
 1   6   4   3   7 - 8   9
 1   6   4   3 - 7   8   9
 1   6   4 + 3   7   8   9
 1   6 + 3   4   7   8   9
 1   3   6   4   7   8   9
패스 3
 1   3   6   4   7   8 - 9
 1   3   6   4   7 - 8   9
 1   3   6   4 - 7   8   9
 1   3   6 + 4   7   8   9
 1   3   4   6   7   8   9
패스 4
 1   3   4   6   7   8 - 9
 1   3   4   6   7 - 8   9
 1   3   4   6 - 7   8   9
 1   3   4   6   7   8   9
패스 5
 1   3   4   6   7   8 - 9
 1   3   4   6   7 - 8   9
 1   3   4   6   7   8   9
패스 6
 1   3   4   6   7   8 - 9
 1   3   4   6   7   8   9
비교를 21번 했습니다.
교환을 8번 했습니다.
[1, 3, 4, 6, 7, 8, 9]


***

**버블 정렬 알고리즘 개선**

한 번 지나갔는데 모두 정렬되어 있는 배열이라면 더이상 정렬을 위해 탐색하지 않아도 된다. 따라서 만약 모든 배열이 정렬되어 있다면 한 번만 처음부터 끝까지 스캔한 이후로는 더이상 스캔할 필요가 없다.

In [9]:
# 버블 정렬 알고리즘 개선 - 내가 짠 코드 (똑같다!)

def bubble_sort(arr):
    lenArr = len(arr)
    cnt = 0
    for i in range(lenArr): # 정렬하면 마지막 원소 하나 남았을 때는 비교하지 않아도 되므로 lenArr - 1번만 비교하면 된다.
        flag = False
        cnt += 1
        for j in range(lenArr - 1, i, -1):
            if arr[j] < arr[j - 1]:
                arr[j], arr[j - 1] = arr[j - 1], arr[j]
                flag = True
        if not flag:
            break
            
    print(f'array : {a}, cnt: {cnt}')

a = [1, 2, 3, 4, 9]
bubble_sort(a)
print(a)

array : [1, 2, 3, 4, 9], cnt: 1
[1, 2, 3, 4, 9]


In [10]:
# 버블 정렬 알고리즘 개선 - 정렬 완료된 배열에 대해서는 더이상 비교를 진행하지 않는다.

def bubble_sort(arr):
    """버블 정렬 알고리즘"""
    n = len(arr)
    for i in range(n - 1):
        exchange = 0
        for j in range(n-1, i, -1):
            if arr[j] < arr[j - 1]:
                arr[j], arr[j - 1] = arr[j - 1], arr[j]
                exchange += 1
        if exchange == 0:
            break

arr = [1, 3, 9, 2, 4]
bubble_sort(arr)
print(arr)

[1, 2, 3, 4, 9]


In [35]:
# 버블 정렬 알고리즘 개선 2 - 내가 짠 코드

def bubble_sort2(arr):
    n = len(arr)
    cnt = 0
    i = 0
    while i < n - 1:
        last = n - 1
        for j in range(n - 1, i, -1):
            cnt += 1
            if arr[j] < arr[j - 1]:
                arr[j], arr[j - 1] = arr[j - 1], arr[j]
                last = j
        i = last
    
    print(f'array : {a}, cnt: {cnt}')

a = [9, 1, 3, 4, 6, 7, 8]
bubble_sort2(a)
print(a)

array : [1, 3, 4, 6, 7, 8, 9], cnt: 21
[1, 3, 4, 6, 7, 8, 9]


In [37]:
# 버블 정렬 알고리즘 개선2 - 정렬 완료된 배열에 대해서는 더이상 비교를 진행하지 않는다.

def bubble_sort(arr):
    """버블 정렬 알고리즘"""
    n = len(arr)
    k = 0
    cnt = 0
    while k < n - 1:
        last = n - 1
        for j in range(n-1, k, -1):
            cnt += 1
            if arr[j] < arr[j - 1]:
                arr[j], arr[j - 1] = arr[j - 1], arr[j]
                last = j - 1
        k = last
    print(cnt)

arr = [9, 1, 3, 4, 6, 7, 8]
bubble_sort(arr)
print(arr)

27
[1, 3, 4, 6, 7, 8, 9]


### 셰이커 정렬

홀수 패스에서는 가장 작은 원소를 맨 앞으로 이동시키고, 짝수 패스에서는 가장 큰 원소를 맨 뒤로 이동 시키는 방식

이게 왜 가능할까?
첫 번째 원소를 제외하고 모두 정렬되어 있을 때 첫 번째 원소가 가장 큰 원소라면 모든 앞의 n-1번의 패스가 지난 후에야 비로소 정렬이 된다. 따라서 셰이커 정렬을 사용한다면 앞쪽의 큰 원소를 뒤로 보내고, 뒤쪽의 작은 원소를 앞으로 보내는 과정에서 불필요한 비교를 줄일 수 있다.

In [13]:
# 셰이커 정렬

def shaker_sort(arr):
    """셰이커 정렬"""
    left = 0
    right = len(arr) - 1
    last = right
    while left < right:
        for j in range(right, left, -1):
            if arr[j - 1] > arr[j]:
                arr[j - 1], arr[j] = arr[j], arr[j - 1]
                last = j
        left = last
        
        for j in range(left, right):
            if arr[j] > arr[j + 1]:
                arr[j], arr[j + 1] = arr[j + 1], arr[j]
                last = j
        right = last

arr = [1, 3, 9, 2, 4]
shaker_sort(arr)
print(arr)        

[1, 2, 3, 4, 9]


In [42]:
# 셰이커 정렬 - 내가 짠 코드

def shaker_sort(arr):
    n = len(arr)
    i = 0
    comp = 0
    exch = 0
    while i < n:
        comp += 1
        if i % 2 == 0: # 홀수 패스 (idx는 1씩 작으니까 짝, 홀수 패스가 바뀜)
            last = n - 1
            for j in range(n - 1, i, -1):
                if arr[j] < arr[j - 1]:
                    arr[j], arr[j - 1] = arr[j - 1], arr[j]
                    last = j
                    exch += 1
            i = last
        else: # 짝수 패스
            last = i
            for j in range(i, n - 1):
                if arr[j] > arr[j + 1]:
                    arr[j], arr[j + 1] = arr[j + 1], arr[j]
                    last = j
                    exch += 1
            n = last
    print(f'comp : {comp}, exch : {exch}')

a = [9, 1, 3, 4, 6, 7, 8]
shaker_sort(a)
print(a)

comp : 3, exch : 6
[1, 3, 4, 6, 7, 8, 9]


**shaker 정렬 내가 짠 코드 개선점** <br/>
1. 내가 짠 코드에서는 index를 i와 n으로 지정했다는 점과 책의 코드는 left와 right 변수를 지정했다는 점이 달랐다. 같은 역할을 하는 코드라면 변수명을 통해 코드를 직관적으로 알 수 있도록 하는 것이 훨씬 도움될 것이다!


2. 만약 홀수 패스, 짝수 패스, 홀수 패스, 짝수 패스 이런 패턴이 연속적으로 반복되는 것이라면 홀수, 짝수 순서에 맞도록 코드를 배치하되 매번 비교연산자를 통해 홀수 패스인지 짝수 패스인지 비교할 필요가 없다.

In [43]:
# 셰이커 정렬 - 내가 짠 코드 (개선)

def shaker_sort(arr):
    right = len(arr) - 1
    left = 0
    while left < right: # 비교 연산자 생각 필요
        # 홀수 패스
        last = right
        for j in range(right, left, -1):
            if arr[j] < arr[j - 1]:
                arr[j], arr[j - 1] = arr[j - 1], arr[j]
                last = j
        left = last
        
        # 짝수 패스
        for j in range(left, right):
            if arr[j] > arr[j + 1]:
                arr[j], arr[j + 1] = arr[j + 1], arr[j]
                last = j
        right = last

a = [9, 1, 3, 4, 6, 7, 8]
shaker_sort(a)
print(a)

[1, 3, 4, 6, 7, 8, 9]


### 파이썬 산술 연산에 사용하는 내장 함수

|함수|설명|
|:--:|:--:|
|abs(x)|x의 절댓값을 반환|
|divmod(a, b)|a를 b로 나눴을 때의 몫과 나머지로 구성된 튜플을 반환|
|float(x)|문자열 또는 수로 입력받은 x를 부동 소수점 수로 변환하여 값을 반환. x를 생략하면 0.0을 반환|
|hex(x)|정수값 x의 16진수 문자열을 반환|
|int(x, base)|x를 int형 정수로 변환한 값을 반환. base는 0 ~ 36의 범위에서 진수를 나타내야 하며, 생략할 경우 10진법에 해당)|
|max(args1, args2, ...)|최댓값 반환|
|min(args1, args2, ...)|최소값 반환|
|oct(x)|x에 해당하는 8진수 문자열 반환|
|pow(x, y, z)|x의 제곱인 (x\*\*y)를 반환. z값을 입력하면 x의 y 제곱을 z로 나누었을 때의 나머지를 반환. 같은 식인 pow(x, y) % z보다 효율적으로 계산할 수 있다.|
|round(n, ndigits)|n의 소수부를 ndigits 자릿수가 되도록 반올림한 값을 반환. ndigits가 None이거나 생략한 경우 입력한 값에 가장 가까운 정수 반환|
|sum(x, start)|x의 원소값을 처음부터 끝까지 순서대로 더한 총합에 start값을 더하여 반환.|