🍱 셸 정렬

- 단순 삽입 정렬의 장점 살리고 단점 보완하여 더 빠르게 정렬하는 알고리즘

* 단순 삽입 정렬의 문제

- 만일 배열의 뒷부분에 가장 작은 원소가 있다면?
    - 뒷 부분 원소를 정렬하기 위해 n번의 이동(대입) 해야 함
- 0보다 작은 원소를 만날 때까지 이웃한 왼쪽 원소를 하나씩 대입하는 작업 반복
- 특징:
1. 장점: 이미 정렬 마쳤거나 정렬이 거의 끝나가는 상태에서 속도가 빠름
2. 단점: 삽입할 위치가 멀리 떨어져 있으면 이동 횟수 많아짐


* 셸 정렬 알아보기

- 도널드.L.셸이 고안한 셰정렬 알고리즘. 
- 단순 삽입 정렬 장점 살리고 단점 보완
- 먼저 정렬한 배열의 원소를 그룹으로 나눠 각 그룹별로 정렬 수행 그 후 정렬된 그룹을 합치는 작업 반복해 원소 이동 횟수 줄임
    - 예: 4- 정렬 -> 2 - 정렬 -> 1 - 정렬  = h 정렬
    - 정렬 횟수는 늘어나지만 전체적으로 원소 이동 횟수가 줄어듬

In [3]:
# 셸정렬 알고리즘 구현하기 

from typing import MutableSequence 

def shell_sort(a: MutableSequence) -> None:
    """셸정렬"""
    n = len(a) 
    h = n//2
    while h > 0:
        for i in range(h, n):
            j = i - h 
            tmp = a[i] 
            while j >= 0 and a[j] > tmp:
                a[j + h] = a[j]
                j -= h 
            a[j + h] = tmp 
        h //= 2
        
if __name__ == '__main__':
    print('셸 정렬을 수행합니다.') 
    num = int(input('원소 수를 입력하세요 : '))
    x = [None] * num                            # 원소 수 num 배열 생성
    
    for i in range(num):
        x[i] = int(input(f'x[{i}]: ')) 
        
    shell_sort(x)       # 배열 x 셸 정렬 
    
    print('오름차순으로 정렬했습니다') 
    for i in range(num):
        print(f'x[{i}] = {x[i]}')        

셸 정렬을 수행합니다.
오름차순으로 정렬했습니다
x[0] = 1
x[1] = 2
x[2] = 3
x[3] = 4
x[4] = 5
x[5] = 6
x[6] = 7
x[7] = 8


단순 삽입 정렬과 거의 유사하지만 주목하는 원소와 비교하는 원소가 서로 이웃하지 안혹 h개만큼 떨어져 있다는 점

h 초깃값 = n // 2 로 구함(전체 배열 절반 값) 
    
    - while 문 반복할 때마다 다시 2로 나눈 값으로 업데이트 
    - 따라서, h는 원소 수가 8이면 4 -> 2 -> 1
    - 원소 수가 7이면 3 -> 1

* h값의 선택 
- 원소 수인 n값이 8이면 h값을 4 -> 2-> 1 로 변화
- h 값은 n 부터 감소하다가 마지막 1이 됨
- h 값을 어떤 수열로 감소시키면 효율적인 정렬을 할 수 있을까? 
    - h값이 서로 배수가 되지 않도록 해야 함
    - 효율적인 수열: h = ... -> 121 -> 40 -> 13 -> 4 -> 1
        - 위 수열 거꾸로 하면 1부터 시작해 3배한 값에 1을 더함 
        - 하지만, h 초깃값이 지나치게 크면 효과가 없음
        - 따라서, 배열 원소 수 n을 9로 나누었을 때 그 몫을 넘지 않도록 정해야?    

In [7]:
# 셸 정렬 알고리즘 구현하기(h * 3 + 1 수열 사용) 

from typing import MutableSequence 

def shell_sort(a: MutableSequence) -> None: 
    """셸 wjdfuf(h * 3 + 1) 수열 사용"""
    n = len(a) 
    h = 1
    
    while h < n  // 9:
        h = h * 3 + 1
        
    while h > 0:
        for i in range(h, n):
            j = i - h 
            tmp = a[i]
            while j >= 0 and a[j] > tmp:
                a[j + h] = a[j]
                j -= h 
            a[j + h] = tmp 
        h //= 3
        
if __name__=='__main__':
    print('셸 정렬을 수행합니다(h * 3 + 1 수열 사용). ')
    num = int(input('원소 수를 입력하세요...: '))
    x = [None] * num      # 원소 수가 num 인 배열 생성 
    
    for i in range(num):
        x[i] = int(input(f'x[{i}]: '))
        
    shell_sort(x)     # 배열 x 셸 정렬 
    
    print('오름차순으로 정렬했습니다') 
    
    for i in range(num):
        print(f'x[{i}] = {x[i]}') 

셸 정렬을 수행합니다(h * 3 + 1 수열 사용). 
오름차순으로 정렬했습니다
x[0] = 1
x[1] = 2
x[2] = 3
x[3] = 3
x[4] = 4
x[5] = 6
x[6] = 7
x[7] = 8


    while h < n  // 9:
        h = h * 3 + 1

    - h 초깃값 구함
    - 1부터 시작해 h * 3 + 1 수열 사용하는 작업 반복하지만  n // 9 넘지 않는 최댓값을 h 대입



    두번 째 while 문

    - h 값이 변하는 방법이 기존과 다름
    - h 값을 3으로 나누는 작업 반복해서 결국에 h = 1 이 됨
    
    - 셸 정렬 시간 복잡도: O(n**1.25) 
    - 단순 정렬 시간 복잡도: O(n**2) 
    - 셸 정렬은 이웃하지 않고 떨어져 있는 원소 서로 교환해서 불안정적