# シェルソート


挿入ソートでは、未整理のデータから取り出した値を、整理済みデータのどこに挿入すべきかがパッと分かると効率が良い。

そこで、なるべく整理済みのデータの最後尾（または先頭）に位置づけられるように前処理をしてしまおう、というのがシェルソートである。

（逆に、整理済みデータから挿入箇所を探すところを工夫したのがバイナリソート（二分探索挿入ソート）となる。）


シェルソートでは、未整理の配列$A$を間隔 $g$ ごとの配列 $A_{modg0} = [a_0,a_g,a_{2g},...], A_{modg1} = [a_1,a_{g+1},a_{2g+1}, ...], ...$ に分けたうえで挿入ソートを行い、ラフに前処理をする。

この挿入ソートを行う際に、部分配列の最後尾に注目するやり方（螺旋本ではこちら）の他に、$g$ 種類の部分配列ごとに挿入ソートを終わらせるやり方があると思われる。本実装は後者で行う。


In [7]:
from logging import basicConfig, root, DEBUG, WARNING

basicConfig(level=DEBUG if "get_ipython" in globals() else WARNING)


def insertion_sort(nums: list[int], g: int) -> list[int]:
    # mod(g)==0, mod(g)==1...の部分配列ごとに挿入ソートする。
    for rem in range(0, g):
        root.debug(f"{g=}, {rem=}")
        # 1周目は [rem, rem+g] を、2週目は [rem, rem+g, rem+2g] を...のように挿入ソートを行う。
        last = rem + g
        while last < len(nums):
            root.debug(f"{g=}, {rem=}, {last=}")
            # challenger を g づつ減らしてループする。
            challenged = last - g
            while 0 <= challenged:
                root.debug(f"{g=}, {rem=}, {last=}, {challenged=}")
                if nums[challenged] > nums[challenged + g]:
                    tmp = nums[challenged]
                    nums[challenged] = nums[challenged + g]
                    nums[challenged + g] = tmp
                challenged -= g
                root.debug(f"{nums=}")

            last += g
            root.debug(f"{nums=}")

        root.debug(f"{nums=}")

    return nums

In [8]:
def shell_sort(nums: list[int]) -> tuple[int, list[int], list[int]]:
    G_asc = []
    h = 1
    while h < len(nums):
        G_asc.append(h)
        h = 3 * h + 1
    G = G_asc[::-1]
    root.debug(G)

    for g in G:
        # 呼び出し先で再代入を行わない限りは、メソッドを跨いでも同じオブジェクトが参照されるため、ここで再代入を行わない書き方も可能である。
        # しかし、呼び出し元がMutableを期待している時に、呼び出し先がImmutableな挙動だと、動かすまで誤りが分からない。
        # したがって、呼び出し元でImmutableを強制し、バグを未然に防ぐ。
        nums = insertion_sort(nums, g)

    return (len(G), G, nums)

In [10]:
input = """
5
5
1
4
3
2
""".strip()
expected = (2, [4, 1], [1, 2, 3, 4, 5])
actual = shell_sort([int(num) for num in input.splitlines()[1:]])
assert expected == actual

DEBUG:root:[4, 1]
DEBUG:root:g=4, rem=0
DEBUG:root:g=4, rem=0, last=4
DEBUG:root:g=4, rem=0, last=4, challenged=0
DEBUG:root:nums=[2, 1, 4, 3, 5]
DEBUG:root:nums=[2, 1, 4, 3, 5]
DEBUG:root:nums=[2, 1, 4, 3, 5]
DEBUG:root:g=4, rem=1
DEBUG:root:nums=[2, 1, 4, 3, 5]
DEBUG:root:g=4, rem=2
DEBUG:root:nums=[2, 1, 4, 3, 5]
DEBUG:root:g=4, rem=3
DEBUG:root:nums=[2, 1, 4, 3, 5]
DEBUG:root:g=1, rem=0
DEBUG:root:g=1, rem=0, last=1
DEBUG:root:g=1, rem=0, last=1, challenged=0
DEBUG:root:nums=[1, 2, 4, 3, 5]
DEBUG:root:nums=[1, 2, 4, 3, 5]
DEBUG:root:g=1, rem=0, last=2
DEBUG:root:g=1, rem=0, last=2, challenged=1
DEBUG:root:nums=[1, 2, 4, 3, 5]
DEBUG:root:g=1, rem=0, last=2, challenged=0
DEBUG:root:nums=[1, 2, 4, 3, 5]
DEBUG:root:nums=[1, 2, 4, 3, 5]
DEBUG:root:g=1, rem=0, last=3
DEBUG:root:g=1, rem=0, last=3, challenged=2
DEBUG:root:nums=[1, 2, 3, 4, 5]
DEBUG:root:g=1, rem=0, last=3, challenged=1
DEBUG:root:nums=[1, 2, 3, 4, 5]
DEBUG:root:g=1, rem=0, last=3, challenged=0
DEBUG:root:nums=[1, 2, 3, 4,