# 希尔排序

希尔排序也称“递减增量排序”，它对插入排序做了改进，将列表分成数个子列表，并对每一个子列表应用插入排序。如何切分列表是希尔排序的关键——并不是连续切分，而是使用增量 i（有时称作步长）选取所有间隔为 i 的元素组成子列表。

以下图中的列表为例，这个列表有 9 个元素。如果增量为 3，就有 3 个子列表，每个都可以应用插入排序，结果如后面的图所示。尽管列表仍然不算完全有序，但通过给子列表排序，我们已经让元素离它们的最终位置更近了。

![希尔排序1](shell_sort1.jpg)

![希尔排序2](shell_sort2.jpg)

下展示了最终的插入排序过程。由于有了之前的子列表排序，因此总移动次数已经减少了。本例只需要再移动 4 次。

![希尔排序3](shell_sort3.jpg)

如前所述，如何切分列表是希尔排序的关键。后面的代码实现中的函数采用了另一组增量。先为 $\frac{n}{2}$个子列表排序，接着是 $\frac{n}{4}$ 个子列表。最终，整个列表由基本的插入排序算法排好序。下图展示了采用这种增量后的第一批子列表。

![希尔排序4](shell_sort4.jpg)

In [1]:
def shell_sort(alist):
    sublistcount = len(alist) // 2
    while sublistcount > 0:
        for startposition in range(sublistcount):
            gap_insertion_sort(alist, startposition, sublistcount)

        sublistcount = sublistcount // 2

def gap_insertion_sort(alist, start, gap): 
    for i in range(start+gap, len(alist), gap):
        currentvalue = alist[i]
        position = i

        while position >= gap and alist[position-gap] > currentvalue:
            alist[position] = alist[position-gap]
            position = position-gap

        alist[position] = currentvalue

In [2]:
a_list = [54, 26, 93, 17, 77, 31, 44, 55, 20]
print(f"before sorting: {a_list}")
shell_sort(a_list)
print(f"after sorting: {a_list}")
assert a_list == sorted(a_list)

before sorting: [54, 26, 93, 17, 77, 31, 44, 55, 20]
after sorting: [17, 20, 26, 31, 44, 54, 55, 77, 93]


In [3]:
%timeit shell_sort(a_list)

1.43 μs ± 3.01 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)


希尔排序的时间复杂度大概介于 $O(n)$ 和 $O(n^2)$ 之间。若采用上面代码中的增量，则时间复杂度是 $O(n^2)$ 。通过改变增量，比如采用 $2^k-1 (1, 3, 7, 15, 31, \cdots)$，希尔排序的时间复杂度可以达到 $O(n^{\frac{3}{2}})$。

### 参考文档
《Python数据结构与算法分析（第2版）》：5.3.4 希尔排序