# 桶排序

Refs:
- https://zhuanlan.zhihu.com/p/110079476

**思路**
1. 将数组中的元素依据大致大小分配到若干个桶中
2. 对每一个桶中的元素进行排序（可以选择某种原地排序算法）
3. 然后将各个排好序的桶合并成最终的有序结果

**性能**
1. 空间复杂度：$O(n+m)$，其中 m 为桶的数量
2. 时间复杂度：$O(n+k)$，其中 k 为每个桶中元素个数
3. 稳定性：✅
4. In-place：❌

**使用限制**
1. 数组中元素范围必须在某个范围之内，且分布要相对均匀

![](https://pic3.zhimg.com/80/v2-778606f734e905642bccd69c199c1582_720w.jpg)

In [1]:
import math


def bucket_sort(items, bucket_size=5):
    if len(items) <= 1:
        return items

    # 判断桶内最大最小值
    min_ = max_ = items[0]
    for item in items:
        if item < min_:
            min_ = item
        elif item > max_:
            max_ = item

    # 桶
    bucket_num = math.ceil((max_ - min_) / bucket_size)
    buckets = [[] for _ in range(bucket_num)]

    # 将 items 分桶存放
    for item in items:
        bucket_idx = math.floor((item - min_) / bucket_size)
        buckets[bucket_idx].append(item)

    total = 0
    for bucket in buckets:
        if not bucket:
            continue

        # 对每一个桶单进行排序，此处使用插入排序，或者选用其他原地排序算法也行
        _insert_sort(bucket)

        # 将排好序的元素回填到原数组
        for item in bucket:
            items[total] = item
            total += 1


def _insert_sort(items):
    """插入排序
    """
    len_ = len(items)
    sorted_idx = 0

    while sorted_idx < len_:
        tmp_idx = sorted_idx - 1
        while tmp_idx >= 0:
            if items[tmp_idx] > items[tmp_idx + 1]:
                items[tmp_idx], items[tmp_idx + 1] = items[tmp_idx + 1], items[tmp_idx]
                tmp_idx -= 1
            else:
                break

        sorted_idx += 1

In [2]:
items = [65,9,37,7,24,25,7,62,5,84,27,59,67,5,8,42,7]
print(items)

bucket_sort(items)

print(items)

[65, 9, 37, 7, 24, 25, 7, 62, 5, 84, 27, 59, 67, 5, 8, 42, 7]
[5, 5, 7, 7, 7, 8, 9, 24, 25, 27, 37, 42, 59, 62, 65, 67, 84]


In [3]:
%run utils.ipynb

def wrapper_bucket_sort_for_testing(items):
    bucket_sort(items)
    return items, []

test_sort_funtion(wrapper_bucket_sort_for_testing)