在数据结构中，"key"（键）是用于标识和访问数据元素的唯一标识符或索引。它是一个与数据元素相关联的值，用于区分不同的元素并在数据结构中进行检索、插入、删除等操作。

键通常用于识别数据结构中的每个元素，使得可以快速、高效地进行数据访问和操作。在字典、映射、集合等数据结构中，键是与值相关联的，而值则可以是任何类型的数据。


Set interface:

Container:

build(x): 从一个可迭代的对象X中构建一个集合（set），将X中的每个项添加到集合中。这个集合可能是一个数据结构，用于存储独特的项。
Len(): 返回集合中存储的项的数量。

Static:

find(k):根据给定的key，静态查找并返回存储在集合中的对应项。这意味着找到的项是根据已有的数据直接检索的，不会对数据进行修改。

Dynamic:

Insert(x): 将给定的项x插入到集合中。如果已经存在具有相同key的项，则用新的项替换旧的项。

Delete(x): 根据给定的key，删除并返回集合中对应的项。这个操作会从集合中移除指定的项。

Order:

iter_ord():返回集合中存储的项，按照key的顺序一个接一个地进行迭代。

find_min():返回集合中具有最小key的项。

find_max():返回集合中具有最大key的项。

find_next(k):返回集合中具有key大于给定key k的最小项。

find_prev(k):返回集合中具有key小于给定key k的最小项。


存储项在数组中的任意顺序可以实现一个（效率不高的）集合。

将存储的项按键递增排序可以带来以下优点：

    更快的查找最小/最大值：
        当项按键递增排序存储时，最小值通常在数组的第一个索引处，最大值通常在数组的最后一个索引处。这意味着可以通过直接访问这两个索引来快速找到最小和最大的项，而不需要遍历整个数组来寻找。

    通过二分查找更快的查找：
        使用二分查找算法可以在排序后的数组中以O(log n)的时间复杂度快速查找特定键对应的项。由于数组已经按键排序，因此可以利用二分查找的特性，在较短的时间内定位到目标项，而不必像在无序数组中那样逐个检查每个项。

虽然按键排序可以提高某些操作的速度，但在插入新项和删除项时可能会导致数组重新排序，这可能会带来额外的性能开销。因此，这种方法在实践中可能不够高效，但在一些特定场景下，如对集合进行频繁的查找操作而很少进行插入和删除操作时，仍然是一种可行的实现方式。




Sorting:



    二分查找与高效的集合数据结构：
        通过对已排序的数组进行二分查找，可以创建一个高效的集合数据结构。二分查找利用了已排序数组的特性，能够在O(log n)的时间复杂度内找到目标元素，从而使得集合的操作（如查找、插入、删除等）更加高效。

    输入与输出：
        给定一个静态的数组A，其中包含n个数字作为输入。输出则是一个静态的数组B，它是数组A的一个有序排列。

    排列与排序：
        在这里，“排列”指的是具有相同元素但顺序不同的数组。而“排序”则指的是按照一定的顺序将数组元素重新排列，使得每个元素满足B[i - 1] ≤ B[i]的条件。

    示例：
        举例说明了输入数组A经过排序后的输出数组B。例如，输入数组[8, 2, 4, 9, 3]经过排序后输出数组[2, 3, 4, 8, 9]。

    破坏性排序与原地排序：
        如果排序操作会直接覆盖原始数组A，而不是创建一个新的有序数组B，则称为“破坏性排序”（destructive sort）。而“原地排序”（in-place sort）则是指排序过程中只使用O(1)额外空间，即不需要额外的数组来存储排序后的结果。原地排序必然是破坏性的，因为它直接修改了原始数组A。
        


Permutation Sort:



排列的数量：

    数组A有n个元素，共有n!（n的阶乘）个排列。其中至少有一个排列是有序的。

对每个排列进行检查：

    对于数组A的每个排列，都需要检查它是否已排序。在最坏的情况下，检查一个排列是否已排序需要Θ(n)的时间。

示例：

    以数组[2, 3, 1]为例，它的所有排列是 {[1, 2, 3], [1, 3, 2], [2, 1, 3], [2, 3, 1], [3, 1, 2], [3, 2, 1]}。


In [None]:

#permutation_sort的实现
def permutation_sort(A):
    for B in permutations(A): # O(n!)
        if is_sorted(B): # O(n)
            return B # O(1)

这段代码中，permutations(A)是生成数组A的所有排列的函数，它的时间复杂度是O(n!)。is_sorted(B)是检查数组B是否已排序的函数，它的时间复杂度是O(n)。因此，整个permutation sort的时间复杂度为Ω(n! · n)，这是指数级别的。



Permutation Sort分析：

    该算法通过对所有可能性进行穷举，并针对每个可能性进行检查来确保正确性。由于它尝试了所有可能的排列，因此被称为“蛮力法”（Brute Force）。
    但是，由于排列的数量以及对每个排列的检查，导致了其运行时间为指数级别，即Ω(n! · n)，这在实际应用中通常是不可接受的。

解决递归式（Recurrences）是算法分析中的一个重要问题，常用的方法包括替换法（Substitution Method）、递归树（Recurrence Tree）和主定理（Master Theorem）。

    替换法（Substitution Method）：
        替换法的基本思想是猜测递归式的解，然后将这个解代入原始递归式中，验证是否成立。如果解符合递归式，就证明了其正确性。这通常涉及到猜测一个与递归式形式相符合的解，并通过数学归纳法或其他方法来证明。

    递归树（Recurrence Tree）：
        递归树是一种图形化的方法，用于表示递归算法中的递归调用和计算的结构。通过绘制递归树，可以清晰地展示每一层递归调用的数量以及它们的计算成本。通过对递归树的分析，可以得到递归算法的时间复杂度的估计。

    主定理（Master Theorem）：
        主定理是一种用于解决许多递归式的公式。它提供了一种简单而有效的方法来确定递归算法的时间复杂度。主定理通常用于解决具有特定形式的递归式，其中递归调用的次数和子问题的规模都符合一定的规律。通过应用主定理，可以直接得到递归式的解析解，而不需要进行复杂的数学推导。

Selection sort(选择排序)分析：

基本思想是每次从待排序的数组中选择最大（或最小）的元素，然后将其放到已排序部分的末尾。




    算法步骤：
        选择排序的具体步骤如下：
            遍历数组，从当前未排序部分中找到最大的元素。
            将找到的最大元素与当前未排序部分的最后一个元素交换位置，将最大元素放到已排序部分的末尾。
            递归地对剩余未排序部分进行相同的操作，直到整个数组排序完成。

    例子：
        以输入数组[8, 2, 4, 9, 3]为例，选择排序的过程如下：
            [8, 2, 4, 3, 9]
            [3, 2, 4, 8, 9]
            [2, 3, 4, 8, 9]

    算法实现：
        选择排序的实现可以通过递归的方式完成。其中，prefix_max函数用于找到数组A中前缀部分A[:i + 1]中的最大值的索引。

    prefix_max函数分析：
        对prefix_max函数进行分析，可以通过数学归纳法证明其时间复杂度为Θ(n)。基本情况为i = 0时，只有一个元素，返回其索引；对于i > 0的情况，递归地调用自身，每次处理一个元素。

    选择排序分析：
        选择排序的时间复杂度可通过递归式分析得到。基本情况为只有一个元素时，时间复杂度为Θ(1)；对于n > 1的情况，每次递归都需要进行一次prefix_max操作，其时间复杂度为Θ(n)。因此，总体时间复杂度为Θ(n^2)。

总的来说，选择排序是一种简单但效率较低的排序算法，其时间复杂度为Θ(n^2)，适用于小规模数据或作为其他高级排序算法的子过程。




In [None]:
#选择排序：
def selection_sort(A):
    n = len(A)
    for i in range(n - 1):
        min_index = i
        for j in range(i + 1, n):
            if A[j] < A[min_index]:
                min_index = j
        A[i], A[min_index] = A[min_index], A[i]


# 示例用法
arr = [8, 2, 4, 9, 3]
selection_sort(arr)
print("Sorted array:", arr)


: 

Insertion sort(插入排序)：


插入排序算法步骤：

    插入排序算法的基本思想是将数组分为已排序部分和未排序部分，然后逐步将未排序部分的元素插入到已排序部分的合适位置，直到整个数组排序完成。


insertion_sort函数解析：

    insertion_sort函数负责递归地对数组A的前缀A[:i + 1]进行排序。
        在基本情况下（i = 0），表示数组只有一个元素，已经是有序的，无需操作。
        在递归调用中，对前缀A[:i]进行排序，然后调用insert_last函数对当前元素进行插入操作。

insert_last函数解析：

    insert_last函数用于将数组A的最后一个元素插入到已排序部分的合适位置，假设前缀A[:i]已经是有序的。
        在基本情况下（i = 0），表示数组只有一个元素，已经是有序的，无需操作。
        在递归调用中，如果当前元素小于前一个元素，则交换它们的位置，并继续递归地向前查找合适的位置。

insert_last函数的时间复杂度分析：

    基本情况下，对于i = 0，数组只有一个元素，已经是有序的，时间复杂度为Θ(1)。
    在归纳步骤中，假设对于i的情况下insert_last函数能正确排序，那么对于i+1的情况，时间复杂度为S(n) = S(n − 1) + Θ(1)，其中S(n)表示对前缀A[:i + 1]进行排序的时间复杂度。解该递归式得到S(n) = Θ(n)。

插入排序算法的时间复杂度分析：

    基本情况下，对于i = 0，数组只有一个元素，时间复杂度为Θ(1)。
    在归纳步骤中，假设对于i的情况下插入排序算法能正确排序，那么对于i+1的情况，时间复杂度为T(n) = T(n − 1) + Θ(n)，其中T(n)表示对前缀A[:i + 1]进行排序的时间复杂度。解该递归式得到T(n) = Θ(n^2)。




In [None]:
#插入排序
'''
插入排序的工作原理是通过构建有序序列，对于未排序数据，
在已排序序列中从后向前扫描，找到相应位置并插入。

插入排序的算法步骤如下：
1. 从第一个元素开始，该元素可以认为已经被排序；
2. 取出下一个元素，在已经排序的元素序列中从后向前扫描；
3. 如果该元素（已排序）大于新元素，将该元素移到下一位置；
4. 重复步骤3，直到找到已排序的元素小于或者等于新元素的位置；
5. 将新元素插入到该位置后；
6. 重复步骤2~5。


'''
def insertion_sort(A):
    n = len(A)
    for i in range(1, n):
        key_item = A[i]
        j = i - 1
        while j >= 0 and A[j] > key_item:
            A[j + 1] = A[j]
            j -= 1
        A[j + 1] = key_item

Merge sort(归并算法)：


    归并排序算法步骤：
        首先将待排序数组分成两个子数组，然后递归地对这两个子数组进行排序。
        排序完成后，将两个已排序的子数组合并成一个有序的数组。

    merge_sort函数解析：
        merge_sort函数用于递归地对数组A的指定范围[a:b]进行排序。
            在基本情况下（当1 < b - a时），将数组分成两半，并递归地对左右两半进行排序。
            排序完成后，调用merge函数将两个已排序的子数组合并成一个有序的数组。

    merge函数解析：
        merge函数用于将两个已排序的子数组L和R合并成一个有序的数组A。
            在基本情况下（当a < b时），根据两个子数组的末尾元素的大小，依次将较大的元素放入数组A的末尾。
            递归地向前移动指针，直到将所有元素合并到数组A中。

    merge函数的时间复杂度分析：
        基本情况下，对于n = 0，表示待合并的子数组为空，时间复杂度为Θ(1)。
        在归纳步骤中，假设对于n的情况下merge函数能正确合并，那么对于n+1的情况，时间复杂度为S(n) = S(n − 1) + Θ(1)，其中S(n)表示合并长度为n的子数组的时间复杂度。解该递归式得到S(n) = Θ(n)。

    归并排序算法的时间复杂度分析：
        基本情况下，对于n = 1，表示数组只有一个元素，已经是有序的，时间复杂度为Θ(1)。
        在归纳步骤中，假设对于k < n的情况下归并排序算法能正确排序，那么对于n的情况，时间复杂度为T(n) = 2T(n/2) + Θ(n)。使用主定理或递归树法可得到T(n) = Θ(n log n)。


In [None]:
#Merge Sort
'''
归并排序是一种分治算法。其思想是将原始数组切分成较小的数组，直到每个小数组只有一个位置，
接着将小数组归并成较大的数组，直到最后只有一个排序完毕的大数组。
'''
def merge(left, right):
    result = []
    left_pointer = right_pointer = 0

    while left_pointer < len(left) and right_pointer < len(right):
        if left[left_pointer] < right[right_pointer]:
            result.append(left[left_pointer])
            left_pointer += 1
        else:
            result.append(right[right_pointer])
            right_pointer += 1

    result.extend(left[left_pointer:])
    result.extend(right[right_pointer:])
    return result
