<a href="https://colab.research.google.com/github/fxr1115/Learning/blob/main/Python3-Algorithm/2_sorting-algorithm/merged_heap_sort.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [4]:
from typing import List

## 题目1 排序数组

### 归并排序$O(nlogn)$

**将两个有序列表合并成一个有序的列表**
- 开辟一个长度等同于两个数组长度之和的新数组，动态更新
- 使用**两个指针**来遍历原有的两个数组，不断将较小的数字添加到新数组中，并移动对应的指针

In [2]:
def merge(arr1, arr2):
    arr = []
    index1, index2 = 0, 0

    while index1 < len(arr1) and index2 < len(arr2):
        if arr1[index1] <= arr2[index2]:
            arr.append(arr1[index1])
            index1 += 1
        else:
            arr.append(arr2[index2])
            index2 += 1

    # 当一个元素全部处理完，还有一个有未处理完的
    arr.extend(arr1[index1:])
    arr.extend(arr2[index2:])

    return arr

arr1 = [1, 3, 5]
arr2 = [2, 4, 6]
merged_array = merge(arr1, arr2)
print(merged_array)

[1, 2, 3, 4, 5, 6]


归并排序：**将数组拆分为有序数组**
- 一个二分拆数组的*递归函数*，加上*一个合并两个有序列表的函数*
- 过程
    - 将原有数组不断地二分，直到只剩下最后一个数字
    - 嵌套的递归开始返回，一层层地调用`merge`函数



In [3]:
def merge_sort(arr):
    if len(arr) == 0:
        return

    # 对arr的[start, end]区间归并排序
    def merge_sort_recursive(arr, start, end):
        # 只剩下一个数字，停止拆分，返回单个数字组成的列表
        if start == end:
            return [arr[start]]

        middle = (start + end) // 2
        left = merge_sort_recursive(arr, start, middle)
        right = merge_sort_recursive(arr, middle + 1, end)
        return merge(left, right)

    # 调用递归函数，并将结果拷贝回原数组
    result = merge_sort_recursive(arr, 0, len(arr) - 1)
    for i in range(len(arr)):
        arr[i] = result[i]

arr = [5, 2, 9, 1, 5, 6]
merge_sort(arr)
print(arr)

[1, 2, 5, 5, 6, 9]


### 堆排序（不稳定）

**堆**：  
符合以下两个条件之一的完全二叉树（所有层（除了最后一层）都是满的）
- 根节点的值 ≥ 子节点的值，这样的堆被称之为最大堆，或大顶堆
- 根节点的值 ≤ 子节点的值，这样的堆被称之为最小堆，或小顶堆。

**堆排序过程**：
- 用数列构建出一个大顶堆，取出堆顶的数字
- 调整剩余的数字，构建出新的大顶堆，再次取出堆顶的数字
- 循环往复，完成整个排序

要**解决的问题**：
- 如何用数列构建出一个大顶堆；
- 取出堆顶的数字后，如何将剩余的数字调整成新的大顶堆

**完全二叉树的性质**，将根节点的下标视为0：
- 对于完全二叉树中的第`i`个数，它的左子节点下标：`left = 2i + 1`
- 对于完全二叉树中的第`i`个数，它的右子节点下标：`right = left + 1`
- 对于有`n`个元素的完全二叉树(n≥2)，它的最后一个非叶子结点的下标：`n/2 - 1`


- 每次都是3个数在比较

In [7]:
def heap_sort(arr):
    # 构建初始大顶堆
    build_max_heap(arr)
    for i in range(len(arr) - 1, 0, -1):
        arr[0], arr[i] = arr[i], arr[0]
        # 调整剩余数组，使其满足大顶堆
        max_heapify(arr, 0, i)

# 构建初始大顶堆
def build_max_heap(arr):
    # 从最后一个非叶子结点开始调整大顶堆
    for i in range(len(arr) // 2 - 1, -1, -1):
        max_heapify(arr, i, len(arr))

# 调整大顶堆，heap_size 表示剩余未排序的数字的数量
def max_heapify(arr, i, heap_size):
    l = 2 * i + 1
    r = l + 1
    # 记录根结点、左子树结点、右子树结点三者中的最大值下标
    largest = i
    if l < heap_size and arr[l] > arr[largest]:
        largest = l
    if r < heap_size and arr[r] > arr[largest]:
        largest = r
    if largest != i:
        arr[i], arr[largest] = arr[largest], arr[i]
        max_heapify(arr, largest, heap_size)

arr = [5, 3, 8, 6, 2, 7, 4, 1]
heap_sort(arr)
print(arr)

[1, 2, 3, 4, 5, 6, 7, 8]


### 题
给定一个整数数组`nums`，将该数组升序排列
-  不使用任何内置函数 的情况下解决问题，时间复杂度为$O(nlog(n))$，并且空间复杂度尽可能小

**归并排序**

In [5]:
class Solution:
    def sortArray(self, nums: List[int]) -> List[int]:
        return self.merge_sort(nums, 0, len(nums) - 1)

    def merge_sort(self, nums, start, end):
        if start == end:
            return [nums[start]]
        middle = (start + end) // 2
        left = self.merge_sort(nums, start, middle)
        right = self.merge_sort(nums, middle + 1, end)
        return self.merge(left, right)

    def merge(self, left, right):
        arr = []
        index1, index2 = 0, 0
        while index1 < len(left) and index2 < len(right):
            if left[index1] <= right[index2]:
                arr.append(left[index1])
                index1 += 1
            else:
                arr.append(right[index2])
                index2 += 1
        arr.extend(left[index1:])
        arr.extend(right[index2:])
        return arr

Solution().sortArray([5,2,3,1])

[1, 2, 3, 5]

**堆排序**

In [8]:
class Solution:
    def sortArray(self, nums: List[int]) -> List[int]:
        n = len(nums)
        # 构建最大堆
        for i in range(n // 2 - 1, -1, -1):
            self.heapify(nums, i, n)

        # 逐步取出堆顶元素
        for i in range(n - 1, 0, -1):
            nums[i], nums[0] = nums[0], nums[i]
            self.heapify(nums, 0, i)

        return nums

    def heapify(self, nums, i, n):
        largest = i
        left = 2 * i + 1
        right = left + 1

        if left < n and nums[left] > nums[largest]:
            largest = left
        if right < n and nums[right] > nums[largest]:
            largest = right

        if largest != i:
            nums[i], nums[largest] = nums[largest], nums[i]
            self.heapify(nums, largest, n)

Solution().sortArray([5,2,3,1])

[1, 2, 3, 5]