# 排序的基本概念和分类

## 基本概念
### 定义
排序，就是使一串记录，按照其中的某个或某些关键字的大小，递增或递减的排列起来的操作。排序算法，就是如何使得记录按照要求排列的方法。

### 稳定性：
经过某种排序后，如果两个记录序号同等，且两者在原无序记录中的先后秩序依然保持不变，则称所使用的排序方法是稳定的，反之是不稳定的。

### 内排序和外排序
内排序：排序过程中，待排序的所有记录全部放在内存中
外排序：排序过程中，使用到了外部存储。
通常讨论的都是内排序。

### 影响内排序算法性能的三个因素：
时间复杂度：即时间性能，高效率的排序算法应该是具有尽可能少的关键字比较次数和记录的移动次数
空间复杂度：主要是执行算法所需要的辅助空间，越少越好。
算法复杂性。主要是指代码的复杂性。

### 分类
根据排序过程中借助的主要操作，可把内排序分为：

- 插入排序
- 交换排序
- 选择排序
- 归并排序

按照算法复杂度可分为两类：

- 简单算法：包括冒泡排序、简单选择排序和直接插入排序
- 改进算法：包括希尔排序、堆排序、归并排序和快速排序

# 冒泡排序

冒泡排序（Bubble sort）：

时间复杂度O(n^2)

交换排序的一种。其核心思想是：两两比较相邻记录的关键字，如果反序则交换，直到没有反序记录为止。

In [5]:
class SQList:
    '''
    冒泡排序（升序排列）
    '''
    def bubble_sort(self, nums):
        """
        冒泡排序，时间复杂度O(n^2)
        """
        length = len(nums)
        for i in range(length):
            # After each loop, a^(i)[i] = min{a^(i)[i:]},
            # where a^(i) is the array in the i-th loop
            j = length-2
            while j >= i:
                if nums[j] > nums[j+1]:
                    nums[j], nums[j+1] = nums[j+1], nums[j]
                j -= 1
        return nums
    
    def bubble_sort_advance(self, nums):
        """
        冒泡排序改进算法，时间复杂度O(n^2)
        设置flag，当一轮比较中未发生交换动作，则说明后面的元素其实已经有序排列了。
        对于比较规整的元素集合，可提高一定的排序效率。
        """
        length = len(nums)
        flag = True
        i = 0
        while i < length and flag:
            flag = False
            j = length - 2
            while j >= i:
                if nums[j] > nums[j + 1]:
                    nums[j], nums[j+1] = nums[j+1], nums[j]
                    flag = True
                j -= 1
            i += 1
        return nums

In [6]:
sqnumst = SQList()
nums = [4,1,7,3,8,5,9,2,6]

In [8]:
%%timeit
sqnumst.bubble_sort(nums)

4.94 µs ± 138 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [9]:
%%timeit
sqnumst.bubble_sort_advance(nums)

1.15 µs ± 16.1 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


# 简单选择排序
简单选择排序（simple selection sort）:时间复杂度O(n^2)

通过n-i次关键字之间的比较，从n-i+1个记录中选出关键字最小的记录，并和第i（1<=i<=n)个记录进行交换。

通俗的说就是，对尚未完成排序的所有元素，从头到尾比一遍，记录下最小的那个元素的下标，也就是该元素的位置。再把该元素交换到当前遍历的最前面。其效率之处在于，每一轮中比较了很多次，但只交换一次。因此虽然它的时间复杂度也是O(n^2)，但比冒泡算法还是要好一点。

In [17]:
class SQList:
    def select_sort(self, nums):
        """
        简单选择排序，时间复杂度O(n^2)
        """
        length = len(nums)
        for i in range(length):
            # After each loop, a^(i)[i] = min{a^(i)[i:]},
            # where a^(i) is the array in the i-th loop
            for j in range(i+1, length):
                if nums[i] > nums[j]:
                    nums[i], nums[j] = nums[j], nums[i]
        return nums     
sqnumst = SQList()
nums = [4,1,7,3,8,5,9,2,6]

In [18]:
%%timeit
sqnumst.select_sort(nums)

4.58 µs ± 123 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


# 直接插入排序
直接插入排序（Straight Insertion Sort）:时间复杂度O(n^2)

基本操作是将一个记录插入到已经排好序的有序表中，从而得到一个新的、记录数增1的有序表。