# 排序算法

- 排序是计算机最常见的操作之一
- 排序就是将一组杂乱无章的数据按一定规律排列起来（递增或递减）
- 排序的对象可以是数字型，也可以是字符型，按其对应的`ASCII`码的顺序排列

## 5.2 选择排序

- 选择排序（升序）：
 每次在若干无序的数据中查找最小的数，放在无序数据的首位。
    - 从$N$个元素的列表中找最小值及其下标，与第一个元素交换
    - 从第二个元素开始的$N-1$个元素中找最小值及其下标，与第二个元素交换
    - 以此类推，$N-1$轮后即为排序好的数据

选择排序算法实现（升序）：

In [1]:
a = [49, 38, 65, 97, 76, 13, 27, 49]

for i in range(len(a) - 1):          # 控制轮次，只进行n-1次
    m = i                            # 标记i的位置
    for j in range(i+1, len(a)):     # 找最小值，从i+1开始
        if a[j] < a[m]:
            m = j                    # 用m标记最小值的下标
    # m和i交换，借助第三个变量
    temp = a[i]
    a[i] = a[m]
    a[m] = temp

print(a)

[13, 27, 38, 49, 49, 65, 76, 97]


使用Python提供的特殊语法进行两个数交换：a, b = b, a

In [2]:
a = [49, 38, 65, 97, 76, 13, 27, 49]

for i in range(len(a) - 1):
    m = i
    for j in range(i+1, len(a)):
        if a[j] < a[m]:
            m = j
    a[i], a[m] = a[m], a[i]
    
print(a)

[13, 27, 38, 49, 49, 65, 76, 97]


选择排序算法分析：
- 选择排序共需比较$N-1$轮，总共的比较次数为：$(N-1)+(N-2)+...+2+1=N(N-1)/2$
- 选择排序执行的交换次数为$N-1$

## 5.2 冒泡排序

冒泡排序（升序）：
- 第一轮比较：从第一个元素开始，按顺序对列表中的所有N个元素中连续的两个元素进行两两比较，如果两者不满足升序关系则交换。第一轮后，最大数降下沉到列表最后
- 第二轮比较：从第一个元素开始，对列表中前$N-1$个元素进行两两比较，使次大数沉到最后
- 以此类推，$N-1$轮后，排序完毕

In [3]:
a = [77, 42, 35, 12, 101, 5]

for i in range(len(a) - 1):
    for j in range(len(a) - i - 1):
        if a[j] > a[j+1]:
            a[j], a[j+1] = a[j+1], a[j]
            
print(a)

[5, 12, 35, 42, 77, 101]


冒泡排序算法改进：
- 如果在某一轮比较中，一次交换也没有执行过，就说明已经排好序了。

In [4]:
a = [77, 42, 35, 12, 101, 5]

for i in range(len(a) - 1):
    flag = True       # 假设当前列表是排好序的
    for j in range(len(a) - 1 - i):
        if a[j] > a[j+1]:
            a[j], a[j+1] = a[j+1], a[j]      # 如果发生交换，将flag立为False
            flag = False
    if flag == True:
        break

print(a)

[5, 12, 35, 42, 77, 101]


冒泡排序算法分析：
- 算法主要的消耗时间是比较的次数
- 冒泡排序共需比较$N-1$轮，总共的次数为：$(N-1)+(N-2)+...+2+1=N(N-1)/2$
- 冒泡排序执行交换的次数不确定
- 冒泡排序是一种效率很低的排序算法

## 5.3 函数

函数：
- 函数用于在程序中分离不同的任务
- 实现结构化程序设计
- 减少程序复杂度
- 实现代码的复用
- 提高代码的质量
- 协作开发
- 实现特殊功能（递归）

In [None]:
问题1:判断一个数是否是素数

In [11]:
n = int(input('Please enter a number: '))

for i in range(2, n):
    if n % i == 0:
        print('Not a prime number')
        break
else:
    print('%d is a prime number'%n)

Please enter a number: 35
Not a prime number


**注：上面代码中`else`是和`for`循环并列的，这样也是可以的**

问题2：编写函数判定一个数是否是素数，并调用其输出200以内的素数

In [14]:
def is_prime(a):
    for i in range(2, a):      
        if a % i == 0:
            return False
    else:
        return True
for j in range(2, 200):
    if is_prime(j) == True:
        print(j, end=',')

2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59,61,67,71,73,79,83,89,97,101,103,107,109,113,127,131,137,139,149,151,157,163,167,173,179,181,191,193,197,199,

上述代码可以用一个初等数学中的一个结论可以减少开方级的计算量：整数的因子，一个因子必定大于或等于整数的平方根，另一个因子必定小于或等于整数的平方根

In [16]:
import math

def is_prime(a):
    m = int(math.sqrt(a))
    for i in range(2, m+1):
        if a % i == 0:
            return False
    else:
        return True
for i in range(2, 200):
    if is_prime(i) == True:
        print(i, end=',')

2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59,61,67,71,73,79,83,89,97,101,103,107,109,113,127,131,137,139,149,151,157,163,167,173,179,181,191,193,197,199,

问题3:将冒泡排序算法写成函数形式：

In [18]:
def bubble_sort(a):
    for i in range(len(a)-1):
        for j in range(len(a)-i-1):
            if a[j] > a[j+1]:
                a[j], a[j+1] = a[j+1], a[j]
                
a = [77, 42, 35, 12, 101, 5]
bubble_sort(a)
print(a)

[5, 12, 35, 42, 77, 101]


递归函数：自调用函数，在函数体内部直接或间接调用自己

问题4:编写函数求$n$的阶乘

In [19]:
# 非递归方法
def factorial(n):
    s = 1
    for i in range(1, n+1):
        s = s * i
    return s
factorial(5)

120

In [21]:
# 递归方法
def factorial(n):
    if n == 1:
        return 1
    else:
        s = n * factorial(n-1)          # n! = n*(n-1)!
        return s

factorial(5)

120

## 5.4 归并排序

归并排序：
- 将包含$N$个元素的列表拆分成两个含$N/2$个元素的字列表
- 对两个子列表递归调用归并排序（最后可以将整个列表分解为$N$个子列表）
- 合并两个已排好序的列表

归并排序算法实现：

In [3]:
def merge(left, right):        # 合并两个子列表(两个已经排好序的子列表)
    merged = []
    i, j = 0, 0                     # i和j分别是left和right的下标
    
    # len_left, len_right = len(left), len(right)
    while i < len(left) and j < len(right):
        if left[i] <= right[j]:
            merged.append(left[i])
            i += 1
        else:
            merged.append(right[j])
            j += 1
            
    merged.extend(left[i:])        # 归并左子列表剩余元素
    merged.extend(right[j:])      # 归并右子列表剩余元素
    print(left, right, merged)
    return merged

In [5]:
def mergeSort(a):        # 归并排序
    if len(a) <= 1:          # 空或者只有一个元素，直接返回列表
        return a
    mid = len(a) // 2
    left = mergeSort(a[:mid])
    right = mergeSort(a[mid:])
    return merge(left, right)

a = [98, 23, 45, 14, 6, 67, 33, 42]
a1 = mergeSort(a)
print(a1)

[98] [23] [23, 98]
[45] [14] [14, 45]
[23, 98] [14, 45] [14, 23, 45, 98]
[6] [67] [6, 67]
[33] [42] [33, 42]
[6, 67] [33, 42] [6, 33, 42, 67]
[14, 23, 45, 98] [6, 33, 42, 67] [6, 14, 23, 33, 42, 45, 67, 98]
[6, 14, 23, 33, 42, 45, 67, 98]


归并排序算法的分析：
- 归并排序需要将列表一步步拆分成子列表，共$log_{2}N$步
- 每一步都相当于需要合并$N$个元素的有序列表，最大比较次数是$N$次
- 归并排序需要至多$Nlog_{2}N$次比较
- 归并排序要比冒泡排序和选择排序快的多

Python语言系统提供的排序算法：底层采用了一种归并排序算法实现
- Python的列表类型提供`sort()`方法

In [6]:
a = [98, 23, 45, 14, 6, 67, 33, 42]
a.sort()      # 默认升序排序
print(a)

[6, 14, 23, 33, 42, 45, 67, 98]


In [7]:
a = [98, 23, 45, 14, 6, 67, 33, 42]
a.sort(reverse=True)       # 降序排序
print(a)

[98, 67, 45, 42, 33, 23, 14, 6]


- Python的内置函数`sorted`

In [8]:
a = [98, 23, 45, 14, 6, 67, 33, 42]
b = sorted(a)             # 降序采用sorted(a, reverse=True)
print(a)
print(b)

[98, 23, 45, 14, 6, 67, 33, 42]
[6, 14, 23, 33, 42, 45, 67, 98]
