# 汉诺塔问题 (hanoi)

递归的两个要素：
1. 调用自身
2. 递归终止条件


In [None]:
def hanoi(n, A, B, C):
    """
    # 把n个盘子从A经过B移动到C
    :param n: n个盘子
    :param A: 表示A柱子
    :param B: 表示B柱子
    :param C: 表示C柱子
    :return: 盘子的移动顺序
    """

    if n > 0:  # 递归在终止条件
        hanoi(n-1, A, C, B)
        print("moving from %s to %s" % (A, C))
        hanoi(n-1, B, A, C)


# 测试
hanoi(3, 'A', 'B', 'C')

moving from A to C
moving from A to B
moving from C to B
moving from A to C
moving from B to A
moving from B to C
moving from A to C


# 顺序查找 (linear search)

顺序查找，也叫线性查找。
1. 时间复杂度: O(n)
2. 内置查找函数: index()

In [None]:
def linear_search(li, val):
    """

    :param li: 列表
    :param val: 待查找的元素
    :return: 元素下标或者‘None'/'-1’
    """
    for i in range(len(li)):  # 注意range()函数包头不包尾
        if li[i] == val:
            return i
            break
    else:
        return None


# 还可以用enumerate()函数
def linear_search_1(li, val):
    for index, value in enumerate(li):
        if value == val:
            return index
    else:
        return None


# 测试
li = [1, 2, 3, 5, 7, 10]
print(linear_search(li, 10))
print(linear_search_1(li, 10))

# 二分查找 (binary search)

二分查找，也叫折半查找

要求: 有序列表

时间复杂度: O(logn)

In [None]:
from cal_time import *


@cal_time
def binary_search(li, val):
    left = 0
    right = len(li)-1
    while left <= right:  # 候选区有值
        mid = (left + right) // 2
        if li[mid] == val:
            return mid
            break
        elif li[mid] > val:  # 要找的值在mid左侧
            right = mid - 1
        else:  # li[mid < val  # 要找的值在mid右侧
            left = mid + 1
    else:
        return None

# 测试
# li = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# print(binary_search(li, 2))


# 比较线性查找和二分查找的时间复杂度
@cal_time
def linear_search_1(li, val):
    for index, value in enumerate(li):
        if value == val:
            return index
    else:
        return None


li = list(range(100000))
linear_search_1(li, 3890)
binary_search(li, 3890)

# 冒泡排序 (bubble sort)

排序：使无序数列变为有序数列
内置函数：sort()
排序方法：
1. LowB三人组：冒泡排序，选择排序，插入排序
2. NB三人组：快速排序，堆排序，归并排序
3. 其它：希尔排序，桶排序，计数排序，基数排序

冒泡排序原理：
1. 列表每两个相邻的数，如果前面比后面大，则交换这两个数
2. 一趟排序后，则无序区减少一个数，有序区增加一个数
因为有两个for循环，时间内复杂度：O(n^2)

In [None]:
def bubble_sort(li):
    n = len(li)
    for i in range(n-1):  # range(n-1)是从0取到n-2，共n-1个数。一共排n-1趟。
        for j in range(n-1-i):  # 第0趟，指针j最后停在n-2, 第1趟，指针j最后停在n-3...
            if li[j] > li[j+1]:
                li[j], li[j+1] = li[j+1], li[j]
    return li


# 测试
import random

li = list(range(100))
random.shuffle(li)
print(li)
print(bubble_sort(li))

# 除了random.shuffle()，还可以用random.randint()生成随机列表
lis = [random.randint(0, 10000) for _ in range(10)]
# 表示生成10个范围在(0-10000)之间的随机整数
print(lis)
print(bubble_sort(lis))


# 改进版冒泡排序原理：
# 如果一趟排序没有发生任何交换，则意味着数列已经有序
def bubble_sort_1(li):
    n = len(li)
    for i in range(n-1):  # range(n-1)是从0取到n-2，共n-1个数。一共排n-1趟。
        exchange = False
        for j in range(n-1-i):  # 第0趟，指针j最后停在n-2, 第1趟，指针j最后停在n-3...
            if li[j] > li[j+1]:
                li[j], li[j+1] = li[j+1], li[j]
                change = True
        if not exchange:
            return li
            break
    return li


# 测试
li = list(range(100))
random.shuffle(li)
print(li)
print(bubble_sort_1(li))

# 选择排序 (select sort)

选择排序原理：
1. 每次从当前剩余列表中选择一个最小的数
2. 列表元素减一

In [None]:
def select_sort(li):
    n = len(li)
    new_li = []
    for i in range(n):  # 走n趟
        min_val = min(li)
        li.remove(min_val)
        new_li.append(min_val)
    return new_li


# 测试
import random
li = list(range(100))
random.shuffle(li)
print(li)
print(select_sort(li))

# 上述选择排序有两个缺点：
# 1. 开了一个新列表，占内存
# 2. 利用了min()和append()这样时间复杂度为O(n)的函数


# 新版本
# 时间复杂度：O(n^2)
def select_sort_1(li):
    n = len(li)
    for i in range(n-1):  # i表示第几趟,一共需要n-1趟
        min_loc = i
        for j in range(i+1, n):  # j表示当前无序区的遍历指针
            if li[j] < li[min_loc]:
                li[j], li[min_loc] = li[min_loc], li[j]
        # 循环完毕后无序区最小的数处在无序区第一个位置
    # 循环完毕后列表已经有序
    return li


# 或者
def select_sort_2(li):
    n = len(li)
    for i in range(n-1):  # i表示第几趟,一共需要n-1趟
        min_loc = i
        for j in range(i+1, n):  # j表示当前无序区的遍历指针
            if li[j] < li[min_loc]:
                min_loc = j
        # 循环完毕后无序区最小的数的序号是min_loc
        # 将此最小值与无序区第一个数做交换
        li[min_loc], li[i] = li[i], li[min_loc]
    return li

    # 循环完毕后列表已经有序


# 测试
import random
li = list(range(100))
random.shuffle(li)
print(li)
print(select_sort_1(li))
print(select_sort_2(li))

# 插入排序 (insert sort)

插入排序原理：
1. 初始时手里（有序去）只有一张牌
2. 每次从无序区摸一张牌，插到手里已有牌的正确位置

时间复杂度：O(n^2)

In [None]:
def insert_sort(li):
    n = len(li)
    for i in range(1, n):  # 从第二张开始摸，需要摸n-1次, i表示当前摸到的牌的下标
        j = i - 1  # j指的是手中最后一张牌的下标
        tmp = li[i]
        while j >= 0 and tmp < li[j]:  # 摸到的牌需要倒着遍历有序区元素从而插到正确的位置
              li[j+1] = li[j]
              j -= 1
        # while 结束可能是因为
        # 1. li[j]<tmp
        # 2. j=-1
        # 两种情况都需要把tmp插入到j后面的位置
        li[j+1] = tmp
    return li


# 测试
import random
li = list(range(100))
random.shuffle(li)
print(li)
print(insert_sort(li))

# 快速排序 (quick sort)

快速排序原理：
运用递归的思想
1. 取第一个元素p，使其归位
2. 归位意味着,列表被p分为两个部分,左边元素都小于p,右边元素都大于p
3. 左右两边再分别递归. 递归终止条件为至少有两个元素

时间复杂度：O(nlogn)

快速排序存在两个问题：

1.递归深度:
* Python默认递归深度为999，如果需要改动：
* import sys
* sys.setrecursionlimit(10000)
2.最坏情况：

数列为倒序，在这种情况下，每次partition并没有把数列近似对半，而是每次只少一个元素，此时时间复杂度为O(n^2)
* 解决方法：随机选取一个数和列表第一个数做交换，然后以它作为开始归位元素

In [None]:
def partition(li, left, right):
    tmp = li[left]
    while left < right:
        while left < right and li[right] >= tmp:
            # 这里left < right是防止一直找不到比tmp小的数，right超出-1
            # 如果right一直左移直到等于left,说明值全部比tmp大，则直接退出整个循环
            right -= 1
        li[left] = li[right]
        while left < right and li[left] <= tmp:
            left += 1
        li[right] = li[left]
    # 循环结束时，left=right, 且当前位置为空，放回tmp
    li[left] = tmp
    mid = left
    return mid


def quick_sort(li, left, right):
    if left < right:  # 子列表至少有两个元素，一个的话就有序了，不用递归
        mid = partition(li, left, right)
        quick_sort(li, left, mid-1)
        quick_sort(li, mid+1, right)
    return li


# 不想传入left和right，可以把函数包装起来
# 不能再quick_sort()函数里给left和right传值，因为需要递归调用quick_sort()函数
# 但是可以在quick_sort_1()中赋值，因为其只运行一次，没有递归使用
def quick_sort_1(li):
    left = 0
    right = len(li) - 1
    quick_sort(li, left, right)
    return li


# 测试
import random
li = list(range(50))
random.shuffle(li)
print(li)
print(quick_sort_1(li))

# 堆排序 (heap sort)

树的基础知识：

树

二叉树：每个节点最多有两个孩子节点，或者说度不超过2的树

满二叉树：全部元素排满的二叉树

完全二叉树：从满二叉树中拿走最后几个元素 (排列顺序为从上到下，从左到右)


---


二叉树存储方式：1.链式存储 2.顺序存储(就是用列表)，我们此处用顺序存储方式


---


完全二叉树的父子节点关系：
  1. 父，左孩子，右孩子：i, 2i+1, 2i+2
  2. 子, 父: i, (i-1)//2


---


堆：一种特殊的完全二叉树结构

大根堆，小根堆

堆的向下调整：当根节点的左右子树都是堆时，可以通过一次向下调整来将其变成为一整个堆


---


堆排序原理：
1. 建立堆
2. 得到堆顶元素，为最大元素
3. 去掉堆顶，将堆最后一个元素放到堆顶，再通过一次向下调整重新使堆有序
4. 堆顶元素为第二大元素
5. 重复步骤3，直到堆变空

简记为：建立堆，挨个出数（从后取数，向下调整）


---


建立堆的方法：农村包围城市，从最后一个非叶子节点开始，做向下调整，直到到根（这样从最后一级往上调整完后，一定是个堆）

时间复杂度：O(nlogn)


---


Python内置模块-heapq, q代表queue
1. 常用函数 heapify(x)：建立一个小根堆
2. heappush(heap,item)：往里加元素
3. heappop(heap)：调用一次弹出一个最小的数

In [None]:
def sift(li, low, high):
    """
    :param li: 列表
    :param low: 堆的根节点位置
    :param high: 堆的最后一个元素的位置
    :return:
    """
    i = low  # 最开始指向根节点
    j = 2 * i + 1  # j是左孩子
    tmp = li[low]   # 把堆顶存起来
    while j <= high:  # 只要j位置有数，比较j处的数和tmp的大小
        if j+1 <= high and li[j+1] > li[j]:  # 如果右孩子有并且比较大
            j = j + 1   # j指向右孩子
        if li[j] > tmp:
            li[i] = li[j]
            i = j  # 往下看一层
            j = 2 * i + 1
        else:  # li[j] <= tmp
            li[i] = tmp  # 把tmp放在某一级领导位置上
            break
    else:
        li[i] = tmp   # 把tmp放在叶子节点上


def heap_sort(li):
    n = len(li)
    # 建堆
    for i in range((n-2)//2, -1, -1):
        # i表示建堆的时候调整的部分的根的下标
        sift(li, i, n-1)
    # 挨个出数（从后取数，向下调整）
    low = 0
    high = n-1
    while low < high:
        li[low], li[high] = li[high], li[low]
        high -= 1
        sift(li, low, high)
    return li


# 或者用for循环
def heap_sort_1(li):
    n = len(li)
    # 建堆
    for i in range((n-2)//2, -1, -1):
        # i表示建堆的时候调整的部分的根的下标
        sift(li, i, n-1)
    # 挨个出数（从后取数，向下调整）
    for i in range(n-1, -1, -1):
        li[0], li[i] = li[i], li[0]
        sift(li, 0, i-1)
    return li


# 测试
import random
li = list(range(50))
random.shuffle(li)
print(li)
print(heap_sort_1(li))

# topK问题——堆排序应用

topK 问题：在一个数列(n)里取出前K大的数
这个问题属于堆排序的一个应用
解决思路：
  1. 正常排序后切片：O(nlogn)
  2. 部分排序lowB三人组：O(nK)
  3. 部分堆排序：O(nlogK)  *最优

利用堆排序解决topK问题的原理：
  1. 取列表前K个元素建立一个小根堆。则堆顶元素就是目前第K大的数。
  2. 依次遍历原列表元素，如果元素小于堆顶，则忽略该元素；若元素大于堆顶
     则将堆顶换成该元素，并做一次调整
  3. 遍历完毕后，倒序弹出堆顶

In [None]:
# 调整小根堆的sift()函数
def sift(li, low, high):
    """
    :param li: 列表
    :param low: 堆的根节点位置
    :param high: 堆的最后一个元素的位置
    :return:
    """
    i = low  # 最开始指向根节点
    j = 2 * i + 1  # j是左孩子
    tmp = li[low]   # 把堆顶存起来
    while j <= high:  # 只要j位置有数，比较j处的数和tmp的大小
        if j+1 <= high and li[j+1] < li[j]:  # 如果右孩子有并且比较小
            j = j + 1   # j指向右孩子
        if li[j] < tmp:
            li[i] = li[j]
            i = j  # 往下看一层
            j = 2 * i + 1
        else:  # li[j] >= tmp
            li[i] = tmp  # 把tmp放在某一级领导位置上
            break
    else:
        li[i] = tmp   # 把tmp放在叶子节点上


def topK(li, k):
    heap = li[0:k]  # 同range()函数一样，包头不包尾
    # 取列表前K个数建小根堆
    # 注意之前的sift()函数调整大根堆，需要做符号上的改动
    for i in range((k-2)//2, -1, -1):
        # i表示建堆的时候调整的部分的根的下标
        sift(heap, i, k - 1)
    # 遍历元素
    for i in range(k, len(li)-1):
        if li[i] > heap[0]:
            heap[0] = li[i]
            sift(heap, 0, k-1)
    # 循环结束后倒序弹出元素
    for i in range(k-1, -1, -1):
        heap[0], heap[i] = heap[i], heap[0]
        sift(heap, 0, i-1)
    return heap


# 测试
import random
li = list(range(50))
random.shuffle(li)
print(li)
print(topK(li, 5))

# 归并排序 (merge sort)

归并(merge)：将两段有序的列表合成为一个有序列表的操作

归并排序原理：
1. 分解：将列表越分越小，直至分成一个元素
2. 递归终止条件：一个元素是有序的
3. 合并：将两个有序列表归并，列表越来越大

简记：先分解再合并

时间复杂度：O(nlogn)

空间复杂度：O(n)

因为 merge()函数开了一个新列表ltmp

In [None]:
def merge(li, low, mid, high):
    """

    :param li: 数列
    :param low: 左边数列第一个值的下标
    :param mid: 左边数列最后一个值的下标，也是右边数列第一个值前面那个数的下标
    :param high: 右边数列第一个值的下标
    :return:
    """
    i = low
    j = mid + 1   # i,j表示两段有序列表的起始端下标
    ltmp = []
    while i <= mid and j <= high:  # 只要左右两边都有数
        if li[i] < li[j]:
            ltmp.append(li[i])
            i += 1
        else:
            ltmp.append(li[j])
            j += 1
    # while执行完，肯定有一部分没数了
    while i <= mid:
        ltmp.append(li[i])
        i += 1
    while j <= high:
        ltmp.append(li[j])
        j += 1
    # 覆盖原数列
    li[low:high+1] = ltmp
    return li


# 测试merge()函数
# li = [5, 6, 8, 1, 2, 4]
# print(merge(li, 0, 2, 5))


def merge_sort(li, low, high):
    if low < high:  # 至少有两个元素
        # 注意这个 if 千万不能写成 while，写 while 的本身就会循环！！！
        mid = (low+high)//2
        merge_sort(li, low, mid)
        merge_sort(li, mid+1, high)
        merge(li, low, mid, high)
    return li


# 测试
import random
li = list(range(50))
random.shuffle(li)
print(li)
print(merge_sort(li, 0, len(li)-1))

# 排序小结

![](https://drive.google.com/uc?export=view&id=1_2y1df1f7Pzbm5brGj0fQsuTHGrfVDLe)
![](https://drive.google.com/uc?export=view&id=1e8kmmUzFXbPyTNvxMIU-4TLGz0QkmRbs)


# 希尔排序 (Shell sort)——分组版插入排序

希尔排序：是一种分组插入排序算法
原理：
1. 首先取一个整数d1=n/2, 将元素分为d1组，每组相邻量元素间隔为d1, 在组内进行插入排序
2. 取d2=d1/2, 重复上述分组排序过程，直到di=1，然后所有元素在同一组内进行一次插入排序

注意：希尔排序每趟并不是使某些元素有序，而是使整体数据越来越接近有序；最后一趟排序使得所有数据有序。

希尔排序的时间复杂度与选取的gap值有关，但总体来说比NB三人组慢，比LowB三人组快。

In [None]:
def insert_sort_gap(li, gap):  # 这里需要考虑gap, 所以在原有插入排序的基础上做了一些改动
    n = len(li)
    for i in range(gap, n):  # 从第二张开始摸，需要摸n-1次, i表示当前摸到的牌的下标
        j = i - gap  # j指的是手中最后一张牌的下标
        tmp = li[i]
        while j >= 0 and tmp < li[j]:  # 摸到的牌需要倒着遍历有序区元素从而插到正确的位置
              li[j+gap] = li[j]
              j -= gap
        # while 结束可能是因为
        # 1. li[j]<tmp
        # 2. j=-gap
        # 两种情况都需要把tmp插入到j后面间隔gap的位置
        li[j+gap] = tmp
    return li


def shell_sort(li):
    d = len(li) // 2
    while d >= 1:
        insert_sort_gap(li, d)
        d //= 2
    # d=1 后再做最后一次插入排序
    return li


# 测试
import random
li = list(range(100))
random.shuffle(li)
print(li)
print(shell_sort(li))

[57, 19, 74, 44, 24, 90, 92, 41, 53, 50, 76, 51, 22, 79, 58, 30, 65, 32, 13, 6, 82, 87, 52, 62, 89, 70, 39, 63, 83, 23, 43, 26, 86, 75, 9, 38, 59, 72, 1, 56, 93, 2, 34, 96, 47, 99, 88, 5, 98, 35, 45, 42, 4, 61, 67, 91, 64, 15, 28, 46, 40, 33, 11, 0, 36, 69, 48, 66, 80, 95, 18, 68, 71, 10, 81, 60, 97, 8, 31, 16, 27, 21, 78, 55, 73, 20, 37, 54, 12, 7, 49, 14, 84, 3, 25, 77, 29, 94, 85, 17]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]


# 计数排序 (count sort)

要求: 已知列表中的数范围都在0到100之间，（但列表可能很长），设计时间复杂度为O(n)的算法

优点：快

缺点：有要求，必须知道列表的数值范围max；而且需要占用空间，开一个长度为max+1长的列表。如果数值范围在一亿，却只有5个数，就要开一个一亿+1的列表，很不划算


In [None]:
def count_sort(li, max_count=100):   # 默认数值范围在0-100之间
    count = [0 for _ in range(max_count+1)]   # 计数列表长度应该为101
    # 生成一个长度为101的值全部为0的列表
    for val in li:
        # 不要只记得用 for i in range()， 这个是用来取下标的
        # 此处需要取值
        count[val] += 1
    # 循环结束后，已经计数完毕
    li.clear()
    for ind, num in enumerate(count):
        for i in range(num):
            li.append(ind)
    return li


# 测试
import random
li = [random.randint(0, 100) for _ in range(1000)]
# 生成一个长度为1000的值为random.randint(0, 100)的列表 
print(li)
count_sort(li)
print(li)

[53, 24, 28, 28, 48, 30, 89, 16, 12, 11, 13, 21, 4, 85, 95, 26, 45, 1, 25, 75, 46, 2, 61, 70, 25, 28, 23, 24, 98, 76, 60, 53, 79, 78, 19, 96, 92, 63, 41, 75, 27, 15, 77, 35, 11, 3, 53, 96, 83, 25, 6, 64, 16, 96, 23, 16, 70, 50, 33, 67, 74, 5, 22, 68, 93, 8, 98, 79, 64, 8, 83, 14, 4, 29, 52, 93, 72, 48, 3, 85, 16, 100, 13, 33, 24, 78, 55, 93, 77, 89, 4, 17, 29, 90, 50, 60, 11, 35, 14, 46, 32, 97, 78, 21, 14, 9, 75, 63, 59, 22, 42, 62, 85, 80, 21, 50, 36, 43, 29, 41, 63, 96, 89, 53, 6, 23, 30, 61, 91, 83, 99, 88, 38, 13, 48, 61, 97, 68, 28, 97, 72, 32, 3, 26, 76, 45, 18, 59, 71, 58, 37, 80, 3, 82, 67, 0, 1, 28, 16, 61, 14, 55, 91, 45, 56, 37, 91, 48, 94, 49, 73, 3, 16, 12, 68, 0, 20, 82, 61, 36, 52, 31, 100, 77, 75, 70, 29, 34, 92, 9, 60, 87, 10, 19, 36, 3, 70, 43, 41, 92, 87, 23, 38, 68, 98, 83, 59, 70, 34, 81, 51, 73, 17, 84, 56, 59, 43, 31, 64, 55, 33, 28, 76, 85, 26, 47, 29, 7, 33, 82, 27, 0, 13, 19, 50, 44, 51, 55, 85, 44, 62, 81, 41, 47, 51, 8, 3, 90, 24, 37, 28, 71, 53, 61, 88, 38

# 桶排序 (bucket sort)——解决计数排序的缺点


在计数排序中，如果元素范围比较大（比如一到一亿），如何改造算法?

桶排序原理（bucket sort）:首先将元素分在不同的桶中，再对每个桶中的元素排序

桶排序的表现取决于数据的分布，需要对不同数据排序时采取不同的分部策略。

平均情况时间复杂度: O(n+k)

最坏情况时间复杂度: O(n^2k)

空间复杂度：O(nk)

In [None]:
# 额外需要两个参数，一个是数值范围，还有桶的个数
def bucket_sort(li, n=100, max_num=10000):  # 一共100个桶
    buckets = [[] for _ in range(n)]
    # 100个[]桶，每个桶也是一个列表
    for val in li:
        i = min(val//(max_num//n), n-1)
        # i 表示val放在几号桶里
        # 但当val=10000时，没有100号桶，所以放在最后一个桶里，即n-1号
        buckets[i].append(val)
        # 把元素放入桶内
        # 桶内元素放入后直接排序
        for j in range(len(buckets[i])-1, 0, -1):
            # [0, 2, 4, 1]
            # 这里需要注意两点
            # 1. j到1处结束,因为j需要和j-1比较，所以要确保j-1存在
            # 2.** 当桶内只有一个元素时,我们有range(0,0,-1),
            #      相当于从0倒着到1(包头不包尾)，在我们看来是错误的，
            #      但其实python不会报错，只是不运行此段程序，就不会比较交换
            #      当有第二个元素时，才进行比较交换
            if buckets[i][j] < buckets[i][j-1]:
                buckets[i][j], buckets[i][j-1] = buckets[i][j-1], buckets[i][j]
            else:
                break
    # 循环结束后所有元素有序入子桶
    # 把桶中元素依次输出
    sorted_li = []
    for buc in buckets:
        sorted_li.extend(buc)
        # append添加进去的是子列表，带有[], extend是直接延长
    return sorted_li


import random
li = [random.randint(0, 10000) for _ in range(1000)]
# 生成一个长度为1000的值为random.randint(0, 100)的列表
print(li)
print(bucket_sort(li))

[6980, 2452, 725, 609, 8370, 2567, 815, 7689, 5890, 2044, 6674, 5576, 6429, 3949, 3204, 2018, 1020, 3365, 2466, 9560, 1419, 6067, 7663, 8956, 9568, 4930, 4226, 9995, 1677, 5593, 4779, 632, 3894, 1337, 3292, 3825, 6109, 1560, 5103, 4072, 8349, 6081, 6409, 400, 6015, 2788, 1257, 2635, 9299, 6776, 8620, 3691, 5592, 8936, 4245, 2641, 8200, 5188, 7074, 9144, 8495, 6695, 7454, 1414, 2525, 5829, 6814, 6998, 7741, 2670, 7882, 2703, 6737, 8731, 6476, 1723, 1863, 1111, 1496, 2639, 1382, 1987, 8267, 7690, 3607, 9237, 4689, 9260, 1327, 9619, 7080, 2274, 576, 2526, 3332, 7112, 3611, 149, 2235, 1481, 1003, 9779, 9190, 1679, 5901, 9970, 2715, 4495, 4719, 8591, 1719, 4745, 5415, 3542, 1990, 3420, 5044, 4236, 5247, 2370, 2782, 1874, 835, 3115, 7904, 5513, 6409, 7859, 7743, 6250, 1486, 4632, 6092, 8387, 9312, 3625, 4331, 600, 1805, 7526, 8775, 1330, 1841, 4953, 8490, 6140, 3867, 5497, 2010, 7526, 6030, 5750, 9790, 3391, 4924, 8992, 2218, 5615, 3896, 4335, 6863, 4093, 4304, 8819, 6541, 6266, 6658, 5822, 

In [None]:
# 举例说明range(0, 0, -1)不会报错
for j in range(1, 0, -1): # 从1倒着到1
  print(j)
for i in range(0, 0, -1): # 从0倒着到1
  print(i)

1


# 基数排序 (radix sort)——桶排序的延伸

这里的基数其实就是关键字的意思

多关键字排序：例如，假如现在有一个员工表，要求按照薪资排序，薪资相同的员工按照年龄排序

解决方法：关键字顺序反过来。先按照年龄排序，然后再按照薪资进行***稳定的***排序。 这样，薪资相同的员工一定是按照年龄排好序的

数排序: 比如排序两位数的列表，同样思路，可以先按个位数进行桶排序(0-9个桶)，排好后依次输出。再按照十位进行桶排序(0-9个桶)，排好后再依次输出即可。可以想像，十位相同的数，各位小的在前面。

基数排序虽然是桶排序的延伸，但二者是有区别的：
1. 桶排序：是分一次桶，然后在各个桶里排序
2. 基数排序：是分多次桶，先按第一个关键字分桶(桶内没有排序,之所以会排序，是因为桶是有序的，而且取出时按顺序取出)，按顺序取出，再按下一个关键字分桶。。。依次下去

时间复杂度: O(kn)

空间复杂度：O(k+n)

k 表示数字位数

速度比较:


*   计数排序时间复杂度为O(n)
*   NB三人组为O(nlogn)
*   所以谁快谁慢取决于k和logn大小。当数字范围很大（k大），而列表较小（n小）时，基数排序就没有快排效果好





In [None]:
def radix_sort(li):
    # 先得确定有多少位数
    max_num = max(li)
    # 最大值 99->2次，888->3次，10000->5次 (it=0,1,2,3,4)
    it = 0
    while 10 ** it <= max_num:  # it即iteration,循环多少位数次
        buckets = [[] for _ in range(10)]  # 桶编号为0-9
        for val in li:
            # 987 it=0 987//1=987 987%10=7 个位
            # 987 it=1 987//10=98 98%10=8 十位
            # 987 it=2 987//100=9 9%10=9 百位
            # (0)62  it=2 62//100=0  0%10=0 百位
            digit = (val//(10**it)) % 10
            buckets[digit].append(val)
        # 循环结束后按个位数入桶完毕
        # 按顺序取出
        li.clear()
        for buc in buckets:
            li.extend(buc)
        it += 1
    return li


import random
li = [random.randint(0, 1000) for _ in range(1000)]
# 生成一个长度为1000的值为random.randint(0, 100)的列表
print(li)
print(radix_sort(li))

[452, 673, 378, 230, 304, 212, 288, 119, 864, 938, 923, 740, 613, 856, 853, 318, 69, 623, 217, 819, 470, 317, 13, 374, 304, 594, 650, 328, 462, 821, 923, 354, 635, 628, 163, 956, 3, 557, 83, 659, 700, 780, 122, 686, 911, 471, 828, 260, 666, 341, 591, 899, 163, 216, 126, 730, 718, 722, 954, 761, 630, 428, 424, 901, 732, 838, 296, 356, 329, 747, 967, 955, 24, 59, 728, 577, 313, 982, 344, 298, 662, 219, 426, 760, 857, 369, 976, 214, 695, 238, 731, 679, 127, 881, 632, 268, 978, 331, 686, 596, 914, 917, 486, 846, 288, 56, 463, 898, 377, 264, 128, 685, 273, 591, 134, 879, 722, 585, 83, 307, 797, 873, 390, 634, 827, 684, 403, 152, 221, 294, 980, 543, 463, 58, 206, 468, 517, 138, 868, 182, 471, 582, 43, 94, 578, 820, 358, 958, 122, 59, 19, 577, 786, 617, 968, 974, 882, 339, 893, 945, 831, 490, 266, 512, 198, 264, 875, 8, 326, 24, 418, 167, 353, 950, 388, 396, 7, 309, 897, 474, 634, 353, 238, 660, 553, 530, 857, 790, 30, 497, 57, 597, 827, 582, 425, 823, 658, 996, 558, 20, 25, 686, 340, 63, 530

# 查找排序习题

## 习题1

给两个字符串s和t,判断t是否为s重新排列后组成的单词

*   s="anagram", t="nagaram", return true
*   s="rat", t="car", return false

In [None]:
# 我的思路：利用计数排序，然后对比每个字母个数是否一致
def judge(s , t):
    # 建立count列表，长度为26
    count_s = [0 for _ in range(26)]
    count_t = [0 for _ in range(26)]
    for str_s in s:
        num_s = ord(str_s) - 97
        # ord()函数返回字母的序号，从97-122
        # a的序号为97
        count_s[num_s] += 1
    for str_t in t:
        num_t = ord(str_t) - 97
        count_t[num_t] += 1
    # 两个循环结束后，均已统计完毕
    if count_t == count_s:
        return True
    else:
        return False


# 其他思路：排序s和t,然后看他们是否一致
# 排序可以直接使用sort()函数,不用自己造轮子了
def judge_1(s, t):
    ss = list(s)
    tt = list(t)
    # 先把字符串转换为列表，然后排序
    ss.sort()
    tt.sort()
    return ss == tt


def judge_2(s, t):
    return sorted(list(s)) == sorted(list(t))
# sorted()是返回一个新的列表，sort()是对原列表排序


def judge_3(s, t):
    dict1 = {}  # {'a':2, 'b':4, ...}
    dict2 = {}
    for ch in s:
        dict1[ch] = dict1.get(ch, 0) + 1
        # 不能写成 dict1[ch] += 1
        # 因为如果是第一次遇到'a', 则dict['a'] = 空
        # 空 不能加 1
    for ch in t:
        dict2[ch] = dict2.get(ch, 0) + 1
    return dict1 == dict2


# 测试
print(judge("anagram", "nagaram"))
print(judge("rat", "car"))
print(judge_3("anagram", "nagaram"))
print(judge_3("rat", "car"))

True
False
True
False


In [None]:
# 帮助理解dict的用法
dict = {'a':1, 'b':2}
print(dict.get('a'))
print(dict['a'])

1
1


## 习题2

给定一个有序的m*n的二维列表，查找某个数是否存在

有序: 从左到右，从上到下依次排好的

In [None]:
# 我的答案：利用魔法函数__contains__()
def search(matrix, target):
    li = []
    for line in matrix:
        li.extend(line)
    # 结束后list为一个一维列表
    return li.__contains__(target)


# 其他思路:利用in()函数
def search_1(matrix, target):
    for line in matrix:
        if target in line:
            return True
            # return之后函数结束，后面的代码不会再运行
    else:
        return False


# 利用二分查找
def search_2(matrix, target):
    h = len(matrix)  # 行数 3
    if h == 0:   # 注边界条件 matrix=[]
        return False
    w = len(matrix[0])  # 列数 4
    if w == 0:  # 注边界条件 matrix=[[],[],[]]
        return False
    left = 0  # 左指针
    right = h*w - 1  # 右指针
    """
    [
    [1, 2, 3, 4]
    [11, 12, 13, 14]
    [21, 22, 23, 24]
    ]
    """
    while left <= right:
        mid = (left + right) // 2   # (0+11)//2=5
        x = mid // w   # 5//4=1
        y = mid % w   # 5%4=1
        if matrix[x][y] > target:
            right = mid - 1
        elif matrix[x][y] == target:
            return True
        else:
            left = mid + 1
    else:
        return False


# 测试
ma = [[1, 2], [3, 4]]
print(search(ma, 1))
ma = [[1, 2], [3, 4]]
print(search_1(ma, 3))
ma = [[1, 2], [3, 4]]
print(search_2(ma, 5))

True
True
False


## 习题3

给定一个列表和一个整数，设计算法找到两个数的下标，使得两个数之和为给定的整数。

例如，列表[1,2,5,4]与目标数3，1+2=3，结果为（）

In [None]:
# 我的思路: 取列表第一个元素，然后从第二个依次遍历元素，看是否相加为target
#          再取第二个元素，然后从第三个依次遍历元素.....
# 时间复杂度大概为: O(1/2n^2)
def find_two(li, target):
    for i in range(len(li)):
        num1 = li[i]
        for j in range(i+1, len(li)):
            num2 = li[j]
            if num1 + num2 == target:
                return [i, j]
    else:
        return None


# 其他思路：先排序，然后利用二分查找
# 时间复杂度大概为: O(nlogn)
class Solution:  # 此处我们定义一个类
    # 先写二分查找函数
    def binary_search(self, li, left, right, val):
        while left <= right:
            mid = (left + right)//2
            if li[mid][0] == val:
                return mid
            elif li[mid][0] < val:
                left = mid + 1
            else:
                right = mid - 1
        else:
            return None

    def twosum(self, nums, target):  # 写两数之和函数
        # 排序之前需要把原列表数的下标存下来
        new_nums = [[num, i] for i, num in enumerate(nums)]
        new_nums.sort(key=(lambda x:x[0]))
        # lambda函数用法，相当于每次给sort函数传递一个元素x=[num, i]         
        # 然后取x[0]=num,以num值做排序。x是个变量，所以这里需要用lambda函数

        for i in range(len(new_nums)):
            a = new_nums[i][0]
            b = target - a
            if b >= a:
                j = self.binary_search(new_nums, i+1, len(new_nums)-1, b) 
                 # 调用类里其他函数需要用 self.xxx()
            else:
                j = self.binary_search(new_nums, 0, i-1, b)
            # 如果能找到j
            if j:
                return [new_nums[i][1], new_nums[j][1]]


# 测试
li = [2, 2, 2, 5, 4]
print(find_two(li, 7))
li = [2, 2, 2, 5, 4]
print(find_two(li, 4))
li = [1, 2, 5, 4]
print(find_two(li, 8))
li = [-1, 2, 5, 4]
print(find_two(li, 1))

print('----------------------')

li = [-1, 2, 5, 4]
solution = Solution()
print(solution.twosum(li, 1))

[0, 3]
[0, 1]
None
[0, 1]
----------------------
[0, 1]


# 数据结构

数据结构按照其*逻辑结构*(和物理结构不同)可以分为：

1.   线性结构：数据结构中的元素存在一对一的相互关系
2.   树结构：数据结构中的元素存在一对多的相互关系
3.   图结构：数据结构中的元素存在多对多的相互关系

物理结构: 指的是在计算机内实现该数据结构的结构。例如，之前我们讲的树(逻辑结构为树结构)，使用列表的方式(物理结构为列表结构)存储的。


# 列表(list)

列表(list)是一种基本数据类型

列表中的元素是顺序存储的

Python中列表的操作:按下表查找 O(1)，插入元素 **O**(n)，删除元素 O(n)....

Python中的列表和其他语言中“数组”的不同：


1.   列表中的元素类型可以不同
2.   列表长度不固定



In [None]:
# 列表中的元素类型可以不同
li = [1, 2, '3']
print(li)
type(li)

[1, 2, '3']


list

# 栈(stack)

栈(stack)是一个数据集合，可以理解为只能在一端进行插入或者删除操作的列表。

栈的特点: 后进先出 LIFO (last-in, first out)

栈的概念: 栈顶，栈底

栈的基本操作：


*   进栈：push
*   出栈: pop
*   取栈顶：gettop

栈的实现: 使用一般的列表结构即可实现栈


*   进栈：li.append
*   出栈: li.pop
*   取栈顶：li[-1]





In [None]:
class Stack:

    def __init__(self):
        self.stack = []
        # 使用列表[]实现栈

    def push(self, element):
        self.stack.append(element)

    def pop(self):
        if len(self.stack) > 0:
            return self.stack.pop()
        else:
            return None
        # list.pop 没有参数默认弹出列表最后一个元素

    def gettop(self):
        if len(self.stack) > 0:
            return self.stack[-1]
        else:
            return None


stack = Stack()
stack.push(1)
stack.push(2)
stack.push(3)
print(stack.pop())
print(stack.gettop())

## 栈的重要应用——括号匹配问题

括号匹配问题：给一个字符串，其中包含小括号，中括号，大括号，求该字符串中的括号是否匹配。

例如：


*   ()()[]{}, 匹配
*   {([])},   匹配
*   (){,    不匹配
*   {[}],   不匹配




In [None]:
class Stack:

    def __init__(self):
        self.stack = []
        # 使用列表实现栈

    def push(self, element):
        self.stack.append(element)

    def is_empty(self):
        return len(self.stack) == 0

    def pop(self):
        if not self.is_empty():
            return self.stack.pop()
        else:
            return None
        # list.pop 没有参数默认弹出列表最后一个元素

    def gettop(self):
        if not self.is_empty():
            return self.stack[-1]
        else:
            return None


def bracket_pair(string):
    stack = Stack()
    # 建立一个字典，说明括号之间的对应关系
    # 右括号找左括号，所以将右括号设为key
    match = {
        ')': '(',
        ']': '[',
        '}': '{'
    }
    for ch in string:  # 分两种情况：元素为左括号或者为右括号
        if ch in {'(', '[', '{'}:  # 元素为左括号
            stack.push(ch)  # 左括号一律直接入栈
        else:  # ch in {')', ']', '}'} 元素为右括号
            # 分三种情况：
            # 1. 栈为空，来一个右括号，那么一定是错的，报错
            # 2.1 栈不空，但是栈顶不是对应的左括号，报错
            # 2.2 栈不空，且栈顶是对应的左括号，推出栈顶
            if stack.is_empty():
                return False
            else:
                if stack.gettop() == match[ch]:
                    stack.pop()
                else:
                    return False
    # for循环结束后，还要判断栈是否为空
    # 因为当心这种情况，()[
    if stack.is_empty():
        return True
    else:
        return False


st = '()[]{[]}'
st1 = '{}['
st2 = '([])]'
st3 = '([)]'

print(bracket_pair(st))
print(bracket_pair(st1))
print(bracket_pair(st2))
print(bracket_pair(st3))

True
False
False
False


# 队列(queue)

队列(queue)是一个数据集合，仅允许在列表的一点进行插入，另一端进行删除。

进行插入的一端称为队尾(rear),称为进队或入队

进行删除的一端称为对头(front),称为出队

队列的性质：先进先出FiFo (First-in, First-out)

问题：队列能否用列表简单实现？

1.   不能，因为一个元素出队后，所有元素需向前挪动一个位置，时间复杂度太高。或者可以向后移动‘front’指针，但是这样就浪费了前面的存储空间。



![](https://drive.google.com/uc?export=view&id=130L8IVJ2PEJt87xt-3kIJDvCifSvkVcp) 

解决方法：队列的实现方式--环形队列

环形队列：当 rear 或者 front 指针 == maxsize - 1 时，(maxsize是队列的长度)，再前进一个位置就自动到0


*   出队: front指针前进1 front = (front+1) % maxsize
*   进队: rear指针前进1 rear = (rear+1) % maxsize
*   队空: rear == front
*   队满：(rear+1) % maxsize == front


In [None]:
class Queue:
    def __init__(self, size):
        # size是环形队列的长度，定义object的时候需要赋值给size
        self.size = size
        # 建立一个长度为size的列表来表示队列
        self.queue = [0 for _ in range(self.size)]
        # 最初的队首队尾指针均为0
        self.front = 0
        self.rear = 0

    def push(self, element):
        if not self.is_filled():
            self.rear = (self.rear + 1) % self.size
            self.queue[self.rear] = element
        else:
            raise IndexError('Queue is filled.')

    def pop(self):
        if not self.is_empty():
            self.front = (self.front + 1) % self.size
            return self.queue[self.front]
            # front后移以后，那个位置上的元素还在，不过没有关系，我们已经不考虑这个位置了
            # 而是从front+1开始算起，以后这个位置会被覆盖掉
        else:
            raise IndexError('Queue is empty')

    def is_empty(self):
        return self.front == self.rear

    def is_filled(self):
        return (self.rear + 1) % self.size == self.front


# 测试
q = Queue(5)  # 需要传入一个参数size
# 注意，长度为5的队列只能放4个数，因为front位置没有放值(是0)
for i in range(4):
    q.push(i)
print(q.queue)
print(q.pop())
print(q.pop())
print(q.pop())
print(q.pop())
print(q.is_empty())

q1 = Queue(8)  # 需要传入一个参数size
for i in range(8):
    q1.push(i)
# 长度为8的队列只能放7个数
# 所以会报错

## 队列的内置模块(deque)

双向队列

双向队列的两端都支持进队和出队的操作：


*   队首进队 
*   队首出队 （单向）
*   队尾进队 （单向）
*   队尾出队

使用方法：from collections import deque
*   创建队列：q = deque()
*   进队：append() 
*   出队: popleft() 
*   双向队列队首进队: appendleft()
*   双向队列队尾出队: pop()


In [None]:
from collections import deque

q = deque()
# 单向操作
q.append(1)  # 队尾进队
q.append(2)
print(q)
print(q.popleft())  # 队首出队
print(q)

# 双向操作
q.appendleft(0)  # 队首进队
print(q)
print(q.pop())  # 队尾出队
print(q)

#------------------------------------------------------------------
# deque([...], size) 函数可以传入两个参数
# 1. [...] 就是在[...]基础上创建队列
# 2. size表示队列的长度，但不同的是
#    若队列元素超出size,自动从队首弹出元素，再从队尾写入

q1 = deque([1, 2, 3], 6)
q1.append(4)
q1.append(5)
print(q1)
print(q1.popleft())
print(q1)

q1.append(6)
q1.append(7)
q1.append(8)
q1.append(9)
# 队列元素超过6,自动从队首弹出2,3，再从队尾写入8,9
print(q1)



#------------------------------------------------------------------
# 运用这个自动弹出的功能，我们考虑一个简单的应用
# 读取一个文件(.txt)的后n行

def tail(n):
    with open('test.txt', 'r') as f:
        # .txt文件相当于每行为一个元素，一共n个元素的队列
        que = deque(f, n)
        return que


for line in tail(5):
    print(line, end=' ')
# 文件一共10行，按照自动弹出原则，最后应该保留文件的后5行

# 栈应用—迷宫问题-深度优先搜索


![](https://drive.google.com/uc?export=view&id=1_frvs_GeAv02kG4uzULrNZjWtnEvDeS2) 

栈：**深度优先搜索** (一条路走到黑)

回溯法

思路：从一个节点开始，任意找下一个能走的点，再依次找，当找不到能走的点时，退回上一个点寻找是否有其他方向的点

使用栈存储**当前的路径**

In [None]:
maze = [
    [1,1,1,1,1,1,1,1,1,1],
    [1,0,0,1,0,0,0,1,0,1],
    [1,0,0,1,0,0,0,1,0,1],
    [1,0,0,0,0,1,1,0,0,1],
    [1,0,1,1,1,0,0,0,0,1],
    [1,0,0,0,1,0,0,0,0,1],
    [1,0,1,0,0,0,1,0,0,1],
    [1,0,1,1,1,0,1,1,0,1],
    [1,1,0,0,0,0,0,0,0,1],
    [1,1,1,1,1,1,1,1,1,1]
]

# 定义一个字典，包含四个lambda函数，完成的功能是
# 给定一个当前位置 x,y, 返回四个方向的坐标值
dirs = [
    lambda x, y: (x+1, y),   # 右
    lambda x, y: (x-1, y),   # 左
    lambda x, y: (x, y+1),   # 下
    lambda x, y: (x, y-1),   # 上
]


def maze_path(x1, y1, x2, y2):
    stack = []   # 使用栈记录路径，用二维元组表示矩阵下标
    stack.append((x1, y1))  # 将起点入栈
    while len(stack) > 0:
        # 栈空表示连起点都退出栈了，代表没有路可走，游戏结束
        # 所以只要栈不空，就继续搜索路线
        curNode = stack[-1]  # 以栈顶元素为当前位置，搜索下一个点

        # 拿到当前位置后需要判断是否为终点
        if (curNode[0], curNode[1]) == (x2, y2):
            # 依次遍历栈，返回路径
            for pa in stack:
                print(pa)
            # 游戏结束，需要终止函数
            return None  # 注意return会直接终止掉函数def

        # 如果未到终点，继续搜索
        for dir in dirs:
            nexNode = dir(curNode[0], curNode[1])
            # 传入x,y, 返回下一个点的坐标元组
            if maze[nexNode[0]][nexNode[1]] == 0:
                # 如果下一个点为0，代表可以走，该点入栈
                stack.append(nexNode)
                maze[nexNode[0]][nexNode[1]] = 2
                # 且标记为走过了， 以后就不会再走了
                # 找到可以走的方向，即可结束方向for循环
                break  # 注意这个break只能终止内层for循环,对外层while无效
        else:
            # 如果四个方向都不能走，则回溯，推出栈顶元素，向后退一步
            stack.pop()
            # pop()函数默认退出列表最后一个元素

    # 没有被游戏结束的return退出函数，则表示栈空了，所以退出了while循环
    # 意味着没有路
    print("No path")


# 测试
maze_path(1, 1, 8, 8)
print('-----------------')
maze_path(7, 1, 8, 8)

(1, 1)
(2, 1)
(3, 1)
(4, 1)
(5, 1)
(5, 2)
(5, 3)
(6, 3)
(6, 4)
(6, 5)
(7, 5)
(8, 5)
(8, 6)
(8, 7)
(8, 8)
-----------------
No path


# 队列应用—迷宫问题-广度优先搜索

队列: 广度优先搜索

思路：从一个节点开始，寻找**所有**接下来能继续走的点，继续不断寻找，直到找到出口。

使用队列存储**当前正在考虑的节点**

与栈相比，使用队列解决迷宫问题可以保证所得路径是最短路径。

代码难点在于如何记录当前节点是由哪个节点走来的

![](https://drive.google.com/uc?export=view&id=1CID8HVGpw4bY2hYLMxWNEWTwRadeuXYQ) 

In [None]:
from collections import deque
# 注意deque是一个双向队列，使用pop或者append函数时需要注意方向

maze = [
    [1,1,1,1,1,1,1,1,1,1],
    [1,0,0,1,0,0,0,1,0,1],
    [1,0,0,1,0,0,0,1,0,1],
    [1,0,0,0,0,1,1,0,0,1],
    [1,0,1,1,1,0,0,0,0,1],
    [1,0,0,0,1,0,0,0,0,1],
    [1,0,1,0,0,0,1,0,0,1],
    [1,0,1,1,1,0,1,1,0,1],
    [1,1,0,0,0,0,0,0,0,1],
    [1,1,1,1,1,1,1,1,1,1]
]

# 定义一个字典，包含四个lambda函数，完成的功能是
# 给定一个当前位置 x,y, 返回四个方向的坐标值
dirs = [
    lambda x, y: (x+1, y),   # 右
    lambda x, y: (x-1, y),   # 左
    lambda x, y: (x, y+1),   # 下
    lambda x, y: (x, y-1),   # 上
]


def print_path(path):
    # 这个函数用来回头找路，输入为记录所有出队节点的列表
    curnode = path[-1]  # 终点
    real_path = [curnode[0:2]]  # 记录终点,只要前两个元素即可
    while curnode[2] != -1:  # 循环至直到找到起点
        curnode = path[curnode[2]]
        # path中下标为curnode[2]的元素就是curnode的前一个节点
        real_path.append(curnode[0:2])
    real_path.append(curnode[0:2])  # 记录起点
    real_path.reverse()
    for node in real_path:
        print(node)


def maze_queue(x1, y1, x2, y2):
    queue = deque()
    curNode = (x1, y1, -1)  # 起点
    queue.append(curNode)  # 起点进入队列
    path = []
    while len(queue) > 0:  # 队空表示当前没有任何可以走的路
        curNode = queue.popleft()
        # 队首节点出队，注意这里要使用 popleft 而不是 pop
        path.append(curNode)
        # 将所有出队的点存在另一个列表里,方便以后回头找源头路

        # 如果达到终点
        if curNode[0] == x2 and curNode[1] == y2:
            print_path(path)
            return True

        # 没有到终点，继续找路
        for dir in dirs:
            nexNode = dir(curNode[0], curNode[1])
            if maze[nexNode[0]][nexNode[1]] == 0:
                queue.append((nexNode[0], nexNode[1], len(path)-1))
                # 下一个节点可以走的话就进队
                # 第三个位置记录nexNode从谁来的，是从curNode来的，即path列表的最后一个元素
                maze[nexNode[0]][nexNode[1]] = 2
                # 标记已经走过 (防止其他路线会拐回去)
                # 这里不同于栈，队列法需要记录所有可以走的下一个节点，广度优先搜索
    else:
        print('No path!')
        return False


# 测试
maze_queue(1, 1, 8, 8)

(1, 1)
(1, 1)
(2, 1)
(3, 1)
(4, 1)
(5, 1)
(5, 2)
(5, 3)
(6, 3)
(6, 4)
(6, 5)
(7, 5)
(8, 5)
(8, 6)
(8, 7)
(8, 8)


True

# 链表

链表是由一系列节点组成的元素集合。每个节点包含两个部分，数据域item和指向下一个节点的指针next。通过节点之间的相互连接，最终串联成一个链表。

注意，要寻找链表中的某个节点，唯一的办法是寻找上一个节点的next节点，这是链表与列表的最大不同，这也就导致了二者在查找，按下标查找，插入和删除操作中的不同表现。

In [None]:
class Node:
  def __init__(self, item):
    self.item = item
    self.next = None
  

a = Node(1)
b = Node(2)
c = Node(3)
a.next = b
b.next = c
print(a.next.item)
print(a.next.next.item)

2
3


In [None]:
class Node:
    def __init__(self, item):  # 此处的item为Node类的初始参数
        self.item = item
        # self.item 是创建一个名为 item 的 method
        # 此 method 定义为传入初始参数 item
        self.next = None
        # self.next 是创建一个名为 next 的 method
        # 此 method 定义为传入 None


# 【头插法创建链表】
# 从 head 处插入元素, 维护head
# 最终结果为倒序
def create_linked_list_head(li):
    head = Node(li[0])
    # 初始化头节点
    for ele in li[1:]:
        node = Node(ele)  # 建立节点
        node.next = head  # 插入头位置
        head = node  # 更新头节点
    return head
    # 最终返回head,因为只有顺着head才能找到所有的节点


# 【尾插法创建链表】
# 从 tail 处插入元素，维护head 和 tail
# 最终结果为顺序
def create_linked_list_tail(li):
    head = Node(li[0])
    tail = head
    for ele in li[1:]:
        node = Node(ele)
        tail.next = node
        tail = node
    return head
    # 还是得返回头节点, 因为只能从head往后找


# 【链表的遍历】
def print_linked_list(head):
    while head:
        print(head.item, end=',')
        head = head.next


# 测试
head = create_linked_list_head([1, 2, 3])
print_linked_list(head)
print()
head1 = create_linked_list_tail([1, 2, 3])
print_linked_list(head1)

3,2,1,
1,2,3,

![](https://drive.google.com/uc?export=view&id=1-8kT_qSr_H5DCges45UqZGGr53hnpzT4) 

【链表的插入和删除】

插入 

这里注意，要先把‘4’和‘2’连起来再连接‘1’和‘4’,否则‘1,2’一但断开，‘2’以及之后的数字就无法找到，就迷失在内存里了。
```
p.next = curNode.next   
curNode.next = p
```
删除 

删除也是一个道理，先把‘1,2’ 连起来再删除
```
curNode.next = curNode.next.next   
del p
```

【双链表】

每个节点有两个指针，一个指向后一个节点，一个指向前一个节点
```
class Node:
  def __init__(self, item):
    self.item = item
    self.next = None
    self.prior = None
```

双链表的插入和删除：
https://www.bilibili.com/video/BV1mp4y1D7UP?p=60


链表总结：
1.   列表与链表时间复杂度分析：
*  按元素查找：O(N), O(N)
*  按下标查找：O(1), O(N)
*  在某元素后插入：O(N), O(1)
*  删除某元素：O(N), O(1)
2.   链表在插入和删除的操作上明显快于列表。且其内存分配更为灵活，可以用链表重新实现栈和队列。尤其是队列，不再受长度的限制，也无需再设计成环形。












# 哈希表

##哈希表 
是一个通过哈希函数来计算数据存储位置的数据结构，通常支持如下操作：


*   insert(key,value): 插入键值对
*   get(key): 若存在返回value,否则返回空
*   delete(key): 删除键为key的键值对



##直接寻址表
将key为k的元素放到k位置上

当关键字的全局阈比较小时，直接寻址是一种简单而有效的方法
![](https://drive.google.com/uc?export=view&id=1Jmjs1Y8_8oHPrXHGZdMlf96jjzXuNJpK) 

缺点：


*   当全局阈很大时，需要消耗大量内存，很不实际
*   当阈很大而实际出现的key很少，则大量空间被浪费
*   无法处理关键字不是数字的情况


哈希（Hashing）改进了直接寻址表：



1. 构建大小为m的寻址表T
2. 构建哈希函数h(-),它将阈映射到表T[0,1...m-1]
3. key为k的元素放到h(k)位置上

## 哈希表（Hash table）

也叫散列表，是一种线性表的存储结构。哈希表由一个直接寻址表和一个哈希函数组成。哈希函数h(k)将元素关键字k作为自变量，返回元素的存储下表。

![](https://drive.google.com/uc?export=view&id=1udNXtEUjBvXiuZFdRKjbjdgKklwXYzpd) 

哈希冲突：

对于一个哈希函数，出现两个不同元素映射到同一个位置的情况叫做哈希冲突， 比如上述例子中的 h(0)=h(7)=h(14)...

解决哈希冲突的两个方法：

1. 开放寻址法：如果哈希函数返回的位置已经有值，则可以向后探查新的位置来存储这个值。常用的探查方法有：
![](https://drive.google.com/uc?export=view&id=15qwQvvmiCljFySpxEQrV8kFt6h4RkAPd) 

2. 拉链法：将哈希表的每个位置都连接一个链表。当发生冲突时，冲突的元素将被加到该位置链表的最后
![](https://drive.google.com/uc?export=view&id=1Mob2iPHaOsB6nsAB52PSFlxhdaI3eH3N) 

常见哈希函数：

![](https://drive.google.com/uc?export=view&id=1_oV-DJR-PJcUsoZ6UTAi01tGJO1Tg1j_) 


哈希表的代码实现：

[参见链接视频](https://www.bilibili.com/video/BV1mp4y1D7UP?p=63)

哈希表的应用：

[参见链接视频](https://www.bilibili.com/video/BV1mp4y1D7UP?p=64)
*   Python中的字典和集合都是通过哈希表来实现的
*   密码学中的 md5 算法和 SHA2 算法



# 树

##树的概念 
参见堆排序

树的实例：[模拟文件系统](https://www.bilibili.com/video/BV1mp4y1D7UP?p=66)

##二叉树

![](https://drive.google.com/uc?export=view&id=1bFhOvGsp9GyWQtuLhnWXwMhmi5OzIsUg) 

In [None]:
# 定义二叉树的节点
class BiTreeNode:
    def __init__(self, data):
        self.data = data
        self.lchild = None
        self.rchild = None


# 手动构造节点
a = BiTreeNode('A')
b = BiTreeNode('B')
c = BiTreeNode('C')
d = BiTreeNode('D')
e = BiTreeNode('E')
f = BiTreeNode('F')
g = BiTreeNode('G')

# 手动链接节点
e.lchild = a
e.rchild = g
a.rchild = c
c.lchild = b
c.rchild = d
g.rchild = f

root = e

# 测试
# 打印节点c
print(root.lchild.rchild.data)

C


##二叉树的遍历


![](https://drive.google.com/uc?export=view&id=1hN_tDgFGyVJGsSKjddN7mSiusyznm7jA) 

In [None]:
# 前序遍历 (首先打印根节点)
def pre_order(root):
    if root:  # 如果存在节点
        print(root.data, end=',')
        pre_order(root.lchild)
        pre_order(root.rchild)
# 测试
pre_order(root)



print('\n-----')
# 中序遍历 (中间打印根节点)
def in_order(root):
    if root:  # 如果存在节点
        in_order(root.lchild)
        print(root.data, end=',')
        in_order(root.rchild)
# 测试
in_order(root)



print('\n-----')
# 后序遍历 (最后打印根节点)
def post_order(root):
    if root:  # 如果存在节点
        post_order(root.lchild)
        post_order(root.rchild)
        print(root.data, end=',')
# 测试
post_order(root)

# 注意: 知道一种遍历并不能唯一确定一颗二叉树，
#      但是如果给出两种遍历，则可以唯一确定，
#      面试会要求在得出树后给出第三种遍历



print('\n-----')
# 层次遍历 (使用队列)
from collections import deque
def level_order(root):
    queue = deque()
    queue.append(root)
    while len(queue)>0:  # 只要队不空
        node = queue.popleft()
        print(node.data, end=',')
        if node.lchild:
            queue.append(node.lchild)
        if node.rchild:
            queue.append(node.rchild)
# 测试
level_order(root)

E,A,C,B,D,G,F,
-----
A,B,C,D,E,G,F,
-----
B,D,C,A,F,G,E,
-----
E,A,G,C,F,B,D,

## 二叉搜索树

二叉搜索树的每个节点的左子树的所有节点比它小，右子树的所有节点比它大

![](https://drive.google.com/uc?export=view&id=17z6PykOa0cVdzlU4z9RY3_18C-jeCgTB) 

二叉搜索树的插入和查询

二叉搜索树的删除

![](https://drive.google.com/uc?export=view&id=1B6td_lAQXJ8wZVUNcmaOH6uhFAgmmEw9) 

In [None]:
# 定义二叉树搜索的节点
class BiSearchTreeNode:
    def __init__(self, data):
        self.data = data
        self.lchild = None
        self.rchild = None
        self.parent = None

# 定义二叉搜索树
class BTS:
    def __init__(self, li):
        self.root = None
        if li:
            for val in li:
                # 递归插入
                # self.re_insert(self.root, val)
                # 非递归插入
                self.no_re_insert(val)

    # 递归法实现二叉搜索树的插入
    def re_insert(self, node, val):  # node表示当前要考虑插入的节点
        if node == self.root and not node:  # 如果树空且此处为空,建立根节点
            self.root = BiSearchTreeNode(val)
            return
        if not node:  # 此处为空，直接插入
            node = BiSearchTreeNode(val)
        elif val < node.data:
            node.lchild = self.re_insert(node.lchild, val)
            node.lchild.parent = node  # 还得把父亲连起来
        elif val > node.data:
            node.rchild = self.re_insert(node.rchild, val)
            node.rchild.parent = node
        return node

    # 非递归法实现二叉搜索树的插入
    def no_re_insert(self, val):
        p = self.root
        if not p:  # 如果树空, 直接建立根节点
            self.root = BiSearchTreeNode(val)
            return
        while True:
            if val < p.data:
                if p.lchild:  # 如果左孩子存在，向下继续找
                    p = p.lchild
                else:  # 如果左孩子不存在，直接插入并结束循环
                    p.lchild = BiSearchTreeNode(val)
                    p.lchild.parent = p
                    return
            elif val > p.data:
                if p.rchild:  # 如果右孩子存在，向下继续找
                    p = p.rchild
                else:  # 如果右孩子不存在，直接插入并结束循环
                    p.rchild = BiSearchTreeNode(val)
                    p.rchild.parent = p
                    return
            else:  # 遇到相等的值，此处不考虑，什么也不做即可
                return

    # 前序遍历
    def pre_order(self, root):
        if root:  # 如果存在节点
            print(root.data, end=',')
            self.pre_order(root.lchild)
            self.pre_order(root.rchild)

    # 中序遍历
    def in_order(self, root):
        if root:  # 如果存在节点
            self.in_order(root.lchild)
            print(root.data, end=',')
            self.in_order(root.rchild)

    # 后序遍历
    def post_order(self, root):
        if root:  # 如果存在节点
            self.post_order(root.lchild)
            self.post_order(root.rchild)
            print(root.data, end=',')


    # 递归法实现二叉搜索树的查询
    def re_query(self, node, val):
        if not node:  # 递归终止条件:直到最后一层都找不到
            return None
        if val < node.data:
            return self.re_query(node.lchild, val)
        elif val > node.data:
            return self.re_query(node.rchild, val)
        else:  # 相等，找到了
            return node

    # 非递归法实现二叉搜索树的查询
    def no_re_query(self, val):
        p = self.root
        if not p:  # 树空
            return None
        while p:
            if val < p.data:
                p = p.lchild
            elif val > p.data:
                p = p.rchild
            else:
                return p
        # 结束循环意味着没找到
        return None


    # 二叉搜索树的删除
    # 分为三种情况：1，要删除的节点为叶子节点(没有孩子)：直接删除
    #            2. 要删除的节点只有一个(左或者右)孩子：把其(左或者右)孩子和其父亲连起来
    #            3. 要删除的节点有两个孩子(左右孩子)：
    #               需要决定把谁替上来，可以选择左边最大的或者右边最小的节点，此处我们选择右边最小的节点
    #               右边最小的节点是右边一直走左侧直到底的那个节点
    #               将此节点提上去，并删除这个节点(此处又有两种情况，该节点没有孩子和只有一个右孩子)

    # 情况1，删除的节点没有孩子
    def __remove_1(self, node):
        if not node.parent:  # 如果是根节点
            self.root = None
        else:
            # 判断该节点是其父的左孩子还是右孩子
            if node == node.parent.lchild:
                node.parent.lchild = None
                # node.parent = None
            else:
                node.parent.rchild = None
                # node.parent = None
                # 注意父亲跟孩子断了联系就可以了，当然可以再加上孩子和父亲断联系

    # 情况2. 删除的节点只有一个孩子
    # 情况2.1 删除的节点只有一个左孩子
    def __remove_2l(self, node):
        if not node.parent:  # 是根节点
            self.root = node.lchild
            node.lchild.parent = None
        else:
            # 判断该节点是其父的左孩子还是右孩子
            if node == node.parent.lchild:
                node.parent.lchild = node.lchild
                node.lchild.parent = node.parent
            else:
                node.parent.rchild = node.lchild
                node.lchild.parent = node.parent

    # 情况2.2 删除的节点只有一个右孩子
    def __remove_2r(self, node):
        if not node.parent:  # 是根节点
            self.root = node.rchild
            node.rchild.parent = None
        else:
            if node == node.parent.lchild:
                node.parent.lchild = node.rchild
                node.rchild.parent = node.parent
            else:
                node.parent.rchild = node.rchild
                node.rchild.parent = node.parent

    # 二叉搜索树删除
    def delete(self, val):
        if self.root:  # 不是空树
            # 先找到再删除
            node = self.no_re_query(val)
            if not node:  # 要删除的节点不存在
                return False
            # 删除node
            # 第1种情况:没有孩子
            if not node.lchild and not node.rchild:
                self.__remove_1(node)
            # 第2.1种情况:只有左孩子
            elif not node.rchild:
                self.__remove_2l(node)
            # 第2.2种情况:只有右孩子
            elif not node.lchild:
                self.__remove_2r(node)
            # 第3种情况:既有左孩子又有右孩子
            else:
                # 先找到右边最最最左侧的节点 min_node
                min_node = node.rchild
                while min_node.lchild:
                    min_node = min_node.lchild
                # 把 min_node 放到 node 位置 (数据替换即可，则不用链接父子关系)
                node.data = min_node.data
                # 再把 min_node 删除
                # min_node 要么没有孩子，要么只有一个右孩子
                if min_node.rchild:
                    self.__remove_2r(min_node)
                else:
                    self.__remove_1(min_node)


# 测试插入
tree = BTS([4, 5, 6, 1, 3, 2, 7, 9, 8])
tree.pre_order(tree.root)
print('')
tree.in_order(tree.root)
print('')
tree.post_order(tree.root)
print('')

# 注意中序遍历的二叉搜索树一定是有序且升序排列的
# 因为它是先输出左边然后中间最后右边，符合二叉搜索树的定义: 左小右大

# 测试中序遍历为上升有序
import random
li = list(range(100))
random.shuffle(li)
tree = BTS(li)
tree.in_order(tree.root)


# 测试查询
print('')
print(tree.re_query(tree.root, 3))
print(tree.no_re_query(3))
print(tree.re_query(tree.root, 3).data)
print(tree.no_re_query(3).data)
print(tree.re_query(tree.root, 120))
print(tree.no_re_query(120))


# 测试删除
tree1 = BTS([1,4,2,3,5,7,9,8,6])
tree1.in_order(tree1.root)
tree1.delete(4)
print('')
tree1.in_order(tree1.root)
tree1.delete(1)
print('')
tree1.in_order(tree1.root)
tree1.delete(8)
print('')
tree.in_order(tree1.root)

4,1,3,2,5,6,7,9,8,
1,2,3,4,5,6,7,8,9,
2,3,1,8,9,7,6,5,4,
0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,
<__main__.BiSearchTreeNode object at 0x7f4542fe7790>
<__main__.BiSearchTreeNode object at 0x7f4542fe7790>
3
3
None
None
1,2,3,4,5,6,7,8,9,
1,2,3,5,6,7,8,9,
2,3,5,6,7,8,9,
2,3,5,6,7,9,

# AVL树 (自平衡的二叉搜索树)

由来:
平均情况下，二叉搜索树搜索的时间复杂度为O(logn)。但是在最坏情况下——二叉搜索树非常偏斜——时间复杂度会大大增加。AVL树就是为解决这个问题的。
![](https://drive.google.com/uc?export=view&id=1AlQwagm0Bu68cPngpUMjCWkx_wKHq2qZ) 

## AVL树的插入和维持（旋转）

*  插入一个节点可能会破坏AVL树的平衡，可以通过**旋转**操作来进行修正。
*  插入一个节点后，只有从插入节点到根节点的路径上的节点的平衡可能被改变。我们需要找出第一个破坏了平衡条件的节点，称之为K。K的两颗子树的高度差为2。
*  不平衡的出现可能有四种情况

![](https://drive.google.com/uc?export=view&id=1Nj86scvbpvo1rrCBcBbUHCHIqRaEONaL) 

1. AVL树的四种旋转的代码：

  https://www.bilibili.com/video/BV1mp4y1D7UP?p=76
  
  https://www.bilibili.com/video/BV1mp4y1D7UP?p=77

2. AVL树的插入代码：（插入操作基本等同于二叉搜索树的插入，**难点在于插入之后还要保持平衡，即需要对不同的插入情况考虑不同的旋转操作**）

  https://www.bilibili.com/video/BV1mp4y1D7UP?p=78

3. AVL树的应用：B树 （B-Tree）是一种自平衡的多路搜索树，常用于数据库的索引。


# 贪心算法 （算法进阶）

贪心算法是指，在对问题求解时，总是做出在当前看来值最好的选择。也就是说，不从整体最优上加以考虑，它所做出的是在某种意义上的局部最优解。

贪心算法并不能保证会得到最优解，但是在某些问题上贪心算法的解就是最优解。要求会判断一个问题是否能用贪心算法来计算。

## 找零问题
假设上店老板需要找零钱，钱币的面值有：100 50, 20, 5, 1元，如何找零使得所需要的钱币张数最少？

In [None]:
# 贪心算法的简单应用

t = [100, 50, 20, 5, 1]
t1 = [100, 50, 20, 5]

def change(t, n):   # e.g. n=376
    m = [0 for _ in range(len(t))]
    for i, money in enumerate(t):
        m[i] = n // money  # m[0]=3
        n = n % money   # new n=76
    return m, n


# 测试
print(change(t, 376))
print(change(t1, 376))

([3, 1, 1, 1, 1], 0)
([3, 1, 1, 1], 1)


## 背包问题
![](https://drive.google.com/uc?export=view&id=1YIUNwOFLnLNpnogOPXoXEKwYKEBlfnDr) 

![](https://drive.google.com/uc?export=view&id=1jSHehp0y9OzKKmIYFL3FQwq-81gq2GRH) 

*  0-1背包不能用贪心算法来解决，因为可能会浪费很多背包容量
*  分数背包可以用贪心算法解决，因为分数的原因，不用担心背包容量被浪费，所以先紧着贵的来（贪心）。




In [None]:
# 分数背包代码：
goods = [(60, 10), (120, 30), (100, 20)]  #每个商品元组表示(价格，重量), 每个商品只有一个
goods.sort(key=lambda x: x[0]/x[1], reverse=True)  #按照单位重量价格降序排序

print(goods)

def fractional_backpack(goods, w):  #w表示背包容量
    m = [0 for _ in range(len(goods))]   #m的index对应的是排好序的goods
    total_value = 0
    for i, (price, weight) in enumerate(goods):
        if w >= weight:  #背包余量大于商品重量
            m[i] = 1
            total_value += price
            w -= weight
        else:  #背包余量小于商品重量，取部分商品
            m[i] = w/weight
            total_value += m[i] * price
            w = 0  #背包连当前商品都装不完，余量肯定为0了，直接结束循环
            break
    return m, total_value

print(fractional_backpack(goods, 50))

[(60, 10), (100, 20), (120, 30)]
([1, 1, 0.6666666666666666], 240.0)


## 拼接最大数字问题

![](https://drive.google.com/uc?export=view&id=1FyOmGrsjvWJUm38UnoWTtP1JWvIif0m6) 


In [None]:
# 贪心算法应用-数字拼接问题
from functools import cmp_to_key

li = [32, 94, 128, 1286, 6, 71]

def xy_cmp(x, y):
    if x+y < y+x:
        return 1
    elif x+y > y+x:
        #例如[94,71] 9471>7194, 这是我们想要的顺序，所以赋值为-1
        #因为sort()函数默认是按照升序排列的, 即-1先排
        return -1
    else:
        return 0


def number_join(li):
    #先把数字转换为字符串再进行比较
    #字符串按位比较，两个字符串第一位字符的ascii码谁大，
    #字符串就大，不再比较后面的； 第一个字符相同就比第二个字符串，以此类推。
    li = list(map(str, li))
    li.sort(key=cmp_to_key(xy_cmp))  #按照-1,0,1将数字字符串排好序了
    return "".join(li)


print(number_join(li))

## 活动选择问题
![](https://drive.google.com/uc?export=view&id=1srwmm3YZSOcyjp-PkVyjJ0sixG2NOyh_) 

![](https://drive.google.com/uc?export=view&id=1XI8TUgQf254flZP-zm9N7SLuQv3FZKwE) 

In [None]:
# 贪心算法应用-活动选择问题
# 这里有两点需要注意：
# 1. 最先结束的活动一定是最优解的一部分
# 2. 贪心贪的是结束时间

activities = [(1,4),(3,5),(0,6),(5,7),(3,9),(5,9),(6,10),(8,11),(2,14),(12,16)]
# 因为贪心是按照结束时间进行贪心，所以需要保证活动首先按照结束时间排好序
activities.sort(key=lambda x : x[1])

def activity_selection(a):
    res = [a[0]]   #根据法则1，最先结束的活动a[0]一定在最优解里
    for i in range(1, len(a)):
        if a[i][0] >= res[-1][1]:  #下一个活动的开始时间晚于上一个活动的结束时间，不冲突
            res.append(a[i])
    return res


print(activity_selection(activities))

[(1, 4), (5, 7), (8, 11), (12, 16)]


# 动态规划

## 导言-——斐波那切数列问题
*   斐波那切数列： Fn = Fn-1 + Fn-2
*   问题: 使用递归和非递归的方法来求解斐波那切数列的第n项的值

动态规划两个要素：
* 递推式 （也就是说一个问题可以不断化成子问题进行求解。这里给出了递推式，但一般情况下需要我们自己观察总结） 
* 重复子问题（将子问题的答案存储起来，避免像递归那样重复计算子问题）



In [1]:
# 递归方法：计算很慢，因为存在“子问题的重复计算”
# 例如求f(5)=f(4)+f(3), f(4)=f(3)+f(2)....这里的f(3)等需要独立计算好多次，所以很慢
def fibnacci(n):
    if n==1 or n==2:
        return 1
    else:
        return fibnacci(n-1) + fibnacci(n-2)

print(fibnacci(10))


# 非递归方法：其实就是一种简单的动态规划（DP）思想
# 动态规划：递推式 + 重复子问题（将子问题的答案存储起来，避免像递归那样重复计算子问题）
def fibnacci_no_recursion(n):
    f = [0, 1, 1]  #多加一个0，因为方便记录第一项为1，第二项为1
    if n > 2:
        for i in range(n-2):  #第三项只需加一次，第四项需要加两次...
            sum = f[-1] + f[-2]
            f.append(sum)
    return f[n]


print(fibnacci_no_recursion(10))

55
55


## 钢条切割问题

![](https://drive.google.com/uc?export=view&id=1sPrmXJ-DmRrMmgLaj9JB9kZ5BIjpVOC6) 

方法一：暴力枚举法

例如，长度为4的钢条，一共有8中切法，然后分别计算出获得的价格。

缺点：对于长度为n的钢条，一共有2^n中切法，指数爆炸。。。
![](https://drive.google.com/uc?export=view&id=1u2gFn4AnTSWBQDC8QvQwHtZTdPcnKNqC) 

其实，我们可以计算出对于每个长度的钢条，最优解为多少，从而推导出计算规律

p[i]为价格表，r[i]为对应的最优价格

![](https://drive.google.com/uc?export=view&id=166Wkf7jMWnfLvLRrmId56_33Je8dVIpk) 

递推式1：

根据以上规律，我们总结出一个递推式

![](https://drive.google.com/uc?export=view&id=1zTCXVQc5bNsjowr52bFubUwJCGm0mwfW) 

动态规划第一要素：最优子结构（递推式）

![](https://drive.google.com/uc?export=view&id=1MDvyWwStJ0uJ-YxQaIQF1XX1-nnVH3Lv) 

递推式2：

递推式1可以简化为递推式2

![](https://drive.google.com/uc?export=view&id=1rQ0jAmsy2fYPheVCcLc2JX63tfNBxmyw) 

In [None]:
# 动态规划应用--钢条切割问题
# 1. 递推式1 （递归法实现）
# 2. 递推式2 （递归法实现）
# 3. 递推式2+避免子问题重复计算（动态规划实现）

p = [0, 1, 5, 8, 9, 10, 17, 17, 20, 24, 30]


# 1. 递推式1 （递归法实现）
def cut_rod_recur_1(p, n):
    if n == 0:  #递归终止条件
        return 0
    else:
        res = p[n]
        for i in range(1, n):
            res = max(res, cut_rod_recur_1(p, i) + cut_rod_recur_1(p, n-i))
        return res


print(cut_rod_recur_1(p, 9))


# 2. 递推式2 （递归法实现）
def cut_rod_recur_2(p, n):
    if n == 0:  #递归终止条件
        return 0
    else:
        res = 0
        for i in range(1, n+1):
            res = max(res, p[i] + cut_rod_recur_2(p, n-i))
        return res


print(cut_rod_recur_2(p, 9))

# 注意：这两种递归解法都存在重复计算子问题，但是法2比法1强一点，因为
#      法2只存在一个递归，而法1有两个递归，存在更多重复计算

# 这两种方法是“自顶向下”的求解，所以存在很多重复计算

“自顶向下”的两个递归法：

![](https://drive.google.com/uc?export=view&id=1sJJHTMALZZ-IvVmdvWkVjB4EjhwyHY9D) 

"自底向上"动态规划法：

![](https://drive.google.com/uc?export=view&id=1qiFDHPTG9PiDxei3MUTyj5TqSn1QZezl) 

In [None]:
# 如果采用“自底向上”的顺序，且将已知子问题的答案存储起来，将大大减少重复计算
# 这也就是 动态规划方法：递推式+存储子问题（避免重复计算）


# 3. 递推式2+避免子问题重复计算（动态规划实现）
def cut_rod_dp(p, n):
    r = [0]
    for i in range(1, n+1):
        res = 0
        for j in range(1, i+1):
            res = max(res, p[j] + r[i-j])
        r.append(res)
    return r[n]


print(cut_rod_dp(p, 9))

"自底向上"动态规划时间复杂度：

![](https://drive.google.com/uc?export=view&id=1tkHGi_s5iL6qg9qOEipYUCEDfbjr7A1N) 

钢条切割问题的重构解：

![](https://drive.google.com/uc?export=view&id=16AHp6YD8dt6bAotkSD8RySMfCr9fDT2v) 

In [5]:
# 问题延伸：要求给出钢条的切割方案
p = [0, 1, 5, 8, 9, 10, 17, 17, 20, 24, 30]

def cut_rod_extend(p, n):
    r = [0]  # r记录的是最大值
    s = [0]  # s记录的是最大值情况时，左边未切割的长度
    for i in range(1, n + 1):
        res_r = 0
        res_s = 0
        for j in range(1, i + 1):
            if res_r < p[j] + r[i - j]:
                res_r = p[j] + r[i - j]
                res_s = j   # 发现新的最大值，就换掉当前的s值
        r.append(res_r)
        s.append(res_s)
    return r[n], s
# 但s只是那个表，不是直接的切割方案


# 进一步列出具体的解决方案
def cut_solution(p, n):
    r, s = cut_rod_extend(p, n)
    ans = []
    while n > 0:
        ans.append(s[n])
        n -= s[n]
    return ans


print(cut_rod_extend(p, 10))
print(cut_solution(p, 10))
print(cut_solution(p, 9))
p1 = [0,1,5,8,9,10,17,17,20,21,23,24,26,27,27,28,30,33,36,39,40]
print(cut_rod_extend(p1, 20)[0], cut_solution(p1, 20))

(30, [0, 1, 2, 3, 2, 2, 6, 1, 2, 3, 10])
[10]
[3, 6]
56 [2, 6, 6, 6]


![](https://drive.google.com/uc?export=view&id=1fEryEJN8WMbOH_tXBAQmWnjlWGg3wMGl) 

## 最长公共子序列问题

![](https://drive.google.com/uc?export=view&id=1J49e_wVt6lQ3etnn91UBMBrlOjlZLcfX) 

![](https://drive.google.com/uc?export=view&id=15erNl40xpcI_KN0cCE7d7iUqIjJgVtIp) 

![](https://drive.google.com/uc?export=view&id=1VPJnH-7BfOfzp8POyKIab1QERoT9ieCu) 

In [None]:
# 动态规划应用--最长公共子序列

#首先计算出最长的子序列长度
def lcs_length(x, y):
    m = len(x)
    n = len(y)
    c = [[0 for _ in range(n+1)] for _ in range(m+1)]  #创建一个(m+1)行(n+1)列的矩阵表
    for i in range(1, m+1):
        for j in range(1, n+1):
            if x[i-1] == y[j-1]:  #表格的下标和字符串的下标错一位，因为有空集的存在
                c[i][j] = c[i-1][j-1] + 1
            else:
                c[i][j] = max(c[i-1][j], c[i][j-1])
    for _ in c:
        print(_)  # 按行打印出c表
    return c[m][n]

print(lcs_length("ABCBDBA", "BDCABA"))



#下一步是获得具体的最长子序列

#先得到数值来源的箭头表格
def lcs(x, y):
    m = len(x)
    n = len(y)
    c = [[0 for _ in range(n + 1)] for _ in range(m + 1)]  #记录最长值
    s = [[0 for _ in range(n + 1)] for _ in range(m + 1)]  #记录数值来源，即表格中的箭头
    for i in range(1, m + 1):
        for j in range(1, n + 1):
            if x[i - 1] == y[j - 1]:  # 表格的下标和字符串的下标错一位，因为有空集的存在
                c[i][j] = c[i - 1][j - 1] + 1
                s[i][j] = 1  #规定 左上为1， 上方为2，左方为3
            else:
                if c[i-1][j] >= c[i][j-1]:  #来自于上方
                    c[i][j] = c[i-1][j]
                    s[i][j] = 2
                else:
                    c[i][j] = c[i][j-1]   #来自于左方
                    s[i][j] = 3
    return c[m][n], s

c, s = lcs("ABCBDAB", "BDCABA")
for _ in s:
    print(_)



# 至此，得到了数值来源的箭头表格，然后利用回溯法找出具体的最长子序列
def trace_lcs(x, y):
    c, s = lcs(x, y)
    i = len(x)
    j = len(y)
    res = []
    while i > 0 and j > 0:
        if s[i][j] == 1:  #来自左上方,表示匹配，所以把此处的字母加入答案列表
            res.append(x[i-1])  #注意错一位问题
            i -= 1
            j -= 1
        elif s[i][j] == 2: #来自上方,表示不匹配
            i -= 1
        else: #来自左方,表示不匹配
            j -= 1
    return "".join(reversed(res))

print(trace_lcs("ABCBDAB", "BDCABA"))

## 欧几里得算法——最大公约数

![](https://drive.google.com/uc?export=view&id=1W_mBsNL-Y50jbnwXutgFDNHKIIPbwTl_) 

![](https://drive.google.com/uc?export=view&id=1wW630dDz_HxwwRUKHvrNpfcn6DEexGdu) 

In [None]:
# 欧几里得算法--寻找两个数的最大公约数

# 递归写法
def gcd_recur(a, b):
    if b == 0:
        return a
    else:
        return gcd_recur(b, a % b)

print(gcd_recur(12, 16))


# 非递归写法
def gcd_no_recur(a, b):
    while b > 0:
        r = a % b
        a = b
        b = r
    return a

print(gcd_no_recur(12, 16))


##################################################
## 应用--利用欧几里得算法实现一个分数类的四则运算
class Fraction:
    def __init__(self, a, b):
        self.a = a
        self.b = b
        #约分
        x = self.gcd(a, b)
        self.a /= x
        self.b /= x

    def gcd(self, a, b):
        while b > 0:
            r = a % b
            a = b
            b = r
        return a

    #使用魔法函数__add__定义加法，需要分母通分，所以先要求最小公倍数
    #求最小公倍数函数
    def zgbs(self, a, b):
        # 12 16 --> 4
        # 3 * 4 * 4 = 48 # 最小公倍数为48
        x = self.gcd(a, b)
        # return (a / x) * (b / x) * x
        return a * b / x


    def __add__(self, other):
        a = self.a
        b = self.b
        # other其实就是Fraction类的另一个object，所以当然也有.a和.b
        c = other.a
        d = other.b
        fenmu = self.zgbs(b, d)
        fenzi = a * (fenmu / b) + c * (fenmu / d)
        # 可以直接return一个类，相当于把fenzi,fenmu当做a,b
        # 传进Fraction类里，而该类会自动进行约分和分数形式表示
        return Fraction(fenzi, fenmu)


    def __str__(self):  #增加魔法函数使输出变为分数形式
        return "%d/%d" % (self.a, self.b)


f = Fraction(30, 16)
print(f)

x = Fraction(1, 2)
y = Fraction(1, 3)
# “+”表示调用add魔法函数，对一个类的两个objects进行操作
print(x + y)