# Notes

## 汉诺塔问题

Q: 三根柱子abc，从下往上由大到小摞着64个圆盘，每次只能移动一个圆盘并且大圆盘不能再小圆  
盘上，最后将这一罗圆盘移动到另外一根柱子上  

A: 考虑三个圆盘的情况：  
- 第一步把最上面的两个圆盘经过b移动到c，  
- 第二步把底部的圆盘移动到柱子b上，  
- 第三步通过柱子a把c上的顶部两个圆盘移动到b  

假设有n个圆盘，则可以把顶部的n-1个圆盘看作一个整体，递归的使用这种移动方式来实现全部圆  
盘的移动

In [4]:
def hanoi(n, a, b, c):
    if n > 0:
        hanoi(n-1, a, c, b)
        print("moving from %s to %s" % (a, c))
        hanoi(n-1, b, a, c)

In [5]:
hanoi(3, "a", "b", "c")

moving from a to c
moving from a to b
moving from c to b
moving from a to c
moving from b to a
moving from b to c
moving from a to c


## 列表查找
查找：在一些数据元素中通过一定的方法找出与给定关键字相同的数据元素的过程  
列表查找(线性表查找):从列表中查找指定元素  
- 输入:列表、待查找元素  
- 输出:元素下标(未找到返回-1或None)

内置列表查找函数：index()---这是线性查找，因为人为指定的列表可能是无序的，而对一个列  
表排序的时间复杂度>O(n)

### 顺序查找(Linear Serach)
从列表第一个元素开始，顺序进行搜索，时间复杂度的为O(n)

In [10]:
def linear_search(list, val):
    for i, v in enumerate(list):
        if v == val:
            return i
    return None

In [11]:
linear_search([1,2,3,4], 3)

2

### 二分查找(Binary Search)
针对有序列表的查找方法 从有序列表的初始候选区li[0:n]开始，通过对查找的值和候选区域中间  
值进行比较，可以使候选区域减半，维护候选区是关键

我们用left和right来标记候选区域的头和尾的index，中间值为li[(left+right/)2]，如果比查找值  
小，则维护右边区域为候选区，即让left <- (left+right/)2 +1，如果比查找值大，则维护左边区域  
为候选区，即让right <- (left+right/)2 -1

重复上面步骤 值得某个候选区的中间值等于待查找值结束，并返回这个中间值的索引  
或者候选区域为空集(left>right)时结束，此时说明列表中没有待查找值

In [12]:
def binary_search(list, val):
    left = 0
    right = len(list) - 1
    while left <= right:
        mid = (left + right) // 2
        if list[mid] == val:
            return mid
        elif list[mid] > val:
            right = mid - 1
        else:
            left = mid + 1
    return None

In [14]:
binary_search([1,2,3,5], 3)

2

二分查找的复杂度为O(logn)(2为底)。因为当问题的规模为n时，每次循环都会减半问题的规模，  
所以只需要logn次就会把问题规模减到0

## 列表排序
排序：将一组无序的记录序列调整为有序的记录序列  
列表排序: 将无序列表变成有序列表  
- 输入: 列表
- 输出: 有序列表

升序与降序  
内置排序函数 sort()

常见排序方法:  
冒泡排序，选择排序，插入排序  
快速排序，堆排序，归并排序  
希尔排序，计数排序，基数排序

### 冒泡排序(Bubble Sort)
- 列表每两个相邻的数，如果前面的数比后面的数大，则交换这两个数
- 冒泡排序的一趟 无序区会减少一个数，有序区会增加一个数

从第一个数开始，跟后一个位置的数比较，若更大则交换位置，值到后面位置的数比他更大，然  
后再从这个数开始跟他后面的位置的数比较(大的数往上冒，直到被一个更大的数盖住)。这一趟  
完成之后，最后一个位置的数一定是最大的(即无序区较少一个数，有序区增加一个数)  
第二趟就只需要比较到倒数第二个位置的数即可

假设列表长度为n，第0趟结束后有序数区域有1个，而无序数区域有n-1个;第n-2趟结束后有序数  
区域有n-1个无序数区域有一个就是第一个位置的数，而它本身就是最小的数，不需要再被冒泡  
了，所以对一个长度为n的列表排序总共需要进行n-1趟冒泡  

In [2]:
def bubble_sort(list):
    for i in range(len(list) - 1): # n-1趟
        for j in range(len(list) - i - 1): # 指针在无序区移动
            if list[j] > list[j+1]:
                list[j], list[j+1] = list[j+1], list[j]
    return list

In [15]:
import random 
li = [random.randint(0,100) for i in range(100)]
print(li)
bubble_sort(li)
print(li)

[54, 84, 75, 46, 50, 13, 50, 92, 2, 83, 80, 45, 28, 74, 63, 15, 68, 89, 96, 59, 37, 15, 20, 67, 52, 24, 22, 50, 2, 32, 51, 12, 7, 47, 29, 10, 85, 44, 72, 21, 27, 51, 76, 80, 28, 26, 67, 5, 49, 68, 5, 64, 14, 10, 90, 13, 66, 42, 99, 98, 22, 77, 34, 1, 97, 5, 33, 67, 79, 69, 7, 90, 97, 49, 50, 16, 32, 36, 11, 34, 48, 76, 23, 41, 77, 87, 13, 78, 72, 7, 63, 63, 72, 96, 48, 84, 98, 36, 24, 86]
[1, 2, 2, 5, 5, 5, 7, 7, 7, 10, 10, 11, 12, 13, 13, 13, 14, 15, 15, 16, 20, 21, 22, 22, 23, 24, 24, 26, 27, 28, 28, 29, 32, 32, 33, 34, 34, 36, 36, 37, 41, 42, 44, 45, 46, 47, 48, 48, 49, 49, 50, 50, 50, 50, 51, 51, 52, 54, 59, 63, 63, 63, 64, 66, 67, 67, 67, 68, 68, 69, 72, 72, 72, 74, 75, 76, 76, 77, 77, 78, 79, 80, 80, 83, 84, 84, 85, 86, 87, 89, 90, 90, 92, 96, 96, 97, 97, 98, 98, 99]


冒泡排序的时间复杂度为$O(n^2)$  
冒泡排序的改进: 如果一趟冒泡没有发生交换，则认为这个列表的排序已经完成

In [18]:
def bubble_sort(list):
    for i in range(len(list) - 1): # n-1趟
        exchange = False
        for j in range(len(list) - i - 1): # 指针在无序区移动
            if list[j] > list[j+1]:
                list[j], list[j+1] = list[j+1], list[j]
                exchange = True
        print(list)
        if not exchange:
            return list

In [19]:
li = [9,8,1,7,2,6,3,4]
print(li)
bubble_sort(li)

[9, 8, 1, 7, 2, 6, 3, 4]
[8, 1, 7, 2, 6, 3, 4, 9]
[1, 7, 2, 6, 3, 4, 8, 9]
[1, 2, 6, 3, 4, 7, 8, 9]
[1, 2, 3, 4, 6, 7, 8, 9]
[1, 2, 3, 4, 6, 7, 8, 9]


[1, 2, 3, 4, 6, 7, 8, 9]

### 选择排序

In [5]:
def select_sort_simple(list):
    sort_list = []
    n = len(list)
    for i in range(n-1):
        t = 0
        min_ = list[t]
        for j in range(1, len(list)):
            if min_ >= list[j]:
                min_ = list[j]
                t = j
        sort_list.append(min_)
        list.pop(t)
    sort_list.append(list[0])

    return sort_list

In [7]:
def select_sort_simple(list):
    sort_list = []
    n = len(list)
    for i in range(n):
        min_ = min(list)
        sort_list.append(min_)
        list.remove(min_)

    return sort_list

In [8]:
list = [3,1,4,2,7,5]
select_sort_simple(list)

[1, 2, 3, 4, 5, 7]

缺陷：
- 重新申请一块内存来存放sort_li
- 最小值运算是$O(n)$的
- 删除运算时$O(n)$的，删掉某个元素后还要把后面的元素往前面挪
- 这个算法的时间复杂度为$O(n^2)$
- 要考虑类似冒泡排序一样的原地排序

确定一个列表的无序区和有序区，第零趟时无序区为整个列表[0,n-1]，  
经过无序区中一次选择最小的元素，把无序区第一个位置的元素与这个最小的元素  
交换位置，那么无序区的个数会减一[1:n-1],有序区个数会增加一[0]，第i次选择时，  
无序区的个数有n-i个，范围是[i,n-1], 把从无序区选择出来的最小元素  
与无序区的第一个元素交换,经过n-1次后无序区为列表的最后一个元素，  
而他本身就是最大的数

**算法关键点** 有序区和无序区，无序区最小数的位置

In [48]:
def select_sort(list):
    for i in range(len(list)): # 第i趟
        min_loc = i
        for j in range(i, len(list)): # 无序区位置[i:n]
            if list[min_loc] >= list[j]:
                min_loc = j
        list[i], list[min_loc] = list[min_loc], list[i]
    return list

In [49]:
list = [3,1,4,2,7,5]
select_sort(list)

[1, 2, 3, 4, 5, 7]

选择排序的时间复杂度为$O(n)$???

### 插入排序
初始时有序区只有一个数(第一个位置的数)，每次让无序区的第一个位置的数  
插入到有序区的正确位置

In [60]:
def insert_sort(list):
    for i in range(1, len(list)): # 无序区的范围从[1,n]到[n-1:n-1]
        for j in range(i):
            if list[i-j] < list[i-j-1]:
                list[i-j], list[i-j-1] = list[i-j-1], list[i-j]
        # print(list)
    return list

In [61]:
list = [3,1,4,2,7,5]
insert_sort(list)

[1, 2, 3, 4, 5, 7]

In [92]:
def insert_sort(list):
    n = len(list)
    for i in range(1, n):
        j = i - 1 # 有序区最后一个数的index
        tmp = list[i] # 无序区第一个数
        while j >= 0 and list[j] > tmp:
            list[j+1], list[j] = list[j], list[j+1]
            j -= 1
    return list

In [93]:
list = [3,1,4,2,7,5]
insert_sort(list)

[1, 2, 3, 4, 5, 7]

In [20]:
a = '123'
print(a)
rev_a = a[::-1]
print(rev_a)

123
321


### 希尔排序

![Shell Sort](./Images/希尔排序.png)

In [86]:
def shell_sort(list):
    n = len(list)
    # 初始增量n//2
    inc = n // 2
    while inc >= 1:
        # 每一趟使用插入排序
        for i in range(inc, n):
            tmp = list[i]
            # 有序区最后一个元素的index
            j = i - inc
            while j >= 0 and list[j] > tmp:
                list[j], list[j+inc] = list[j+inc], list[j]
                j -= inc
        inc //= 2
    return list

In [87]:
li = [15, 5, 2, 7, 12, 6, 1, 4, 3, 9, 8, 10]
shell_sort(li)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15]

### 计数排序
通过计数而不是比较来进行排序，适用于范围较小的整数序列

![计数排序](./Images/计数排序.png)

In [101]:
def counting_sort(list):
    n = len(list)
    if n < 2:
        return list
    # 寻找最大值
    max = list[0]
    for i in range(1, n):
        if list[i] > max:
            max = list[i]
    
    # 分配一个长度为max+1的数组作为计数数组
    count = [0] * (max + 1)

    # 计数
    for i in range(n):
        count[list[i]] += 1
    
    # 累计
    for i in range(1, max+1):
        count[i] += count[i-1]
    
    output = [None] * n
    for i in range(n):
        output[count[list[i]] - 1] = list[i]
        count[list[i]] -= 1

    return output

In [102]:
li = [2,4,1,2,5,3,4,8,7]
counting_sort(li)

[1, 2, 2, 3, 4, 4, 5, 7, 8]

### 快速排序

In [28]:
def partition(list, left, right):
    tmp = list[left]
    while left < right: # 交替移动left和right指针直到其重合
        while left < right and list[right] >= tmp: # 移动右指针，找比tmp小的数
            right -= 1
        list[left] = list[right]

        while left < right and list[left] <= tmp: # 移动左指针，找比tmp大的数
            left += 1
        list[right] = list[left]

    list[left] = tmp # 将tmp放在left和right重合的地方
    return left

def quick_sort(list, left, right):
    if left >= right: # 两个以上元素才需要递归
        return ;
    mid = partition(list, left, right)
    quick_sort(list, left, mid-1)
    quick_sort(list, mid+1, right)
    return list

In [29]:
li = [3, 1, 5, 4, 18,7, 2] 
quick_sort(li, 0, len(li)-1)

[1, 2, 3, 4, 5, 7, 18]

### 归并排序
合并一个两部分分别有序的列表为一整个有序列表

In [46]:
def merge(list, left, mid, right):
    tmp = []
    l_pos, r_pos = left, mid+1 # 左半区[left:mid], 右半区[mid+1:right]

    # 合并
    while l_pos <= mid and r_pos <= right:
        if list[l_pos] <= list[r_pos]:
            tmp.append(list[l_pos])
            l_pos += 1
        else:
            tmp.append(list[r_pos])
            r_pos += 1
    # 合并左半区剩余元素
    while l_pos <= mid:
        tmp.append(list[l_pos])
        l_pos += 1
    # 合并右半区剩余元素
    while r_pos <= right:
        tmp.append(list[r_pos])
        r_pos += 1

    # 把合并后列表复制回原列表
    list[left:right+1] = tmp
    return list

def merge_sort(list, left, right):
    if left >= right:
        return list
    mid = (left + right) // 2
    merge_sort(list, left, mid)
    merge_sort(list, mid+1, right)
    merge(list, left, mid, right)
    
    return list

In [47]:
li = [3,1,5,7,2,4] 
merge_sort(li,0,len(li)-1)

[1, 2, 3, 4, 5, 7]

### 堆排序
- 满二叉树：每一层的节点数都达到最大值
- 完全二叉树：叶节点只能出现在最下层和次下层， 并且最下面一层的节点都集  
中在该层最左边的若干位置的二叉树

使用数组存储：
- 下标为i的节点的父节点下标：(i-1)/2【向下取整】
- 下标为i的节点的左子节点下标：i*2 + 1
- 下标为i的节点的右子节点下标：i*2 + 2

顶堆：
- 大顶堆：一颗完全二叉树，任意节点比其子节点大
- 小顶堆：一颗完全二叉树，任意节点比其子节点小

![大顶堆](./Images/大顶堆.png)

#### 维护堆的性质【大顶堆】

![维护大顶堆](./Images/维护大顶堆_1.png)

维护index为1的节点，找出其与两个子节点的最大值（index 3），1 $\leftrightarrow$ 3

![维护大顶堆](./Images/维护大顶堆_2.png)

维护index 1的子节点 3（之前最大值的index），找出其与两个子节点的最大值（index 8），3 $\leftrightarrow$ 8

![维护大顶堆](./Images/维护大顶堆_3.png)

In [2]:
# 维护堆的性质
def heapify(list, n, i): # （列表，维护节点的index）
    largest = i
    lson = i * 2 + 1
    rson = i * 2 + 2
    # 找出i节点和其两个子节点中最大元素的index
    if lson < n and list[largest] < list[lson]:
        largest = lson
    if rson < n and list[largest] < list[rson]:
        largest = rson
    # i 节点需要维护
    if largest != i:
        list[largest], list[i] = list[i], list[largest]
        heapify(list, n, largest)
    return list

#### 堆排序
- 建堆
- 把堆顶与堆低元素交换，然后维护index 0的节点
- 将堆低元素脱离堆
- 循环第二，三步，直至

In [6]:
def heap_sort(list):
    n = len(list)
    # 建堆
    # Index n-1的父节点的index
    i = n // 2 - 1
    while i >= 0:
        heapify(list, n-1, i)
        i -= 1
    # 排序
    low = n - 1
    while low > 0:
        list[low], list[0] = list[0], list[low]
        heapify(list, low, 0)
        low -= 1
    return list

In [7]:
li = [2, 3, 8, 1, 4, 9, 10, 7, 16, 14]
heap_sort(li)

[1, 2, 3, 4, 7, 8, 9, 10, 14, 16]