<a href="https://colab.research.google.com/github/Jakeh33/algs4/blob/main/Algorithms.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 引言
- [课程及教材地址](https://algs4.cs.princeton.edu/home/)
- [github](https://github.com/kevin-wayne/algs4)
- 示例语言JAVA
- [Coursera](https://www.coursera.org/learn/algorithms-part1/home/welcome)
- [b站](https://www.bilibili.com/video/BV1u441127b5)
- [油管](https://www.youtube.com/playlist?list=PLRdD1c6QbAqJn0606RlOR6T3yUqFWKwmX)

# 基础

## 算法复杂度
- 1
- logN：二分
- N：循环
- NlogN：分治
- $N^2$：双循环
- $N^3$：三循环
- $2^N$：穷举

![总结](https://algs4.cs.princeton.edu/14analysis/images/classifications.png)


## 并查集（Union-Find）


### 动态连接性
- 已知一系列的组合，两两之间连通，目标是判断任意两个数之间是否连通
- 已连接子集{a b} {c d e} {f g} {h}
- 每个子集中的元素都是连通的



#### 快速查找
- 数组中连通的位置存储的数据相同
- 直接通过索引查找目标位置
- 在这个基础上如果需要合并，需要先得到p位置的数字，再遍历将相同数字的位置改为q的数字
- 这种合并方案在实现时会随着数据量增加而变慢
- 复杂度：初始化N，合并N，查找1
- 判断N个项目就产生了$N^2$操作次数，不够快

#### 快速合并
- 数组中每个位置存储其父节点的位置，将数组看作树结构
- 判断是否连通只需判断是否属于同一个根节点
- 合并只需要将根节点连接起来
- 复杂度：初始化N,合并N（包含搜索根节点），查找N（最复杂时）
- 树可能会很高，寻找的速度变慢


![举例](https://algs4.cs.princeton.edu/15uf/images/quick-union-overview.png)

#### 快速合并提升
- 避免将树的高度叠高
- 通过判断树的高度，在合并时将更短的树的根节点连接到更高的树的根节点
- 降低每个节点与根节点的距离
- 复杂度：初始化N，合并$\log N$,查找$\log N$
- 带路径压缩的合并（将节点的父节点设为其祖父节点）

![原理](https://algs4.cs.princeton.edu/15uf/images/weighted-quick-union-overview.png)

![总结](https://algs4.cs.princeton.edu/15uf/images/uf-performance.png)

#### 应用
- 蒙特卡洛模拟
  - 初始全闭网格，给定概率设为开
  - 判断其上下是否连通
  - 连通后给出其概率估计值
  - 为了减少数据量，可以在上下各增加一个虚拟位，只需判断两个虚拟位是否连通

In [None]:
import numpy as np
class UF:
  parent = []
  rank = []
  count = 0
  
  def __init__(self,n):
    if (n<0):
      return 0
    else:
      self.count = n
      self.parent =[]
      self.rank = []
      for i in range(0,n):
        self.parent.append(i)
        self.rank.append(0)
  def find(self,p):
    while(p!= self.parent[p]):
      self.parent[p] = self.parent[self.parent[p]]
      p = self.parent[p]
    return p
  def get_count(self):
    return self.count
  def connected(self,p,q):
    return self.find(p) == self.find(q)
  def union(self,p,q):
    rootP = self.find(p)
    rootQ = self.find(q)
    if (rootP == rootQ):
      return
    if (self.rank[rootP] < self.rank[rootQ]):
      self.parent[rootP]=rootQ
    elif (self.rank[rootP] > self.rank[rootQ]):
      self.parent[rootP]=rootP
    else:
      self.parent[rootQ] = rootP
      self.rank[rootP]+=1
    self.count -=1
uf = UF(10)
uf.union(3,4)
uf.union(3,8)
uf.union(6,5)
uf.union(9,4)
uf.union(2,1)
uf.union(8,9)
print(uf.parent)
print(uf.rank)
print(uf.get_count())
uf.union(5,0)
uf.union(7,2)
uf.union(6,1)
uf.union(1,0)
uf.union(6,7)
print(uf.parent)
print(uf.rank)
print(uf.get_count())

[0, 2, 2, 3, 3, 6, 6, 7, 3, 3]
[0, 0, 1, 1, 0, 0, 1, 0, 0, 0]
4
[0, 6, 6, 3, 3, 6, 6, 6, 3, 3]
[0, 0, 1, 1, 0, 0, 2, 0, 0, 0]
0


## 堆栈、队列、背包

### 栈
- 后进先出
- 链表实现或数组实现
- 好习惯：在pop之后置null
- 数组实现：在满栈之后扩展数组，在占用小于1/4时缩小数组长度

### 队列
- 先进先出
- 链表实现：两个指针，指向头和尾


# 排序

## 基础排序
- 按照某种规则对键值进行排序 
- 比较大小，交换位置

### 选择排序
- 选择未排序中最小的与首项交换位置
- ~$\frac{1} 2 N^2$

In [None]:
def sele_sort(arr):
  n = len(arr)
  for i in range(0,n):
    index = i
    for j in range(i,n):
      if (arr[j]<arr[index]):
        index = j
    if (index != i):
      temp = arr[i]
      arr[i] = arr[index]
      arr[index] = temp
  return arr

### 插入排序
- 将标志位左边的按照顺序排好，新数据逐次交换至正确位置
- ~$\frac{1} 4 N^2$

In [None]:
def insert_sort(arr):
  n = len(arr)
  for i in range(0,n):
    for j in range(i,0,-1):
      if (arr[j]<arr[j-1]):
        temp = arr[j]
        arr[j] =arr[j-1]
        arr[j-1] = temp
  return arr

### 希尔排序(shellsort)
- 在插入排序基础上，多次循环，逐次比较的间隔缩小
- 间隔h的选取
  - $2^n$不太行
  - $2^n -1$也许可行
  - $3n-1$ 还不错
  - Sedgewivk $1,5,19,41,109,209,505,929...$ 挺好用的
- ~ $N^{3/2}$

In [None]:
def shell_sort(arr,h_list):
  n = len(arr)
  m = len(h_list)
  for j in range(0,m):
    h = h_list[j]
    for i in range(h,n):
      for k in range(i,h-1,-h):
        if (arr[k]<arr[k-h]):
          temp = arr[k]
          arr[k]= arr[k-h]
          arr[k-h] =temp
  return arr


### 洗牌排序
- 生成随机数列的方式
- 对现有有序/无序数列遍历，标志位i每增加1，生成一个在0~i中的随机整数r，交换i,r

### 应用
- convex hull：   
  需要一组空间点中能够作为顶点组成多边形将其余所有点包围的顶点组合
- Graham 扫描
 - 选择y坐标最小的点
 - 将其余点与其连线计算极角并排序
 - 按顺序连线，必须满足从原点开始每一个新的连线都是以上一条线延长线逆时针旋转后得到的
 - 通过判断三个点坐标组成的行列式值的符号，确定是否逆时针（CCW）

## 归并排序（Mergesort）
- 对半分
- 递归排序：一直对半分到双元素排序
- 合并

### 分治
- 将问题通过二分递归求解
- ~$6NlogN$
- $D(N) = 2D(N/2) , D(1) =0 \to D(N)= NlogN$
- 数据量越大越高效
- 在比较次数上最优，但空间l

### 自下而上的递归
- 从两个元素为一组开始两两合并
- 排序完成的部分呈幂次增长

In [None]:
def merge(left,right):
  res = []
  i =j =0
  while(i<len(left) and j<len(right)):
    if (left[i]<right[j]):
      res.append(left[i])
      i +=1
    else:
      res.append(right[j])
      j +=1
  while (i == len(left) and j < len(right)):
    res.append(right[j])
    j +=1
  while (i < len(left) and j == len(right)):
    res.append(left[i])
    i +=1
  return res

def merge_sort(arr):
  if len(arr)<=1:
    return arr
  middle = len(arr)//2
  left = merge_sort(arr[:middle])
  right = merge_sort(arr[middle:])
  return merge(left,right)


## 快排
- 递归：把数列按照基准元素分为两部分，一部分小于，另一部分大于
- 重复分割
- 无需额外空间
- ~$NlogN$

In [None]:
# 实现逻辑
def quick_sor(arr):
  if len(arr) <= 1:
    return arr
  else:
    base = arr[0]
    less = [v for v in arr[1:] if v<=base]
    more = [v for v in arr[1:] if v>base]
    return quick_sor(less) + [base] + quick_sor(more)

In [None]:
def partition(arr,lo,hi):
  base = arr[lo]
  i = lo+1
  j = hi
  while(i<j):
    while(i<j and arr[i]<= base):
      i+=1
    while(i<j and arr[j]>base):
      j -=1
    arr[i],arr[j] =arr[j],arr[i]
  arr[lo],arr[i-1] = arr[i-1],arr[lo]
  return i-1
  
def quick_sort(arr,lo,hi):
  if lo < hi:
    mid = partition(arr,lo,hi)
    quick_sort(arr,lo,mid-1)
    quick_sort(arr,mid+1,hi)
  else:
    return
  return arr
  

- 选取最大/小的第k个元素：
  - 分组
  - 判断分组元素是否是k
  - 大于k，右边部分继续分组，反之左边
- 重复键值：
  - 三向分割，小于，等于，大于
  

## 优先级队列（Priority queues）
- 取出队列中最大/最小的项


### 二进制堆（Binary Heap）
- 将数组视为二叉树
- 保证父节点的值大于叶子节点
- 新插入的数放在最后，通过比较换位确定在二叉树中的位置


### 堆排序
- 根据二进制堆的概念
- 将每个节点下的二叉树都确保最小/最大排序原则

- 保证$NlogN$
- 时间和空间上都是最优
- 内循环比快排多（比较次数多）
- 缓存空间使用率低
- 不稳定

In [None]:
import math
def shift_down(arr,start,end):
  left = 2*start+1
  right = 2*start+2
  maxium = start
  if (left < end) and (arr[left]>arr[start]):
    maxium = left
  if (right < end) and(arr[right]>arr[maxium]):
    maxium = right
  if maxium != start:
    arr[start],arr[maxium] = arr[maxium],arr[start]
    shift_down(arr,maxium,end)

def heap_sort(arr):
  n = len(arr)
  for i in range(n-1,-1,-1):
    shift_down(arr,i,n)
  for i in range(n-1,0,-1):
    arr[0],arr[i] = arr[i],arr[0]
    shift_down(arr,0,i)
  return arr


## 排序测试
- 几种算法总结

![summary](https://algs4.cs.princeton.edu/25applications/images/sort-characteristics.png)

In [None]:
arr = [2,5,7,3,1,8,10,1,4,3,12,16,13,1,4,8,5,10,15,13,21,4]
h_list = [7,3,1]    

print(insert_sort(arr))
print(sele_sort(arr))
print(shell_sort(arr,h_list))
print(merge_sort(arr))
print(quick_sort(arr,0,len(arr)-1))
print(heap_sort(arr))

[1, 1, 1, 2, 3, 3, 4, 4, 4, 5, 5, 7, 8, 8, 10, 10, 12, 13, 13, 15, 16, 21]
[1, 1, 1, 2, 3, 3, 4, 4, 4, 5, 5, 7, 8, 8, 10, 10, 12, 13, 13, 15, 16, 21]
[1, 1, 1, 2, 3, 3, 4, 4, 4, 5, 5, 7, 8, 8, 10, 10, 12, 13, 13, 15, 16, 21]
[1, 1, 1, 2, 3, 3, 4, 4, 4, 5, 5, 7, 8, 8, 10, 10, 12, 13, 13, 15, 16, 21]
[1, 1, 1, 2, 3, 3, 4, 4, 4, 5, 5, 7, 8, 8, 10, 10, 12, 13, 13, 15, 16, 21]
[1, 1, 1, 2, 3, 3, 4, 4, 4, 5, 5, 7, 8, 8, 10, 10, 12, 13, 13, 15, 16, 21]


# 搜索


## 基本符号表

- 插入一个有关键字和键值
- 给出关键字，搜索对应值
- `a[key] = val`
- 

## 二叉搜索树
Binary Search Tree（BST）

- 结构：
  - 对称二叉树：每个节点都大于其左子树的叶子节点，小于其右子树的叶子节点
  - ![示例](https://algs4.cs.princeton.edu/32bst/images/bst-anatomy.png)

#### 二叉树遍历
- 前序：根节点 -> 左节点 -> 右节点
- 中序：左节点 -> 根节点 -> 右节点
- 后序：左节点 -> 右节点 -> 根节点
- ![举例](https://pic4.zhimg.com/80/v2-0fcc909a2787cd92c1315481748d2b57_720w.jpg)
- 前序：A-B-D-F-G-H-I-E-C
- 中序：F-D-H-I-G-B-E-A-C
- 后序：F-H-I-G-D-E-B-C-A

In [None]:
class Node:
  def __init__(self,data):
    self.data = data
    self.left_child = None
    self.right_child = None

class BST:
  preOrder = []

  def __init__(self,node_list):
    self.root = Node(node_list[0])
    for i in node_list[1:]:
      self.insert(i) 
  
  def search(self, root, data):
    flag = 0
    prev = None
    while(root != None) and root.data !=data:
      prev = root
      if (data < root.data):
        root = root.left_child
      elif (data > root.data):
        root = root.right_child
    if (root):
      flag = 1
    return flag, prev, root

  def insert(self,data):
    flag,prev,root = self.search(self.root, data)
    if (prev == None):
      print("initial")
      self.root = Node(val)
    
    if (flag == 0):
      root = Node(data)
      if (data<prev.data):
        prev.left_child = root
      else:
        prev.right_child = root
    else:
      print("Already exist")
    return

  def delete(self, data):
    flag,prev,root = self.search (self.root, data)
    if (flag == 0):
      print("Failed to delete, cause no such data")
      return 
    
    # 备选节点没有左右叶子节点
    if (root.left_child == None or root.right_child == None):

      if (root.left_child == None and root.right_child == None):
        replace = None
      elif (root.left_child == None):
        replace = root.right_child
      elif (root.right_child == None):
        replace = root.left_child
    
      if (prev.left_child == root):
        prev.left_child = replace
      else:
        prev.right_child = replace
    
    if (root.left_child and root.right_child):
      check = root.right_child
      while (check.left_child):
        check = check.left_child
      temp = check.data
      self.delete(check.data)
      root.data = temp
    return 

  # 前序遍历（根左右）
  def preOrderTra(self,node):
    if (node):
      print(node.data,end = ' ')
      self.preOrderTra(node.left_child)
      self.preOrderTra(node.right_child)
  # 中序遍历（左根右）
  def inOrderTra(self,node):
    if (node):
      self.inOrderTra(node.left_child)
      print(node.data,end=' ')
      self.inOrderTra(node.right_child)
  # 后序遍历（左右根）
  def postOrderTra(self,node):
    if(node):
      self.postOrderTra(node.left_child)
      self.postOrderTra(node.right_child)
      print(node.data,end =' ')

    
arr =  [17,5,25,2,11,35,9,16,29,38,7,8]
a = BST(arr)
a.preOrderTra(a.root)
a.delete(5)
print()
a.preOrderTra(a.root)

17 5 2 11 9 7 8 16 25 35 29 38 
17 7 2 11 9 8 16 25 35 29 38 

## 红黑树
- 构建更为平衡的二叉树
- 将2-3树改写为二叉树
  - 2-3树：根节点为2个数，三个叶子节点分别为三个区间的数据
  - 红黑树：含有红黑节点的自平衡二叉树，满足：
    - 节点为黑色或红色
    - 根节点为黑色
    - 叶子节点（None）为黑色
    - 每个红色节点的两个子节点必为黑
    - 任意节点到每个叶子节点的路径包含相同数量的黑色节点


  


In [None]:
class Node:
  def __init__(self,data):
    self.data =data
    self.left_child = None
    self.right_child = None
    self.isRed = False
    
class RBtree:


---
# 实战

In [None]:
def mmmm(n):
  mem = [-1]*(n+1)
  def dp(n):
    if mem[n] != -1:
      return mem[n]
    if n == 1:
      return 1
    res = n

    if (n%2 == 0 and n%3 ):
      res = min(res,dp(n//2)+1,dp(n-1)+1)
    elif (n%3 == 0 and n%2):
      res = min(res,dp(n//3)+1,dp(n-1)+1)
    elif (n%3 == 0 and n%2 ==0):
      res = min(res,dp(n//3)+1,dp(n-1)+1,dp(n//2)+1)
    else:
      res = min(res,dp(n-1)+1)
    # print(res,mem)
    if res != -1:
      mem[n] = res 
    return mem[n]
  return dp(n)

n = 565
print(mmmm(n))


11
