# 算法

## 定义
- 对特定问题`求解方法和步骤`的一种描述
- 是`一串有限序列的指令`
- 每个指令标识一个或多个操作


In [None]:
"""
解决问题的方法和步骤
step1:...
step2:...
step3:...
...
"""
PI = 3.14
class Solution:
    def area(self, r:float)->float:
        res = PI * r * r
        return res

## 算法描述
- 自然语言：中文，英文
  - 求一元一次方程解，面积，周长等
- 流程图：
  - ![传统流程图和 NS 流程图.png](attachment:image-3.png)
- 伪代码：类语言，如类 C 语言
- 程序代码：python 语言，C 语言程序 ...

## 算法与程序
- `算法`是解决问题的方法或过程，考虑如何将输入转换成输出，一个问题可以有多种算法
- `程序`是用特定程序设计语言对算法的具体实现
  - 程序 = 数据结构 + 算法
  - 数据结构通过算法实现操作
  - 算法根据数据结构设计程序

## 算法特性
- `有穷性`，执行有限步骤或有限时间后完成
- `确定性`，无二义性，即对于相同的输入只能得到相同的输出
- `可行性`，可执行的
- `输入`，零个或多个输入
- `输出`，一个或多个输出

## 算法设计的要求
- `正确性`，满足问题要求，能正确解决问题，算法转化为程序后要注意：
  1. 程序中`不含语法错误`
  2. 程序对于`几组输入数据（测试用例）`能够得出满足要求的结果
  3. 程序对于`精心选择的，典型、苛刻且带有刁难性`的几组测试用例能够得到满足要求的结构
  4. 程序对于`一切合法的输入数据`都能得出满足要求的结果
  - PS: 通常以`第 3 条意义上的正确性`作为衡量一个算法是否合格的标准
- `可读性`，通俗易懂
  1. 算法主要是为了人的阅读和交流，其次才是为计算机执行
  2. 另一方面来说，晦涩难读的算法易于隐藏错误而难以调试和优化
- `健壮性`，预支错误路径
  1. 当`输入非法数据`时，算法恰当的作出反应或进行相应处理，而不是产生莫名其妙的输出结果
  2. 处理出错的时候，不应是中断程序的执行，而是返回错误的值便于上层处理
- `高效性`，尽可能少时间和低的存储

## 算法分析
- 同一个问题，可以有许多不同的算法。那么如何来评价这些算法的优劣程度呢？
`算法分析`，目的是看算法实际是否可行，并在一题多解的场景下进行性能上的比较，以便从中挑选出较优算法。
- 一个好的算法，首先要具备正确性，健壮性，可读性的前提下，然后就是考虑`算法的效率`
- 算法效率以两个维度来考虑：
  - `时间效率`，算法执行过程消耗的`时间`
  - `空间效率`，算法执行过程耗费的`存储空间`
  - PS: 注意的是，`时间效率和空间效率有时是矛盾的`，即牺牲空间来缩短时间的消耗

## 算法时间效率的度量
- 算法时间效率可以用依据该算法编写的程序在计算机上执行所消耗的`时间`来度量
- 两种度量方法
  - 事后统计：
    - 将算法实现，测算其时间和空间开销
    - `缺点`：编写程序实现算法花费较多的时间和精力，所得的实验结果依赖于计算机的软硬件环境因素，无法精准判断算法本身的优劣
  - 事前分析：
    - 对算法所消耗的资源的一种估算方法
    - `推荐使用`

## 算法事前分析方法
- 一个算法的运行时间是指一个算法在计算机上运行所耗费的时间大致可以等于计算机执行`一种简单的操作的时间`（如赋值，移动，比较等）与算法中进行的简单操作的`次数`的`乘积`。
  - `算法运行时间 = 一个简单操作所需的时间 x 简单操作次数`
- 也即算法中每条语句的执行时间之和 (Σ: 累加和)
  - `算法运行时间 = Σ 每条语句的执行次数 x 该语句执行一次所需要的时间`
  - 其中，每条语句的执行次数也称为`语句频度`，所以也有如下转化：
  - `算法运行时间 = Σ 每条语句频度 x 该语句执行一次所需要的时间`
  - 每条语句执行一次所需的时间，一般都是随机器环境而异。取决于机器的指令性能、速度以及编译的代码质量。是由机器本身软硬件环境决定的，与算法无关。
  - 因此，可以`假设执行每条语句所需的时间均为单位时间`。这就可以独立于不同机器的环境来分析算法的时间性能。此时上述表达式可进一步转化为：
  - `算法运行时间 = Σ 每条语句频度`

## 算法时间复杂度定义
- 算法中`基本语句重复执行的次数`是`问题规模n`的某个函数f(n)，算法的时间度量记作： `T(n)=O(f(n))`
- 它表示随着 n 增大，算法的执行时间增长率和 f(n) 的增长率相同，称`渐近时间复杂度`
- `基本语句重复执行的次数`剖析：
  - 算法中重复执行次数和算法的执行时间成正比的语句
  - 对算法运行时间贡献最大
  - 执行次数最多
- `问题规模`示例：
  - 排序: n 为记录数
  - 矩阵: n 为矩阵的阶数
  - 多项式: n 为多项式的项数
  - 集合: n 为元素的个数
  - 数: n 为树的节点个数
  - 图: n 为图的顶点数或变数


## 算法分析-比较数量级
- 为了比较不同算法的时间效率，仅比较它们的数量级
- 例如： T1(n) = 10n^2 与 T2(n) = 5n^3 , 哪个更优？
- 若有某个`辅助函数 f(n)`，使得当 n 趋于近无穷大时，T(n)/f(n)的极限值为`不等于零的常数`，则称f(n)是T(n)的同数量级函数。记作`T(n)=O(f(n))`,称O(f(n))为`算法的渐进时间复杂度（O 是数量级的符号,Order）`，简称`时间复杂度`。

In [None]:
n = int(input("假使此场景下输入的 n 的值为正无穷 >>>:"))

假使此场景下输入的 n 的值为正无穷 >>>: 1000000


### 指数级

In [None]:
for i in range(n):              # n 次
    for j in range(n):          # n * n 次
        for k in range(n):      # n * n * n 次
            x += 1              # n * n * n 次

# 根据多项式推算出语句频度
# T(n) = 2n^3 + n^2 + n
# ||
# ||
# T(n) = n^3

### 对数级

In [None]:
i = 1
while i <= n:
    i *= 2

"""
循环执行 1 次： i = 1 * 2 = 2
循环执行 2 次： i = 2 * 2 = 2^2
循环执行 3 次： i = 2^2 * 2 = 2^3
循环执行 4 次： i = 2^3 * 2 = 2^4

...
循环执行 n 次： i = 2^n
"""
    
# T(n) = O(lgn)

### 算法时间复杂度计算 1
有的情况下，算法中基本操作重复执行的次数还随问题的输入数据集不同而不同
- ✅最坏时间复杂度：指在最坏情况下，算法的执行时间
- ✅平均时间复杂度：指在所有可能输入示例在等概率出现的情况下，算法期望执行时间
- 最好时间复杂度：指在最好情况（如最优输入数据集），算法的执行时间

In [None]:
def func():
    for i in range(n):
        return i  # 找到目标 num 则返回第 i 个元素，即共执行了 i 次
    return 0

func()

"""
- 最好情况： 1 次
- 最坏情况： n
- 平均时间复杂度为： O(n)
"""

### 算法时间复杂度计算 2
- 对于复杂的算法，可以将它分成几个容易估算的部分，然后利用加法、乘法等基本运算法则去计算算法的时间复杂度

In [None]:
# 加法
T(n) = T1(n) + T2(n) = O(f(n)) + O(g(n)) = O(max(f(n), g(n)))

# 乘法
T(n) = T1(n) * T2(n) = O(f(n)) * O(g(n)) = O(f(n) * g(n))

# 算法时间效率的比较
当 n 取得值很大时，指数时间算法和多项式时间算法在所需时间上非常悬殊：

复杂度低 -> 复杂度高
常数阶 < 对数阶 < 线性阶 < 线性对数阶 < 平方阶 < 立方阶 < ... < k 方阶 < 指数阶
O(1)    O(lgn)  O(n)      O(nlgn)   O(n^2)  O(n^3)  ...  O(n^k)    O(2^n)

- 示例图 TODO


# 渐进空间复杂度
- 空间复杂度，即算法所需存储空间的度量
  - 记作  S(n) = O(f(n))
  - 其中 n 为问题的规模或大小

- 算法要占据的空间
  - 算法本身要占据的空间，输入/输出，指令，常数，变量等
  - 算法要使用的辅助空间

## 算法空间复杂度分析，示例
将一对数组 a 中的 n 个数逆序存放到原数组中
- TODO