目标：什么是数据结构、什么是算法? 两者什么关系？

## 1. 算法是什么？

算法就是一系列操作步骤的集合，它能够在有限的资源（时间、指令、内存）下，解决被明确定义的问题。
* 问题被明确定义：输入是什么？输出是什么？
* 操作步骤是确定的、明确的、有限的
* 算法的结果是确定的

## 2. 数据结构是什么？

数据结构定义了数据的组织方式，这种组织方式有多种实现方式。这种组织方式涵盖了数据内容、数据关系、数据行为。例如对于逻辑上的顺序结构，物理上有利用连续存储空间的数组、非连续空间的链表。其中前者用物理上的内存地址的先后顺序表示数据的先后顺序，后者采用指针表示元素的先后顺序，数据行为都包括了增删查改。

每种数据结构都有自己的利弊，比如链表易于删除、插入，但是由于物理空间非连续其访问速度较差。每种数据结构能够经过实践的淘汰被保存下来都有它自己的用武之地，你也可以针对自己的需求设计一种自己的数据结构。

## 3. 数据结构+算法

两者互相依存缺一不可：数据结构是算法的基石，算法为数据结构注入灵魂；如果说数据结构是对现实世界的静态描述，那么算法就是让这个现实世界活跃起来的灵魂。好比一个厨子手拿锅、铲、调料、食材等数据，那菜谱就是他的算法。只有两者皆上等，才能做出美味的菜肴。

## 4. 复杂度分析的定义

厨子做出菜了，怎么评价其好坏？算法复杂度分析（时间复杂度、空间复杂度）用于评估一个算法的优劣。这两个维度的评价标准也告诉我们人类是贪心的既要快又要省（时间快、占用硬件资源少）

那么给了两个解决同一问题的算法怎么评价呢？

* 将两个算法在同一台计算机上跑一下记录时间和物理资源暂用不就好了？
  
**局限性**：
* 耗费资源
* 硬件配置不一样，时间就不一样、消耗的内存也不一样。

能不能有一种在纸上就能估算出来的方法呢？有！

**定义**：算法复杂度分析描述了当问题规模的增加，算法执行所需的时间和空间的**增长系数**。

如果想要在实践中学习如何分析时间复杂度和空间复杂度我们需要先理解迭代和递归。所以我们在这一小节仅仅引入复杂度分析的定义，`第5小结了解迭代与递归`；`第6小结分析算法的时间/空间复杂度`。


## 5. 重要工具：迭代与递归

计算机编程语言Python、Java、C等，基本都支持迭代和递归。它是是我们解决问题的重要工具，你将在各个分治、动态规划、回溯等算法中都能看到它，理解它有助于我们分析和解决问题。**算法是一种逻辑思维、程序语言是一种工具，两者是独立的，不要被语言束缚。你可以用任何一种语言实现你的逻辑思维**

### 5.1 迭代

迭代指一种程序控制结构，程序在满足给定的条件下重复的执行某段代码的行为，直到不满足条件为止。Python中常用的迭代控制结构有`for`、`while`循环。

In [6]:
# for循环
arr = [1,2,3,4]
for i in range(len(arr)):
    arr[i] = arr[i]**2
print(arr)

[1, 4, 9, 16]


In [9]:
# while循环
res = []
i = 0
while i<10:
    i = i+1
    i = i**2
    res.append(i)
print(res)

[1, 4, 25]


从结构上看 `while` 的自由度更高，可以灵活的设计进入和跳出循环的条件，使用的时候要灵活的选择。

### 5.2 递归

指程序调用自身，包括了 递 和 归 两个过程

* **递**：程序不断调用自身的过程
* **归**：到达递过程的最深处，开始逐级返回的过程

写递归程序的重点：

* **递归调用**：调用自身的代码
* **终止条件**：程序的出口，这是递转归的重要条件，如果程序一直找不到出口，那么程序会一直调用下去，直到达到调用栈的最大深度。
* **返回结果**：在归的过程中将结果逐级返回

注意递归调用是非常耗费资源的，每次调用都要保存调用函数的当前状态，以保证在调用结束后程序能够恢复当前状态继续执行（其实也是保证了归这个过程顺利执行），很多系统设置了最大的调用栈的深度。

典型的递归调用的例子是 `fibonacci数列` 第 `n` 项是第 `n-1` 和 `n-2` 项的和 即：$fib(n)=fib(n-1)+fib(n-2)$, 其中 $fib(1)=fib(2)=1$ 求当给定任意数字 n 时 $fib(n)$ 的值。

In [3]:
# 求fibonacci数列第n项的值
def fib_recur(n):
    # 程序出口
    if n==1 or n==2:
        return 1
    # 递归调用
    res = fib_recur(n-1)+fib_recur(n-2)
    # 返回结果
    return res
print(fib_recur(10))

55


递归调用栈分析：

<img src="./fib.png">

我们发现递归的调用过程中存在着很多的重复计算，其实递归就是一个暴力求解的过程，它的时间、空间复杂度都很低，但是很多算法是基于它优化得来的，其中一个非常常用的优化策略就是**剪枝**，例如在上述图中我们将已经重复计算的 $fib(3) 、fib(4)$ 存储起来，用到的时候直接拿出来用，不用再重复计算，这样就提高时间复杂度，虽然空间复杂度上升了但是在可接受范围内，毕竟存储器比时间要便宜。具体代码如下：

In [1]:
def fib_table(n, table):
    if n==1 or n==2:
        return 1
    # 剪枝策略，减少重复递归计算
    if table[n]!=-1:
        return table[n]
    res = fib_table(n-1, table)+fib_table(n-2, table)
    table[n] = res
    return res
n = 10
table = [-1]*(n+1)
print(fib_table(n, table))
print(table)

55
[-1, -1, -1, 2, 3, 5, 8, 13, 21, 34, 55]


In [None]:
# 时间测试
import time
n = 40

t1 = time.time()
res_recur = fib_recur(n)
t2 = time.time()
print(f"fib_recur | 结果：{res_recur} | 时间：{round(t2-t1,4)} sec")

table = [-1]*(n+1)
res_tab = fib_table(n, table)
t3 = time.time()
print(f"fib_table | 结果：{res_tab} | 时间：{round(t3-t2,4)} sec")

fib_recur | 结果：102334155 | 时间：13.1498 sec
fib_table | 结果：102334155 | 时间：0.0006 sec


**深入思考**：从本质上，递归体现了分治的算法思想，“将求解问题分解为子问题，然后逐一击破，然后利用子问题的解求解问题”的思维范式，这种至关重要，很多算法就是基于递归改进的，比如上面说的剪枝的改进策略，大大减少了重复计算。

* 从算法角度看，搜索、排序、回溯、分治、动态规划等许多重要算法策略直接或间接地应用了这种思维方式。
* 从数据结构角度看，递归天然适合处理链表、树和图的相关问题，因为它们非常适合用分治思想进行分析（因为具有**重复子结构**，即子问题和要求解的问题本质上是同一结构）。
  
**综上：当问题具有重复子结构的时候，递归能够提供暴力解，然后根据具体问题选择优化策略！！！** 多做题总结算法框架。

## 6. 时/空间复杂度分析

### 6.1 时间复杂度

时间复杂度分析统计的不是算法运行时间，而是算法运行时间随着数据量变大时的**增长趋势**

### 6.2 空间复杂度

空间复杂度（space complexity）用于衡量算法占用内存空间随着数据量变大时的**增长趋势**

### 二叉树

## 三、算法

### 2. 分治

基于分治实现的二分查找

In [None]:
def binary_search(nums, target, i, j):
    if i>j:
        return -1
    mid = (i+j)//2
    if nums[mid]==target:
        return mid
    elif target>nums[mid]:
        return binary_search(nums, target, mid+1, j)
    else:
        return binary_search(nums, target, i, mid-1)
nums = [1,2,3,4,5,6,7,8]
print(binary_search(nums, 3, 0, 7))

2


### 3. 贪心

[零钱兑换](https://leetcode.cn/problems/coin-change/description/)：给你一个整数数组 `coins` ，表示不同面额的硬币；以及一个整数 `amount` ，表示总金额。计算并返回可以凑成总金额所需的最少的硬币个数。如果没有任何一种硬币组合能组成总金额，返回 -1 。你可以认为每种硬币的数量是无限的。

In [3]:
def coin_change_greedy(coins: list[int], amt: int) -> int:
    """零钱兑换：贪心"""
    # 假设 coins 列表有序
    i = len(coins) - 1
    count = 0
    # 循环进行贪心选择，直到无剩余金额
    while amt > 0:
        # 找到小于且最接近剩余金额的硬币
        while i > 0 and coins[i] > amt:
            i -= 1
        # 选择 coins[i]
        amt -= coins[i]
        count += 1
    # 若未找到可行方案，则返回 -1
    return count if amt == 0 else -1
coins = [1,2,3,4]
amount = 8
print(coin_change_greedy(coins, amount))

2


### 4. 动态规划

[爬楼梯](https://leetcode.cn/problems/climbing-stairs/description/)：假设你正在爬楼梯。需要 n 阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢？

In [5]:
def climbStairs(n):
    if n==1 or n==2:
        return n
    return climbStairs(n-1)+climbStairs(n-2)

n = 4
print(climbStairs(n))

5


## 四、应用

### 1. 排序

#### 快速排序

In [2]:
# 递归版本
def quick_sort(arr):
    if len(arr)<=1:
        return arr # 递归出口
    m = arr[len(arr)//2] # 选择中间元素
    left = [i for i in arr if i< m] # 小于基准
    middle = [i for i in arr if i == m] # 等于基准
    right = [i for i in arr if i > m] # 大于基准
    return quick_sort(left)+middle+quick_sort(right) # 递归调用

import random
arr = [random.randint(1,100) for _ in range(10)]
print(arr)
print(quick_sort(arr))

[88, 84, 67, 11, 15, 48, 51, 84, 69, 48]
[11, 15, 48, 48, 51, 67, 69, 84, 84, 88]


In [None]:
# 递归（inplace）版本
def quicksort_inplace(arr, low, high):
    if low<high:
        index = splition(arr, low, high)
        quicksort_inplace(arr, low, index-1)
        quicksort_inplace(arr, index+1, high)

def splition(arr, low, high):
    # 根据基准划分list
    m = arr[high] # 末尾作为基准
    i = low-1 # i以及i的左边都是小于m的
    for j in range(low, high):
        if arr[j]<m:
            i+=1
            arr[i], arr[j] = arr[j], arr[i] 
    arr[i+1], arr[high] = arr[high], arr[i+1] # 将基准摆在正确位置
    return i+1

# 示例使用
arr = [3, 6, 8, 10, 1, 1, 2]
quicksort_inplace(arr, 0, len(arr) - 1)
print(arr)