# 数据结构与算法

## 数据结构 - 更高效的代码

高手之间的细节包括:

1. 算法够不够优化 -----> 时间复杂度低
2. 数据存取效率是不是够高 -----> 响应快
3. 内存是不是够节省 -----> 空间复杂度低

为什么学习数据结构和算法？有 3 点比较重要

1. 直接好处是能够有写出性能更优的代码。
2. 算法，是一种解决问题的思路和方法，有机会应用到生活和事业的其他方面。
3. 长期来看，大脑思考能力是个人最重要的核心竞争力，而算法是为数不多的能够有效训练大脑思考能力的途径之一。

数据结构与算法的定义(广义):

- 数据结构: 一组数据的存储结构.(数据在内存中是以何种方式存储的)
- 算法: 操作数据的一组方法. (操作这组数据的方法)

数据结构是为算法服务的，算法要作用在特定的数据结构上 如果选择链表，那就不适合用二分法；如果想用二分法，那么就应该选择数数组

![summary](./img/img1.webp)

20 个最常用的、最基础数据结构与算法：

- 10 个数据结构：数组、链表、栈、队列、散列表、二叉树、堆、跳表、图、Trie 树；
- 10 个算法：递归、排序、二分查找、搜索、哈希算法、贪心算法、分治算法、回溯算法、动态规划、字符串匹配算法

大 O 复杂度表示法：T(n)=O(f(n)) T(n) 表示代码执行的时间； n 表示数据规模的大小； f(n) 表示每行代码执行的次数总和。

因为这是一个公式，所以用 f(n) 来表示。公式中的 O，表示代码的执行时间 T(n) 与 f(n) 表达式成正比。

![time](./img/img3.webp)

总结
一、什么是复杂度分析？

1. 数据结构和算法解决是“如何让计算机更快时间、更省空间的解决问题”。
2. 因此需从执行时间和占用空间两个维度来评估数据结构和算法的性能。
3. 分别用时间复杂度和空间复杂度两个概念来描述性能问题，二者统称为复杂度。
4. 复杂度描述的是算法执行时间（或占用空间）与数据规模的增长关系。

二、为什么要进行复杂度分析？

1. 和性能测试相比，复杂度分析有不依赖执行环境、成本低、效率高、易操作、指导性强的特点。
2. 掌握复杂度分析，将能编写出性能更优的代码，有利于降低系统开发和维护成本。

三、如何进行复杂度分析？

1. 大 O 表示法
   1）来源
   算法的执行时间与每行代码的执行次数成正比，用 T(n) = O(f(n))表示，其中 T(n)表示算法执行总时间，f(n)表示每行代码执行总次数，而 n 往往表示数据的规模。
   2）特点
   以时间复杂度为例，由于时间复杂度描述的是算法执行时间与数据规模的增长变化趋势，所以常量阶、低阶以及系数实际上对这种增长趋势不产决定性影响，所以在做时间复杂度分析时忽略这些项。
2. 复杂度分析法则
   1）单段代码看高频：比如循环。
   2）多段代码取最大：比如一段代码中有单循环和多重循环，那么取多重循环的复杂度。
   3）嵌套代码求乘积：比如递归、多重循环等
   4）多个规模求加法：比如方法有两个参数控制两个循环的次数，那么这时就取二者复杂度相加。

四、常用的复杂度级别？
- 多项式阶：随着数据规模的增长，算法的执行时间和空间占用，按照多项式的比例增长。包括，
O(1)（常数阶）、O(logn)（对数阶）、O(n)（线性阶）、O(nlogn)（线性对数阶）、O(n^2)（平方阶）、O(n^3)（立方阶）
- 非多项式阶：随着数据规模的增长，算法的执行时间和空间占用暴增，这类算法性能极差。包括，
O(2^n)（指数阶）、O(n!)（阶乘阶）

五、如何掌握好复杂度分析方法？
复杂度分析关键在于多练，所谓孰能生巧。


一、复杂度分析的 4 个概念

1. 最坏情况时间复杂度：代码在最理想情况下执行的时间复杂度。
2. 最好情况时间复杂度：代码在最坏情况下执行的时间复杂度。
3. 平均时间复杂度：用代码在所有情况下执行的次数的加权平均值表示。
4. 均摊时间复杂度：在代码执行的所有复杂度情况中绝大部分是低级别的复杂度，个别情况是高级别复杂度且发生具有时序关系时，可以将个别高级别复杂度均摊到低级别复杂度上。基本上均摊结果就等于低级别复杂度。

二、为什么要引入这 4 个概念？

1. 同一段代码在不同情况下时间复杂度会出现量级差异，为了更全面，更准确的描述代码的时间复杂度，所以引入这 4 个概念。
2. 代码复杂度在不同情况下出现量级差别时才需要区别这四种复杂度。大多数情况下，是不需要区别分析它们的。

三、如何分析平均、均摊时间复杂度？

1. 平均时间复杂度
   代码在不同情况下复杂度出现量级差别，则用代码所有可能情况下执行次数的加权平均值表示。
2. 均摊时间复杂度
   两个条件满足时使用：1）代码在绝大多数情况下是低级别复杂度，只有极少数情况是高级别复杂度；2）低级别和高级别复杂度出现具有时序规律。均摊结果一般都等于低级别复杂度。
