
# Numpy简介
使用例子:
- 点积/内积
- 矩阵相乘
- 逐元素矩阵乘
- 线性系统
- 矩阵逆
- 随机数
- 处理表示为数组的图像（OpenCV-Python）

应用:

- 机器学习（Machine Learning）
- 深度学习（Deep Learning）
- 机器学习库 scikit-learn
- 绘图库 Matplotlib
- Pandas

numpy是所有科学软件包中的核心库。 numpy库中的核心对象是numpy数组。

[一个10分钟的NumPy入门教程](https://www.bilibili.com/video/BV1Wy4y1h7ii?from=search&seid=12584087987975944154)


本教程主要分3部分进行，分别是
- 一维数组（向量）
- 二维数组（矩阵）
- 三纬数组（张量）  
该教程主要内容来自于[The Visual Guide to NumPy](https://betterprogramming.pub/numpy-illustrated-the-visual-guide-to-numpy-3b1d4976de1d)

# Numpy 数组 VS Python 列表
NumPy数组类似于Python列表。 它们都可以用作容器，具有快速获取和设置项目以及较慢地插入和删除元素的功能。

NumPy特点：
- 在尺寸不止一维的情况下，可以向量化操作时比列表快
- 将元素追加到末尾比列表慢
- NumPy数组只能快速处理一种类型的元素
![image.png](attachment:image.png)

# 一维数组 VS 一维列表
![image.png](attachment:image.png)

## 创建特定数组
![image.png](attachment:image.png)

通常需要创建一个空数组，该空数组通过形状和元素类型与现有数组匹配
![image.png](attachment:image.png)

类似的函数还有非常多
![image.png](attachment:image.png)

![image.png](attachment:image.png)

## 初始化单调数组
![image.png](attachment:image.png)
如果需要浮点数组，例如[0.，1.，2.]，则可以更改arange输出的类型：arange（3）.astype（float），但是有一种更好的方法。 arange函数对类型敏感：如果将int作为参数输入，它将生成int，并且如果输入浮点数（例如arange（3.）），则将生成浮点数。

## 生成随机数
![image.png](attachment:image.png)

# 向量索引
一旦将数据存储在数组中，NumPy提供简单的方法来将其取回 **注意索引是从0开始的**
![image.png](attachment:image.png)

- 上面展示了各式各样的索引，例如取出某个特定区间，从右往左索引、只取出奇数位等等。但它们都是所谓的view，也就是不存储原始数据。这些索引方法允许分配修改原始数组的内容。
- 因此需要特别注意：只有下面最后一种方法才是复制数组，如果用其他方法都可能破坏原始数据：
![image.png](attachment:image.png)

- 视图（view）是数据的一个别称或引用，通过该别称或引用亦便可访问、操作原有数据，但原有数据不会产生拷贝。如果我们对视图进行修改，它会影响到原始数据，物理内存在同一位置。

### 布尔索引
从NumPy数组中获取数据的另一种超级有用的方法是布尔索引，它允许使用各种逻辑运算符，来检索符合条件的元素
![image.png](attachment:image.png)
注意：Python中的三元比较3<=a<=5在NumPy数组中不起作用。


如上所述，布尔索引也会改写数组。它有两个常见的函数，分别是np.where和np.clip：
![image.png](attachment:image.png)

## 向量操作
算术运算是NumPy速度最引入注目的地方之一。NumPy的向量运算符已达到C++级别，避免了Python的慢循环。NumPy允许像普通数字一样操作整个数组（加减乘除、整除、幂）：
![image.png](attachment:image.png)

向量还可以与标量进行类似的运算，方法相同
![image.png](attachment:image.png)

NumPy拥有大多数的数学函数用于处理向量
![image.png](attachment:image.png)

向量的点积、叉积也有运算符
https://www.shuxuele.com/algebra/vectors-cross-product.html
![image.png](attachment:image.png)

也可以进行三角函数、反三角函数、求斜边运算
![image.png](attachment:image.png)

数组可以四舍五入为整数
- floor取**下界**
- ceil取**上界**
- round为**四舍五入**；对于恰好介于四舍五入的十进制值之间的值，NumPy会四舍五入为最接近的偶数值。 因此，将1.5和2.5舍入为2.0，-0.5和0.5舍入为0.0，依此类推
![image.png](attachment:image.png)

NumPy还可以执行以下基本的统计运算（最大最小值、平均值、方差、标准差）：
![image.png](attachment:image.png)

NumPy支持的排序函数的功能比Python列表对应函数更少
![image.png](attachment:image.png)

## 比较浮点数
函数np.allclose(a, b)用于比较具有给定公差的浮点数组
![image.png](attachment:image.png)
- np.allclose假设所有的比较数字的等级是1个单位。例如在上图中，它就认为1e-9和2e-9相同，如果要进行更细致的比较，需要通过atol指定比较等级np.allclose(1e-9, 2e-9, atol=1e-17) == False。

- math.isclose进行比较没有假设前提，而是基于用户给出的一个合理abs_tol值：math.isclose(0.1+0.2–0.3, abs_tol=1e-8) == True。

# 矩阵
在学习矩阵运算之前，我们要明白两个概念
- 行是axis=0
- 列是axis=1
![image.png](attachment:image.png)

矩阵初始化语法与向量相似，注意这里的函数(ones, zeros,empty)是需要**双括号**，因为第二个位置参数是为dtype保留的

![image.png](attachment:image.png)

随机矩阵的生成也类似于向量的生成
![image.png](attachment:image.png)

二维索引语法比嵌套列表更方便,和一维数组一样，下图的view表示，切片数组实际上并未进行任何复制。修改数组后，更改也将反映在切片中。
![image.png](attachment:image.png)

## axis参数
在许多操作（例如求和）中，我们需要告诉NumPy是否要跨行或跨列进行操作。为了使用任意维数的通用表示法，NumPy引入了axis的概念：axis参数实际上是所讨论索引的数量：第一个索引是axis=0，第二个索引是axis=1，等等。因此在二维数组中，如果axis=0是按列，那么axis=1就是按行。
![image.png](attachment:image.png)

## 矩阵运算
除了普通的运算符（如+，-，\*，/，// 和 \*\*）以元素方式计算外，还有一个@运算符可计算矩阵乘积：
![image.png](attachment:image.png)

![image.png](attachment:image.png)

## 广播
在NumPy允许向量和矩阵之间，甚至两个向量之间进行元素的混合运算：
![image.png](attachment:image.png)

### 外积和内积
![image.png](attachment:image.png)

### 行向量和列向量
从上面的示例可以看出，在二维数组中，行向量和列向量被不同地对待。默认情况下，一维数组在二维操作中被视为行向量。因此，将矩阵乘以行向量时，可以使用(n，)或(1，n)，结果将相同。如果需要列向量，则有**转置**方法对其进行操作：
![image.png](attachment:image.png)

从一维数组中生成二位数组列向量的两个操作
- reshape重排
- newaxis建立新索引
![image.png](attachment:image.png)
这里的-1参数表示reshape自动计算第二个维度上的数组长度，None在方括号中充当np.newaxis的快捷方式，该快捷方式在指定位置添加了一个空axis。

因此，NumPy中总共有三种类型的向量：
- 一维数组
- 二维行向量
- 二维列向量  
这是两者之间显式转换的示意图：
![image.png](attachment:image.png)
根据规则，**一维数组被隐式解释为二维行向量**，因此通常不必在这两个数组之间进行转换，相应区域用灰色标出。

## 矩阵操作
连接矩阵有两个主要函数
![image.png](attachment:image.png)
- 这两个函数只堆叠矩阵或只堆叠向量时，都可以正常工作。但是当涉及一维数组与矩阵之间的混合堆叠时，vstack可以正常工作：hstack会出现尺寸不匹配错误。
- 因为如上所述，一维数组被解释为行向量，而不是列向量。解决方法是将其转换为列向量，或者使用column_stack自动执行：

![image.png](attachment:image.png)

## 堆叠逆操作
![image.png](attachment:image.png)

矩阵可以通过两种方式完成复制：
- tile类似于复制粘贴
- repeat类似于分页打印
![image.png](attachment:image.png)

特定的列和行可以用delete进行删除
![image.png](attachment:image.png)

插入特定行和列
![image.png](attachment:image.png)

append就像hstack一样，该函数无法自动转置一维数组，因此再次需要对向量进行转置或添加长度，或者使用column_stack代替：
![image.png](attachment:image.png)

实际上，如果我们需要做的就是向数组的边界添加常量值，那么pad函数就足够了：
![image.png](attachment:image.png)

## Meshgrid
Meshgrid这个方法在深度学习的目标检测中经常被使用到。创建如下矩阵
![image.png](attachment:image.png)

该meshgrid函数接受任意一组索引，mgrid仅是切片，indices只能生成完整的索引范围。fromfunction如上所述，仅使用I和J参数一次调用提供的函数
![image.png](attachment:image.png)

在NumPy中有一种更好的方法。无需在整个矩阵上耗费存储空间。仅存储大小正确的矢量就足够了，运算规则将处理其余的内容：
![image.png](attachment:image.png)

## 矩阵统计
![image.png](attachment:image.png)

二维及更高维度中，argmin和argmax函数返回最大最小值的索引：
![image.png](attachment:image.png)

all和any两个函数也能使用axis参数：
![image.png](attachment:image.png)

# 三维数组
在深度学习中，多维数组是经常会被使用到的。

![image.png](attachment:image.png)

我们来看一个彩色图像的例子
![image.png](attachment:image.png)

通过重排一维向量或转换嵌套的Python列表来创建3D数组时，索引的含义为（z，y，x）。

第一个索引是平面的编号，然后才是在该平面上的移动：
![image.png](attachment:image.png)
这种索引顺序很方便，例如用于保留一堆灰度图像（矩阵）：这a[i]是引用第i个图像的快捷方式。



但是此索引顺序不是通用的。处理RGB图像时，通常使用（y，x，z）顺序：前两个是像素坐标，最后一个是颜色坐标（Matplotlib中是RGB ，OpenCV中是BGR ）
![image.png](attachment:image.png)
这样，可以方便地引用特定像素：a[i,j]给出像素的RGB元组(i,j)。

因此，创建特定几何形状的实际命令取决于正在处理的某一种约定：
![image.png](attachment:image.png)

## 矩阵堆叠
![image.png](attachment:image.png)
RGB图像数组（为简便起见，上图仅2种颜色）

## concatenate
![image.png](attachment:image.png)

## moveaxis
![image.png](attachment:image.png)
这种转换没有实际的复制发生。它只是混合索引的顺序。混合索引顺序的另一个操作是数组转置。检查它可能会让我们对三维数组更加熟悉。

## swapaxes
![image.png](attachment:image.png)