<img src="https://numpy.net.cn/doc/stable/_static/numpylogo.svg" alt="NumPy Logo" height="60"><br>

# **NumPy Tutorial**
> [NumPy 中文官方文档](https://numpy.net.cn/doc/stable/index.html)
---

## 1. 基础操作
### 1.1 获取帮助
* 查看数组的帮助文档：`help(a)`

In [None]:
import numpy as np
# 查看文档字符串
help(np.max) # 相当于print(np.max.__doc__)

### 1.2 数组的属性
* 数组的属性：`shape`、`ndim`、`size`、`dtype`

In [None]:
import numpy as np
# 创建一个二维数组
a = np.array([[1, 2, 3], [4, 5, 6]])
# 获取数组的属性
print(a.shape)  # 数组的维度，按(rows,cols)，输出: (2, 3)
print(a.size)  # 数组元素的总数，输出: 6
print(a.ndim)  # 数组的轴数（维数），输出: 2
print(a.dtype)  # 数组中元素的数据类型，输出: dtype('int32')
print(a.itemsize)  # 数组中每个元素的字节大小，输出: 4
print(a.nbytes)  # 数组占用的总字节数，输出: 24

### 1.3 创建数组
* 创建基本数组：
  - `np.array()`：从Python列表或元组创建数组
  - `np.zeros()`：创建一个全零数组
  - `np.ones()`：创建一个全一数组
  - `np.empty()`：创建一个空数组，数组元素为<mark>随机值</mark>
  - `np.arange()`：创建一个等差数组
  - `np.linspace()`：创建一个等间隔数组

In [None]:
import numpy as np
# 创建数组
array_1d = np.array([1, 2, 3]) # 通过list创建数组
array_2d = np.array([[1, 2, 3], [4, 5, 6]],dtype=float) # 通过list创建二维数组,指定元素类型为float
array_zero = np.zeros((3,3),dtype=np.int16) # 创建一个2x3的全0数组,指定元素类型为int16
print(f"array_1d = {array_1d}\narray_2d = \n{array_2d}\narray_zero = \n{array_zero}")
# 创建数字序列（类似于range()函数）
array_range = np.arange(0, 10, 2.5) # 创建一个从0到9，步长为2.5的数组
theta = np.linspace(0, np.pi, 4) # 创建一个从0到π，包含4个元素的数组
array_reshaped = np.arange(6).reshape((3,2)) # 将0到5的数组转换为3x2的数组
print(f"array_range = {array_range}\ncos = {np.cos(theta)}")
print(f"array_reshaped = \n{array_reshaped}")


### 1.4 基本运算
* NumPy数组中的运算符`*`是逐元素相乘，而不是矩阵乘法。要进行矩阵乘法，需要使用`@`运算符(Python >= 3.5)或`np.dot()`函数。
* `+=`和`*=`等运算符用于原地修改数组，而不是创建新数组。
* 常用操作：`a.sum()`、`a.mean()`、`a.max()`、`a.min()`、`a.prod()`、`a.cumsum()`、`a.cumprod()`、`a.std()`、`a.var()`、`a.argmax()`、`a.argmin()`、`a.argsort()`

In [None]:
import numpy as np
A = np.array([[1,2],[3,4]])
B = np.array([[5,6],[7,8]])
# 逻辑运算
print(A < 3) # 每个元素是否小于3，返回布尔值数组
# 数组乘法
print(A @ B) # 矩阵乘法，或者使用A.dot(B)或np.dot(A, B)
print(A * B) # 逐元素相乘
print(A**2) # 每个元素的平方
B *= A # *= 操作会修改B数组，而不是创建新数组
print(f"B={B}")
# 常用操作
print(f"sum={A.sum()}")   # 数组所有元素的和
print(f"col_sum={A.sum(axis=0)}") # 每列的和，0-列，1-行
print(f"cum_sum={A.cumsum(axis=0)}") # 每列的累计和，0-列，1-行
print(f"mean={A.mean()}") # 数组所有元素的平均值
print(f"max={A.max()}")   # 数组所有元素的最大值
print(f"min={A.min()}")   # 数组所有元素的最小值
print(f"std={A.std()}")   # 数组所有元素的标准差
print(f"var={A.var()}")   # 数组所有元素的方差
# 通用函数 `ufunc`
print(np.sqrt(A)) # 每个元素的平方根
print(np.exp(A)) # 每个元素的指数
print(np.log(A)) # 每个元素的自然对数
print(np.sin(A)) # 每个元素的正弦值

### 1.5 索引和切片
* 使用tuple进行索引时，输出的是一个元素
* 使用list进行索引时，输出的是一个数组，而不是一个元素

In [None]:
import numpy as np
# 一维数组
A = np.array([1,2,3,4,5,6,7,8,9])
print(A[0:5]) # 第0到4个元素，或 A[:5]
print(A[5:]) # 第5个元素到最后一个元素
print(A[::2]) # 每隔一个元素取一个，即第0、2、4、6、8个元素
print(A[::-1]) # 反转数组

# 多维数组
B = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(B[0, :]) # 第0行，或 B[0]
# ...代替:，对于多维数组...表示剩下的所有维度
print(B[1, ...]) # 第1行，或 B[1]
# 用flat迭代器遍历数组所有元素（ravel()函数返回一个展平的一维数组）
for element in B.flat:
    print(element)

# 使用索引数组进行索引，被索引的数组是一维的情况
i = np.array([[0, 1], [1, 2]]) # 二维索引
print(A[i]) # 输出也是二维形式
# 被索引的数组是多维的情况
print(B[i]) # 索引指的是B的第一个维度
# 多维索引
j = np.array([[0, 1], [1, 2]])
print(B[i, j]) # 索引指的是B的第一个维度和第二个维度
# 使用tuple进行索引
t=(1, 2)
print(B[t]) # 输出一个元素，但如果使用l=[1,2]进行索引，输出的是一个数组


In [None]:
import numpy as np
# 一个例子：使用数组索引搜索时间相关序列的最大值
time = np.linspace(20, 145, 5)  # time scale
data = np.sin(np.arange(20)).reshape(5, 4)  # 4 time-dependent series
# index of the maxima for each series
ind = data.argmax(axis=0)
# times corresponding to the maxima
time_max = time[ind]
data_max = data[ind, range(data.shape[1])]  # => data[ind[0], 0], data[ind[1], 1]...
time_max
data_max

* bool索引
  - 可以使用bool数组进行索引，bool数组的长度必须与被索引的数组的长度相同
  - 输出的数组的长度是bool数组中True的数量

In [None]:
import numpy as np
a = np.arange(12).reshape(3, 4)
b = a > 4 # 输出一个bool数组
a[b] # 输出a中所有大于4元素的一维数组

### 1.6 数组的形状操作

In [None]:
import numpy as np

A = np.floor(10*np.random.random((3,4))) # 创建一个3x4的随机数组，元素取0-9的整数
print(A)
# 以下操作都会返回一个新的修改了形状的数组，但不改变原数组A
print(A.ravel()) # 展平数组为一维
print(A.reshape(6,2)) # 重塑为6x2的数组
print(A.T) # 转置数组
# 以下操作会修改原数组a的形状
A.resize((2,6)) # 修改数组形状为2x6，或 A.resize((2,-1))，-1表示自动计算该维度大小
print(A)
A.shape = (6,2) # 直接修改shape属性也可以修改数组形状
print(A)
# 数组拼接
B = np.floor(10*np.random.random((3,4)))
C = np.floor(10*np.random.random((3,4)))
print(np.vstack((B, C))) # 垂直堆叠数组
print(np.hstack((B, C))) # 水平堆叠数组

### 1.7 副本和视图
* 变量的简单赋值操作和索引操作以及函数的传参，不会创建新的对象，而是创建一个新的引用（视图）指向原对象
* 视图（View）：通过简单赋值操作、索引操作或函数传参，创建的新对象，指向原对象的内存地址，对视图的操作会影响原对象（修改shape不会改变原对象的内存地址，因为view只共享数据，不共享元数据）

In [None]:
import numpy as np
# 简单赋值，相当于引用，不会创建新的对象
a = np.array([[1, 2, 3]])
b = a  # b是a的引用
b is a # True
# 视图view
c = a.view() # 显示视图，切片操作也会创建视图
c is a # False
c.base is a # True
c = c.reshape(3, 1) # 修改视图的shape，不改变原对象的shape
a.shape # (1, 3)
# 深拷贝copy
d = a.copy()
d is a # False
d.base is a # False
d.shape # (1, 3)

### 1.8 保存数组

In [None]:
import numpy as np
# 保存和读取数组
a = np.arange(10)
np.save('a.npy', a)
b = np.load('a.npy')
# 保存为文本格式
np.savetxt('a.txt', a)                 # 保存为txt格式
np.savetxt('a.csv', a, delimiter=',')  # 保存为CSV格式
c = np.loadtxt('a.csv', delimiter=',') # 读取文本格式

## 2. 图表
### 2.1 直方图

In [None]:
import numpy as np
rg = np.random.default_rng(1)
import matplotlib.pyplot as plt
# Build a vector of 10000 normal deviates with variance 0.5^2 and mean 2
mu, sigma = 2, 0.5
v = rg.normal(mu, sigma, 10000)
# Plot a normalized histogram with 50 bins
plt.hist(v, bins=50, density=True) 
# Compute the histogram with numpy and then plot it
(n, bins) = np.histogram(v, bins=50, density=True)  # NumPy version (no plot)
plt.plot(.5 * (bins[1:] + bins[:-1]), n) 

### 2.2 曲线
* plt.plot() 函数与MATLAB中的plot函数十分类似

In [None]:
import numpy as np
import matplotlib.pyplot as plt
# 一维数据曲线
x = np.linspace(0, 2*np.pi, 100)
plt.plot(x,'g.') # 绿色点
# 二维数据曲线
fig = plt.figure() # 创建一个新的图表
plt.plot(x, np.sin(x),'r+') # 红色+
# 子图
plt.figure() # 创建一个新的图表
plt.subplot(1,2,1) # 1行2列第1个子图
plt.plot(x, np.sin(x))
plt.subplot(1,2,2)
plt.plot(x, np.cos(x))

