# NumPy 常用知识点汇总

> 本 Notebook 系统整理了 NumPy 的核心概念、常用函数与典型用法，适合快速查阅与学习。

In [None]:
import numpy as np

print("NumPy 版本:", np.__version__)

## 一、核心概念：`ndarray`

- 同类型多维数组
- 高效内存布局（C 连续）
- 关键属性：`ndim`, `shape`, `size`, `dtype`, `itemsize`

In [None]:
# 创建一个二维数组
arr = np.array([[1, 2, 3], [4, 5, 6]])

print("数组:\n", arr)
print("维度 (ndim):", arr.ndim)
print("形状 (shape):", arr.shape)
print("元素总数 (size):", arr.size)
print("数据类型 (dtype):", arr.dtype)
print("每个元素字节数 (itemsize):", arr.itemsize)

## 二、创建数组

常用函数：`array`, `zeros`, `ones`, `full`, `eye`, `arange`, `linspace`, `random`

In [None]:
# 从列表创建
a1 = np.array([1, 2, 3])
print("array:", a1)

# 全零/全一/填充
a2 = np.zeros((2, 3))
a3 = np.ones((2, 3))
a4 = np.full((2, 3), 7)
print("\nzeros:\n", a2)
print("\nones:\n", a3)
print("\nfull:\n", a4)

# 单位矩阵
a5 = np.eye(3)
print("\neye (单位矩阵):\n", a5)

# 序列
a6 = np.arange(0, 10, 2)        # [0, 2, 4, 6, 8]
a7 = np.linspace(0, 1, 5)       # 均匀5个点
print("\narange:", a6)
print("linspace:", a7)

# 随机数
a8 = np.random.rand(2, 3)       # [0,1) 均匀分布
a9 = np.random.randn(2, 3)      # 标准正态分布
a10 = np.random.randint(0, 10, size=(2, 3))  # 整数随机
print("\nrand (均匀):\n", a8)
print("\nrandn (正态):\n", a9)
print("\nrandint (整数):\n", a10)

## 三、数组操作

- 形状变换：`reshape`, `T`, `flatten`, `ravel`
- 拼接：`concatenate`, `vstack`, `hstack`
- 分割：`split`
- 广播（自动对齐不同形状）

In [None]:
arr = np.array([[1, 2, 3], [4, 5, 6]])

# 形状变换
print("原数组:\n", arr)
print("reshape(3,2):\n", arr.reshape(3, 2))
print("转置 T:\n", arr.T)
print("flatten (副本):", arr.flatten())
print("ravel (视图优先):", arr.ravel())

# 拼接
a = np.array([[1], [2]])
b = np.array([[3], [4]])
print("\nvstack:\n", np.vstack([a, b]))
print("hstack:\n", np.hstack([a, b]))

# 分割
c = np.array([1, 2, 3, 4])
print("\nsplit into 2 parts:", np.split(c, 2))

## 四、数学与统计方法

- 求和、均值、标准差等
- 聚合可指定 `axis`（0: 列方向, 1: 行方向）
- 矩阵乘法：`dot` 或 `@`

In [None]:
arr = np.array([[1, 2, 3], [4, 5, 6]])

print("数组:\n", arr)
print("sum (全):", np.sum(arr))
print("sum axis=0 (列和):", np.sum(arr, axis=0))
print("mean:", np.mean(arr))
print("std:", np.std(arr))
print("min:", np.min(arr), " | argmin:", np.argmin(arr))
print("max:", np.max(arr), " | argmax:", np.argmax(arr))

# 累积
print("cumsum:", np.cumsum(arr))

# 矩阵乘法
A = np.array([[1, 2], [3, 4]])
B = np.array([[5], [6]])
print("\nA @ B =\n", A @ B)  # 或 np.dot(A, B)

## 五、索引与切片

- 基础索引：`arr[i, j]`
- 切片：`arr[:, 1]`
- 布尔索引：`arr[arr > 3]`
- 花式索引：`arr[[0,1], [1,2]]`

> ⚠️ 切片返回视图（修改影响原数组），布尔/花式索引返回副本。

In [None]:
arr = np.array([[1, 2, 3], [4, 5, 6]])

# 基础索引与切片
print("arr[0, 1]:", arr[0, 1])
print("第1列:", arr[:, 1])
print("第0行:", arr[0, :])

# 布尔索引
print("大于3的元素:", arr[arr > 3])

# 花式索引
print("取 (0,1) 和 (1,2):", arr[[0, 1], [1, 2]])

# 演示视图 vs 副本
slice_view = arr[:, 1]
slice_view[0] = 999
print("修改切片后原数组:\n", arr)  # 会被改变！

## 六、其他实用技巧

- 类型转换：`astype`
- 处理 NaN：`isnan`, `nan_to_num`
- 保存/加载：`save`, `load`

In [None]:
# 类型转换
arr_int = np.array([1, 2, 3])
arr_float = arr_int.astype(np.float32)
print("转为 float32:", arr_float, arr_float.dtype)

# NaN 处理
arr_nan = np.array([1, np.nan, 3])
print("含 NaN 数组:", arr_nan)
print("是否 NaN:", np.isnan(arr_nan))
print("替换 NaN 为 0:", np.nan_to_num(arr_nan, nan=0.0))

# 保存与加载（可选运行）
# np.save('my_array.npy', arr_nan)
# loaded = np.load('my_array.npy')
# print("加载的数组:", loaded)

## ✅ 总结

掌握以上内容，即可应对大多数 NumPy 使用场景，包括：
- 数据预处理
- 科学计算
- 机器学习输入准备
- 图像/信号处理基础

> 提示：在 Jupyter 中按 `Shift + Tab` 可查看函数文档，`?np.sum` 查看详细帮助。