# PyTorch Tensor 常用计算方法详解

PyTorch 的 `Tensor` 类提供了极其丰富的方法，涵盖了从基础数学运算到高级线性代数的所有需求。对于开发者来说，掌握这些方法可以写出更简洁、高效的代码。

PyTorch 的运算通常有两种调用方式，**功能基本等价**：
1.  **函数式**：`torch.mean(x)`
2.  **方法式**：`x.mean()`

以下是按功能分类的常用 Tensor 计算方法详解，包含代码示例和注意事项。

---

## 一、归约运算（Reduction Operations）
**作用**：将张量的多个元素聚合为一个值（或沿某个维度聚合）。
**关键点**：注意 `dim` 参数，决定沿哪个维度计算。

| 方法 | 说明 | 示例 |
| :--- | :--- | :--- |
| `mean(dim)` | 计算均值 | `x.mean(dim=0)` |
| `sum(dim)` | 计算求和 | `x.sum(dim=1)` |
| `prod(dim)` | 计算乘积 | `x.prod()` |
| `std(dim, unbiased)` | 计算标准差 | `x.std(dim=0, unbiased=False)` |
| `var(dim, unbiased)` | 计算方差 | `x.var(dim=0)` |
| `max(dim)` | 最大值 (返回值，索引) | `val, idx = x.max(dim=1)` |
| `min(dim)` | 最小值 (返回值，索引) | `val, idx = x.min(dim=1)` |
| `argmax(dim)` | 最大值的索引 | `x.argmax(dim=1)` |
| `argmin(dim)` | 最小值的索引 | `x.argmin()` |
| `norm(p, dim)` | 计算范数 (L1, L2 等) | `x.norm(p=2, dim=1)` |
| `cumsum(dim)` | 累积求和 | `x.cumsum(dim=0)` |

**代码示例**：

In [None]:

import torch
x = torch.tensor([[1., 2., 3.], [4., 5., 6.]])

print(x.mean())          # 标量：3.5
print(x.mean(dim=0))     # 按列均值：[2.5, 3.5, 4.5]
print(x.sum(dim=1))      # 按行求和：[6., 15.]
print(x.std(dim=1))      # 按行标准差

## 二、逐元素数学运算（Element-wise Math）
**作用**：对张量中的每个元素独立进行数学计算。
**关键点**：支持广播机制（Broadcasting）。

| 方法 | 说明 | 示例 |
| :--- | :--- | :--- |
| `add(other)` | 加法 (`+`) | `x.add(1)` 或 `x + 1` |
| `sub(other)` | 减法 (`-`) | `x.sub(1)` 或 `x - 1` |
| `mul(other)` | 乘法 (`*`) | `x.mul(2)` 或 `x * 2` |
| `div(other)` | 除法 (`/`) | `x.div(2)` 或 `x / 2` |
| `pow(exp)` | 幂运算 | `x.pow(2)` 或 `x ** 2` |
| `sqrt()` | 平方根 | `x.sqrt()` |
| `rsqrt()` | 倒数平方根 (`1/sqrt`) | `x.rsqrt()` |
| `square()` | 平方 | `x.square()` |
| `abs()` | 绝对值 | `x.abs()` |
| `neg()` | 取负 | `x.neg()` 或 `-x` |
| `exp()` | 指数 (`e^x`) | `x.exp()` |
| `log()` | 自然对数 (`ln`) | `x.log()` |
| `log10()` / `log2()` | 对数 | `x.log10()` |
| `sin()`, `cos()`, `tan()` | 三角函数 | `x.sin()` |
| `floor()`, `ceil()`, `round()` | 下取整，上取整，四舍五入 | `x.floor()` |
| `clamp(min, max)` | 截断 (类似 ReLU) | `x.clamp(min=0)` |


**代码示例**：


In [None]:
x = torch.tensor([1., 4., 9.])

print(x.sqrt())       # [1., 2., 3.]
print(x.pow(0.5))     # [1., 2., 3.] (等价 sqrt)
print(x.clamp(min=0, max=5)) # 限制范围
print(x.exp())        # [e^1, e^4, e^9]

## 三、比较与逻辑运算（Comparison & Logic）
**作用**：生成布尔张量（Boolean Tensor），常用于 Mask 操作。

| 方法 | 说明 | 示例 |
| :--- | :--- | :--- |
| `eq(other)` | 等于 (`==`) | `x.eq(0)` |
| `ne(other)` | 不等于 (`!=`) | `x.ne(0)` |
| `gt(other)` | 大于 (`>`) | `x.gt(0)` |
| `lt(other)` | 小于 (`<`) | `x.lt(0)` |
| `ge(other)` | 大于等于 (`>=`) | `x.ge(0)` |
| `le(other)` | 小于等于 (`<=`) | `x.le(0)` |
| `bool()` | 转换为布尔类型 | `x.bool()` |
| `masked_fill(mask, val)`| 按掩码填充值 | `x.masked_fill(x<0, 0)` |

**代码示例**：


In [None]:
x = torch.tensor([-1., 0., 1., 2.])

mask = x.gt(0)          # [False, False, True, True]
print(x[mask])          # [1., 2.] (布尔索引)
print(x.masked_fill(x < 0, 0)) # [-0., 0., 1., 2.] (负数变 0)


## 四、线性代数运算（Linear Algebra）
**作用**：矩阵乘法、转置等。

| 方法 | 说明 | 示例 |
| :--- | :--- | :--- |
| `matmul(other)` | 矩阵乘法 (`@`) | `x.matmul(y)` 或 `x @ y` |
| `mm(other)` | 2D 矩阵乘法 | `x.mm(y)` (严格 2D) |
| `bmm(other)` | 批量矩阵乘法 | `x.bmm(y)` (3D: [B, N, M]) |
| `t()` | 2D 转置 | `x.t()` |
| `transpose(dim0, dim1)` | 任意维度交换 | `x.transpose(0, 1)` |
| `permute(*dims)` | 任意维度重排 | `x.permute(2, 0, 1)` |
| `inverse()` | 矩阵求逆 | `x.inverse()` |
| `det()` | 行列式 | `x.det()` |

**代码示例**：


In [None]:
A = torch.randn(3, 4)
B = torch.randn(4, 5)

C = A.matmul(B)     # 形状 [3, 5]
D = A @ B           # 等价写法
print(A.t().shape)  # [4, 3]



## 五、形状与内存操作（Shape & Memory）
虽然不算“计算”，但通常与计算紧密配合。

| 方法 | 说明 | 示例 |
| :--- | :--- | :--- |
| `view(*shape)` | 改变形状 (需内存连续) | `x.view(-1, 10)` |
| `reshape(*shape)` | 改变形状 (更智能) | `x.reshape(3, -1)` |
| `squeeze(dim)` | 去除维度为 1 的轴 | `x.squeeze()` |
| `unsqueeze(dim)` | 增加维度为 1 的轴 | `x.unsqueeze(0)` |
| `flatten(start, end)`| 展平 | `x.flatten(1, 2)` |
| `contiguous()` | 使内存连续 | `x.transpose(0,1).contiguous()` |
| `item()` | 获取标量值 (Python 数) | `x.sum().item()` |
| `numpy()` | 转为 NumPy 数组 | `x.numpy()` |

---

## 六、梯度与设备管理（Gradient & Device）
深度学习特有的操作。

| 方法 | 说明 | 示例 |
| :--- | :--- | :--- |
| `backward()` | 反向传播 | `loss.backward()` |
| `detach()` | 脱离计算图 (无梯度) | `x.detach()` |
| `requires_grad_(flag)`| 设置是否需要梯度 | `x.requires_grad_(True)` |
| `to(device)` | 移动设备 (CPU/CUDA) | `x.to('cuda')` |
| `cuda()` / `cpu()` | 快捷移动设备 | `x.cuda()` |
| `type(dtype)` | 转换数据类型 | `x.float()` / `x.half()` |

