## 什么是 Tensor

1. 标量，也称 Scalar，是一个只有大小，没有方向的量，比如 1.8、e、10 等。
2. 向量，也称 Vector，是一个有大小也有方向的量，比如 (1,2,3,4) 等。
3. 矩阵，也称 Matrix，是多个向量合并在一起得到的量，比如[(1,2,3),(4,5,6)]等。

![data_type](./data_type.jpg)

这种统一的数据形式，在 PyTorch 中我们称之为张量 (Tensor)。从标量、向量和矩阵的关系来看，你可能会觉得它们就是不同“维度”的 Tensor，这个说法对，也不全对。

说它不全对是因为在 Tensor 的概念中，我们更愿意使用 Rank（秩）来表示这种“维度”，比如标量，就是 Rank 为 0 阶的 Tensor；向量就是 Rank 为 1 阶的 Tensor；矩阵就是 Rank 为 2 阶的 Tensor。也有 Rank 大于 2 的 Tensor。当然啦，你如果说维度其实也没什么错误，平时很多人也都这么叫。

## Tensor 的类型、创建及转换

### Tensor 的类型

![tensor_type](./tensor_type.jpg)

### Tensor 的创建

#### 直接创建
torch.tensor(data, dtype=None, device=None,requires_grad=False)

我们从左往右依次来看，首先是 data，也就是我们要传入模型的数据。PyTorch 支持通过 list、 tuple、numpy array、scalar 等多种类型进行数据传入，并转换为 tensor。

接着是 dtype，它声明了你需要返回一个怎样类型的 Tensor，具体类型可以参考前面表格里列举的 Tensor 的 8 种类型。

然后是 device，这个参数指定了数据要返回到的设备，目前暂时不需要关注，缺省即可。

最后一个参数是 requires_grad，用于说明当前量是否需要在计算中保留对应的梯度信息。在 PyTorch 中，只有当一个 Tensor 设置 requires_grad 为 True 的情况下，才会对这个 Tensor 以及由这个 Tensor 计算出来的其他 Tensor 进行求导，然后将导数值存在 Tensor 的 grad 属性中，便于优化器来更新参数。

所以，你需要注意的是，把 requires_grad 设置成 true 或者 false 要灵活处理。如果是训练过程就要设置为 true，目的是方便求导、更新参数。而到了验证或者测试过程，我们的目的是检查当前模型的泛化能力，那就要把 requires_grad 设置成 Fasle，避免这个参数根据 loss 自动更新。

#### 从 NumPy 中创建
torch.from_numpy(ndarry)

#### 创建特殊形式的 Tensor
- torch.zeros(*size, dtype=None...)
- torch.eye(size, dtype=None...)
- torch.ones(size, dtype=None...)
- torch.rand(size)
- torch.randn(size)
- torch.normal(mean, std, size)
- torch.randint(low, high, size）
- torch.rand 用于生成数据类型为浮点型且维度指定的随机 Tensor，随机生成的浮点数据在 0~1 区间均匀分布。
- torch.randn 用于生成数据类型为浮点型且维度指定的随机 Tensor，随机生成的浮点数的取值满足均值为 0、方差为 1 的标准正态分布。
- torch.normal 用于生成数据类型为浮点型且维度指定的随机 Tensor，可以指定均值和标准差。
- torch.randint 用于生成随机整数的 Tensor，其内部填充的是在[low,high) 均匀生成的随机整数。

### Tensor 的转换

In [14]:
# Int 与 Tensor 的转换：
import torch

a = torch.tensor(1)
b = a.item()

a, b


(tensor(1), 1)

In [15]:
# list 与 tensor 的转换：

a = [1,2,3]
b = torch.tensor(a)
c = b.numpy().tolist()

b, c

(tensor([1, 2, 3]), [1, 2, 3])

In [16]:
# NumPy 与 Tensor 的转换：

import numpy as np
a = np.array([1,2,3])
b = torch.tensor(a)
a, b

(array([1, 2, 3]), tensor([1, 2, 3], dtype=torch.int32))

In [17]:
# CPU 与 GPU 的 Tensor 之间的转换：

# CPU->GPU: data.cuda()
# GPU->CPU: data.cpu()

## Tensor 的常用操作

### 获取形状

In [18]:
# shape 是 torch.tensor 的一个属性，
# 而 size() 则是一个 torch.tensor 拥有的方法。
a = torch.zeros(2,3,4)
a.shape, a.size()

(torch.Size([2, 3, 4]), torch.Size([2, 3, 4]))

In [19]:
# numel() 函数直接统计元素数量
a.numel()

24

### 矩阵转秩 (维度转换）
permute() 和 transpose() 可以用来实现矩阵的转秩

In [20]:
# 用 permute 函数可以对任意高维矩阵进行转置
x = torch.rand(2,3,5)
x.shape

torch.Size([2, 3, 5])

In [21]:
x = x.permute(2,1,0)
x.shape

torch.Size([5, 3, 2])

In [22]:
x = torch.rand(2,3,4)
x.shape

torch.Size([2, 3, 4])

In [23]:
# transpose不同于 permute，它每次只能转换两个维度，或者说交换两个维度的数据
x = x.transpose(1,0)
x.shape

torch.Size([3, 2, 4])

### 形状变换
在 PyTorch 中有两种常用的改变形状的函数，分别是 view 和 reshape

In [30]:
x = torch.randn(4, 4)
x.shape

torch.Size([4, 4])

In [31]:
x = x.view(2,8)
x.shape

torch.Size([2, 8])

In [32]:
x = x.permute(1,0)
x.shape

torch.Size([8, 2])

In [33]:
x.view(4,4) # 因为 view 不能处理内存不连续 Tensor 的结构。

RuntimeError: view size is not compatible with input tensor's size and stride (at least one dimension spans across two contiguous subspaces). Use .reshape(...) instead.

In [34]:
# reshape 相当于进行了两步操作，先把 Tensor 在内存中捋顺了，然后再进行 view 操作。
x = x.reshape(4,4)
x.shape

torch.Size([4, 4])

### 增减维度
有时候我们需要对 Tensor 增加或者删除某些维度，比如删除或者增加图片的几个通道。PyTorch 提供了 squeeze() 和 unsqueeze() 函数解决这个问题。

#### squeeze

In [35]:
# squeeze()。如果 dim 指定的维度的值为 1，则将该维度删除，
# 若指定的维度值不为 1，则返回原来的 Tensor。
x = torch.rand(2,1,3)
x.shape


torch.Size([2, 1, 3])

In [36]:
y = x.squeeze(1)
y.shape

torch.Size([2, 3])

In [37]:
z = y.squeeze(1)
z.shape

torch.Size([2, 3])

#### unsqueeze

In [38]:
# 这个函数主要是对数据维度进行扩充。给指定位置加上维数为 1 的维度
x = torch.rand(2,1,3)
y = x.unsqueeze(2)
y.shape

torch.Size([2, 1, 1, 3])

In [40]:
z = y.unsqueeze(0)
z.shape

torch.Size([1, 2, 1, 1, 3])

In [None]:
torch.Tensor(), torch.tensor()