# **2.1 数据操作**

## **2.1.1 入门**

In [161]:
import torch # 导入torch

张量表示一个由数值组成的数组，这个数组可能有多个维度。零维张量也称为标量，是一个数字，如1、3、5。一维张量也成为向量（vector），如[1]、[1, 2, 3]。二维张量也称为矩阵（matrix），如[[1, 2], [3, 4]]、[[1, 2, 3]]、[[], [], []]。更高维度（即三维或三维以上）的数组统称为张量。

我们可以用arange方法创建一个向量：

In [162]:
x = torch.arange(12)
x

tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

通过shape属性访问张量的形状（也可以称为尺寸、维度信息）

In [163]:
x.shape

torch.Size([12])

如果只想知道张量中元素的总数，也就是数字标量的个数，可以使用numel方法：

In [164]:
x.numel()

12

如果想改变张量的形状，而不改变元素的数量和值，可以使用reshape方法：

In [165]:
X = x.reshape(3, 4) # 三行四列
X

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])

使用reshape()时，可以省略一个维度的信息，不需要我们做除法，如X = x.reshape(-1, 4)或X = x.reshape(3, -1)

In [166]:
X = x.reshape(4, -1) # 四行
X

tensor([[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8],
        [ 9, 10, 11]])

有时我们需要创建其他类型的张量，可以用以下方法：

In [167]:
torch.zeros(2, 3, 4) # 创建一个2 * 3 * 4的全0张量

tensor([[[0., 0., 0., 0.],
         [0., 0., 0., 0.],
         [0., 0., 0., 0.]],

        [[0., 0., 0., 0.],
         [0., 0., 0., 0.],
         [0., 0., 0., 0.]]])

In [168]:
torch.ones(3) # 创建一个长为3的全1张量，注: 参数为为3表示向量，为(1, 3)时表示矩阵

tensor([1., 1., 1.])

In [169]:
torch.randn(1, 3) # 创建一个1 * 3的，内部元素服从标准高斯分布（正态分布）的张量

tensor([[ 1.1026,  1.3607, -2.2431]])

此外，还可以使用tensor()方法，将python列表作为参数构建张量。

In [170]:
torch.tensor([[1, 2, 3], [4, 5, 6]])

tensor([[1, 2, 3],
        [4, 5, 6]])

## **2.1.2 运算符**

张量是数据的表示，想要利用好这些数据，就要在张量上执行数学运算。最简单且有用的运算类型为**按元素**运算，运算对象可以为一个或多个张量。

In [171]:
x = torch.tensor([1, 2, 4, 8])
y = torch.tensor([2, 2, 2, 2])
x - 1, y * 2, x + y, x - y, x * y, x / y, x ** y # 加、减、乘、除、求幂

(tensor([0, 1, 3, 7]),
 tensor([4, 4, 4, 4]),
 tensor([ 3,  4,  6, 10]),
 tensor([-1,  0,  2,  6]),
 tensor([ 2,  4,  8, 16]),
 tensor([0.5000, 1.0000, 2.0000, 4.0000]),
 tensor([ 1,  4, 16, 64]))

“按元素”方式的应用很广，除了上面几种基本运算符外，还有一些方法，如：

In [172]:
torch.exp(x)

tensor([2.7183e+00, 7.3891e+00, 5.4598e+01, 2.9810e+03])

除了按元素计算，还有各种线性代数运算，例如向量点积、矩阵乘法等，这些在后面的学习中会解释。

我们可以把多个张量在某个维度上拼接（concatenate）在一起，形成更大的张量。

In [173]:
X = torch.arange(12, dtype=torch.float32).reshape(3, 4) # dype指定张量内元素是torch中的32位浮点型
Y = torch.tensor([[2, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])
print(X.dtype, Y.dtype)
Z1 = torch.cat((X, Y), dim=0)
Z2 = torch.cat((X, Y), dim=1)
Z1, Z1.dtype, Z2, Z2.dtype

torch.float32 torch.int64


(tensor([[ 0.,  1.,  2.,  3.],
         [ 4.,  5.,  6.,  7.],
         [ 8.,  9., 10., 11.],
         [ 2.,  1.,  4.,  3.],
         [ 1.,  2.,  3.,  4.],
         [ 4.,  3.,  2.,  1.]]),
 torch.float32,
 tensor([[ 0.,  1.,  2.,  3.,  2.,  1.,  4.,  3.],
         [ 4.,  5.,  6.,  7.,  1.,  2.,  3.,  4.],
         [ 8.,  9., 10., 11.,  4.,  3.,  2.,  1.]]),
 torch.float32)

我们还能通过逻辑运算符构建张量。以X == Y（尺寸一致）为例：对于X和Y每个对应位置上的元素，若相等，则逻辑张量该位置的值为True，否则为False。

In [174]:
X == Y

tensor([[False,  True, False,  True],
        [False, False, False, False],
        [False, False, False, False]])

使用sum()方法对张量的每个元素求和，可以得到一个0维张量：

In [175]:
X.sum()

tensor(66.)

## 2.1.3 广播机制

在2.1.2节中学习张量的“按元素”计算时，参与运算的张量的尺寸通常是一致的，在某些情况下，即使形状不同，我们也可以通过广播机制（broadcasting mechanism）来实现“按元素”计算。这种机制的工作原理如下：
1. 通过复制元素来对张量进行扩展，使扩展后的张量具有相同的尺寸；
2. 对生成的张量执行“按元素”计算。

张量将沿着长度为1的维度进行广播，例如：

In [176]:
a = torch.arange(3).reshape(3, 1)
b = torch.arange(2).reshape(1, 2)
a, b, a + b

(tensor([[0],
         [1],
         [2]]),
 tensor([[0, 1]]),
 tensor([[0, 1],
         [1, 2],
         [2, 3]]))

例中，a张量将第一列复制到其他列，直到与b列数相同，b张量将复制到其他行，直到与a行数相同，然后再进行相加。

## 2.1.4 索引和切片

和python数组一样，张量中的元素可以通过索引或切片访问。

In [177]:
X = torch.arange(12, dtype=torch.float32).reshape(3, 4) # dype指定张量内元素是torch中的32位浮点型
X, X[-1], X[1:3]

(tensor([[ 0.,  1.,  2.,  3.],
         [ 4.,  5.,  6.,  7.],
         [ 8.,  9., 10., 11.]]),
 tensor([ 8.,  9., 10., 11.]),
 tensor([[ 4.,  5.,  6.,  7.],
         [ 8.,  9., 10., 11.]]))

除读取外，还能利用索引和切片对张量元素进行修改。

In [178]:
X[1, 2] = 9
X

tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  9.,  7.],
        [ 8.,  9., 10., 11.]])

如果想为多个元素赋值，也只需要利用它们的索引。

In [179]:
X[:2, 1:] = 12 # 在索引框[]中，用逗号“,”隔开X每个维度上的索引，:2代表前两行，:代表第1列（逻辑上的第2列）到最后
X

tensor([[ 0., 12., 12., 12.],
        [ 4., 12., 12., 12.],
        [ 8.,  9., 10., 11.]])

## 2.1.5 节省内存

执行一些操作可能会导致为结果重新分配内存。

In [180]:
X = torch.arange(12, dtype=torch.float32).reshape(3, 4) # dype指定张量内元素是torch中的32位浮点型
Y = torch.tensor([[2.0, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])

before = id(Y)
Y = Y + X
id(Y) == before

False

在这个例子中，python先计算Y + X，为结果分配新的内存，再令Y指向新内存的位置。
这是可能是不可取的，有以下两个原因：
1. 如果不原地更新，其他引用仍然会指向旧的内存位置，导致代码可能无意中引用旧的参数。
2. 通常情况下，我们希望原地执行张量的更新，无需不必要地分配内存，节省开销。

幸运的是，执行原地操作非常简单。我们可以用切片表示法，将计算的结果分配给与原数组切片对应的原内存中。如Y[:] = \<expression>。同时，使用组合赋值符，如“+=”，也可以进行原地操作。

In [181]:
Z = torch.zeros_like(Y) # 创建尺寸与Y相同的全0张量
print('id(Z) =', id(Z))
Z[:] = X + Y # 将X + Y的结果分配给先前分配的数组
Z += Z # 组合赋值
print('id(Z) =', id(Z))

id(Z) = 2722590477744
id(Z) = 2722590477744


## 2.1.6 转换为其他Python对象

将深度学习框架定义的张量转换为numpy数组（ndarray）很容易，反之也同样容易。

In [182]:
A = X.numpy() # 将torch张量转换为numpy数组
B = torch.tensor(A) # 将numpy数组转换为torch张量
type(A), type(B), id(A), id(X), id(B)

(numpy.ndarray, torch.Tensor, 2722589309136, 2722590587776, 2722590585456)

要将大小为1的张量转换成python标量,可以调用item()方法或python的内置方法，如int()

In [183]:
a = torch.tensor([3.5])
a, a.item(), float(a), int(a)

(tensor([3.5000]), 3.5, 3.5, 3)