### 2.2.1 创建tensor

In [1]:
# 首先导入PyTorch
import torch

In [2]:
# 创建一个5x3的未初始化的Tensor：
x = torch.empty(5, 3)
print(x)

tensor([[1.0102e-38, 9.0919e-39, 1.0102e-38],
        [8.9082e-39, 9.2755e-39, 1.0837e-38],
        [8.4490e-39, 1.1112e-38, 1.0194e-38],
        [9.0919e-39, 8.4490e-39, 9.6429e-39],
        [8.4490e-39, 9.6429e-39, 9.2755e-39]])


In [3]:
# 创建一个5x3的随机初始化的Tensor:
y = torch.rand(5, 3)
print(y)

tensor([[0.7285, 0.0815, 0.2594],
        [0.5888, 0.4555, 0.7882],
        [0.3437, 0.7168, 0.3832],
        [0.4074, 0.1384, 0.3757],
        [0.9963, 0.1289, 0.5599]])


In [4]:
# 创建一个5x3的long型全0的Tensor:
z = torch.zeros(5, 3, dtype=torch.long)
print(z)

tensor([[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]])


In [5]:
x = torch.tensor([5.5, 3])
print(x)

tensor([5.5000, 3.0000])


In [6]:
# 通过现有的Tensor来创建，此方法会默认重用输入Tensor的一些属性，例如数据类型，除非自定义数据类型。
x = x.new_ones(5, 3, dtype=torch.float64)  # 返回的tensor默认具有相同的torch.dtype和torch.device
print(x)

tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]], dtype=torch.float64)


In [7]:
# 指定新的数据类型
y = torch.randn_like(x, dtype=torch.float)
print(y) 

tensor([[ 1.3964, -0.3068, -0.0438],
        [-0.3694,  0.7346,  0.7118],
        [-1.9267, -0.5269, -0.5103],
        [ 0.9307, -1.0041, -0.5653],
        [-0.2234, -0.6141, -0.5410]])


In [8]:
# 可以通过shape或者size()来获取Tensor的形状:
print(x.size())
print(x.shape)

torch.Size([5, 3])
torch.Size([5, 3])


### 2.2.2 操作

+ 算术操作

In [9]:
# 加法形式一
  y = torch.rand(5, 3)
  print(x + y)

tensor([[1.3007, 1.3105, 1.7530],
        [1.2245, 1.8028, 1.5357],
        [1.1721, 1.2505, 1.0169],
        [1.1013, 1.1689, 1.8965],
        [1.9866, 1.7678, 1.5752]], dtype=torch.float64)


In [10]:
# 加法形式二
  print(torch.add(x, y))

tensor([[1.3007, 1.3105, 1.7530],
        [1.2245, 1.8028, 1.5357],
        [1.1721, 1.2505, 1.0169],
        [1.1013, 1.1689, 1.8965],
        [1.9866, 1.7678, 1.5752]], dtype=torch.float64)


In [11]:
# 指定输出
  result = torch.empty(5, 3)
  torch.add(x, y, out=result)
  print(result)

tensor([[1.3007, 1.3105, 1.7530],
        [1.2245, 1.8028, 1.5357],
        [1.1721, 1.2505, 1.0169],
        [1.1013, 1.1689, 1.8965],
        [1.9866, 1.7678, 1.5752]])


In [12]:
# 加法形式三、inplace
# adds x to y
  y.add_(x)
  print(y)

tensor([[1.3007, 1.3105, 1.7530],
        [1.2245, 1.8028, 1.5357],
        [1.1721, 1.2505, 1.0169],
        [1.1013, 1.1689, 1.8965],
        [1.9866, 1.7678, 1.5752]])


+ 索引
+ 索引出来的结果与原数据共享内存，也即修改一个，另一个会跟着修改。

In [13]:
y = x[0, :]
y += 1
print(y)
print(x[0, :]) # 源tensor也被改了

tensor([2., 2., 2.], dtype=torch.float64)
tensor([2., 2., 2.], dtype=torch.float64)


+ 改变形状

In [14]:
# 用view()来改变Tensor的形状：
y = x.view(15)
z = x.view(-1, 5)  # -1所指的维度可以根据其他维度的值推出来
print(x.size(), y.size(), z.size())

torch.Size([5, 3]) torch.Size([15]) torch.Size([3, 5])


view()返回的新Tensor与源Tensor虽然可能有不同的size，但是是共享data的，也即更改其中的一个，另外一个也会跟着改变。(顾名思义，view仅仅是改变了对这个张量的观察角度，内部数据并未改变)

In [15]:
x += 1
print(x)
print(y) # 也加了1

tensor([[3., 3., 3.],
        [2., 2., 2.],
        [2., 2., 2.],
        [2., 2., 2.],
        [2., 2., 2.]], dtype=torch.float64)
tensor([3., 3., 3., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       dtype=torch.float64)


如果想返回一个真正新的副本（不共享data内存），先用clone创造一个副本然后再使用view()

In [16]:
x_cp = x.clone().view(15)
x -= 1
print(x)
print(x_cp)

tensor([[2., 2., 2.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]], dtype=torch.float64)
tensor([3., 3., 3., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       dtype=torch.float64)


使用clone还有一个好处是会被记录在计算图中，即梯度回传到副本时也会传到源Tensor。

In [17]:
# item(), 它可以将一个标量Tensor转换成一个Python number
x = torch.randn(1)
print(x)
print(x.item())

tensor([0.4747])
0.4746860861778259


### 2.2.3 广播机制

In [18]:
# 当对两个形状不同的Tensor按元素运算时，可能会触发广播（broadcasting）机制：先适当复制元素使这两个Tensor形状相同后再按元素运算。例如
x = torch.arange(1, 3).view(1, 2)
print(x)
y = torch.arange(1, 4).view(3, 1)
print(y)
print(x + y)

tensor([[1, 2]])
tensor([[1],
        [2],
        [3]])
tensor([[2, 3],
        [3, 4],
        [4, 5]])


由于x和y分别是1行2列和3行1列的矩阵，如果要计算x + y，那么x中第一行的2个元素被广播（复制）到了第二行和第三行，而y中第一列的3个元素被广播（复制）到了第二列。如此，就可以对2个3行2列的矩阵按元素相加。

### 2.2.4 运算的内存开销

In [19]:
# 索引操作不会开辟新内存，而像y = x + y这样的运算会新开内存，然后将y指向新内存。
# 使用Python自带的id函数来演示：如果两个实例的ID一致，那么它们所对应的内存地址相同；反之则不同。
x = torch.tensor([1, 2])
y = torch.tensor([3, 4])
id_before = id(y)
y = y + x
print(id(y) == id_before) # False 

False


In [20]:
# 如果想指定结果到原来的y的内存，可以使用前面介绍的索引来进行替换操作。
# 把x + y的结果通过[:]写进y对应的内存中。
x = torch.tensor([1, 2])
y = torch.tensor([3, 4])
id_before = id(y)
y[:] = y + x
print(id(y) == id_before) # True

True


In [21]:
# 还可以使用运算符全名函数中的out参数或者自加运算符+=(也即add_())达到上述效果，例如torch.add(x, y, out=y)和y += x(y.add_(x))
x = torch.tensor([1, 2])
y = torch.tensor([3, 4])
id_before = id(y)
torch.add(x, y, out=y) # y += x, y.add_(x)
print(id(y) == id_before) # True

True


虽然view返回的Tensor与源Tensor是共享data的，但是依然是一个新的Tensor（因为Tensor除了包含data外还有一些其他属性），二者id（内存地址）并不一致。

### 2.2.5 Tensor和NumPy相互转换

用numpy()和from_numpy()可以将Tensor和NumPy中的数组相互转换。
但是这两个函数所产生的的Tensor和NumPy中的数组共享相同的内存（所以他们之间的转换很快），改变其中一个时另一个也会改变！

+ Tensor转NumPy

In [22]:
# 使用numpy()将Tensor转换成NumPy数组
a = torch.ones(5)
b = a.numpy()
print(a, b)
a += 1
print(a, b)
b += 1
print(a, b)

tensor([1., 1., 1., 1., 1.]) [1. 1. 1. 1. 1.]
tensor([2., 2., 2., 2., 2.]) [2. 2. 2. 2. 2.]
tensor([3., 3., 3., 3., 3.]) [3. 3. 3. 3. 3.]


+ NumPy数组转Tensor

In [24]:
# 使用from_numpy()将NumPy数组转换成Tensor
import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
print(a, b)
a += 1
print(a, b)
b += 1
print(a, b)

[1. 1. 1. 1. 1.] tensor([1., 1., 1., 1., 1.], dtype=torch.float64)
[2. 2. 2. 2. 2.] tensor([2., 2., 2., 2., 2.], dtype=torch.float64)
[3. 3. 3. 3. 3.] tensor([3., 3., 3., 3., 3.], dtype=torch.float64)


所有在CPU上的Tensor（除了CharTensor）都支持与NumPy数组相互转换。

另一个常用的将NumPy中的array转换成Tensor的方法是torch.tensor()。
但此方法总是会进行数据拷贝（消耗更多的时间和空间），所以返回的Tensor和原来的数据不再共享内存。

+ torch.tensor()

In [25]:
c = torch.tensor(a)
a += 1
print(a, c)

[4. 4. 4. 4. 4.] tensor([3., 3., 3., 3., 3.], dtype=torch.float64)
