## 3.2 张量：多维数组

In [2]:
import torch

In [3]:
a = torch.ones(3) # 创建一个大小为3的一维张量，用1.0填充
a

tensor([1., 1., 1.])

In [4]:
a[1]

tensor(1.)

In [5]:
float(a[1])

1.0

In [6]:
a[2] = 2.0

In [7]:
a

tensor([1., 1., 2.])

## 3.3 索引张量

In [9]:
# Python列表索引
some_list = list(range(6))
some_list[:] # 列表中所有元素
some_list[1:4] # 包含第1个元素到第3个元素，不包含第4个元素
some_list[1:] # 包含第1个元素到列表末尾的元素
some_list[:4] # 从列表开始到第3各元素，不包含第4个元素
some_list[:-1] # 从列表的开始到最后一个元素之前的所有元素
some_list[1:4:2] # 从第1个元素（包含）到第4个元素（不包含），移动步长为2

[1, 3]

In [10]:
# 张量索引
points = torch.tensor([[4.0, 1.0], [5.0, 3.0], [2.0, 1.0]])
points[1:] # 第1行之后的所有行，隐含所有列
points[1:, :] # 第1行之后的所有行，所有列
points[1:, 0] # 第1行之后的所有行，第1列
points[None] # 增加大小为1的维度，就像unsqueeze()方法

tensor([[[4., 1.],
         [5., 3.],
         [2., 1.]]])

## 命名张量

> 张量的维度或坐标轴通常用来表示诸如像素位置或颜色通道的信息，这意味着当我们要把一个张量作为索引时，需要记住维度的顺序并按此顺序编写索引

In [11]:
img_t = torch.randn(3, 5, 5) # shape [channels,rows,columns]
weights = torch.tensor([0.2126, 0.7152, 0.0722])

batch_t = torch.randn(2, 3, 5, 5) # shape [batch,channels,rows,columns]

# RGB通道总在从末端开始的第3维。所以惰性的未加权平均值可以写成：
img_gray_navie = img_t.mean(-3) # 在倒数第3维上求均值
batch_gray_navie = batch_t.mean(-3) # 在倒数第3维上求均值
img_gray_navie.shape, batch_gray_navie.shape

(torch.Size([5, 5]), torch.Size([2, 5, 5]))

> PyTorch将允许对相同形状的张量进行乘法运算，也允许与给定维度中其中一个操作数大小为1的张量进行运算。它还会自动附加大小为1的前导维度，这个特性被称为广播<br> 形状为(2,3,5,5)的batch_t乘一个形状为(3,1,1)unsqueezed_weights张量，得到一个形状为(2,3,5,5)的张量

In [31]:
unsqueezed_weights = weights.unsqueeze(-1).unsqueeze_(-1) # 增加维度，使weights由[3]变为[3,1,1]
img_weights = (img_t * unsqueezed_weights) # img_t是[3,5,5]
batch_weights = (batch_t * unsqueezed_weights) # batch_t是[2,3,5,5]
img_gray_weighted = img_weights.sum(-3)
batch_gray_weighted = batch_weights.sum(-3)
batch_weights.shape, batch_t.shape, unsqueezed_weights.shape

(torch.Size([2, 3, 5, 5]), torch.Size([2, 3, 5, 5]), torch.Size([3, 1, 1]))

> 命名张量是一个试验性的特性。张量工厂函数（诸如tensor()和rand()函数）有一个names参数，该参数是一个字符串序列<br> 当已经有一个张量并且想要为其添加名称但不改变现有的名称时，可以对其调用refine_names()方法<br> 与索引类似，省略号（...）允许省略任意数量的维度

In [32]:
weights_named = torch.tensor([0.2126, 0.7152, 0.0722], names=['channels'])

  weights_named = torch.tensor([0.2126, 0.7152, 0.0722], names=['channels'])


In [34]:
img_named = img_t.refine_names(..., 'channels', 'rows', 'columns')
batch_named = batch_t.refine_names(..., 'channels', 'rows', 'columns')
print("img named:", img_named.shape, img_named.names)
print("batch named:", batch_named.shape, batch_named.names)

img named: torch.Size([3, 5, 5]) ('channels', 'rows', 'columns')
batch named: torch.Size([2, 3, 5, 5]) (None, 'channels', 'rows', 'columns')


> align_as()方法返回一个张量，其中添加了缺失的维度

In [48]:
weights_named

tensor([0.2126, 0.7152, 0.0722], names=('channels',))

In [43]:
img_named

tensor([[[-1.3288,  0.5182, -0.1372, -0.1133,  1.3232],
         [ 0.1769, -0.6114, -0.1858, -0.4913, -1.0995],
         [-0.9871,  0.2338,  0.5339, -0.4538,  0.7615],
         [ 0.2828, -0.5871,  1.1352,  1.1719,  2.1611],
         [ 0.2247,  1.1713,  0.4192, -0.0594, -0.4336]],

        [[ 0.5314,  1.3407,  0.9194,  0.1881,  0.0520],
         [-1.3833, -1.1005, -1.8879, -0.4862,  1.3897],
         [ 1.1135,  2.0742, -0.4646,  0.5100, -0.2030],
         [ 0.6632,  0.3951, -0.2613, -0.1183,  0.5028],
         [-0.7822,  1.7327,  0.7137, -0.5928, -0.7704]],

        [[ 0.4322,  0.5245,  0.5777, -0.6532, -0.6770],
         [-0.9522, -0.8489, -0.8848,  0.0692,  0.1155],
         [ 0.8614,  0.6715, -1.6090,  1.6301, -1.3214],
         [ 2.8653, -1.5783, -0.1659, -0.6980, -0.3391],
         [-0.3951, -0.2601,  0.4095,  0.4812,  0.5965]]],
       names=('channels', 'rows', 'columns'))

In [47]:
weights_aligned = weights_named.align_as(img_named)
print(weights_aligned.shape,"\n", weights_aligned)

torch.Size([3, 1, 1]) 
  tensor([[[0.2126]],

        [[0.7152]],

        [[0.0722]]], names=('channels', 'rows', 'columns'))


> 接收维度参数的函数，例如sum()，也接收命名维度

In [49]:
gray_named = (img_named * weights_aligned).sum('channels')
gray_named.shape, gray_named.names

(torch.Size([5, 5]), ('rows', 'columns'))

>如果用不同的名称组合维度，会出现错误

> 在对命名的张量进行操作的函数之外使用张量，需要通过将这些张量重命名为None来删除它们的名称

In [50]:
gray_plain = gray_named.rename(None)
gray_plain.shape, gray_plain.names

(torch.Size([5, 5]), (None, None))

## 3.5 张量的元素类型

In [51]:
double_points = torch.ones(10, 2, dtype=torch.double)
short_points = torch.tensor([[1, 2], [3, 4]], dtype=torch.short)
short_points.dtype

torch.int16

In [53]:
# 转换类型
double_points = torch.zeros(10, 2).double()
short_points = torch.ones(10, 2).short()
double_points, short_points

(tensor([[0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.]], dtype=torch.float64),
 tensor([[1, 1],
         [1, 1],
         [1, 1],
         [1, 1],
         [1, 1],
         [1, 1],
         [1, 1],
         [1, 1],
         [1, 1],
         [1, 1]], dtype=torch.int16))

> to()方法会检查转换是否是必要的，如果必要，则执行转换

In [55]:
double_points = torch.zeros(10, 2).to(torch.double)
double_points

tensor([[0., 0.],
        [0., 0.],
        [0., 0.],
        [0., 0.],
        [0., 0.],
        [0., 0.],
        [0., 0.],
        [0., 0.],
        [0., 0.],
        [0., 0.]], dtype=torch.float64)

## 3.8 张量元数据：大小、偏移量和步长

### 3.8.1 偏移量、步长、复制等

In [56]:
points = torch.tensor([[4.0, 1.0], [5.0, 3.0], [2.0, 1.0]])
second_point = points[1]
second_point.storage_offset() # 张量在储存区中的偏移量

2

> 张量在存储区中的偏移量为2，是因为需要跳过第1个点（[4.0, 1.0]），该点共有两个元素

In [57]:
second_point.size(), second_point.shape

(torch.Size([2]), torch.Size([2]))

> size()是Size类的一个实例，因为该张量是一维的，所以包含一个元素。函数size()所包含的信息与张量对象的shape属性所包含的相同

> 步长是一个元组，指示当索引在每个维度中增加1时在存储区中必须跳过的元素数量

In [58]:
points.stride() # 查看步长

(2, 1)

> 访问一个二维张良中的位置(i,j)的元素会导致访问储存中的第storage_offset+stride[0]*i_stride[1]*j个元素。偏移量通常为0，如果这个张量是为容纳更大的张量而创建的存储视图，那么偏移量可以为正值<br> 这种张量和存储区之间的间接关系使得一些操作开销并不大，如转置一个张量或者提取一个子张量，因为它们不会导致内存重新分配，而是创建一个新的张量对象，该张量具有不同的大小偏移量和步长

In [59]:
second_point = points[1]
second_point.size()

torch.Size([2])

In [60]:
second_point.storage_offset()

2

In [61]:
second_point.stride()

(1,)

> 子张量的维度少了一维，同时仍然索引了与原始张量points相同的存储区，意味着更改子张量会对原始张量产生影响

> 可以把子张量复制成一个新的张量

In [62]:
points = torch.tensor([[4.0, 1.0], [5.0, 3.0], [2.0, 1.0]])
second_point = points[1].clone()
second_point[0] = 10.0
points

tensor([[4., 1.],
        [5., 3.],
        [2., 1.]])

### 3.8.2 无复制转置

In [63]:
points = torch.tensor([[4.0, 1.0], [5.0, 3.0], [2.0, 1.0]])
points

tensor([[4., 1.],
        [5., 3.],
        [2., 1.]])

In [65]:
points_t = points.t() # 转置，transpose()方法的简写
points_t

tensor([[4., 5., 2.],
        [1., 3., 1.]])

In [67]:
id(points.storage()) == id(points_t.storage())

False

> ??这里不应该是True?

### 3.8.3 高维转置

> PyTorch中的转置不限于矩阵。可以通过指定2个维度，即翻转形状和步长，来转置一个多维数组

In [69]:
some_t = torch.ones(3, 4, 5)
transpose_t = some_t.transpose(0, 2)
some_t.shape

(torch.Size([3, 4, 5]), torch.Size([5, 4, 3]))

In [70]:
transpose_t.shape

torch.Size([5, 4, 3])

In [71]:
some_t.stride()

(20, 5, 1)

In [72]:
transpose_t.stride()

(1, 5, 20)

### 3.8.4 连续张量

> 在PyTorch中一些张量操作只对连续张量起作用，利用contiguous()方法，可以通过一个非连续张量得到一个新的连续张量，张量的内容是一样的，但是步长和存储发生了改变

In [73]:
points = torch.tensor([[4.0, 1.0], [5.0, 3.0], [2.0, 1.0]])
points_t = points.t()
points_t

tensor([[4., 5., 2.],
        [1., 3., 1.]])

In [74]:
points_t.storage()

 4.0
 1.0
 5.0
 3.0
 2.0
 1.0
[torch.FloatStorage of size 6]

In [75]:
points_t.stride()

(1, 2)

In [76]:
points_t_cont = points_t.contiguous()
points_t_cont

tensor([[4., 5., 2.],
        [1., 3., 1.]])

In [77]:
points_t_cont.storage()

 4.0
 5.0
 2.0
 1.0
 3.0
 1.0
[torch.FloatStorage of size 6]

## 3.9 将张量储存到GPU

> 可以用指定构造函数或to()方法在GPU上创建张量

In [85]:
points_gpu = torch.tensor([[4.0, 1.0], [5.0, 3.0], [2.0, 1.0]], device='cuda')

In [79]:
points_gpu = points.to(device='cuda')

In [82]:
# points_gpu = points.to(divice='cuda:0') # 如果有多个GPU，可以从0开始传递一个整数来确定存储张量的GPU 但是我没有

> 在此基础上，对张量的任何操作都将在GPU上执行，不会返回到CPU，可以通过向to()提供一个CPU参数，将张量移回CPU

In [89]:
points_gpu = 2 * points.to(device='cuda') # 在GPU上执行乘法
points_gpu

tensor([[ 8.,  2.],
        [10.,  6.],
        [ 4.,  2.]], device='cuda:0')

In [90]:
points_gpu = points_gpu.to(device='cpu') # 移回CPU
points_gpu

tensor([[ 8.,  2.],
        [10.,  6.],
        [ 4.,  2.]])

In [None]:
# 通过简写的cpu()和cuda()替代to()
points_gpu = points.cuda()
points_gpu = points.cuda(0)
points_gpu = points_gpu.cpu()