# Lesson 2.张量的索引、分片、合并以及维度调整

- torch安装在python3.7.4 下面

In [1]:
import torch
import numpy as np

## 一、张量的符号索引

&emsp;&emsp;张量也是有序序列，我们可以根据每个元素在系统内的顺序“编号”，来找出特定的元素，也就是索引。

### 1.一维张量索引

&emsp;&emsp;一维张量的索引过程和Python原生对象类型的索引一致，基本格式遵循`[start: end: step]`，索引的基本要点回顾如下。

- 冒号分隔，表示对某个区域进行索引，也就是所谓的切片
  - t[a:b]
  - t[a:b:step] step必须大于0

In [3]:
t1 = torch.arange(1,11)
t1

tensor([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [4]:
t1[0]
# 组成一维张量的是多个零位张量
# tensor(1) 就是0维张量

tensor(1)

> 注：张量索引出来的结果还是零维张量， 而不是单独的数。要转化成单独的数，需要使用item()方法。

- 冒号分隔，表示对某个区域进行索引，也就是所谓的切片

In [5]:
t1[1:8]  # 第2个元素到第9个元素 左闭右开

tensor([2, 3, 4, 5, 6, 7, 8])

- 第二个冒号，表示索引的间隔

In [6]:
t1[1:8:2] # 2-9，每隔两个元素取一个

tensor([2, 4, 6, 8])

- 冒号前后没有值，表示索引整个区域

In [7]:
t1[1::2]   # 从2到最后一个元素，每隔两个

tensor([ 2,  4,  6,  8, 10])

In [None]:
t1[:8:2]  #  从1-8个元素 每隔2个

>在张量的索引中，step位必须大于0

In [8]:
t1[9:1:-1]  # torch中不支持反向索引

#  ValueError: step must be greater than zero

ValueError: step must be greater than zero

### 2.二维张量索引

&emsp;&emsp;二维张量的索引逻辑和一维张量的索引逻辑基本相同，二维张量可以视为两个一维张量组合而成，而在实际的索引过程中，需要用**逗号进行分隔**，分别表示对哪个一维张量进行索引、以及具体的一维张量的索引。

In [10]:
t2 = torch.arange(1,10).reshape(3,3)
t2

tensor([[1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]])

In [11]:
t2[0,1]  # 第一行，第二列的元素 

# 二维张量可以看做矩阵

tensor(2)

In [12]:
t2[0,::2]  # 第0行 所有列 每隔2列取一次

tensor([1, 3])

In [13]:
t2[0,[0,2]]

tensor([1, 3])

In [14]:
t2[::2,::2]  
# 表示每隔两行取一行、并且每一行中每隔两个元素取一个

tensor([[1, 3],
        [7, 9]])

In [15]:
t2[[0,2],1]

tensor([2, 8])

**理解**：对二维张量来说，基本可以视为是对矩阵的索引，并且行、列的索引遵照相同的索引规范，并用逗号进行分隔。

### 3.三维张量的索引

&emsp;&emsp;在二维张量索引的基础上，三维张量拥有三个索引的维度。我们将三维张量视作矩阵组成的序列，则在实际索引过程中拥有**三个维度，分别是索引矩阵、索引矩阵的行、索引矩阵的列**。

In [17]:
t3 = torch.arange(1,28).reshape(3,3,3)
t3

tensor([[[ 1,  2,  3],
         [ 4,  5,  6],
         [ 7,  8,  9]],

        [[10, 11, 12],
         [13, 14, 15],
         [16, 17, 18]],

        [[19, 20, 21],
         [22, 23, 24],
         [25, 26, 27]]])

In [18]:
t3.shape

torch.Size([3, 3, 3])

In [19]:
t3[1,1,1]

tensor(14)

In [20]:
t3[1,::2,::2]

tensor([[10, 12],
        [16, 18]])

In [21]:
t3[::2,::2,::2]

tensor([[[ 1,  3],
         [ 7,  9]],

        [[19, 21],
         [25, 27]]])

**理解**：更为本质的角度去理解高维张量的索引，其实就是围绕张量的“形状”进行索引

In [22]:
t3[1,1,1]

tensor(14)

## 二、张量的函数索引

&emsp;&emsp;在PyTorch中，我们还可以使用`index_select`函数，通过指定index来对张量进行索引。

- `index_select(对象,索引的维度,indices)`

In [23]:
t1

tensor([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [24]:
t1.ndim

1

In [25]:
indices = torch.tensor([1,2])   # 建立一个一维张量

In [26]:
t1[1:3]

tensor([2, 3])

In [27]:
torch.index_select(t1,0,indices)

tensor([2, 3])

在index_select函数中，第二个参数实际上代表的是索引的维度。对于t1这个一维向量来说，由于只有一个维度，因此第二个参数取值为0，就代表在第一个维度上进行索引

In [28]:
t2 = torch.arange(12).reshape(4, 3)
t2

tensor([[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8],
        [ 9, 10, 11]])

In [29]:
torch.index_select(t2, 0, indices)     

tensor([[3, 4, 5],
        [6, 7, 8]])

dim参数取值为0，代表在shape的第二个维度上索引

In [30]:
torch.index_select(t2, 1, indices)

tensor([[ 1,  2],
        [ 4,  5],
        [ 7,  8],
        [10, 11]])

## 三、tensor.view()方法

&emsp;&emsp;在正式介绍张量的切分方法之前，需要首先介绍PyTorch中的`.view()`方法。该方法会返回一个类似视图的结果，该结果和原张量对象共享一块数据存储空间，并且通过.view()方法，还可以**改变对象结构，生成一个不同结构**，但共享一个存储空间的张量。当然，共享一个存储空间，也就代表二者是“浅拷贝”的关系，**修改其中一个，另一个也会同步进行更改**。

In [32]:
t = torch.arange(6).reshape(2, 3)
t

tensor([[0, 1, 2],
        [3, 4, 5]])

In [34]:
te = t.view(3,2)
te

tensor([[0, 1],
        [2, 3],
        [4, 5]])

In [35]:
t

tensor([[0, 1, 2],
        [3, 4, 5]])

In [37]:
t[0] = 1 # 修改t的第一个元素
t

tensor([[1, 1, 1],
        [3, 4, 5]])

In [38]:
te  #  te同步变化

tensor([[1, 1],
        [1, 3],
        [4, 5]])

In [40]:
tr = t.view(1,2,3)
tr

# 视图：同一个对象的不同表现形式

tensor([[[1, 1, 1],
         [3, 4, 5]]])

“视图”的作用就是节省空间，而值得注意的是，在接下来介绍的很多切分张量的方法中，返回结果都是“视图”，而不是新生成一个对象。

## 四、张量的分片函数

- `chunk(对象,n等分,等分的维度)`
  - 要都能够被等分 否则会降维等分
- `split(对象,n等分,等分的维度)`
  - 可以写n等分
  - 也可以写分成的分数(不是比例)
    - split(t2,[2,6],0) 把原来的8份 2 6 分

### 1.分块：chunk函数


&emsp;&emsp;chunk函数能够按照某维度，对张量进行均匀切分，并且返回结果是原张量的视
图。


In [42]:
t2 = torch.arange(12).reshape(4,3)
t2

tensor([[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8],
        [ 9, 10, 11]])

In [45]:
tc = torch.chunk(t2,4,dim=0)  # 在第零个维度上（按行），进行4等分
tc

# 对于二维张量来说 第一个维度是行
# 把所有的张量对象返回到一个元祖里

(tensor([[0, 1, 2]]),
 tensor([[3, 4, 5]]),
 tensor([[6, 7, 8]]),
 tensor([[ 9, 10, 11]]))

注意：chunk返回结果是一个视图，不是新生成了一个对象

In [46]:
tc[0]  # 上述元祖的第一个张量

tensor([[0, 1, 2]])

In [47]:
tc[0][0]  # 上述二维张量的第一个（只有一行）

tensor([0, 1, 2])

In [50]:
tc[0][0][0] = 1  # 修改第一个元素
tc

(tensor([[1, 1, 2]]),
 tensor([[3, 4, 5]]),
 tensor([[6, 7, 8]]),
 tensor([[ 9, 10, 11]]))

In [51]:
t2   # t2 也发生变化 

tensor([[ 1,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8],
        [ 9, 10, 11]])

当原张量不能均分时，chunk不会报错，但会返回其他均分的结果

In [52]:
torch.chunk(t2, 3, dim=0)            # 次一级均分结果

# 返回的是 2等分的结果 因为不能三等分

(tensor([[1, 1, 2],
         [3, 4, 5]]), tensor([[ 6,  7,  8],
         [ 9, 10, 11]]))

In [53]:
len(torch.chunk(t2, 3, dim=0))  # 返回的是2等分

2

In [54]:
torch.chunk(t2,5,dim=0)  #  不能5等分 返回4等分的结果

(tensor([[1, 1, 2]]),
 tensor([[3, 4, 5]]),
 tensor([[6, 7, 8]]),
 tensor([[ 9, 10, 11]]))

### 2.split函数

split和chunk一样，返回的结果也是view

In [55]:
t2 = torch.arange(12).reshape(4,3)
t2

tensor([[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8],
        [ 9, 10, 11]])

均分情况

In [56]:
torch.split(t2,2,dim=0)  # 对上述二维张量按照第一个维度（行）二等分

(tensor([[0, 1, 2],
         [3, 4, 5]]), tensor([[ 6,  7,  8],
         [ 9, 10, 11]]))

按照索引切分

In [57]:
torch.split(t2,[1,3],0)

# 4份中 按照1:3的切分（1+3=4,不是按照比例分，是按照数量分 
# 如果是8分必须是2/6分）
# 第二个参数输入一个序列时，表示按照序列数值进行切分，也就是1/3分

(tensor([[0, 1, 2]]), tensor([[ 3,  4,  5],
         [ 6,  7,  8],
         [ 9, 10, 11]]))

**注意**，当第二个参数位输入一个序列时，序列的各数值的和必须等于对应维度下形状分量的取值。例如，上述代码中，是按照第一个维度进行切分，而t2总共有4行，因此序列的求和必须等于4，也就是1+3=4，而序列中每个分量的取值，则代表切块大小

In [58]:
torch.split(t2, [1, 1, 1, 1], 0) 

(tensor([[0, 1, 2]]),
 tensor([[3, 4, 5]]),
 tensor([[6, 7, 8]]),
 tensor([[ 9, 10, 11]]))

In [59]:
torch.split(t2, [1, 1, 2], 0) 

(tensor([[0, 1, 2]]), tensor([[3, 4, 5]]), tensor([[ 6,  7,  8],
         [ 9, 10, 11]]))

In [60]:
ts = torch.split(t2, [1, 2], 1)   # 按照列划分
ts

(tensor([[0],
         [3],
         [6],
         [9]]), tensor([[ 1,  2],
         [ 4,  5],
         [ 7,  8],
         [10, 11]]))

In [61]:
ts[0][0]

tensor([0])

In [62]:
ts[0][0] = 1 # 对view进行修改
ts

(tensor([[1],
         [3],
         [6],
         [9]]), tensor([[ 1,  2],
         [ 4,  5],
         [ 7,  8],
         [10, 11]]))

In [63]:
t2  #  原对象同步发生变换

tensor([[ 1,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8],
        [ 9, 10, 11]])

> tensor的split方法和array的split方法有很大的区别，array的split方法是根据索引进行切分。

## 五、张量的合并操作

可以拼接、也可堆叠

- `cat([拼接对象],dim=)`拼接函数
  - 默认dim=0 垂直方向拼接
  - 维度不匹配时 会报错
- `stack([堆叠对象]，dim=)` 
  - 堆叠以后维度为升高


In [64]:
a = torch.zeros(2,3)
a

tensor([[0., 0., 0.],
        [0., 0., 0.]])

In [66]:
b = torch.ones(2,3)
b

tensor([[1., 1., 1.],
        [1., 1., 1.]])

In [67]:
c = torch.zeros(3,3)

In [68]:
torch.cat([a,b])

# 按照行拼接（上下），dim 默认取值为0(二维张量的第一个维度 行)

tensor([[0., 0., 0.],
        [0., 0., 0.],
        [1., 1., 1.],
        [1., 1., 1.]])

In [69]:
torch.cat([a,b],dim=1)

# 水平方向拼接

tensor([[0., 0., 0., 1., 1., 1.],
        [0., 0., 0., 1., 1., 1.]])

In [71]:
torch.cat([a,c],dim=0)

tensor([[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]])

In [72]:
torch.cat([a, c], 1)               
# 形状不匹配时将报错

RuntimeError: Sizes of tensors must match except in dimension 1. Expected size 2 but got size 3 for tensor number 1 in the list.

注意理解，拼接的本质是实现元素的堆积，也就是构成a、b两个二维张量的各一维张量的堆积，最终还是构成二维向量。

- 堆叠函数：stack

&emsp;&emsp;和拼接不同，堆叠不是将元素拆分重装，而是简单的将各参与堆叠的对象分装到一个更高维度的张量里。

In [73]:
a

tensor([[0., 0., 0.],
        [0., 0., 0.]])

In [74]:
b


tensor([[1., 1., 1.],
        [1., 1., 1.]])

In [76]:
torch.stack([a,b])
 # 堆叠之后，生成一个三维张量

tensor([[[0., 0., 0.],
         [0., 0., 0.]],

        [[1., 1., 1.],
         [1., 1., 1.]]])

In [77]:
torch.stack([a, b]).shape

# 从二维张量 变成了3维张量

torch.Size([2, 2, 3])

In [78]:
torch.cat([a, b]).shape

torch.Size([4, 3])

注意对比二者区别，拼接之后维度不变，堆叠之后维度升高。拼接是把一个个元素单独提取出来之后再放到二维张量中，而堆叠则是直接将两个二维张量封装到一个三维张量中，因此，堆**叠的要求更高，参与堆叠的张量必须形状完全相同**。

In [79]:
c

tensor([[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]])

In [80]:
# 维度不匹配时也会报错
torch.stack([a,c])

RuntimeError: stack expects each tensor to be equal size, but got [2, 3] at entry 0 and [3, 3] at entry 1

## 六、张量维度变换

&emsp;&emsp;此前我们介绍过，通过reshape方法，能够灵活调整张量的形状。而在实际操作张量进行计算时，往往需要另外进行降维和升维的操作，当我们需要除去不必要的维度时，可以使用`squeeze`函数，而需要手动升维时，则可采用`unsqueeze`函数。

- 去除不必要的维度`squeeze`函数
  - 直观来看就去除shape中 不需要的1
- 手动升维`unsqueeze(t, dim = n)  ` 在第n个索引的上升高一个维度


In [81]:
a = torch.arange(4)
a

tensor([0, 1, 2, 3])

In [83]:
a2 = a.reshape(1,4)  # 二维张量 1行4列
a2

tensor([[0, 1, 2, 3]])

In [84]:
torch.squeeze(a2).ndim

1

- squeeze函数：删除不必要的维度

In [85]:
t = torch.zeros(1, 1, 3, 1)
t

tensor([[[[0.],
          [0.],
          [0.]]]])

In [86]:
t.shape

torch.Size([1, 1, 3, 1])

t张量解释：一个包含一个三维的四维张量，三维张量只包含一个三行一列的二维张量。

In [88]:
torch.squeeze(t).shape

# 转化后生成了一个一维张量

torch.Size([3])

In [89]:
t1 = torch.zeros(1, 1, 3, 2, 1, 2)
t1.shape

torch.Size([1, 1, 3, 2, 1, 2])

In [90]:
torch.squeeze(t1)


tensor([[[0., 0.],
         [0., 0.]],

        [[0., 0.],
         [0., 0.]],

        [[0., 0.],
         [0., 0.]]])

In [91]:
torch.squeeze(t1).shape

torch.Size([3, 2, 2])

简单理解，squeeze就相当于提出了shape返回结果中的1

- unsqeeze函数：手动升维

In [93]:
t = torch.zeros(1, 2, 1, 2)
t.shape

torch.Size([1, 2, 1, 2])

In [95]:
torch.unsqueeze(t, dim = 0)             
 # 在第1个维度索引上升高1个维度

tensor([[[[[0., 0.]],

          [[0., 0.]]]]])

In [96]:
torch.unsqueeze(t, dim = 0).shape

torch.Size([1, 1, 2, 1, 2])

In [97]:
torch.unsqueeze(t, dim = 2).shape         
# 在第3个维度索引上升高1个维度

torch.Size([1, 2, 1, 1, 2])

In [98]:
torch.unsqueeze(t, dim = 4).shape          
# 在第5个维度索引上升高1个维度

torch.Size([1, 2, 1, 2, 1])

注意理解维度和shape返回结果一一对应的关系，shape返回的序列有几个元素，张量就有多少维度。