本文讲解了pytorch中contiguous的含义、定义、实现，以及contiguous存在的原因，非contiguous时的解决办法。并对比了numpy中的contiguous。

contiguous 本身是形容词，表示连续的，关于 contiguous，PyTorch 提供了`is_contiguous`、`contiguous`(形容词动用)两个方法 ，分别用于判定Tensor是否是 contiguous 的，以及保证Tensor是contiguous的。

## PyTorch中的is_contiguous是什么含义？

`is_contiguous`直观的解释是**Tensor底层一维数组元素的存储顺序与Tensor按行优先一维展开的元素顺序是否一致。**

Tensor多维数组底层实现是使用一块连续内存的1维数组，Tensor在原信息里保存了多维数组的形状，在访问元素时，通过多维度索引转化成1维数组相对于数组起始位置的偏移量即可找到对应的数据。某些Tensor操作，如`transpose`、`permute`、`narrow`、`expand`与原Tensor是共享内存中的数据，不会改变底层数组的存储，但原来在语义上相邻、内存里也相邻的元素在执行这样的操作后，在语义上相邻但在内存上不相邻即不连续了(*is not contiguous*).

如果想要变成连续需要使用`contiguous`方法，如果Tensor不是连续的，则会重新开辟一块内存空间保证数据是在内存中连续的，如果Tensor是连续的，则`contiguous`无操作。

### 行优先

行是指多维数组一维展开的方式，对应的是列优先。C/C++中使用的是行优先方式(row major)，Matlab、Fortran使用的是列优先方式(column major)，PyTorch中Tensor底层实现是C++，也就是使用行优先顺序。举例说明：

In [1]:
import torch
t = torch.arange(12).reshape(3, 4)
t

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])

二维数组t如图1：

![Screen Shot 2021-07-31 at 3.44.10 PM.png](attachment:6af3c1bb-8c85-4afb-9f1b-166cc083f6b1.png)

数组t在内存中实际以一维数组形式存储，通过`flatten`方法查看t的一维展开形式，实际存储形式与一维展开一致，如图2:

In [2]:
t.flatten()

tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

![Screen Shot 2021-07-31 at 3.46.14 PM.png](attachment:67ec97f5-9208-4ea6-ab32-4cfe806b7c57.png)

而列优先的存储逻辑结构如图3:

![Screen Shot 2021-07-31 at 3.46.51 PM.png](attachment:61ab8ea8-fd93-45e7-8d49-a7e64a4c7142.png)

使用列优先存储时，一维数组中元素顺序如图4:

![Screen Shot 2021-07-31 at 3.49.20 PM.png](attachment:9c6c9fd3-aa66-4c8b-977f-1f25130ec9f2.png)

使用列优先存储时，一维数组中元素顺序如图4:

![Screen Shot 2021-07-31 at 3.50.25 PM.png](attachment:1037e7b6-8131-4026-a6c2-815f228f4c3f.png)

图1、图2、图3、图4 中颜色相同的数据表示在同一行，不论是行优先顺序、或是列优先顺序，如果要访问矩阵中的下一个元素都是通过偏移来实现，这个偏移量称为strip。在行优先的存储方式下，访问行中相邻元素物理结构需要偏移1个位置，在列优先存储方式下偏移3个位置。

### 为什么需要contiguous?

1.`torch.view`等方法操作需要连续的Tensor.

`transpose、permute` 操作虽然没有修改底层一维数组，但是新建了一份Tensor元信息，并在新的元信息中的 重新指定 stride。`torch.view` 方法约定了不修改数组本身，只是使用新的形状查看数据。如果我们在 `transpose、permute` 操作后执行 view，Pytorch 会抛出以下错误：

```
invalid argument 2: view size is not compatible with input tensor's size and stride (at least one dimension 
spans across two contiguous subspaces). Call .contiguous() before .view(). 
at /Users/soumith/b101_2/2019_02_08/wheel_build_dirs/wheel_3.6/pytorch/aten/src/TH/generic/THTensor.cpp:213
```

为什么view方法要求Tensor是连续的?考虑一下操作。