# 2.1. 数据操作
## 2.1.1. 入门
- <font size=4> torch.arange()创建一维数组

In [46]:
import torch
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"  # 配置单元格支持多个输出
x = torch.arange(12)  # torch.arange()方法创建长度为12的一维数组，从0到11
# print(x)
x

tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

- <font size=4>通过张量的shape属性来查看张量的维度和大小，也就是查看张量（沿每个轴的长度）的形状 

In [7]:
x.shape

torch.Size([12])

- <font size=4>可以通过张量的size()方法来查看张量的形状和大小

In [13]:
x.size()  # 属性和方法的区别，属性不需要括号，方法需要加上括号

torch.Size([12])

- <font size=4>可以通过张量的numel()方法来查看张量的元素的个数

In [37]:
x.numel()

12

- <font size=4>可以通过张量的reshape()函数来改变张量的形状，但是这个过程不会改变张量的元素的值

In [45]:
x
x1 = x.reshape(3, 4)  # 将x是1行12列，修改为3行4列
x1

tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])

- <font size=4>张量的reshape()方法还能自动推理改变张量维度大小的一个维度，用“-1”代替该维度的值

In [21]:
x.reshape(-1,2)  # 比如该列中，只给了将1行12列的张量x转为2列6行的张量，只要显性的给出任意一个维度的值，另一维度用-1代替，reshape()方法会自动推断另一维度的大小

tensor([[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7],
        [ 8,  9],
        [10, 11]])

In [48]:
x.reshape(2,2,-1)  # 该例中，自动推断了2个2行3列的张量


tensor([[[ 0,  1,  2],
         [ 3,  4,  5]],

        [[ 6,  7,  8],
         [ 9, 10, 11]]])

- <font size=4> 也可以通过张量的view()函数来改变张量的视图形状，view()函数与reshape()的区别是，view()只能针对tensor的storage存储是连续的情况，reshape()则没有限制，reshape=contiguous+view</font>

In [57]:
x.view(4, -1)

tensor([[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8],
        [ 9, 10, 11]])

- <font size=4>
    同样，我们可以创建一个形状为(2,3,4)的张量，其中所有元素都设置为1。代码如下：
    </font>

In [58]:
torch.ones(2,3,4)

tensor([[[1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]],

        [[1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]]])

- <font size=4>
    有时我们想通过从某个特定的概率分布中随机采样来得到张量中每个元素的值。 例如，当我们构造数组来作为神经网络中的参数时，我们通常会随机初始化参数的值。 以下代码创建一个形状为（3,4）的张量。 
    </font>
    <font size=4 color=red>
    其中的每个元素都从均值为0、标准差为1的标准高斯分布（正态分布）中随机采样。
    </font>

In [60]:
torch.randn(3,4)

tensor([[ 0.8719,  0.6763, -1.1493, -1.1393],
        [-0.5862,  0.0528,  0.1616,  0.5389],
        [ 1.3259,  2.1116, -0.2726,  0.3273]])

- <font size=4>
    我们还可以通过提供包含数值的Python列表（或嵌套列表），来为所需张量中的每个元素赋予确定值。 
    </font>
    <font size=4 color=red>
    在这里，最外层的列表对应于轴0，内层的列表对应于轴1。
    </font>

In [64]:
torch.tensor([[1,2,3],[4,5,6]])

tensor([[1, 2, 3],
        [4, 5, 6]])

## 2.1.2. 运算符
<font size=4>
    我们的兴趣不仅限于读取数据和写入数据。 我们想在这些数据上执行数学运算，其中最简单且最有用的操作是按元素（elementwise）运算。 它们将标准标量运算符应用于数组的每个元素。 对于将两个数组作为输入的函数，按元素运算将二元运算符应用于两个数组中的每对位置对应的元素。 我们可以基于任何从标量到标量的函数来创建按元素函数。
    </font><br><br>
    <font size=4>
    在数学表示法中，我们将通过符号 $f:R→R$  来表示一元标量运算符（只接收一个输入）。 这意味着该函数从任何实数（ $R$ ）映射到另一个实数。 同样，我们通过符号 $f:R,R→R$  表示二元标量运算符，这意味着该函数接收两个输入，并产生一个输出。 给定同一形状的任意两个向量 $u$ 和 $v$ 和二元运算符 $f$ ， 我们可以得到向量 $c=F(u,v)$ 。 具体计算方法是 $c_{i}←f(u_{i},v_{i})$ ， 其中 $c_{i} 、 u_{i}$ 和 $v_{i}$ 分别是向量 $c 、 u$ 和 $v$ 中的元素。 在这里，我们通过将标量函数升级为按元素向量运算来生成向量值  $F:Rd,Rd→Rd$ 。
    </font><br><br>
    <font size=4>
    对于任意具有相同形状的张量， 常见的标准算术运算符$（+、-、*、/和**）$都可以被升级为按元素运算。 我们可以在同一形状的任意两个张量上调用按元素操作。 在下面的例子中，我们使用逗号来表示一个具有5个元素的元组，其中每个元素都是按元素操作的结果。
    </font>


In [68]:
x = torch.tensor([1, 2, 4, 8])
y = torch.tensor([2, 2, 2, 2])
x+y
x-y
x*y
x/y
x**y

tensor([ 3,  4,  6, 10])

tensor([-1,  0,  2,  6])

tensor([ 2,  4,  8, 16])

tensor([0.5000, 1.0000, 2.0000, 4.0000])

tensor([ 1,  4, 16, 64])

- <font size=4>
    按元素”方式可以应用更多的计算，包括像求幂这样的一元运算符。
    </font>

In [70]:
torch.exp(x)  # 以e为底x的多少次幂

tensor([2.7183e+00, 7.3891e+00, 5.4598e+01, 2.9810e+03])

<font size=4>
    除了按元素计算外，我们还可以执行线性代数运算，包括向量点积和矩阵乘法。 <br><br>

我们也可以把多个张量连结（concatenate）在一起， 把它们端对端地叠起来形成一个更大的张量。 我们只需要提供张量列表，并给出沿哪个轴连结。 下面的例子分别演示了当我们沿行（轴-0，形状的第一个元素） 和按列（轴-1，形状的第二个元素）连结两个矩阵时，会发生什么情况。 我们可以看到，第一个输出张量的轴-0长度（ 6 ）是两个输入张量轴-0长度的总和（ 3+3 ）； 第二个输出张量的轴-1长度（ 8 ）是两个输入张量轴-1长度的总和（ 4+4 ）。
    </font>

In [87]:
x = torch.arange(12, dtype=torch.float32).reshape(3, 4)
y = torch.tensor([[2.0, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])
x
y
torch.cat((x, y), dim=0)  # 将x与y沿着第0维拼接，也就是按行拼接
torch.cat((x, y), dim=1)  # 将x与y沿着第1维拼接，也就是按列拼接

tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.]])

tensor([[2., 1., 4., 3.],
        [1., 2., 3., 4.],
        [4., 3., 2., 1.]])

tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.],
        [ 2.,  1.,  4.,  3.],
        [ 1.,  2.,  3.,  4.],
        [ 4.,  3.,  2.,  1.]])

tensor([[ 0.,  1.,  2.,  3.,  2.,  1.,  4.,  3.],
        [ 4.,  5.,  6.,  7.,  1.,  2.,  3.,  4.],
        [ 8.,  9., 10., 11.,  4.,  3.,  2.,  1.]])

- <font size=4>
    有时，我们想通过逻辑运算符构建二元张量。 以X == Y为例： 对于每个位置，如果X和Y在该位置相等，则新张量中相应项的值为1。 这意味着逻辑语句X == Y在该位置处为真，否则该位置为0。
    </font>

In [86]:
x == y  # 判断x与y对应位置的元素值是否相等

tensor([[False,  True, False,  True],
        [False, False, False, False],
        [False, False, False, False]])

- <font size=4>
    对张量中的所有元素进行求和，会产生一个单元素张量。
    </font>

In [88]:
x.sum()  # 累加tensor 中的所有元素的和

tensor(66.)

## 2.1.3. 广播机制
<font size=4>
    在上面的部分中，我们看到了如何在相同形状的两个张量上执行按元素操作。 在某些情况下，即使形状不同，我们仍然可以通过调用 广播机制（broadcasting mechanism）来执行按元素操作。 这种机制的工作方式如下：<font color=red>首先，通过适当复制元素来扩展一个或两个数组， 以便在转换之后，两个张量具有相同的形状。 其次，对生成的数组执行按元素操作。</font><br><br>

在大多数情况下，我们将沿着数组中长度为1的轴进行广播，如下例子：
    </font>

In [92]:
a = torch.arange(3).reshape(3, 1)
b = torch.arange(2).reshape(1, 2)
a,b

(tensor([[0],
         [1],
         [2]]),
 tensor([[0, 1]]))

<font size=4>
    由于a和b分别是 $3×1$ 和 $1×2$ 矩阵，如果让它们相加，它们的形状不匹配。 我们将两个矩阵广播为一个更大的 $3×2$ 矩阵，如下所示：矩阵a将复制列， 矩阵b将复制行，然后再按元素相加。
    <font>

In [94]:
a+b

tensor([[0, 1],
        [1, 2],
        [2, 3]])

## 2.1.4. 索引和切片
<font size=4>
    就像在任何其他Python数组中一样，张量中的元素可以通过索引访问。 与任何Python数组一样：第一个元素的索引是0，最后一个元素索引是-1； 可以指定范围以包含第一个元素和最后一个之前的元素。<br><br>

如下所示，我们可以用[-1]选择最后一个元素，可以用[1:3]选择第二个和第三个元素：
    </font>

In [106]:
x
x[-1]
x[1:3]
x[:, 0]

tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.]])

tensor([ 8.,  9., 10., 11.])

tensor([[ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.]])

tensor([0., 4., 8.])

- <font size=4>
    除读取外，我们还可以通过指定索引来将元素写入矩阵。
    </font>

In [108]:
x[1, 2] = 9  # 修改tensor x 的第2行第三列为9
x

tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  9.,  7.],
        [ 8.,  9., 10., 11.]])

## 2.1.5. 节省内存
<font size=4>
    运行一些操作可能会导致为新结果分配内存。 例如，如果我们用Y = X + Y，我们将取消引用Y指向的张量，而是指向新分配的内存处的张量。<br><br>

在下面的例子中，我们用Python的id()函数演示了这一点， 它给我们提供了内存中引用对象的确切地址。 运行Y = Y + X后，我们会发现id(Y)指向另一个位置。 这是因为Python首先计算Y + X，为结果分配新的内存，然后使Y指向内存中的这个新位置。
    </font>

In [113]:
id(y)  # y的地址
y.storage().data_ptr()  # y的数据的起始地址
y = x+y
id(y)
y.storage().data_ptr()

1346187134840

1346118481280

1346187164072

1346118473728

<font size=4>
这可能是不可取的，原因有两个：首先，我们不想总是不必要地分配内存。 在机器学习中，我们可能有数百兆的参数，并且在一秒内多次更新所有参数。 通常情况下，我们希望原地执行这些更新。 其次，如果我们不原地更新，其他引用仍然会指向旧的内存位置， 这样我们的某些代码可能会无意中引用旧的参数。<br><br>
    幸运的是，执行原地操作非常简单。 我们可以使用切片表示法将操作的结果分配给先前分配的数组，<font color=red>例如Y[:] =expression。 为了说明这一点，我们首先创建一个新的矩阵Z，其形状与另一个Y相同， 使用zeros_like来分配一个全 0 的块。</font>
</font>

In [118]:
z = torch.zeros_like(y)
id(z)  # z之前的地址
z[:] = x+y
id(z)  # z之后的地址，可见此时z并没有被赋予新的地址，也就是并没有开辟新的内从空间，只是覆盖掉了之前的数据

1346186657864

1346186657864

- <font size=4>
    如果在后续计算中没有重复使用X， 我们也可以使用X[:] = X + Y或X += Y来减少操作的内存开销。
    <font>

In [121]:
id(x)  # x 之前的地址
x += y # += 计算
id(x)  # x之后的地址，可见执行+=操作和地址不变，不会开辟新的内存空间，而x = x+y会开辟新的内存空间

1346187502200

1346187502200

## 2.1.6. 转换为其他Python对象
<font size=4>
    将深度学习框架定义的张量转换为NumPy张量（ndarray）很容易，反之也同样容易。 torch张量和numpy数组将共享它们的底层内存，就地操作更改一个张量也会同时更改另一个张量。
    </font>

In [125]:
a = torch.tensor([3.5])
a
a.item()  # 将tensor转换为python数据类型
type(a.item())
int(a)

tensor([3.5000])

3.5

float

3