## 张量


### Tensor
#### 张量是什么
几何代数中定义的张量是基于向量和矩阵的推广，比如我们可以将标量视为零阶张量，矢量可以视为一阶张量，矩阵就是二阶张量。
#### 一些常用的张量类型
- 3维 = 时间序列
- 4维 = 图像
- 5维 = 视频  

#### 创建张量

In [7]:
import torch
# 随机初始化矩阵（二维张量）
a = torch.rand(4,3)
print(a)

tensor([[0.6791, 0.5022, 0.0455],
        [0.2783, 0.2004, 0.3984],
        [0.5570, 0.6525, 0.8648],
        [0.2325, 0.9513, 0.4556]])


In [8]:
# 全0矩阵构建
b = torch.zeros(4,4)
print(b)

tensor([[0., 0., 0., 0.],
        [0., 0., 0., 0.],
        [0., 0., 0., 0.],
        [0., 0., 0., 0.]])


In [9]:
# 张量的构建 我们可以通过torch.tensor()直接使用数据，构造一个张量：
x = torch.tensor([5.5, 3]) 
print(x)

tensor([5.5000, 3.0000])


In [14]:

x = a.new_ones(4, 3, dtype=torch.double) 
# 创建一个新的全1矩阵tensor，返回的tensor默认具有相同的torch.dtype和torch.device
# 也可以像之前的写法 x = torch.ones(4, 3, dtype=torch.double)
print(x)
x = torch.randn_like(x, dtype=torch.float)
# 重置数据类型
print(x)
# 结果会有一样的size
# 获取它的维度信息
print(x.size())
print(x.shape)

tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]], dtype=torch.float64)
tensor([[-1.4806,  0.6763,  1.7365],
        [-2.4384,  0.4306, -0.4925],
        [-1.2686, -0.4295, -0.8371],
        [-0.6396, -1.6038, -0.1184]])
torch.Size([4, 3])
torch.Size([4, 3])


### 张量操作
#### 张量加法

In [24]:

import torch
x = torch.ones(5,4)
y = torch.rand(5,4)
print("x: ",x)
print("y: ",y)
#方式一 
# 注意相加时矩阵size要一致
print("1--->x+y: ",x+y)
#方式2
print("2--->x+y: ",torch.add(x, y))
#方式3 原值修改
x.add_(y);
print("原值修改！",x)

x:  tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]])
y:  tensor([[0.7403, 0.9667, 0.0351, 0.0470],
        [0.6012, 0.7206, 0.0482, 0.6057],
        [0.8646, 0.6918, 0.3521, 0.2058],
        [0.7555, 0.2405, 0.5929, 0.9158],
        [0.6076, 0.5072, 0.1262, 0.3433]])
1--->x+y:  tensor([[1.7403, 1.9667, 1.0351, 1.0470],
        [1.6012, 1.7206, 1.0482, 1.6057],
        [1.8646, 1.6918, 1.3521, 1.2058],
        [1.7555, 1.2405, 1.5929, 1.9158],
        [1.6076, 1.5072, 1.1262, 1.3433]])
2--->x+y:  tensor([[1.7403, 1.9667, 1.0351, 1.0470],
        [1.6012, 1.7206, 1.0482, 1.6057],
        [1.8646, 1.6918, 1.3521, 1.2058],
        [1.7555, 1.2405, 1.5929, 1.9158],
        [1.6076, 1.5072, 1.1262, 1.3433]])
原值修改！ tensor([[1.7403, 1.9667, 1.0351, 1.0470],
        [1.6012, 1.7206, 1.0482, 1.6057],
        [1.8646, 1.6918, 1.3521, 1.2058],
        [1.7555, 1.2405, 1.5929, 1.9158],
        [1.6076, 1.5072, 1.1262,

#### 索引操作
需要注意的是：索引出来的结果与原数据共享内存，修改一个，另一个会跟着修改。如果不想修改，可以考虑使用copy()等方法

In [31]:
import torch
x = torch.rand(4,3)
# print(x[:2,:2])

 # 眼睁睁共享内存机制
print(x[0,:])
y = x[0,:]
y += 1
print(y)
print(x[0,:]) # 源tensor也被改了了

tensor([0.7360, 0.7120, 0.9696])
tensor([1.7360, 1.7120, 1.9696])
tensor([1.7360, 1.7120, 1.9696])


#### 维度变换 
张量的维度变换常见的方法有torch.view()和torch.reshape()，下面我们将介绍第一中方法torch.view()



In [42]:
x = torch.rand(3,4)
y = x.view(12)
z = y.view(-1,2) # -1表示自适应
print("x: ",x)
print(x.size())
print("y: ",y)
print(y.size())
print("z: ",z)
print(z.size())

x:  tensor([[0.4705, 0.7388, 0.0829, 0.1663],
        [0.6580, 0.5757, 0.1147, 0.7721],
        [0.3177, 0.1814, 0.8073, 0.2266]])
torch.Size([3, 4])
y:  tensor([0.4705, 0.7388, 0.0829, 0.1663, 0.6580, 0.5757, 0.1147, 0.7721, 0.3177,
        0.1814, 0.8073, 0.2266])
torch.Size([12])
z:  tensor([[0.4705, 0.7388],
        [0.0829, 0.1663],
        [0.6580, 0.5757],
        [0.1147, 0.7721],
        [0.3177, 0.1814],
        [0.8073, 0.2266]])
torch.Size([6, 2])



注: torch.view() 返回的新tensor与源tensor共享内存(其实是同一个tensor)，更改其中的一个，另外一个也会跟着改变。(顾名思义，view()仅仅是改变了对这个张量的观察角度)

In [49]:
print(x) 
print(y) 
x += 1
# view funtion just change the perspective of tensor
# ,if you change the tensor x,the tensor y will also  change 
print(x) 
print(y) 


tensor([[4.4705, 4.7388, 4.0829, 4.1663],
        [4.6580, 4.5757, 4.1147, 4.7721],
        [4.3177, 4.1814, 4.8073, 4.2266]])
tensor([4.4705, 4.7388, 4.0829, 4.1663, 4.6580, 4.5757, 4.1147, 4.7721, 4.3177,
        4.1814, 4.8073, 4.2266])
tensor([[5.4705, 5.7388, 5.0829, 5.1663],
        [5.6580, 5.5757, 5.1147, 5.7721],
        [5.3177, 5.1814, 5.8073, 5.2266]])
tensor([5.4705, 5.7388, 5.0829, 5.1663, 5.6580, 5.5757, 5.1147, 5.7721, 5.3177,
        5.1814, 5.8073, 5.2266])


### reshape
但是很多情况下，我们希望原始张量和变换后的张量互相不影响。为为了使创建的张量和原始张量不共享内存，我们需要使用第二种方法torch.reshape()

In [57]:
import torch
x = torch.rand(5,4)
# 还是共享了内存 x 随着y改变
y = torch.reshape(x,(-1,2))
print(x)
print(y)
y += 1
print(x)
print(y)



tensor([[0.6156, 0.1800, 0.0839, 0.9338],
        [0.8536, 0.8353, 0.9011, 0.3750],
        [0.8272, 0.0199, 0.5095, 0.4609],
        [0.0567, 0.2472, 0.5745, 0.0522],
        [0.3311, 0.5100, 0.3078, 0.2891]])
tensor([[0.6156, 0.1800],
        [0.0839, 0.9338],
        [0.8536, 0.8353],
        [0.9011, 0.3750],
        [0.8272, 0.0199],
        [0.5095, 0.4609],
        [0.0567, 0.2472],
        [0.5745, 0.0522],
        [0.3311, 0.5100],
        [0.3078, 0.2891]])
tensor([[1.6156, 1.1800, 1.0839, 1.9338],
        [1.8536, 1.8353, 1.9011, 1.3750],
        [1.8272, 1.0199, 1.5095, 1.4609],
        [1.0567, 1.2472, 1.5745, 1.0522],
        [1.3311, 1.5100, 1.3078, 1.2891]])
tensor([[1.6156, 1.1800],
        [1.0839, 1.9338],
        [1.8536, 1.8353],
        [1.9011, 1.3750],
        [1.8272, 1.0199],
        [1.5095, 1.4609],
        [1.0567, 1.2472],
        [1.5745, 1.0522],
        [1.3311, 1.5100],
        [1.3078, 1.2891]])


#### clone() ---> view()
- 推荐的方法是我们先用 clone() 创造一个张量副本然后再使用 torch.view()进行函数维度变换 。
- 使用 clone() 还有一个好处是会被记录在计算图中，即梯度回传到副本时也会传到源 Tensor 。

In [61]:
import torch
x = torch.tensor([1,2,3,4,5,6,7,8,9])
print(x)
y = x.clone()
print(y)
# 维度变化 
y = y.view(-1,3)
print(y)

tensor([1, 2, 3, 4, 5, 6, 7, 8, 9])
tensor([1, 2, 3, 4, 5, 6, 7, 8, 9])
tensor([[1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]])


#### 取值操作 
如果我们有一个元素 tensor ，我们可以使用 .item() 来获得这个 value，而不获得其他性质：

In [62]:
import torch
x = torch.randn(1) 
print(type(x)) 
print(type(x.item()))

<class 'torch.Tensor'>
<class 'float'>


### 广播机制
当对两个形状不同的 Tensor 按元素运算时，可能会触发广播(broadcasting)机制：先适当复制元素使这两个 Tensor 形状相同后再按元素运算

In [65]:
x = torch.arange(1,3).view(1,2)
print(x)
y = torch.arange(1, 4).view(3, 1)
print(y)
print(x + y)

tensor([[1, 2]])
tensor([[1],
        [2],
        [3]])
tensor([[2, 3],
        [3, 4],
        [4, 5]])


由于x和y分别是1行2列和3行1列的矩阵，如果要计算x+y，那么x中第一行的2个元素被广播 (复制)到了第二行和第三行，⽽y中第⼀列的3个元素被广播(复制)到了第二列。如此，就可以对2个3行2列的矩阵按元素相加。