# 使用 torch.Tensor来处理数据

Tensor就是pytorch中存储数据的主要格式，跟numpy类似

这里，我们先介绍一些最基本的操作和常用的功能

In [1]:
import torch # 导入torch包
import numpy as np # 导入numpy包

In [2]:
# 创建一个随机的二维数组（矩阵）
exam1 = torch.randn(2, 3)
print(exam1)


-0.0806  0.1469  0.8234
-0.0606 -0.6344 -0.8300
[torch.FloatTensor of size 2x3]



In [3]:
# 跟numpy一样，我们可以构造初始化为0、1的数组
exam2 = torch.zeros(2, 3)

exam3 = torch.ones(2, 3)

print(exam2)

print(exam3)


 0  0  0
 0  0  0
[torch.FloatTensor of size 2x3]


 1  1  1
 1  1  1
[torch.FloatTensor of size 2x3]



In [4]:
# 当然，我们也可以直接从python的数组直接构造
exam4 = torch.Tensor([[1, 2, 4], [2, 3, 6] ])
print(exam4)


 1  2  4
 2  3  6
[torch.FloatTensor of size 2x3]



numpy 通常是通过 .shape 来获取数组的形状，但是对于torch.Tensor，我们使用的是 .size()

对得到的变量进行访问，可以采取访问列表的方式

In [5]:
shape = exam4.size()
print(type(shape))
print(shape[0])
print(shape[1])

<class 'torch.Size'>
2
3


有时候，我们需要对数组形状进行改变，我们可以采用 .view() 的方式

In [6]:
exam5 = exam4.view(3, 2)

# -1表示的是系统自动补齐
exam6 = exam4.view(1, -1)

print(exam5)
print(exam6)


 1  2
 4  2
 3  6
[torch.FloatTensor of size 3x2]


 1  2  4  2  3  6
[torch.FloatTensor of size 1x6]



torch.Tensor 支持大量的数学操作符 + , - , * , / 都是可以用的。

当然也可以用Tensor内置的 add() 等, 这里需要提一下的就是 add 和 add_ 的区别

使用add函数会生成一个新的Tensor变量， add_ 函数会直接再当前Tensor变量上进行操作

所以，对于函数名末尾带有"_" 的函数都是会对Tensor变量本身进行操作的

In [7]:
exam1.add(20)
print(exam1)


-0.0806  0.1469  0.8234
-0.0606 -0.6344 -0.8300
[torch.FloatTensor of size 2x3]



In [8]:
exam1.add_(20)
print(exam1)


 19.9194  20.1469  20.8234
 19.9394  19.3656  19.1700
[torch.FloatTensor of size 2x3]



对于常用的矩阵运算Tensor也有很好的支持

In [9]:
exam7 = torch.Tensor([[1, 2, 3], [4, 5, 6]])
exam8 = torch.randn(2, 3)

print("exam7: " , exam7)
print("exam8: " , exam8)

exam7:  
 1  2  3
 4  5  6
[torch.FloatTensor of size 2x3]

exam8:  
 0.2148  0.1832  1.1225
-0.1068  0.9847 -0.2159
[torch.FloatTensor of size 2x3]



In [10]:
# 矩阵乘法, 其中 t() 表示取转置
torch.mm(exam7, exam8.t())


 3.9487  1.2150
 8.5101  3.2009
[torch.FloatTensor of size 2x2]

In [11]:
# 矩阵对应元素相乘
exam7 * exam8


 0.2148  0.3664  3.3675
-0.4273  4.9234 -1.2951
[torch.FloatTensor of size 2x3]

跟numpy一样，再Tensor中，也存在Broadcasting

当二元操作符左右两边Tensor形状不一样的时候，系统会尝试将其复制到一个共同的形状。例如a的第0维是3, b的第0维是1，那么 a + b这个操作会将b沿着第0维复制3遍。

In [12]:
a = torch.arange(0, 3).view(3, 1)
b = torch.arange(0, 2).view(1, 2)
print("a:", a)
print("b:", b)
print("a+b:", a + b)

a: 
 0
 1
 2
[torch.FloatTensor of size 3x1]

b: 
 0  1
[torch.FloatTensor of size 1x2]

a+b: 
 0  1
 1  2
 2  3
[torch.FloatTensor of size 3x2]



Tensor和Numpy的相互转换

In [13]:
x = np.ones((2, 3))
y = torch.from_numpy(x) # 从numpy -> torch.Tensor
print(y)
z = y.numpy() # 从torch.Tensor -> numpy
print(z)


 1  1  1
 1  1  1
[torch.DoubleTensor of size 2x3]

[[ 1.  1.  1.]
 [ 1.  1.  1.]]


**常用操作**

unsqueeze() 可以让我们把一个向量变成矩阵

In [14]:
x_u = torch.Tensor([1, 2, 3, 4])
print(x_u)
x_u_1 = torch.unsqueeze(x_u, 0)
print(x_u_1)
x_u_2 = torch.unsqueeze(x_u, 1)
print(x_u_2)


 1
 2
 3
 4
[torch.FloatTensor of size 4]


 1  2  3  4
[torch.FloatTensor of size 1x4]


 1
 2
 3
 4
[torch.FloatTensor of size 4x1]



squeeze() 可以让我们把一个矩阵变成向量。

In [15]:
x_sq = torch.Tensor([[1, 2, 3, 4]])
print(x_sq)
x_sq_1 = torch.squeeze(x_u, 0)
print(x_sq_1)


 1  2  3  4
[torch.FloatTensor of size 1x4]


 1
 2
 3
 4
[torch.FloatTensor of size 4]



stack() 可以让我们把很多个矩阵"堆"在一起形成一个新的高维矩阵。

比如，我们有 10 个 (5, 12)的 Tensor， 我们希望把他们堆在一起形成 (10, 5, 12)的Tensor，我们就可以使用 stack

In [16]:
x_sta = []

num = 10

for i in range(num):
    temp = torch.randn((5, 12))
    x_sta.append(temp)
    if i == 5:
        print("每个 tensor 的维度为：", temp.size())
        
print("整个 sequence 的长度为", len(x_sta))

x_sta_1 = torch.stack(x_sta)

print("stack 整个 sequence 之后得到的结果为：", x_sta_1.size())

每个 tensor 的维度为： torch.Size([5, 12])
整个 sequence 的长度为 10
stack 整个 sequence 之后得到的结果为： torch.Size([10, 5, 12])


最后，这里只是一个引子，还有很多很多的操作，可以在pyTorch官方文档上查阅  [torch.Tensor API](http://pytorch.org/docs/master/tensors.html)