# PyTorch 基础 : 张量

In [2]:
import torch
import numpy as np
torch.__version__

'1.4.0+cpu'

## 张量(Tensor)
张量的英文是Tensor，它是PyTorch里面基础的运算单位，与Numpy的ndarray相同都表示的是一个多维的矩阵。  
与ndarray的最大区别就是，PyTorch的Tensor可以在 GPU 上运行，而 numpy 的 ndarray 只能在 CPU 上运行，在GPU上运行大大加快了运算速度。

生成一个简单的张量

In [3]:
x = torch.rand(2,3) #可以任意生成想要的size
x

tensor([[0.5821, 0.3839, 0.6767],
        [0.3717, 0.2753, 0.4947]])

In [4]:
# 可以使用与numpy相同的shape属性查看
print(x.shape)
# 也可以使用size()函数，返回的结果都是相同的
print(x.size())

torch.Size([2, 3])
torch.Size([2, 3])


张量（Tensor）是一个定义在一些向量空间和一些对偶空间的笛卡儿积上的多重线性映射，**其坐标是|n|维空间内，有|n|个分量的一种量**， 其中每个分量都是坐标的函数， 而在坐标变换时，这些分量也依照某些规则作线性变换。r称为该张量的秩或阶（与矩阵的秩和阶均无关系）。 (来自百度百科)

下面生成一些多维的张量：

In [5]:
y = torch.rand(2,3,4,5)
print(y.size())
y

torch.Size([2, 3, 4, 5])


tensor([[[[0.5812, 0.9824, 0.3700, 0.8703, 0.3258],
          [0.6868, 0.1223, 0.5715, 0.4778, 0.2254],
          [0.1033, 0.9976, 0.2032, 0.4555, 0.4622],
          [0.4424, 0.3466, 0.2975, 0.7486, 0.5034]],

         [[0.2153, 0.8870, 0.9458, 0.7590, 0.9892],
          [0.6646, 0.8095, 0.8229, 0.6213, 0.2789],
          [0.4950, 0.6469, 0.9424, 0.9903, 0.4882],
          [0.6367, 0.4505, 0.2655, 0.4938, 0.3228]],

         [[0.8728, 0.1016, 0.8158, 0.6020, 0.2553],
          [0.7104, 0.6706, 0.7550, 0.6073, 0.6986],
          [0.4620, 0.2667, 0.3874, 0.9640, 0.1291],
          [0.8478, 0.3837, 0.4778, 0.3089, 0.0982]]],


        [[[0.0512, 0.1912, 0.6992, 0.8461, 0.0591],
          [0.6329, 0.3485, 0.7167, 0.6537, 0.7594],
          [0.0191, 0.7220, 0.9443, 0.0559, 0.6593],
          [0.3591, 0.7648, 0.7301, 0.3838, 0.5566]],

         [[0.1145, 0.0201, 0.7754, 0.4440, 0.5454],
          [0.6924, 0.4307, 0.8845, 0.1813, 0.1253],
          [0.8363, 0.0817, 0.2392, 0.7139, 0.7814],
  

在同构的意义下:
* 第零阶张量 （r = 0） 为标量 （Scalar）
* 第一阶张量 （r = 1） 为向量 （Vector)
* 第二阶张量 （r = 2） 则成为矩阵 （Matrix)
* 第三阶以上的统称为多维张量。

其中要特别注意的就是标量，我们先生成一个标量：

In [6]:
scalar = torch.tensor(2.333332)
print(scalar)
scalar.size()

tensor(2.3333)


torch.Size([])

对于标量，我们可以直接使用 .item() 从中取出其对应的python对象的数值

In [7]:
scalar.item()

2.333332061767578

特别的：如果张量中只有一个元素的tensor也可以调用`tensor.item`方法

In [8]:
tensor = torch.tensor([3.1433223]) 
print(tensor)
tensor.size()

tensor([3.1433])


torch.Size([1])

In [9]:
tensor.item()

3.143322229385376

### 基本类型
Tensor的基本数据类型有五种：
- 32位浮点型：torch.FloatTensor。 (默认)
- 64位整型：torch.LongTensor。
- 32位整型：torch.IntTensor。
- 16位整型：torch.ShortTensor。
- 64位浮点型：torch.DoubleTensor。

除以上数字类型外，还有
byte和chart型

In [10]:
long = tensor.long()
long

tensor([3])

In [11]:
half = tensor.half()
half

tensor([3.1426], dtype=torch.float16)

In [12]:
int_t = tensor.int()
int_t

tensor([3], dtype=torch.int32)

In [13]:
flo = tensor.float()
flo

tensor([3.1433])

In [15]:
short = tensor.short()
short

tensor([3], dtype=torch.int16)

In [16]:
ch = tensor.char()
ch

tensor([3], dtype=torch.int8)

In [17]:
bt = tensor.byte()
bt

tensor([3], dtype=torch.uint8)

### Numpy转换
使用numpy方法将Tensor转为ndarray

In [18]:
a = torch.randn((3, 2))
# tensor转化为numpy
numpy_a = a.numpy()
print(numpy_a)

[[-0.9762767   0.16459851]
 [-0.03374688  1.0314187 ]
 [ 0.5441837  -1.5202681 ]]


numpy转化为Tensor

In [19]:
torch_a = torch.from_numpy(numpy_a)
torch_a

tensor([[-0.9763,  0.1646],
        [-0.0337,  1.0314],
        [ 0.5442, -1.5203]])

***Tensor和numpy对象共享内存，所以他们之间的转换很快，而且几乎不会消耗什么资源。但这也意味着，如果其中一个变了，另外一个也会随之改变。***

### 设备间转换
一般情况下可以使用.cuda方法将tensor移动到gpu，这步操作需要cuda设备支持

In [21]:
cpu_a=torch.rand(4, 3)
cpu_a.type()

'torch.FloatTensor'

In [None]:
gpu_a=cpu_a.cuda()
gpu_a.type()

使用.cpu方法将tensor移动到cpu

In [None]:
cpu_b=gpu_a.cpu()
cpu_b.type()

如果我们有多GPU的情况，可以使用to方法来确定使用那个设备，这里只做个简单的实例：

In [None]:
#使用torch.cuda.is_available()来确定是否有cuda设备
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)
#将tensor传送到设备
gpu_b=cpu_b.to(device)
gpu_b.type()

### 初始化
Pytorch中有许多默认的初始化方法可以使用

In [22]:
# 使用[0,1]均匀分布随机初始化二维数组
rnd = torch.rand(5, 3)
rnd

tensor([[0.3508, 0.2281, 0.7103],
        [0.7015, 0.0825, 0.1847],
        [0.7947, 0.9190, 0.3153],
        [0.1924, 0.2055, 0.2896],
        [0.0606, 0.4937, 0.9842]])

In [23]:
##初始化，使用1填充
one = torch.ones(2, 2)
one

tensor([[1., 1.],
        [1., 1.]])

In [24]:
##初始化，使用0填充
zero=torch.zeros(2,2)
zero

tensor([[0., 0.],
        [0., 0.]])

In [25]:
#初始化一个单位矩阵，即对角线为1 其他为0
eye=torch.eye(2,2)
eye

tensor([[1., 0.],
        [0., 1.]])

### 常用方法
PyTorch中对张量的操作api 和 NumPy 非常相似，如果熟悉 NumPy 中的操作，那么他们二者基本是一致的：

In [27]:
x = torch.randn(3, 3) #不同的rand，取得是不同的，正态分布什么之类的
print(x)

tensor([[ 0.6535,  0.4191,  0.2873],
        [ 0.7946,  2.1109,  0.3434],
        [-1.2967, -1.4868, -0.4521]])


`torch.max()`函数
* 简单来说是返回一个tensor中的最大值
* torch.max(input, dim, keepdim=False, out=None) -> (Tensor, LongTensor)

### dim
dim的用法不展开，可上网百度查，基本来说：dim=0 ==> 返回每一列的最大值；dim = 1 ==> 返回每一行的最大值

In [28]:
# 沿着行取最大值
max_value, max_idx = torch.max(x, dim=1)
print(max_value, max_idx)

tensor([ 0.6535,  2.1109, -0.4521]) tensor([0, 1, 2])


In [29]:
# 每行 x 求和
sum_x = torch.sum(x, dim=1)
print(sum_x)

tensor([ 1.3598,  3.2490, -3.2356])


In [30]:
y=torch.randn(3, 3)
z = x + y
print(z)

tensor([[ 1.6781,  2.1414, -1.1528],
        [ 0.4667,  2.6493,  1.2208],
        [-0.8366, -1.6180,  0.0561]])


正如官方60分钟教程中所说，以_为结尾的，均会改变调用值

In [31]:
# add 完成后x的值改变了
x.add_(y)
print(x)

tensor([[ 1.6781,  2.1414, -1.1528],
        [ 0.4667,  2.6493,  1.2208],
        [-0.8366, -1.6180,  0.0561]])
