# Tensor

Tensor是PyTorch核心的数据结构，用于构建矩阵、多维数组等。Tensor不仅为模型编码了输入输出的数据形式，也编码了模型的自身参数。Tensor的特点总结如下：
- 支持GPU、TPU加速
- 支持自动求导
- 可以与`np.ndarray`实现快速转换，不改变内存空间

In [1]:
import torch
import numpy as np

## 1. 创建Tensor

- 从列表创建
- 从`np.ndarray`创建
- 从其他的tensor创建
- 根据形状创建

In [2]:
# 从列表创建tensor
data = [[1,2,3], [2,3,4]]
data_tensor = torch.tensor(data)
print(data_tensor)

tensor([[1, 2, 3],
        [2, 3, 4]])


In [3]:
# 从np.ndarray创建tensor
data_np = np.array(data) # np.array同样可以从列表构建数组
data_tensor = torch.from_numpy(data_np)
print(data_tensor)

tensor([[1, 2, 3],
        [2, 3, 4]])


当从其他的tensor来创建新的tensor时，若非特别指定，则保留原tensor的形状、数据类型。

In [6]:
data_ones = torch.ones_like(data_tensor)
print(data_ones)
print(data_ones.type())

tensor([[1, 1, 1],
        [1, 1, 1]])
torch.LongTensor


In [8]:
data_rand = torch.rand_like(data_tensor, dtype = torch.float)
print(data_rand)
print(data_rand.type())

tensor([[0.1320, 0.7394, 0.7742],
        [0.4972, 0.0305, 0.2730]])
torch.FloatTensor


In [9]:
# 若使用like函数来生成与原tensor数据类型冲突的tensor，必须指定dtype
data_rand = torch.rand_like(data_tensor)

RuntimeError: "check_uniform_bounds" not implemented for 'Long'

根据形状来创建tensor，常用的有以下：
- `torch.ones(shape)`
- `torch.zeros(shape)`
- `torch.rand(shape)`

In [14]:
# 根据形状创建tensor
shape = (2, 3) # 形状用元组表示

data_ones = torch.ones(shape)
data_zeros = torch.zeros(shape)
data_rand = torch.rand(shape)

print(f'Ones tensor: \n {data_ones}')
print(f'data_Zeros: \n {data_zeros}')
print(f'data_rand: \n {data_rand}')

Ones tensor: 
 tensor([[1., 1., 1.],
        [1., 1., 1.]])
data_Zeros: 
 tensor([[0., 0., 0.],
        [0., 0., 0.]])
data_rand: 
 tensor([[0.5147, 0.6115, 0.0438],
        [0.9879, 0.6100, 0.3390]])


## Tensor属性（attribute）

In [17]:
print(data_rand.dtype)
print(data_rand.shape)
print(data_rand.device)

torch.float32
torch.Size([2, 3])
cpu


## Tensor opration

有关Tensor的操作，完整列表可见官方文档：https://pytorch.org/docs/stable/torch.html

Tensor默认被创建在CPU上，若需要将它转移到GPU上，可以使用`to`函数：

In [19]:
data_rand = torch.rand(3, 4).to('cuda') if torch.cuda.is_available() else torch.rand(3, 4).to('cpu')

print(data_rand.device)

cuda:0


Tensor和numpy数组一样支持切片操作

In [22]:
data_ones = torch.ones(4, 4).to('cuda')

print(data_ones[0])
print(data_ones[:1])
print(data_ones[:-1])

tensor([1., 1., 1., 1.], device='cuda:0')
tensor([[1., 1., 1., 1.]], device='cuda:0')
tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]], device='cuda:0')


In [25]:
data_ones[:, -1] = 2
print(data_ones)

tensor([[1., 1., 1., 2.],
        [1., 1., 1., 2.],
        [1., 1., 1., 2.],
        [1., 1., 1., 2.]], device='cuda:0')


tensor支持cat拼接操作

In [29]:
data_cat = torch.cat([data_ones, data_ones])
print(data_cat)

tensor([[1., 1., 1., 2.],
        [1., 1., 1., 2.],
        [1., 1., 1., 2.],
        [1., 1., 1., 2.],
        [1., 1., 1., 2.],
        [1., 1., 1., 2.],
        [1., 1., 1., 2.],
        [1., 1., 1., 2.]], device='cuda:0')


In [30]:
data_cat = torch.cat([data_ones, data_ones], dim=1)
print(data_cat)

tensor([[1., 1., 1., 2., 1., 1., 1., 2.],
        [1., 1., 1., 2., 1., 1., 1., 2.],
        [1., 1., 1., 2., 1., 1., 1., 2.],
        [1., 1., 1., 2., 1., 1., 1., 2.]], device='cuda:0')


矩阵乘法：
- @
- matmul

In [48]:
tensor = torch.ones(4, 4)
y1 = tensor @ tensor.T
y2 = tensor.matmul(tensor.T)

y3 = torch.rand_like(y1)
torch.matmul(tensor, tensor.T, out = y3)

print(y1.all() == y2.all(), y1.all() == y3.all())
print(y1)

tensor(True) tensor(True)
tensor([[4., 4., 4., 4.],
        [4., 4., 4., 4.],
        [4., 4., 4., 4.],
        [4., 4., 4., 4.]])


矩阵逐元素相乘：
- *
- mul

In [50]:
z1 = tensor * tensor
z2 = tensor.mul(tensor)

z3 = torch.rand_like(tensor)
torch.mul(tensor, tensor, out = z3)

print(z1.all() == z2.all(), z1.all() == z3.all())
print(z1)

tensor(True) tensor(True)
tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]])


tensor In-place 操作：

在PyTorch中，tensor的In-place操作将直接修改tensor本身，这些操作以`_`后缀为标志：
- `x.add_()`
- `x.copy_()`
- `x.t_()`


## Tensor与numpy的互相转换

- 将tensor转换为numpy数据：`tensor.numpy()`
- 将numpy数据转换为tensor：`torch.from_numpy()`