# 张量的数据结构
Tensor 是深度学习框架中极为基础的概念，也是 PyTroch、TensorFlow 中最重要的知识点之一，它是一种数据的存储和处理结构。

标量，也称 Scalar，是一个只有大小，没有方向的量，比如 1.8、e、10 等。

向量，也称 Vector，是一个有大小也有方向的量，比如 (1,2,3,4) 等。

矩阵，也称 Matrix，是多个向量合并在一起得到的量，比如[(1,2,3),(4,5,6)]等。


![mdfiles/image2.png](mdfiles/image2.png)

Rank（秩）来表示这种“维度”，比如标量，就是 Rank 为 0 阶的 Tensor；向量就是 Rank 为 1 阶的 Tensor；矩阵就是 Rank 为 2 阶的 Tensor。也有 Rank 大于 2 的 Tensor


In [11]:
# torch.tensor
import numpy as np
import torch

data = [1, 2, 3, 4, 5]
# data could be a list, tuple, numpy ndarray, scalar
# list: [1, 2, 3, 4, 5]
# tuple: (1, 2, 3, 4, 5)
# numpy ndarray: np.array([1, 2, 3, 4, 5])
# scalar: 5 (scalar is converted to a 0-dim tensor)
# requires_grad is used for 自动求导机制 autograd 的开关，用来控制这个张量是否参与梯度计算
torch_tensor = torch.tensor([data],dtype=torch.float32,device='cuda:0',requires_grad=False)
print(torch_tensor)

# create from numpy
torch_tensor_from_numpy = torch.from_numpy(np.array(data))
print(torch_tensor_from_numpy)

# torch.zeros ：创建一个指定形状的全零张量
zeros_tensor = torch.zeros(size=(3, 4), dtype=torch.float32)
# torch.ones ：创建一个指定形状的全一张量
ones_tensor = torch.ones(size=(2, 5), dtype=torch.float32)
# torch.eyes ：创建一个单位矩阵张量
eye_tensor = torch.eye(n=4, m=4, dtype=torch.float32)
# torch.arange ：创建一个一维张量，包含指定范围内的等差数列
arange_tensor = torch.arange(start=0, end=10, step=2, dtype=torch.float32)
# torch.linspace ：创建一个一维张量，包含指定范围内的等间隔数列
linspace_tensor = torch.linspace(start=0, end=1, steps=5, dtype=torch.float32)
# torch.rand ：创建一个指定形状的张量，元素服从均匀分布
rand_tensor = torch.rand(size=(3, 3), dtype=torch.float32)
# torch.randn ：创建一个指定形状的张量，元素服从标准正态分布
randn_tensor = torch.randn(size=(2, 4), dtype=torch.float32)
# torch.randperm ：创建一个一维张量，包含指定范围内的随机排列整数
randperm_tensor = torch.randperm(n=10, dtype=torch.int64)
# torch.normal ：创建一个指定形状的张量，元素服从正态分布
normal_tensor = torch.normal(mean=0.0, std=1.0, size=(3, 3), dtype=torch.float32)
# torch.randint ：创建一个指定范围内的随机整数张量
randint_tensor = torch.randint(low=0, high=10, size=(4, 4), dtype=torch.int64)

print(f"zeros_tensor: {zeros_tensor}")
print(f"ones_tensor: {ones_tensor}")
print(f"eye_tensor: {eye_tensor}")
print(f"arange_tensor: {arange_tensor}")
print(f"linspace_tensor: {linspace_tensor}")
print(f"rand_tensor: {rand_tensor}")
print(f"randn_tensor: {randn_tensor}")
print(f"randperm_tensor: {randperm_tensor}")
print(f"normal_tensor: {normal_tensor}")
print(f"randint_tensor: {randint_tensor}")




tensor([[1., 2., 3., 4., 5.]], device='cuda:0')
tensor([1, 2, 3, 4, 5])
zeros_tensor: tensor([[0., 0., 0., 0.],
        [0., 0., 0., 0.],
        [0., 0., 0., 0.]])
ones_tensor: tensor([[1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.]])
eye_tensor: tensor([[1., 0., 0., 0.],
        [0., 1., 0., 0.],
        [0., 0., 1., 0.],
        [0., 0., 0., 1.]])
arange_tensor: tensor([0., 2., 4., 6., 8.])
linspace_tensor: tensor([0.0000, 0.2500, 0.5000, 0.7500, 1.0000])
rand_tensor: tensor([[0.9110, 0.3321, 0.9602],
        [0.7950, 0.6236, 0.7947],
        [0.0589, 0.4025, 0.0117]])
randn_tensor: tensor([[-1.3588, -2.4594,  0.3198, -0.0436],
        [-2.0158,  0.0813,  0.0378, -0.2368]])
randperm_tensor: tensor([9, 3, 7, 4, 8, 0, 6, 5, 1, 2])
normal_tensor: tensor([[ 1.6344, -1.2577,  0.2292],
        [ 0.2665, -0.8695,  1.3954],
        [-0.4596, -0.8160, -1.6917]])
randint_tensor: tensor([[8, 2, 2, 2],
        [4, 7, 7, 1],
        [2, 0, 7, 5],
        [2, 8, 4, 7]])


In [12]:
# 转换

# INT and Tensor conversion
int_value = 5
tensor_from_int = torch.tensor(int_value)
print(f"Tensor from int: {tensor_from_int}")
print(f"Type: {type(tensor_from_int)}")

# item
tensor_value = tensor_from_int.item()
print(f"Tensor value: {tensor_value}")
print(f"Type: {type(tensor_value)}")

# list to tensor and back
list_value = [1, 2, 3, 4, 5]
tensor_from_list = torch.tensor(list_value)
list_from_tensor = tensor_from_list.numpy().tolist()
print(f"Tensor from list: {tensor_from_list}")
print(f"List from tensor: {list_from_tensor}")
print(f"Type of tensor_from_list: {type(tensor_from_list)}")
print(f"Type of list_from_tensor: {type(list_from_tensor)}")


Tensor from int: 5
Type: <class 'torch.Tensor'>
Tensor value: 5
Type: <class 'int'>
Tensor from list: tensor([1, 2, 3, 4, 5])
List from tensor: [1, 2, 3, 4, 5]
Type of tensor_from_list: <class 'torch.Tensor'>
Type of list_from_tensor: <class 'list'>


In [13]:
# CPU 与 GPU 的 Tensor
cpu_tensor = torch.tensor([1, 2, 3], device='cpu')
if torch.cuda.is_available():
    gpu_tensor = cpu_tensor.to('cuda:0')
    print(f"GPU Tensor: {gpu_tensor}")

GPU Tensor: tensor([1, 2, 3], device='cuda:0')


In [14]:
# Tensor 的形式、形状
a=torch.zeros(2, 3, 5)
print(f"Tensor a: {a}")
print(f"Shape of a: {a.shape}")
print(f"Dimensions of a: {a.ndim}")
print(f"Size of a: {a.size()}")

Tensor a: tensor([[[0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.]],

        [[0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.]]])
Shape of a: torch.Size([2, 3, 5])
Dimensions of a: 3
Size of a: torch.Size([2, 3, 5])


In [15]:
# numel()：返回张量中元素的总数
a=torch.zeros(2, 3, 5)
print(f"Number of elements in a: {a.numel()}")

Number of elements in a: 30


In [19]:
# 矩阵转秩 (维度转换）
a = torch.randn(2, 3, 4)
b = a.permute(1, 0, 2)  # 交换维度 具体来说 交换了第0维和第1维
print(b.shape)  # 输出: torch.Size([3, 2, 4])

# transpose()：交换指定的两个维度
c = a.transpose(0, 1)  # 交换第0维和第1维
print(c.shape)  # 输出: torch.Size([3, 2, 4])

# 经过了 transpose 或者 permute 处理之后的数据，变得不再连续了
# 具体来说，如果一个张量在内存中不是按行优先（row-major）顺序存储的，那么它就是不连续的
# contiguous()：将不连续的张量转换为连续的张量
print(a.is_contiguous())  # 输出: True
print(b.is_contiguous())  # 输出: False
d = b.contiguous()
print(d.is_contiguous())  # 输出: True


# view 不能处理内存不连续 Tensor 的结构。
# 如果对一个不连续的 Tensor 使用 view 方法，会报错。
# 这时候需要先调用 contiguous 方法，将其转换为连续的 Tensor，然后再使用 view 方法。
e = d.view(6, 4)
print(e.shape)  # 输出: torch.Size([6, 4])
# 如果直接对 b 使用 view 方法，会报错
# f = b.view(6, 4)  # 会报错，因为 b 是不连续的 Tensor d 已经是连续的 Tensor 了，可以使用 view 方法

# view 不行 reshape 可以
f = b.reshape(6, 4)
print(f.shape)  # 输出: torch.Size([6, 4])


torch.Size([3, 2, 4])
torch.Size([3, 2, 4])
True
False
True
torch.Size([6, 4])
torch.Size([6, 4])


In [None]:
# Really important
# seqeeze and unsqueeze to add or remove dimensions
x = torch.randn(2, 1, 3, 1, 4)
print(f"Original shape: {x.shape}")  # 输出: torch.Size([2, 1, 3, 1, 4])
x_squeezed = x.squeeze()
# 输入的只能是维度为1的维度，否则不会被移除，例如1和3维度 其他维度不是1就不会被移除
print(f"Squeezed shape: {x_squeezed.shape}")  # 输出: torch.Size([2, 3, 4]) why?
# 因为 squeeze() 会移除所有维度为 1 的维度
x_unsqueezed = x_squeezed.unsqueeze(1)
print(f"Unsqueezed shape: {x_unsqueezed.shape}")  # 输出: torch.Size([2, 1, 3, 4]) why?
x_unsqueezed2 = x_unsqueezed.unsqueeze(3)
print(f"Unsqueezed2 shape: {x_unsqueezed2.shape}")  # 输出: torch.Size([2, 1, 3, 1, 4]) why?
# 因为 unsqueeze(1) 会在第 1 and 3 个维度位置添加一个维度，大小为 1

Original shape: torch.Size([2, 1, 3, 1, 4])
Squeezed shape: torch.Size([2, 1, 3, 1, 4])
Unsqueezed shape: torch.Size([2, 1, 1, 3, 1, 4])
Unsqueezed2 shape: torch.Size([2, 1, 1, 1, 3, 1, 4])


: 

In [None]:
# torch.Tensor() 和 torch.tensor() 区别
# torch.Tensor() 是一个类的构造函数，用于创建一个新的张量对象。它可以接受多种类型的输入参数，如列表、元组、NumPy 数组等。
# torch.tensor() 是一个函数，用于将现有的数据转换为张量对象。