In [None]:
'''
Tensor 的创建
'''

# 一、 Tensor 的介绍
'''
Tensor 可以理解为多维数组，类似于 Numpy 数组（ndarray） 的概念。
与 Numpy 数组相比，Tensor 除了支持运行在 CPU 上，还支持运行在 GPU 及各种 AI 芯片上，以实现计算加速；
此外，飞桨基于 Tensor，实现了深度学习所必须的反向传播功能和多种多样的组网算子，从而可更快捷地实现深度学习组网与训练等功能。
'''

# 二、Tensor 的创建
## 2.1 指定数据创建
import paddle # 后面的示例代码默认已导入 paddle 模块
ndim_1_Tensor = paddle.to_tensor([2.0, 3.0, 4.0])
print(ndim_1_Tensor)

paddle.to_tensor(2)
paddle.to_tensor([2])

ndim_2_Tensor = paddle.to_tensor([[1.0, 2.0, 3.0],
                                  [4.0, 5.0, 6.0]])
print(ndim_2_Tensor)

ndim_3_Tensor = paddle.to_tensor([[[1, 2, 3, 4, 5],
                                   [6, 7, 8, 9, 10]],
                                  [[11, 12, 13, 14, 15],
                                   [16, 17, 18, 19, 20]]])
print(ndim_3_Tensor) 
'''基于给定数据创建 Tensor 时，飞桨是通过拷贝方式创建，与原始数据不共享内存。'''

## 2.2 指定形状创建
'''
paddle.zeros([m, n])             # 创建数据全为 0，形状为 [m, n] 的 Tensor
paddle.ones([m, n])              # 创建数据全为 1，形状为 [m, n] 的 Tensor
paddle.full([m, n], 10)          # 创建数据全为 10，形状为 [m, n] 的 Tensor
'''
paddle.ones([2, 3])    

## 2.3 指定区间创建
'''
paddle.arange(start, end, step)  # 创建以步长 step 均匀分隔区间[start, end)的 Tensor
paddle.linspace(start, stop, num) # 创建以元素个数 num 均匀分隔区间[start, stop)的 Tensor
'''
paddle.arange(start=1, end=5, step=1)

'''
此外： paddle.empty, paddle.ones_like、paddle.zeros_like、paddle.full_like, paddle.clone, paddle.rand, paddle.randn, 
paddle.randint, paddle.seed 和 paddle.rand 等参考官网。
'''

## 2.4 指定图像、文本数据创建
'''以下示例代码中将随机生成的图片转换为 Tensor。'''
import numpy as np
from PIL import Image
import paddle.vision.transforms as T
import paddle.vision.transforms.functional as F

fake_img = Image.fromarray((np.random.rand(224, 224, 3) * 255.).astype(np.uint8)) # 创建随机图片
transform = T.ToTensor()
tensor = transform(fake_img) # 使用 ToTensor()将图片转换为 Tensor
# print(tensor)

## 2.5 自动创建 Tensor 的功能介绍
import paddle

from paddle.vision.transforms import Compose, Normalize

transform = Compose([Normalize(mean=[127.5],
                               std=[127.5],
                               data_format='CHW')])

test_dataset = paddle.vision.datasets.MNIST(mode='test', transform=transform)
print(test_dataset[0][1]) # 打印原始数据集的第一个数据的 label
loader = paddle.io.DataLoader(test_dataset)
for data in enumerate(loader):
    i = data[0]
    x, label = data[1]
    print(i)
    print(label) # 打印由 DataLoader 返回的迭代器中的第一个数据的 label
    break

In [None]:
# 三、Tensor 的属性
## 3.1 Tensor 的形状（shape）
import paddle
ndim_4_Tensor = paddle.ones([2, 3, 4, 5])
# print(ndim_4_Tensor)
'''
形状是 Tensor 的一个重要的基础属性，可以通过 Tensor.shape 查看一个 Tensor 的形状，以下为相关概念：

shape：描述了 Tensor 每个维度上元素的数量。

ndim： Tensor 的维度数量，例如向量的维度为 1，矩阵的维度为 2，Tensor 可以有任意数量的维度。

axis 或者 dimension：Tensor 的轴，即某个特定的维度。

size：Tensor 中全部元素的个数。
'''

'''
飞桨框架的 API 有原位（Inplace）操作和非原位操作之分，原位操作即在原 Tensor 上保存操作结果，输出 Tensor 将与输入 Tensor 共享数据，
并且没有 Tensor 数据拷贝的过程。非原位操作则不会修改原 Tensor，而是返回一个新的 Tensor。通过 API 名称区分两者，
如 paddle.reshape 是非原位操作，paddle.reshape_ 是原位操作。
'''
origin_tensor = paddle.to_tensor([1, 2, 3])
new_tensor = paddle.reshape(origin_tensor, [1, 3]) # 非原位操作
same_tensor = paddle.reshape_(origin_tensor, [1, 3]) # 原位操作
print("origin_tensor name: ", origin_tensor.name)
print("new_tensor name: ", new_tensor.name)
print("same_tensor name: ", same_tensor.name)

## 3.2 Tensor 的数据类型（dtype）
# 创建 Tensor 时指定 dtype
ndim_1_tensor = paddle.to_tensor([2.0, 3.0, 4.0], dtype='float64')
print("Tensor dtype of ndim_1_tensor:", ndim_1_tensor.dtype)
# 创建 Tensor 时不指定 dtype，自动选择对应的默认类型
print("Tensor dtype from Python integers:", paddle.to_tensor(1).dtype)
print("Tensor dtype from Python floating point:", paddle.to_tensor(1.0).dtype)

float32_Tensor = paddle.to_tensor(1.0)

float64_Tensor = paddle.cast(float32_Tensor, dtype='float64')
print("Tensor after cast to float64:", float64_Tensor.dtype)

int64_Tensor = paddle.cast(float32_Tensor, dtype='int64')
print("Tensor after cast to int64:", int64_Tensor.dtype)

## 3.3 Tensor 的设备位置（place）
cpu_Tensor = paddle.to_tensor(1, place=paddle.CPUPlace())
print(cpu_Tensor.place)

gpu_Tensor = paddle.to_tensor(1, place=paddle.CUDAPlace(0))
print(gpu_Tensor.place) # 显示 Tensor 位于 GPU 设备的第 0 张显卡上

## 3.4 Tensor 的名称（name）
# Tensor 的名称是独一无二的
print("Tensor name:", paddle.to_tensor(1).name)

## 3.5 Tensor 的 stop_gradient 属性
eg = paddle.to_tensor(1)
print("Tensor stop_gradient:", eg.stop_gradient)
eg.stop_gradient = False
print("Tensor stop_gradient:", eg.stop_gradient)

In [None]:
# 四、Tensor 的操作
## 4.1 索引和切片
'''
基于 0-n 的下标进行索引，如果下标为负数，则从尾部开始计算。
通过冒号 : 分隔切片参数，start:stop:step 来进行切片操作，其中 start、stop、step 均可缺省。
'''

import paddle
# 一维 tensor
ndim_1_Tensor = paddle.to_tensor([0, 1, 2, 3, 4, 5, 6, 7, 8])
# print("Origin Tensor:", ndim_1_Tensor.numpy()) # 原始 1 维 Tensor
# print("First element:", ndim_1_Tensor[0].numpy()) # 取 Tensor 第一个元素的值？
# print("Last element:", ndim_1_Tensor[-1].numpy())
# print("All element:", ndim_1_Tensor[:].numpy())
# print("Before 3:", ndim_1_Tensor[:3].numpy())
# print("From 6 to the end:", ndim_1_Tensor[6:].numpy())
# print("From 3 to 6:", ndim_1_Tensor[3:6].numpy())
# print("Interval of 3:", ndim_1_Tensor[::3].numpy())
# print("Reverse:", ndim_1_Tensor[::-1].numpy())


# 多个维度上进行
ndim_2_Tensor = paddle.to_tensor([[0, 1, 2, 3],
                                  [4, 5, 6, 7],
                                  [8, 9, 10, 11]])
ndim_2_Tensor = paddle.to_tensor([[0, 1, 2, 3],
                                  [4, 5, 6, 7],
                                  [8, 9, 10, 11]])
print("Origin Tensor:", ndim_2_Tensor.numpy())
print("First row:", ndim_2_Tensor[0].numpy())
print("First row:", ndim_2_Tensor[0, :].numpy())
print("First column:", ndim_2_Tensor[:, 0].numpy())
print("Last column:", ndim_2_Tensor[:, -1].numpy())
print("All element:", ndim_2_Tensor[:].numpy())
print("First row and second column:", ndim_2_Tensor[0, 1].numpy())

# 注意
print("First row:", ndim_2_Tensor[0].numpy())
print("First row:", ndim_2_Tensor[0,].numpy())
print("First row:", ndim_2_Tensor[0, :].numpy())
print("All element:", ndim_2_Tensor[0 :].numpy())
print("All element:", ndim_2_Tensor[0 :,].numpy())
print("All element:", ndim_2_Tensor[0 :, :].numpy())

In [42]:
# 五、Tensor 的广播机制
'''
每个 Tensor 至少为一维 Tensor。
从最后一个维度向前开始比较两个 Tensor 的形状，需要满足如下条件才能进行广播：两个 Tensor 的维度大小相等；或者其中一个 Tensor 的维度等于 1；或者其中一个 Tensor 的维度不存在。
'''
import paddle

# 可以广播的例子 1
x = paddle.ones((2, 3, 4))
y = paddle.ones((2, 3, 4))
# 两个 Tensor 形状一致，可以广播
z = x + y
print(z.shape)
# [2, 3, 4]

# 可以广播的例子 2
x = paddle.ones((2, 3, 1, 5))
y = paddle.ones((3, 4, 1))
# 从最后一个维度向前依次比较：
# 第一次：y 的维度大小是 1
# 第二次：x 的维度大小是 1
# 第三次：x 和 y 的维度大小相等
# 第四次：y 的维度不存在
# 所以 x 和 y 是可以广播的
z = x + y
print(z.shape)
# [2, 3, 4, 5]

# 不可广播的例子
x = paddle.ones((2, 3, 4))
y = paddle.ones((2, 3, 6))
# 此时 x 和 y 是不可广播的，因为第一次比较：4 不等于 6
# z = x + y
# ValueError: (InvalidArgument) Broadcast dimension mismatch.

# 六、Tensor 与 Numpy 数组相互转换
# 基于 Numpy 数组创建 Tensor 时，飞桨是通过拷贝方式创建，与原始数据不共享内存。
tensor_to_convert = paddle.to_tensor([1.,2.])
tensor_to_convert.numpy()
