In [4]:
from __future__ import print_function
import torch

In [5]:
x = torch.empty(5,3)
print(x)

tensor([[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]])


In [3]:
x = torch.rand(5, 3)
print(x)

tensor([[0.9836, 0.7050, 0.8535],
        [0.9122, 0.3672, 0.7307],
        [0.9996, 0.2987, 0.2410],
        [0.8849, 0.9882, 0.5264],
        [0.7821, 0.5565, 0.1039]])


torch.long 是 PyTorch 中的一种数据类型，表示 64 位有符号整数类型。
基本信息
全称: torch.int64
别名: torch.long
精度: 64位整数
取值范围: -2^63 到 2^63-1
内存占用: 每个数值占用8字节

In [6]:
x= torch.zeros(5,3, dtype=torch.long)
print(x)

tensor([[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]])


张量是深度学习框架（如PyTorch）中的核心数据结构，可以理解为多维数组的泛化概念。
张量的关键属性
形状（Shape）：描述张量各维度的大小
数据类型（dtype）：如 torch.float32、torch.double 等
设备（device）：数据存储位置（CPU或GPU）
实际应用
在深度学习中，张量用来表示：
输入数据：如图像（通常为4维：batch_size×channels×height×width）
模型参数：如神经网络的权重和偏置
输出结果：模型的预测值
损失函数值：训练过程中的损失计算
张量是PyTorch进行所有数值计算的基础，支持各种数学运算和变换操作。
--------------------------------
# 0维张量 - 标量
scalar = torch.tensor(5)
print(f"0维张量: {scalar}, 形状: {scalar.shape}")

# 1维张量 - 向量
vector = torch.tensor([1, 2, 3])
print(f"1维张量: {vector}, 形状: {vector.shape}")

# 2维张量 - 矩阵
matrix = torch.tensor([[1, 2], [3, 4]])
print(f"2维张量: {matrix}, 形状: {matrix.shape}")

# 3维张量 - 立方体
tensor_3d = torch.tensor([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
print(f"3维张量: {tensor_3d}, 形状: {tensor_3d.shape}")


In [7]:
#直接通过数据创建张量 
x= torch.tensor([2.5,3.5])
print(x)

tensor([2.5000, 3.5000])


In [8]:
#通过已有的张量创建相同尺寸的张量 
x = x.new_ones(5,3,dtype=torch.double)
print(x)

tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]], dtype=torch.float64)


In [9]:
#在 tensor([1., 2., 3.]) 中，数字后面的点（.）表示这些数字是**浮点数（float）**而不是整数（integer）
x = torch.tensor([1.0, 2.0, 3.0], dtype=torch.double)
print(x)

tensor([1., 2., 3.], dtype=torch.float64)


利用randn_like方法创建相同尺寸的张量，并且随机初始化张量，并且随机初始化来对其赋值
在PyTorch中，"相同尺寸的张量"指的是具有**相同形状（shape）**的张量，即在每个维度上都有相同的大小。
torch.randn_like 的作用：
torch.randn_like() 函数会创建一个与输入张量形状相同的新张量，但填充值是从标准正态分布（均值为0，标准差为1）中随机采样的数据。

In [15]:
x = torch.tensor([1.0, 2.0, 3.0], dtype=torch.double)  # 形状为 [3]
print(x)


tensor([1., 2., 3.], dtype=torch.float64)


In [16]:
x = torch.randn_like(x, dtype=torch.float)  
print(x)


tensor([ 0.2113,  1.8213, -0.3036])


In [23]:
original = torch.tensor([[1, 2, 3], [4, 5, 6]], dtype=torch.float)  # 形状: [2, 3]
new_tensor = torch.randn_like(original) 
print(original)
print(new_tensor)


tensor([[1., 2., 3.],
        [4., 5., 6.]])
tensor([[ 1.9856,  0.3117, -0.6586],
        [-1.4092,  0.1598,  1.0222]])


In [25]:
x = torch.tensor([1.0, 2.0, 3.0])
y = torch.tensor([4.0, 5.0, 6.0])

In [27]:
multiplication = torch.mul(x, y)
print(f"x * y = {multiplication}")

x * y = tensor([ 4., 10., 18.])


In [28]:
division = torch.div(x, y)
print(f"x / y = {division}")

x / y = tensor([0.2500, 0.4000, 0.5000])


基本定义
行（Row）：水平方向排列的元素
列（Column）：垂直方向排列的元素
------------------------------
高维张量中的行和列
对于更高维度的张量：
二维：(行, 列)
三维：(深度, 行, 列) 或 (批次, 行, 列)
四维：(批次, 通道, 行, 列) （常用于图像处理）

In [31]:
x = torch.rand(3,2)
y = torch.rand(3,2)
result = torch.empty(3,2)
torch.add(x, y, out=result)
print(result)

tensor([[0.8053, 0.6460],
        [1.0021, 1.0827],
        [1.6562, 0.2575]])


In [32]:
print(x[:,:2])

tensor([[0.3218, 0.3321],
        [0.6427, 0.2426],
        [0.6676, 0.1330]])


In [33]:
print("\nx[:,0] - 只选择第1列:")
print(x[:,0])


x[:,0] - 只选择第1列:
tensor([0.3218, 0.6427, 0.6676])


In [34]:
print("\nx[:,1:] - 从第2列开始到末尾:")
print(x[:,1:])


x[:,1:] - 从第2列开始到末尾:
tensor([[0.3321],
        [0.2426],
        [0.1330]])


In [35]:
print("\nx[1:,:] - 从第2行开始到末尾的所有列:")
print(x[1:,:])


x[1:,:] - 从第2行开始到末尾的所有列:
tensor([[0.6427, 0.2426],
        [0.6676, 0.1330]])


改变张量的形状：torch.view()

view() 方法的特点
不改变数据：只是改变数据的组织方式（形状）
共享内存：返回的张量与原张量共享内存，修改一个会影响另一个
元素总数不变：重塑前后的元素总数必须相等

In [39]:
x = torch.randn(4,4)    # 创建一个4×4的随机张量
y = x.view(16)          # 将x重塑为16个元素的一维张量
z = x.view(-1,8)        # 将x重塑为若干行8列的张量（-1表示自动推断该维度大小）
print(x.size(), y.size(), z.size())  # 打印各个张量的形状

torch.Size([4, 4]) torch.Size([16]) torch.Size([2, 8])


x = torch.randn(4,4)
创建一个形状为 [4, 4] 的张量（4行4列，共16个元素）
数据是从标准正态分布中随机采样得到的
y = x.view(16)
使用 view() 方法将张量重塑为一维
16 表示新的形状为 [16]，即16个元素的一维张量
总元素数量保持不变（4×4 = 16）
z = x.view(-1,8)
-1 是一个特殊值，表示该维度的大小由PyTorch自动推断
由于总元素数是16，而第二维度是8，所以第一维度自动推断为2
因此新形状为 [2, 8]（2行8列）

In [40]:
y = x.view(16)
print("\n重塑为一维 y = x.view(16):")
print(f"形状: {y.shape}")
print(y)


重塑为一维 y = x.view(16):
形状: torch.Size([16])
tensor([-1.0516, -1.7043,  0.8973,  0.2150, -0.5220, -0.5844, -2.0523,  1.1386,
        -1.5446,  0.6166, -0.1808, -0.4970, -0.6396, -0.1100,  0.8414, -0.2160])


In [38]:
z = x.view(-1, 8)
print("\n重塑为二维 z = x.view(-1, 8):")
print(f"形状: {z.shape}")
print(z)


重塑为二维 z = x.view(-1, 8):
形状: torch.Size([2, 8])
tensor([[-0.1544,  0.3992,  1.8202, -0.5044,  0.2974, -1.9535,  0.2268,  2.5592],
        [-2.0014, -0.6979, -0.0454, -0.5095,  0.6831,  0.9144, -0.6697,  0.3931]])


In [41]:
# 验证共享内存
x[0, 0] = 999
print(f"\n修改x[0,0]后，y[0]的值: {y[0]}")  # 也会变为999


修改x[0,0]后，y[0]的值: 999.0


与 reshape() 的区别
虽然 view() 和 reshape() 都可以改变张量形状，但：
view() 要求张量在内存中是连续的，否则会报错
reshape() 更灵活，如果张量不连续会自动创建副本

In [None]:
# 在神经网络中常见的用法
# 将卷积层输出展平为全连接层输入
conv_output = torch.randn(32, 64, 8, 8)  # 批次32，通道64，8×8特征图
flattened = conv_output.view(32, -1)     # 变为 [32, 64*8*8] = [32, 4096]


In [51]:
 #将张量重新组织为指定的列数
# x.view(10, -1) 和 x.view(-1, 10) 的区别
# 这两种写法的主要区别在于哪个维度被固定，哪个维度被自动推断。
x = torch.randn(10)            # 10个元素
x_matrixx = x.view(-1,5)        # 变为 [100, 10] 矩阵
x_matrix = x.view(5, -1)        # 变为 [10, 100] 矩阵
print(x_matrixx)
print(x_matrix)

tensor([[-1.1076, -0.7009,  1.0098,  1.5055, -0.1857],
        [ 2.0886, -1.0067, -0.6668,  0.3669,  1.0423]])
tensor([[-1.1076, -0.7009],
        [ 1.0098,  1.5055],
        [-0.1857,  2.0886],
        [-1.0067, -0.6668],
        [ 0.3669,  1.0423]])


In [52]:
# 创建一个有120个元素的张量
x = torch.randn(2, 3, 4, 5)  # 2×3×4×5 = 120个元素
print(f"原始形状: {x.shape}")  # torch.Size([2, 3, 4, 5])

原始形状: torch.Size([2, 3, 4, 5])


In [None]:
# 在图像处理中的实际应用
# 假设有一批32张RGB图像，每张图像大小为28×28
batch_images = torch.randn(32, 3, 28, 28)  # 32张图像，3个通道，28×28像素
print(f"原始形状: {batch_images.shape}")   # torch.Size([32, 3, 28, 28])

# 情况1: x.view(32, -1) - 保持批次大小为32
flattened1 = batch_images.view(32, -1)
print(f"view(32, -1) 结果: {flattened1.shape}")  # torch.Size([32, 2352])
# 每张图像被展平为2352个特征 (3×28×28 = 2352)

# 情况2: x.view(-1, 2352) - 指定每行有2352个特征
flattened2 = batch_images.view(-1, 2352)
print(f"view(-1, 2352) 结果: {flattened2.shape}")  # torch.Size([32, 2352])
# 这种情况和上面相同，因为2352 = 3×28×28

# 情况3: x.view(-1, 28) - 指定每行有28个特征
try:
    flattened3 = batch_images.view(-1, 28)
    print(f"view(-1, 28) 结果: {flattened3.shape}")  # torch.Size([2688, 28])
    # 自动推断第一维度: 32×3×28×28 ÷ 28 = 2688
except RuntimeError as e:
    print(f"错误: {e}")

In [None]:
#在神经网络中的典型用法

# 1. 保持批次大小，展平其他维度
def forward_method1(self, x):
    # x.shape = [batch_size, channels, height, width]
    batch_size = x.size(0)
    x = x.view(batch_size, -1)  # 展平为 [batch_size, features]
    return x

# 2. 固定特征维度，自动推断批次大小
def forward_method2(self, x):
    # 假设我们知道展平后应该有1000个特征
    x = x.view(-1, 1000)  # 展平为 [batch_size, 1000]
    return x

In [53]:
#如果张量中只有一个元素，可以用.item（）将值取出，作为python number
x = torch.randn(1)
print(x)
print(x.item())

tensor([-0.3506])
-0.35058459639549255


#### 关于Torch Tensor和Numpy和 python array之间的相互转换

1. Tensor 转换为 NumPy 数组
使用 .numpy() 方法将Tensor转换为NumPy数组

In [7]:
a = torch.ones(5)
b = a.numpy()
print(b)  # 输出: [1. 1. 1. 1. 1.]


[1. 1. 1. 1. 1.]


2. NumPy 数组转换为 Tensor
 torch.from_numpy()

In [10]:
import numpy as np
numpy_array = np.array([1, 2, 3])
tensor_from_numpy = torch.from_numpy(numpy_array)
print(tensor_from_numpy)

tensor([1, 2, 3])


3. 共享内存特性
Torch Tensor和NumPy数组之间的一个重要特性是它们共享内存：

In [None]:
a = torch.ones(5)
print(a)        # 输出: tensor([1., 1., 1., 1., 1.])
b = a.numpy()
print(b)        # 输出: [1. 1. 1. 1. 1.]

# 修改Tensor会影响NumPy数组
a.add_(1)
print(a)        # 输出: tensor([2., 2., 2., 2., 2.])
print(b)        # 输出: [2. 2. 2. 2. 2.]


#### Torch Tensor 与 Python 列表的转换
1. Tensor 转换为 Python 列表

In [None]:
# 使用 .tolist() 方法将Tensor转换为Python列表
a = torch.tensor([1, 2, 3])
python_list = a.tolist()


2. Python 列表转换为 Tensor

In [None]:
# 使用 torch.tensor() 或 torch.Tensor() 将Python列表转换为Tensor
python_list = [1, 2, 3]
a = torch.tensor(python_list)


**重要注意事项**
共享内存: Torch Tensor和NumPy数组共享底层内存，修改一个会影响另一个
数据类型一致性: 转换时要注意数据类型的匹配
设备兼容性: 在GPU上的Tensor不能直接转换为NumPy数组，需要先移动到CPU
这些转换功能使得PyTorch能够与Python生态系统中的其他库（如NumPy、Pandas等）很好地集成，方便数据处理和模型训练

关于Cuda Tensor:Tensors可以用.to()方法移动到任意设备上
是 Mac没法用 CUDA/NVIDIA，加速方式需用 MPS

In [15]:
import torch
print(torch.backends.mps.is_available())
print(torch.backends.mps.is_built())

True
True


#### 主要区别：
设备检查：
CUDA: torch.cuda.is_available()
MPS: torch.backends.mps.is_available()
设备定义：
CUDA: torch.device("cuda")
MPS: torch.device("mps")
功能：
MPS 在 macOS 上提供了类似于 CUDA 的 GPU 加速功能
对于大多数 PyTorch 操作，MPS 和 CUDA 的使用方式非常相似
注意事项：
你需要安装支持 MPS 的 PyTorch 版本
某些操作在 MPS 上可能不如在 CUDA 上成熟或快速
你可以通过运行你笔记本中的检查代码来确认 MPS 可用性：

 MPS (Metal Performance Shaders) 不支持 float64 (double) 数据类型。
 在 macOS 上使用 MPS 时，需要使用 float32 数据类型。以下是修复后的代码：

#### 总结
GPU 是通用概念，指图形处理单元，现在广泛用于并行计算
MPS 是苹果公司为Apple Silicon设备提供的高性能计算框架
两者都能显著加速深度学习计算，但适用平台不同
在PyTorch中，它们提供了相似的API，使得代码可以在不同平台上移植
MPS有一些特殊限制（如不支持float64），需要特别处理
选择使用哪种技术主要取决于你的硬件平台：NVIDIA GPU使用CUDA，Apple Silicon使用MPS，其他情况使用CPU。

In [18]:
import torch

# 首先定义 x 变量
x = torch.randn(5, 3)  # 创建一个 5x3 的随机张量
print(f"Original x: {x}")

# 检查是否可以使用 MPS (适用于 macOS 上的 Apple Silicon)
if torch.backends.mps.is_available():
    # 定义设备对象，这里指 MPS 即使用 GPU
    device = torch.device("mps")
    print(f"Using device: {device}")
    
    # 直接在 GPU 上创建一个 tensor
    y = torch.ones_like(x, device=device)
    # 将 x 移动到 GPU 上（y 已经在 GPU 上了）
    x_device = x.to(device)
    z = x_device + y
    print(f"Result on MPS: {z}")
    # 也把 z 移动到 CPU 上面，并同时指定张量元素的数据类型
    # MPS 不支持 float64，所以使用 float32
    print(f"Result moved to CPU with float32 dtype: {z.to('cpu', torch.float32)}")
else:
    # 如果 MPS 不可用，则在 CPU 上执行
    print("MPS not available, running on CPU")
    y = torch.ones_like(x)
    z = x + y
    print(f"Result on CPU: {z}")
    # 在 CPU 上可以使用 float64 (double)
    print(f"Result with double dtype: {z.to(torch.double)}")


Original x: tensor([[ 0.5558,  1.1701,  0.9447],
        [ 0.7543,  0.7514,  0.5123],
        [ 2.3072,  1.3961, -0.0764],
        [-0.6867,  0.0776, -0.0716],
        [ 0.6185,  0.5575,  0.2268]])
Using device: mps
Result on MPS: tensor([[1.5558, 2.1701, 1.9447],
        [1.7543, 1.7514, 1.5123],
        [3.3072, 2.3961, 0.9236],
        [0.3133, 1.0776, 0.9284],
        [1.6185, 1.5575, 1.2268]], device='mps:0')
Result moved to CPU with float32 dtype: tensor([[1.5558, 2.1701, 1.9447],
        [1.7543, 1.7514, 1.5123],
        [3.3072, 2.3961, 0.9236],
        [0.3133, 1.0776, 0.9284],
        [1.6185, 1.5575, 1.2268]])
