In [6]:
import torch

print(f'PyTorch版本: {torch.__version__}')
print(f'CUDA可用: {torch.cuda.is_available()}')
print(f'GPU名称: {torch.cuda.get_device_name(0) if torch.cuda.is_available() else "N/A"}')

# 可选：查看PyTorch内置的CUDA适配版本（辅助排查GPU问题）
print("PyTorch内置CUDA版本：", torch.version.cuda)               # 显示 PyTorch 使用的 CUDA 版本

# 查看triton版本
import triton
print("Triton版本：", triton.__version__)

PyTorch版本: 2.5.1
CUDA可用: True
GPU名称: NVIDIA GeForce RTX 3060 Ti
PyTorch内置CUDA版本： 12.4
Triton版本： 3.1.0


In [2]:
import torch
# 创建一个 5 x 3 的随机张量
x = torch.rand(5, 3)
print(x)

tensor([[0.5923, 0.6313, 0.4679],
        [0.1826, 0.7677, 0.3391],
        [0.2105, 0.4767, 0.8341],
        [0.4557, 0.7572, 0.9797],
        [0.8010, 0.9047, 0.2565]])


In [1]:
import torch
import numpy as np

# 1. 创建张量
# 创建全0张量
x = torch.zeros((3, 4))
# 创建随机初始化张量（0-1均匀分布）
y = torch.rand((3, 4))
# 从NumPy数组转换
z = torch.from_numpy(np.array([[1, 2], [3, 4]], dtype=np.float32))
# 创建指定值的张量
a = torch.tensor([[1.0, 2.0], [3.0, 4.0]])

# 2. 张量属性
print("张量形状:", a.shape)  # 输出: torch.Size([2, 2])
print("数据类型:", a.dtype)  # 输出: torch.float32
print("设备:", a.device)     # 输出: cpu（默认）

# 3. 张量运算
b = torch.tensor([[5.0, 6.0], [7.0, 8.0]])
# 加法
c = a + b
# 矩阵乘法
d = a @ b  # 等价于 torch.matmul(a, b)
# 逐元素乘法： element-wise multiplication
e = a * b
# 转置
f = a.t()

# 4. GPU加速（需有NVIDIA GPU并安装CUDA）
if torch.cuda.is_available():
    a_cuda = a.to("cuda")  # 将张量移到GPU
    b_cuda = b.to("cuda")
    c_cuda = a_cuda + b_cuda
    print("GPU上的计算结果:", c_cuda)

# 5. 自动微分 (Autograd)
x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)  # 开启梯度追踪
y = x ** 2 + 2 * x + 1
print("y:", y)
z = y.sum()
z.backward()  # 计算梯度
print("x的梯度:", x.grad)  # 输出: tensor([4., 6., 8.])（导数为2x+2）

张量形状: torch.Size([2, 2])
数据类型: torch.float32
设备: cpu
GPU上的计算结果: tensor([[ 6.,  8.],
        [10., 12.]], device='cuda:0')
y: tensor([ 4.,  9., 16.], grad_fn=<AddBackward0>)
x的梯度: tensor([4., 6., 8.])
