In [None]:
import torch
import round

In [None]:
# 获取当前GPU设备(设备索引0)的完整属性信息
# 返回对象包含name(显卡型号)、total_memory(总显存)等关键属性
gpu_stats = torch.cuda.get_device_properties(0)

# 计算当前已预留的显存大小（转换为GB单位，保留3位小数）
# max_memory_reserved()返回PyTorch已申请的显存峰值（包括已使用和缓存）
start_gpu_memory = round(torch.cuda.max_memory_reserved() / 1024 / 1024 / 1024, 3)

# 计算GPU总显存大小（转换为GB单位，保留3位小数）
# total_memory以字节为单位，通过连续三次除以1024转换为GB
max_memory = round(gpu_stats.total_memory / 1024 / 1024 / 1024, 3)

# 打印GPU型号和总显存容量
print(f"GPU = {gpu_stats.name}. Max memory = {max_memory} GB.")

# 打印当前已预留的显存量
print(f"{start_gpu_memory} GB of memory reserved.")


In [None]:
# 计算当前已使用的总显存量（GB单位，保留3位小数）
# max_memory_reserved()返回训练过程中PyTorch申请的显存峰值
used_memory = round(torch.cuda.max_memory_reserved() / 1024 / 1024 / 1024, 3)

# 计算LoRA训练实际消耗的显存（总使用量减去初始预留量）
used_memory_for_lora = round(used_memory - start_gpu_memory, 3)

# 计算总显存使用百分比（相对于GPU最大显存）
used_percentage = round(used_memory / max_memory * 100, 3)

# 计算LoRA训练显存占比（相对于GPU最大显存）
lora_percentage = round(used_memory_for_lora / max_memory * 100, 3)

# 打印训练耗时（秒单位）
print(f"{trainer_stats.metrics['train_runtime']} seconds used for training.")

# 打印训练耗时（分钟单位，保留2位小数）
print(f"{round(trainer_stats.metrics['train_runtime']/60, 2)} minutes used for training.")

# 打印峰值显存占用情况
print(f"Peak reserved memory = {used_memory} GB.")  # 绝对数值
print(f"Peak reserved memory for training = {used_memory_for_lora} GB.")  # 净训练消耗

# 打印显存占用比例
print(f"Peak reserved memory % of max memory = {used_percentage} %.")  # 总占用率
print(f"Peak reserved memory for training % of max memory = {lora_percentage} %.")  # 训练净占用率
