# 我的GPU在做什么？

既然我们正在GPU上执行代码，我们可能想要了解更多关于我们如何有效利用硬件的信息。

本教程设计用于与[jupyterlab-nvdashboard](https://github.com/rapidsai/jupyterlab-nvdashboard)一起使用，这是一个Jupyter Lab扩展，可以显示GPU利用率、内存和传输速度的图表。

![](images/nvdashboard.gif)

用于创建此仪表板的所有API都可以在Python中使用，所以让我们自己深入了解pyNVML。

NVML代表NVIDIA管理库，是包含在NVIDIA驱动程序中的一个包，用于报告GPU状态信息。

我们可以导入并使用[`pyNVML`包](https://pypi.org/project/nvidia-ml-py/)来探索这些数据。

In [None]:
!pip install nvidia-ml-py

In [1]:
import pynvml
pynvml.nvmlInit()

这个包提供了对C NVML库的直接绑定，因此他们文档中提到的几乎所有内容都是可能的。

我们可以查看有多少个GPU。

In [2]:
pynvml.nvmlDeviceGetCount()

1

查看我们的驱动程序版本。

In [3]:
pynvml.nvmlSystemGetDriverVersion()

'565.57.01'

然后我们可以为每个GPU获取一个句柄来查询其特定指标。

In [4]:
gpus = [pynvml.nvmlDeviceGetHandleByIndex(i) for i in range(pynvml.nvmlDeviceGetCount())]
gpus

[<pynvml.LP_struct_c_nvmlDevice_t at 0x7fe6e43b3b60>]

我们可以获取型号信息。

In [5]:
[pynvml.nvmlDeviceGetName(gpu) for gpu in gpus]

['Tesla T4']

我们可以获取内存信息（让我们将其转换为GB）

In [6]:
[pynvml.nvmlDeviceGetMemoryInfo(gpu).used / 1e9 for gpu in gpus]

[1.339293696]

In [7]:
[pynvml.nvmlDeviceGetMemoryInfo(gpu).free / 1e9 for gpu in gpus]

[14.766833664]

通过访问来自我们GPU的丰富指标，我们可以就代码性能如何以及如何分配工作做出更明智的决策。