# 我的 GPU 在做什么？

现在我们正在 GPU 上执行代码，我们可能想要更多地了解我们如何充分利用我们的硬件。

本教程设计用于与 [jupyterlab-nvdashboard](https://github.com/rapidsai/jupyterlab-nvdashboard) 一起使用，这是一个 Jupyter Lab 扩展，它显示 GPU 利用率、内存和传输速度的图表。

![](images/nvdashboard.gif)

用于创建此仪表板的所有 API 都可以在 Python 中使用，所以让我们自己深入了解 pyNVML。

NVML 代表 NVIDIA 管理库，是一个包含在 NVIDIA 驱动程序中的包，用于报告 GPU 状态信息。

我们可以导入和使用 [`pyNVML` 包](https://pypi.org/project/pynvml/) 来探索这些数据。

In [None]:
!pip install nvidia-ml-py

In [None]:
import pynvml
pynvml.nvmlInit()

这个包提供了对 C NVML 库的直接绑定，所以他们文档中提到的几乎所有功能都是可能的。

我们可以看到我们有多少个 GPU。

In [None]:
pynvml.nvmlDeviceGetCount()

我们的驱动程序版本是什么。

In [None]:
pynvml.nvmlSystemGetDriverVersion()

然后我们可以为每个 GPU 获取一个句柄来查询其具体指标。

In [None]:
gpus = [pynvml.nvmlDeviceGetHandleByIndex(i) for i in range(pynvml.nvmlDeviceGetCount())]
gpus

我们可以获取型号。

In [None]:
[pynvml.nvmlDeviceGetName(gpu) for gpu in gpus]

我们可以获取内存信息（让我们转换为 GB）

In [None]:
[pynvml.nvmlDeviceGetMemoryInfo(gpu).used / 1e9 for gpu in gpus]

In [None]:
[pynvml.nvmlDeviceGetMemoryInfo(gpu).free / 1e9 for gpu in gpus]

通过访问 GPU 的丰富指标，我们可以对代码的性能和如何划分工作做出更明智的决定。