# CPU 和 GPU 的比较

CPU 是执行代码最常见的处理器类型。CPU 有一个或多个串行处理器，每个处理器从指令栈中获取单个指令并**按顺序执行**。

GPU 是一种协处理器，通常用于视频和图像渲染，但在机器学习和数据科学领域也非常流行。GPU 有一个或多个流式多处理器，它们接收指令数组并**并行执行**。

<figure>

![CPU GPU 比较](images/cpu-gpu.png)

<figcaption style="text-align: center;"> 
    
图片来源 <a href="https://docs.nvidia.com/cuda/cuda-c-programming-guide/">https://docs.nvidia.com/cuda/cuda-c-programming-guide/</a>
    
</figcaption>
</figure>


## 流言终结者的解释

这个视频可能有助于直观地解释这个概念。

In [None]:
from IPython.display import YouTubeVideo
YouTubeVideo(id='-P28LKWTzrI',width=1000,height=600)

## 那么如何控制 GPU 呢？

在 GPU 上执行代码感觉很像在通过网络在第二台计算机上执行代码。

如果我想将 Python 程序发送到另一台机器执行，我需要几个东西：
- 一种将数据和代码复制到远程机器的方法（SCP、SFTP、SMB、NFS 等）
- 一种在远程机器上登录和执行程序的方法（SSH、VNC、远程桌面等）

![CPU GPU 比较](images/two-computers-network.png)

要在 GPU 上实现相同的功能，我们需要通过 PCI 使用 CUDA。但想法仍然是一样的，我们需要将数据和代码移动到设备上并执行该代码。

![CPU GPU 比较](images/computer-gpu-cuda.png)

## 什么是 CUDA？

[CUDA](https://developer.nvidia.com/cuda-zone) 是 C++ 的扩展，它允许我们编译 GPU 代码并与 GPU 交互。

### 但我写的是 Python，不是 C++！

在过去几年里，NVIDIA 投资将 CUDA 功能引入 Python。

如今有像 [Numba](https://numba.pydata.org/) 这样的包，它允许我们即时编译（JIT）Python 代码成与 CUDA 兼容的代码，并提供绑定来传输数据和执行该代码。

还有许多高级包，如 [CuPy](https://cupy.dev/)、[cuDF](https://github.com/rapidsai/cudf)、[cuML](https://github.com/rapidsai/cuml)、[cuGraph](https://github.com/rapidsai/cugraph) 等，它们在 CUDA C++ 中实现功能，然后打包 Python 绑定，以便可以直接从 Python 中使用。这些包统称为 [RAPIDS](https://rapids.ai/)。

最后，还有 [CUDA Python](https://developer.nvidia.com/cuda-python) 库，它为 CUDA 驱动程序和运行时 API 提供 Cython/Python 包装器。

本教程将重点介绍 Numba 和 RAPIDS。