<h1 style="color:#65AE11;">应用概述：对称式迭代费斯妥密码</h2>

本节中，你将初步了解要使用本课程所学方法重构的对称式迭代费斯妥密码应用。此应用已经过 GPU 加速。

<h2 style="color:#65AE11;">目标</h2>

完成本节内容的学习后，您将：

* 熟悉要在整个课程中研究的 CUDA C++ 密码应用
* 了解该应用中需要重点关注的部分和基本可以忽略的部分
* 能够编译并运行该应用
* 获得该应用的性能基准

<h2 style="color:#65AE11;">演示</h2>

运行以下单元以加载本节的视频演示。看完演示后，继续完成此 Notebook 余下的部分。

In [1]:
%%html
<video width="800" controls>
  <source src="https://dli-lms.s3.us-east-1.amazonaws.com/assets/s-ac-02-v1-zh/03-cipher-overview-01.mp4" type="video/mp4">
  Your browser does not support HTML video.
</video>

<h2 style="color:#65AE11;">注释</h2>

单击下方 `...`以查看讲师演示内容的注释。这些注释可能会对你以后回到研讨会继续学习有所帮助。

* [encryption.cuh](baseline_cipher/encryption.cuh) 包含用于执行加密和解密工作的功能。`permute64` 和 `unpermute64`的工作量可以通过`num_iters`来控制。

* [helpers.cuh](baseline_cipher/helpers.cuh) 包含用于错误处理的代码，以及整个课程中都使用的`Timer`类。

* [baseline.cu](baseline_cipher/baseline.cu) 包含用于使用多个CPU内核在CPU上加密、将数据传输到GPU并在GPU上解密、再传输回给CPU以及在CPU上检查正确性的代码。 

* `Timer` 类为应用程序的各个部分提供执行的持续时间。

* 尽管不是必需的，`make`可以用来编译代码并生成报告文件。有关的详细信息，请参见[Makefile](baseline_cipher/Makefile)。

* 有关其它详细信息，请参见整个源代码中的注释。

<h2 style="color:#65AE11;">练习：编译和运行基准应用</h2>

仿照讲师的操作，使用终端编译并运行基准应用。

<h2 style="color:#65AE11;">知识检查</h2>

请回答下列问题，确认您已了解本节的主要目标。您可以通过单击问题下方的`...`单元来显示每个问题的答案。

---

**要执行课程任务，您需要清楚地了解 encryption.cu 中的 `hash`、`permute64` 和 `unpermute64` 函数分别有何作用。**

1. 正确
2. 错误

**答案：2。**

现在，您不需要了解这些函数的工作方式也可以完成课程任务。

---

**以下哪些函数能够在 GPU 上运行？请选择所有适用项。**

1. `permute64`
2. `unpermute64`
3. `encrypt_cpu`
4. `decrypt_gpu`
5. `check_result_cpu`

**答案：1、2、4。**

---

**此基准应用会将内存传输与计算重叠。**

1. 正确
2. 错误

**答案：2。**

---

**此基准应用使用多个 CPU 核心。**

1.True
2.错误

**答案：1。**

---

**此基准应用使用多个 GPU。**

1. 正确
2. 错误

**答案：2。**

---

<h2 style="color:#65AE11;">下一步</h2>

现在您已熟悉基准密码应用，并可编译、运行及对其进行基准测试，接下来您将学习使用 Nsight Systems 可视化分析器为该应用创建可视化的时间表。

请继续学习下一节：[*Nsight Systems 设置*](../04_Nsight_Systems_Setup/Nsight_Systems_Setup.ipynb)。

<h2 style="color:#65AE11;">选择进一步学习</h2>

以下内容供有时间和兴趣的学生对与本课程相关的主题进行更深入的学习。

* [Wikipedia](https://en.wikipedia.org/wiki/Feistel_cipher)更深入地介绍了我们在整个培训中使用的Feistel密码的历史，构造和应用。
* [openmp.org](https://www.openmp.org/resources/)提供了有关并行编程的OpenMP API规范的更多信息。
* 您可以在[这个教程](https://makefiletutorial.com/)中了解有关如何使用Makefile的更多信息。
* 关于使用跨网格循环构建灵活的CUDA核函数的信息，Mark Harris写了[CUDA开发人员专区博客文章](https://developer.nvidia.com/blog/cuda-pro-tip-write-flexible-kernels-grid-stride-loops/)。
* 这篇[geeksforgeeks文章](https://www.geeksforgeeks.org/c-classes-and-objects/)在C++类的使用方面提供了一个很好的速成课程，这些类与我们这个培训课程中使用的`Timer`类很相似。