# 17 调试

bug：计算机代码和性能中的错误。
debugging：计算机代码和性能中的错误的解决方案。

调试代码的工作包括，用不同的工具和方法来识别、诊断和修复错误：
1.遇到bug的时间、方式和人员。
2.如何诊断bug。
3.交互式调试，用于快速、系统地诊断错误。
4.分析工具，用于快速识别内存管理问题。
5.Linting工具，用于捕捉代码样式问题和拼写错误。

## 17.1 遇到一个错误

错误的形式：语法错误、逻辑问题、无限循环、内存管理问题、变量初始化、用户错误或其他人为错误。
错误可能导致的后果：
1.编译代码时出现意外错误。
2.运行代码时出现意外的错误消息。
3.来自链接库的未处理异常。
4.结果不正确。
5.无限暂停或挂断。
6.计算机完全崩溃。
7.段错误（segmentation fault）。
8.静默故障。

测试应该覆盖边界限制，并解决开发和用户遇到的所有错误。

不同时间发现错误的后果：
1．如果在测试中发现错误，在软件使用之前就能修复。
2．如果在用户使用之前发现错误，则可以在用户运行代码产生影响之前修复该错误。
3．如果在运行代码时发现错误，则可以在对结果分析之前修复错误。
4．如果在分析代码产生的结果时发现错误，则可以在将结果作为论文发布之前修复错误。
5．如果在发布结果后发现错误，则必须撤销该论文。

通常只有知道代码预期行为才能诊断和修复错误。

代码中出现问题会导致程序“挂起”。

## 17.2 print语句

print函数进行调试是最简单的，但并不是高效计算的最佳实践。
验证的问题：
1.错误发生在哪一行？
2.此时某些变量的状态是什么？

将打印语句插入到程序中可能发生错误的地方就能够解决第一个问题。


In [1]:
# 一段有问题的代码
def mean(nums):
    bot = len(nums)
    it = 0
    top = 0
    print("Still running at line 5")  # 若能打印则问题在后面
    while it < len(nums):
        top += nums[it]
        print(top)  # 用于监测循环状态（问题：无限循环）
    return float(top) / float(bot)


if __name__ == "__main__":
    a_list = [1, 2, 3, 4, 5, 6, 10, "one hundred"]
    mean(a_list)
# 问题修复：使用sum()函数求和即可，无需循环

KeyboardInterrupt: 

打印语句可以提供非常有用的信息来指出错误，但这种策略的扩展性不强。
大型代码库中，通常需要尝试许多次才能确定错误所在位置。

## 17.3 交互式调试

交互式调试器允许用户在执行期间暂停，并跳转到代码上某个特定的行。
允许开发人员以交互的方式查询代码的状态。
能够在代码执行过程中向下移动，以确定错误的来源。

可进行的操作：
1.查询变量的值。
2.修改变量的值。
3.调用函数。
4.进行小型计算。
5.逐个查看调用堆栈。

这些功能可以帮助开发人员确定产生意外行为的原因。
需要有目的地使用，并对错误有认识。如果对错误的行为没有清楚认识或统一的行动计划，交互式调试器仅支持开发人员尝试随机更改代码或查询变量，这纯粹是碰运气。

交互式调试器的系统使用方法：
1.在调查一行代码之前，先问自己这段代码可能产生什么错误。
2.在查询变量的值之前，先确定预期正确的值。
3.在更改变量的值之前，先算出修改后会产生的影响。
4.在步进（step）执行之前，做一个有根据的猜测，什么情况下为错误，什么情况下为成功。
5.跟踪所尝试的事情和所做的更改。使用版本控制跟踪文件的更改，然后使用笔和纸理清脉络。

## 17.4 在Python中调试（pdb）

使用Python调试器（pdb）实现交互式命令行的交互式调试。
使用trace和断点暂停代码，然后查询代码和变量的状态，逐行步进、重新运行、修改。

pdb使用软件包，开头应导入pdb包。

示例代码：

```python
import pdb


def mean(nums):
    top = sum(nums)
    bot = len(nums)
    return float(top) / float(bot)


    a_list = [1, 2, 3, 4, 5, 6, 10, "one hundred"]
mean(a_list)
```

### 17.4.1 设置跟踪点

设置跟踪点：<code>pdb.set_trace()</code>
程序执行到该跟踪点时会暂停。当程序暂停时，pdb提供了一个接口，用户可以通过该接口键入控制执行的pdb命令。
可以打印出当前作用域内的任何变量的状态，步进执行一行代码或修改这些变量的状态。

跟踪点的位置设置在起始处可以覆盖所有问题。
当脚本运行时，Python调试器会启动并停在代码中这一行。
pdb命令行的提示符为<code>(pdb)</code>

**pdb命令表**

| 命令           | 解释                              |
|--------------|---------------------------------|
| break 或 b    | 设置断点                            |
| continue 或 c | 继续执行程序                          |
| list 或 l     | 查看当前行的代码段                       |
| step 或 s     | 进入函数（进入 for 循环用 next 而不是用 step） |
| return 或 r   | 执行代码直到从当前函数返回                   |
| next 或 n     | 执行下一行                           |
| up 或 u       | 返回到上个调用点（不是上一行）                 |
| p x          | 打印变量x的值                         |
| exit 或 q     | 中止调试，退出程序                       |
| help         | 帮助                              |


### 17.4.2 步进

交互式调试器中达到跟踪点后可以通过步进的方式检查程序。
相当于在程序执行的每一行添加一个打印语句。

step命令步进（输入s）。

### 17.4.3 查询变量

在pdb命令行中输入变量名以查看其值。
方法：
直接输入变量名
使用print()函数

查看a_list
a_list的值错误：求和函数不能处理字符串值“one hundred”

### 17.4.4 设置状态

可以在pdb中直接对值进行修改，如：
<code>(pdb) a_list[-1] = 100</code>

### 17.4.5 运行函数和方法

在调试环境中还可以运行断点范围内的所有函数和方法。
如：<code>(pdb) sum(a_list)</code>

### 17.4.6 继续执行

还可以使用continue（c）命令直接继续执行代码直到结束。
可以用于观察修改是否解决问题。

### 17.4.7 断点

可以设置断点来检查多个点。
断点设置的语法：<code>b(reak) ([file:]lineno | function)[, condition]</code>
即：b+行号/函数名

到断点后使用continue运行到下一个断点或程序结尾。

开发人员得知代码崩溃时的执行路径列表（回溯），用于设置断点的位置。
可以从pdb调试器使用bt命令轻松地得到。
bt命令输出：导致程序当前状态的命令堆栈，有时也称为调用堆栈、执行堆栈、跟踪回溯。


In [None]:
# 17.4 pdb调试
# 此代码不适合在notebook中运行，因为会到jupyter里去步进
# 具体见mean.py，此处仅作示例
import pdb


def mean(nums):
    top = sum(nums)
    bot = len(nums)
    return float(top) / float(bot)

pdb.set_trace()  # 跟踪点设置在程序起始点(17.4.1)
a_list = [1, 2, 3, 4, 5, 6, 10, "one hundred"]  # 输入a_list
# a_list的值错误：求和函数不能处理字符串值“one hundred”
mean(a_list)

## 17.5 剖析

剖析（profiling）工具：用于统计执行调试中每个部分花费的时间。
当处理内存错误问题时，剖析就是调试。而当简单地处理内存效率问题时，剖析主要用来优化程序。
剖析用于找到程序中效率出现问题的部分，并进行优化。

Python使用cProfile剖析代码。
执行cProfile：<code>python -m cProfile -o output.prof fixed_mean.py</code>
output.prof为输出文件的名称。
fixed.py为需要检查的代码名称。

### 17.5.1 使用pstats查看剖析文件

在交互式Python会话中，pstats包中的print_stats()函数能统计每个主要函数中花费的时间

打印内容：
每个函数的调用次数、每个函数中花费的总时间、每次调用函数所花费的时间、程序累积耗费的时间，文件中函数调用的位置。

示例：

```
In [1]: import pstats
In [2]: p = pstats.Stats('output.prof')
In [3]: p.print_stats()
Mon Dec 8 19:43:12 2014 output.prof
        5 function calls in 0.000 seconds
    Random listing order was used
    ncalls tottime percall cumtime percall filename:lineno(function)
    1 0.000 0.000 0.000 0.000 fixed_mean.py:1(<module>)
    1 0.000 0.000 0.000 0.000 {sum}
    1 0.000 0.000 0.000 0.000 fixed_mean.py:1(mean)
    1 0.000 0.000 0.000 0.000 {method 'disable' of ...
    1 0.000 0.000 0.000 0.000 {len}
```

显然，其显示精度并不高。0.000表示时间小于0.0009秒。
更适用于运行时间较长的程序。
可以通过选项修改精度。

更多使用方法：

```python
# 创建Stats对象
    p = pstats.Stats("result.out")

    # strip_dirs(): 去掉无关的路径信息
    # sort_stats(): 排序，支持的方式和上述的一致
    # print_stats(): 打印分析结果，可以指定打印前几行

    # 按照函数名排序，只打印前3行函数的信息, 参数还可为小数,表示前百分之几的函数信息
    p.strip_dirs().sort_stats("name").print_stats(3)

    # 按照运行时间和函数名进行排序
    p.strip_dirs().sort_stats("cumulative", "name").print_stats(0.8)

    # 如果想知道有哪些函数调用了bar
    p.print_callers("bar")

    # 查看test()函数中调用了哪些函数
    p.print_callees("foo")
```

### 17.5.2 可视化查看剖析信息

#### RunSnakeRun

RunSnakeRun：一个常见的图形解释器，用于显示cProfile和kernprof剖析工具的输出。
命令：<code>runsnake &lt;file.prof&gt;</code>
执行内容：打开一个GUI，用于浏览剖析文件。
彩色区域是程序中花费的总时间量。每个函数调用都以分层方式在总时间量中显示出来。

程序顶部是一个百分比按钮，显示代码中每部分花费的时间占总时间的百分比。
通过交互式图形还演示了代码中每部分的行为，能快速查看在哪里浪费了时间。

#### SnakeViz

在浏览器中使用的查看工具。
命令：<code> snakeviz output.prof</code>
执行：打开Web浏览器，并根据output.prof的数据显示交互式信息图。

交互式处理功能：
1.可以逐个函数地查看代码执行。
2.使用径向块表示每个函数中花费的时间。
3.中心圆表示调用堆栈的顶部，即调用所有其他函数的函数。
4.径向环表示的是在主函数调用每个函数中花费的时间，依此类推。
5.鼠标悬停在图表的某个部分时会显示更多信息。

### 17.5.3 使用Kernprof剖析代码

kernprof行剖析工具：显示哪些行的代码效率较低。

使用kernprof必须修改文件本身，在每个需要剖析的函数定义上方使用@profile装饰器。
执行将会完整的执行代码，包含代码的输出。
命令：<code>kernprof -v -l fixed_mean.py</code>

显示示例：

```
16.375
Wrote profile results to fixed_mean.py.lprof
Timer unit: 1e-06 s
Total time: 7e-06 s
File: fixed_mean.py
Function: mean at line 1
Line #    Hits    Time     Per Hit    % Time   Line Contents
==============================================================
    1                                           @profile
    2                                           def mean(nums):
    3       1       2        2.0       28.6         top = sum(nums)
    4       1       0        0.0        0.0         bot = len(nums)
    5       1       5        5.0       71.4         return float(top)/floa t(bot)
```

实现功能时：
1.智能设置时间的精度。
2.只显示使用装饰器的函数的剖析数据。
3.代码中每一行占表格一行
4.第5列（% Time）是最重要的，表示mean函数中每行代码花费的时间百分比。

## 17.6 liniting

linting用来从源代码中移除小问题。
linting会捕获不必要的软件包导入、未使用的变量、潜在的拼写错误、不一致的风格和其他类似的问题。

#### pyflakes

命令：<code> pyflakes elementary.py</code>
返回提示信息：<code> example.py:2: 'numpy' imported but unused </code>
表示包未使用。

大多数linting工具是为了美化代码，虽然有时还能优化代码。
与代码样式相关的linting工具（如flake8、pep8、autopep8）可用于检查错误、变量名称拼写问题和PEP8兼容性。

如pep8工具：<code> pep8 elementary.py</code>
执行：分析提供的Python代码，并逐行显示与PEP8标准风格不兼容性的问题。

pylint工具：<code> pylint -rn example.py</code>
-rn标志：不打印其完整的报告。不加的报告可能十分冗长
