# 错误和异常处理

不论是编程初学者，还是经验老到的专家，在 Python 编程时都会遇到出错信息。出了错就得除错，除错要比写程序难得多。有人统计，一个程序员花在代码除错的时间要远远大于编写代码。实际上程序员熬夜的主要原因不是代码没写完，而是上线的代码要除错。

那么如何才能提高开发效率？首先，写程序的时候尽量少写容易出错的代码；其次，代码出错的时候能够认识出错信息，尽快找到出错原因。当然还有其他一些办法，如在编写代码时使用静态分析工具、编写后进行单元测试，使用调试工具来除错等。编程水平高的一个表现就是除错的快，而这是需要时间和经验的积累。

> 像硬币一样，任何事物都具有两重性或两面性。  

编程亦如此，除了掌握正确的使用方法，了解错误情况也是学习编程的重要一面。在很多书籍中，错误和异常处理通常与其它内容合为一章，或者躲在某个角落里。这里把错误和异常单独列为一章，是充分认识到错误和异常处理的重要性。随着大家的进步本章能不断扩展。不经历风雨怎能见彩虹，没有无数次的除错哪能领悟编程的真谛！

本章主要介绍异常处理的主要内容：
- 错误和异常
- 抛出异常
- 捕获异常

## 错误和异常

错误分为三种：
1. 编写代码时出的错误，称之为语法错误；
2. 语法正确，在运行期检测到的错误，称之为异常；
3. 语法正确且运行无异常，但结果与预期的不同，称之为理解错误。

### 语法错误

在初学 Python 时会经常碰到 Python 语法错误，例如在变量命名时使用了 Python 关键词：

In [1]:
global = 10

SyntaxError: invalid syntax (<ipython-input-1-8a281da2a97a>, line 1)

Python 解释器检测到语法错误，会指出出错那行，并在找到错误的位置标记一个小箭头。

熟练工作后，还会遇到一些因为拼写错误、条件语句或循环语句中忘了冒号`：`、一些标识符使用了中文字符之类的错误：

In [2]:
kilometer = 1000
print(kilomater)

NameError: name 'kilomater' is not defined

In [3]:
if kilometer == 1000:
    print('Unit is km')
else
    print('No happen!')

SyntaxError: invalid syntax (<ipython-input-3-01fa6274f8d5>, line 3)

In [4]:
xlist = [1, 2, 3， 'Hello']

SyntaxError: invalid character in identifier (<ipython-input-4-aa882aaccc93>, line 1)

在使用 PyCharm 之类的集成开发环境，通常能对这些错误做静态分析，自动标识出来，根据分析提示结果修改即可。在交互界面中，如果出现语法错误，快速定位修改即可。 

### 异常

大部分情况下，Python 程序的语法是正确的，但在运行的时候遇到错误，会抛出异常。Python 用异常对象（except object）来表示异常情况。如果异常对象未被处理或捕捉，Python 解释器就会用回溯（Traceback）来终止运行。

In [5]:
for item in ['red', 'green', 'yellow']:
    print(item + 1)

TypeError: must be str, not int

在上面示例中，变量`item`是字符串类型，它不能与整数相加。遇到这个错误会引发 `TypeError` 异常。由于这里没有捕获或处理该异常，就以错误信息展现。错误信息的前面部分显示了异常发生的上下文，并以回溯的形式显示具体信息。其中用长箭头指出可能出错的行，以及错误信息 `TypeError: must be str, not int`。

对于这类异常错误，需要熟悉各种异常类，以及异常对应的各种错误可能。跌的坑多了，经验就会丰富，做好记录和分析，就能吃一堑长一智。

每个异常都是一个异常类的实例，也就是异常类的对象。Python 内置一些异常类，使用下面代码可以计算异常类数目：

In [6]:
exceptions = [item for item in dir(__builtin__) if item.endswith('Error')]
print(len(exceptions), exceptions)

49 ['ArithmeticError', 'AssertionError', 'AttributeError', 'BlockingIOError', 'BrokenPipeError', 'BufferError', 'ChildProcessError', 'ConnectionAbortedError', 'ConnectionError', 'ConnectionRefusedError', 'ConnectionResetError', 'EOFError', 'EnvironmentError', 'FileExistsError', 'FileNotFoundError', 'FloatingPointError', 'IOError', 'ImportError', 'IndentationError', 'IndexError', 'InterruptedError', 'IsADirectoryError', 'KeyError', 'LookupError', 'MemoryError', 'ModuleNotFoundError', 'NameError', 'NotADirectoryError', 'NotImplementedError', 'OSError', 'OverflowError', 'PermissionError', 'ProcessLookupError', 'RecursionError', 'ReferenceError', 'RuntimeError', 'SyntaxError', 'SystemError', 'TabError', 'TimeoutError', 'TypeError', 'UnboundLocalError', 'UnicodeDecodeError', 'UnicodeEncodeError', 'UnicodeError', 'UnicodeTranslateError', 'ValueError', 'WindowsError', 'ZeroDivisionError']


在下表中列出一些常见的内置异常类以及对应的可能出错原因：

| 异常类   | 出错原因  |
|:----------:|-------------------:|
|`AssertionError` |	断言语句（assert）失败 |
|`AttributeError` |	尝试访问未知的对象属性 |
|`EOFError` |	用户输入文件末尾标志EOF |
|`FloatingPointError` |	浮点计算错误 |
|`GeneratorExit` |	`generator.close()`方法被调用的时候 |
|`ImportError` |	导入模块失败的时候 |
|`IndexError` |	索引超出序列的范围 |
|`KeyError` |	字典中查找一个不存在的关键字 |
|`KeyboardInterrupt` |	用户输入中断键 (Ctrl+c or delete). |
|`MemoryError` |	内存溢出 |
|`NameError` |	尝试访问一个未定义变量 |
|`NotImplementedError` |	尚未实现的方法 |
|`OSError` |	操作系统产生的异常 |
|`OverflowError` |	数值运算最大限制溢出 |
|`ReferenceError` |	弱引用（weak reference）试图访问一个已经被垃圾回收机制回收了的对象 |
|`RuntimeError` |	一般的运行时错误 |
|`SyntaxError` |	Python的语法错误 |
|`IndentationError` |	缩进错误 |
|`TabError` |	Tab和空格混合使用 |
|`SystemError` |	Python编译器系统错误 |
|`SystemExit` |	Python编译器进程被关闭 |
|`TypeError` |	不同类型间的无效操作 |
|`UnboundLocalError` |	访问一个未初始化的本地变量 |
|`UnicodeError` |	Unicode相关的错误 |
|`UnicodeEncodeError` |	Unicode编码时的错误 |
|`UnicodeDecodeError` |	Unicode解码时的错误 |
|`UnicodeTranslateError` |	Unicode转换时的错误 |
|`ValueError` |	传入参数类型不正确 |
|`ZeroDivisionError` |	除数为零 |

### 理解错误

Python 程序语法正确且运行无异常，但结果与预期不同。大多是因为理解偏差导致，故称之为理解错误。这种偏差包括对 Python 语言理解的偏差，对项目需求理解的偏差。Python 简单且功能强大，根据二八原则，掌握 20% 的知识就能够做出不错的工作，这也意味着还有更多内容需要去了解。只有深刻理解 Python 语言，因为理解偏差造成的错误就会减少。

In [7]:
xlist = [[]] * 3
xlist[0].append(0)
xlist[1].append(1)
xlist[2].append(2)

在上述代码中，原本意图是创建三个空列表组成的列表，然后在第1个空列表中添加0，在第2个空列表中添加1，在第3个空列表中添加2。预期结果是：
```python
[[0], [1], [2]]
```

然而最终的结果却是：

In [8]:
xlist

[[0, 1, 2], [0, 1, 2], [0, 1, 2]]

理解偏差在于，对列表使用乘法运算符运行时，返回的列表中有3个元素，每个元素确实是列表对象，但这3个元素指向同一个空列表：
![列表乘法](../images/except_error_list_mul.png)
当依次对这三个元素指向的列表进行添加时，实际是对同一个列表添加了三次，导致最终结果如上所示。

In [9]:
xlist = [[], [], []]
xlist[0].append(0)
xlist[1].append(1)
xlist[2].append(2)
xlist

[[0], [1], [2]]

在书面代码中，定义变量`xlist`时使用字面常数来创建嵌套列表，此时列表的三个元素分别指向一个空列表：
![列表乘法](../images/except_nest_list.png)
故而结果就符合预期。

## 抛出异常

### 异常类和对象

使用内置异常类可以创建一个实例对象，也就是一个异常。

In [None]:
err = ZeroDivisionError('零除错误')
err2 = ZeroDivisionError('浮点数零除错误')

使用自省方法来查看：

In [None]:
print(type(err), type(err2))

### `raise` 语句

异常是一个异常类的实例。使用 `raise` 语句可以引发一个异常，也就是抛出指定异常。`raise` 语句语法是
```
raise exception
```
`raise` 后面只有一个参数，该参数要么是一个异常对象，要么是异常类。例如在下面示例代码中，修改变量 `var` 来抛出不同异常：

In [None]:
var = ''
if isinstance(var, int):
    raise err
elif isinstance(var, float):
    raise err2  
else:
    raise ZeroDivisionError

## 捕获异常

出了错怎么办？兵来将挡水来土掩，可以使用`try...except`语句块捕获异常，进行相应处理，以避免程序中断退出。语法具体为：
```
try:
    try suite
except exception1 as var1:
    except suite1
except exception2 as var2:
    except suite2
else:
    suite
finally:
    finally suite
```

`try...except`语句块至少要包含一个`except`从句，`else`从句与`finally`从句是可选的。

Python 程序基本规则是自上而下顺序执行代码的。与条件语句和循环语句一样，`try...except`语句也会改变运行流程。其具体步骤是：
1. 执行`try`语句下的代码块；
2. 如果没有引发异常，代码块执行完后会跳过`except`子句；
3. 如果引发异常，那么会跳过余下语句。开始对`except`语句指定的类型与所引发异常对象的类型进行比对。
    - 如果符合则执行该`except`语句下的语句块；
    - 如果引发异常与任何的`except`均不匹配，那么会把这个异常传递给上层。

### 开始捕获异常

在每一个 `except` 语句指定一个具体异常类。

In [None]:
alist = ['a', 0, 3.1314]
for i, item in enumerate(alist):
    try:
        print('item {0}: {1}'.format(i, item))
        result = 1 / int(item)
        print('the reciprocal: {0}'.format(result))
    except ZeroDivisionError:
        print('捕获 ZeroDivisionError 异常')
    except ValueError:
        print('捕获 ValueError 异常')

    print('This is always printed.')

也可以在一个 `except` 语句中指定多个异常类型，只需要把异常类型用元组括起来。

In [None]:
alist = ['a', 0, 3.1314]
for i, item in enumerate(alist):
    try:
        print('item {0}: {1}'.format(i, item))
        result = 1 / int(item)
        print('the reciprocal: {0}'.format(result))
    except (ValueError, ZeroDivisionError):
        print('捕获  ZeroDivisionError 或 ValueError 异常')
print('This is always printed.')

有时候无法知道程序会抛出啥异常，可以在`except`指定内置异常类的父类`Exception`，这样就可以捕获所有内置异常类，也就是`Exception`的子类：

In [None]:
alist = ['a', 0, 3.1314]
for i, item in enumerate(alist):
    try:
        print('item {0}: {1}'.format(i, item))
        result = 1 / int(item)
        print('the reciprocal: {0}'.format(result))
    except Exception:
        print('catch a exception')
    
    print('This is always printed.')

> 注意，使用`except Exception`的方法并非是好的做法。尽管能够捕获所有异常，但是很容易掩盖了代码中的逻辑错误。

在 `except` 语句甚至可以啥也不指定，在此情况下，会捕获所有异常，如那些继承自 `BaseException` 的异常。但掩盖的错误会更严重。

In [None]:
alist = ['a', 0, 3.1314]
for i, item in enumerate(alist):
    try:
        print('item {0}: {1}'.format(i, item))
        result = 1 / int(item)
        print('the reciprocal: {0}'.format(result))
    except:
        print('catch a exception')
    print('This is always printed.')

### 捕获异常对象

在捕获到异常对象后，如果想要访问异常本身，可以使用`as`来指定变量来指向异常对象。

In [10]:
alist = ['a', 0, 3.1314]
for i, item in enumerate(alist):
    try:
        print('item {0}: {1}'.format(i, item))
        result = 1 / int(item)
        print('结果: {0}'.format(result))
    except ZeroDivisionError as e:
        print('捕获异常 {0}: {1}'.format(type(e), e))
    except ValueError as e:
        print('捕获异常 {0}: {1}'.format(type(e), e))
print('This is always printed.')

item 0: a
捕获异常 <class 'ValueError'>: invalid literal for int() with base 10: 'a'
item 1: 0
捕获异常 <class 'ZeroDivisionError'>: division by zero
item 2: 3.1314
结果: 0.3333333333333333
This is always printed.


也可以一个 `except` 语句指定多个异常类型

In [None]:
alist = ['a', 0, 3.1314]
for i, item in enumerate(alist):
    try:
        print('item {0}: {1}'.format(i, item))
        result = 1 / int(item)
        print('the reciprocal: {0}'.format(result))
    except (ValueError, ZeroDivisionError) as e:
        print('catch a exception {0}: {1}'.format(type(e), e))
print('This is always printed.')

如果是在不知道程序会抛出什么样的异常，可以指定`Exception`，同时捕获异常对象本身，可以从中获取更多信息。

In [None]:
alist = ['a', 0, 3.1314]
for i, item in enumerate(alist):
    try:
        print('item {0}: {1}'.format(i, item))
        result = 1 / int(item)
        print('the reciprocal: {0}'.format(result))
    except Exception as e:
        print('catch a exception {0}: {1}'.format(type(e), e))
        raise
        
    print('This is always printed.')

### `finally` 语句

不管 `try` 语句是否发生异常，`finally` 从句都会执行。这在打开文件出现异常时比较有用，可以使用该语句把文件关闭。

In [11]:
alist = ['a', 0, 3.1314]
for i, item in enumerate(alist):
    try:
        print('item {0}: {1}'.format(i, item))
        result = 1 / int(item)
        print('the reciprocal: {0}'.format(result))
    except Exception as e:
        print('catch a exception {0}: {1}'.format(type(e), e))
    finally:
        print('finally statements.')        

print('This is always printed.')

item 0: a
catch a exception <class 'ValueError'>: invalid literal for int() with base 10: 'a'
finally statements.
item 1: 0
catch a exception <class 'ZeroDivisionError'>: division by zero
finally statements.
item 2: 3.1314
the reciprocal: 0.3333333333333333
finally statements.
This is always printed.


### `else`从句

如果没有引起异常时，偶尔会想要执行一些语句,可以使用`else`从句实现。`else`从句只在没有异常的情况下才会运行，而且只在`finally`从句前才执行。很少人会用到`else`从句，不过有这个语法，还是的提一下。

In [None]:
alist = ['a', 0, 3.1314]
for i, item in enumerate(alist):
    try:
        print('item {0}: {1}'.format(i, item))
        result = 1 / int(item)
    except Exception as e:
        print('catch a exception {0}: {1}'.format(type(e), e))
    else:
        print('else statements.')        
    finally:
        print('finally statements.')        
print('This is always printed.')

## 自定义异常

如果用户需要创建自己的异常类，来引发自定义异常，可以自定义父类为`Exception`的类即可，可以直接继承，或者间接继承。

## 小结

学会记录自己的错误案例。参见[系统内置异常](../builtins/builtins_exception.ipynb)