# 08 异常处理：如何提高程序的稳定性？

## 错误与异常

python程序中的错误至少包括两种，一种是语法错误，另一种则是异常。
1. 语法错误：代码不符合编程规范，无法被识别和执行。

In [1]:
if name is not None
    print(name)

SyntaxError: invalid syntax (<ipython-input-1-ecff4c38d602>, line 1)

2. 异常市值程序的语法正确，可以被执行，但是执行过程中遇到了错误，抛出了异常

In [3]:
10 / 0

ZeroDivisionError: division by zero

In [4]:
order * 2

NameError: name 'order' is not defined

In [5]:
1 + [1, 2]

TypeError: unsupported operand type(s) for +: 'int' and 'list'

于是，当程序运行到这些地方时，就抛出了异常，并且终止运行。例子中的ZeroDivisionError、NameError和TypeError，就是三种常见的异常类型。

还有其他的异常类型。
- 比如KeyError是指字典中的键找不到；
- FileNotFoundError是指发送了读取文件的请求，但相应的文件不存在等等

可以参考文档：https://docs.python.org/3/library/exceptions.html#bltin-exceptions

## 如何处理异常

就要用try和except来做异常处理。比如：

In [7]:
try:
    s = input('please enter two numbers separated by comma: ')
    num1 = int(s.split(',')[0].strip())
    num2 = int(s.split(',')[1].strip())
    res = num1 + num2
except ValueError as err:
    print('Value Error: {}'.format(err))
    
print('continue')

please enter two numbers separated by comma: a
Value Error: invalid literal for int() with base 10: 'a'
continue


这里默认用户输入以逗号相隔的两个整形数字，将其提取后，做后续的操作（**注意 input 函数会将输入转换为字符串类型**）.由于程序抛出的异常类型是 ValueError，和 except block 所 catch 的异常类型相匹配，所以 except block 便会被执行，

注意：except block 只接受与它相匹配的异常类型并执行，如果程序抛出的异常并不匹配，那么程序照样会终止并退出。

刚刚这个例子，如果我们只输入1，程序抛出的异常就是IndexError: list index out of range，与 ValueError 不匹配，那么 except block 就不会被执行，程序便会终止并退出（continue 不会被打印）

In [1]:
try:
    s = input('please enter two numbers separated by comma: ')
    num1 = int(s.split(',')[0].strip())
    num2 = int(s.split(',')[1].strip())
    res = num1 + num2
except ValueError as err:
    print('Value Error: {}'.format(err))
    
print('continue')

please enter two numbers separated by comma: 1


IndexError: list index out of range

显然只用一种错误类型进行检验有局限性。

解决方案：
1. 一种解决方案，是在 except block 中加入多种异常的类型

In [2]:
try:
    s = input('please enter two numbers separated by comma: ')
    num1 = int(s.split(',')[0].strip())
    num2 = int(s.split(',')[1].strip())
    res = num1 + num2
except (ValueError, IndexError) as err:
    print('Value Error: {}'.format(err))
    
print('continue')

please enter two numbers separated by comma: 1
Value Error: list index out of range
continue


In [3]:
# 另一种写法
try:
    s = input('please enter two numbers separated by comma: ')
    num1 = int(s.split(',')[0].strip())
    num2 = int(s.split(',')[1].strip())
    res = num1 + num2
except ValueError as err:
    print('Value Error: {}'.format(err))
except IndexError as err:
    print('Index Error: {}'.format(err))

print('continue')

please enter two numbers separated by comma: 1
Index Error: list index out of range
continue


2. 很多时候，我们很难保证程序覆盖所有的异常类型，所以，更通常的做法，是在最后一个 except block，声明其处理的异常类型是 Exception。Exception 是其他所有非系统异常的基类，能够匹配任意非系统异常。

In [9]:
try:
    s = input('please enter two numbers separated by comma: ')
    num1 = int(s.split(',')[0].strip())
    num2 = int(s.split(',')[1].strip())
    res = num1 + num2
except ValueError as err:
    print('Value Error: {}'.format(err))
except IndexError as err:
    print('Index Error: {}'.format(err))
except Exception as err:
    print('Other Error: {}'.format(err))

print('continue')

please enter two numbers separated by comma: 1
Index Error: list index out of range
continue


或者，第二种写法，你也可以在 except 后面省略异常类型，这表示与任意异常相匹配（包括系统异常等）

In [10]:
try:
    s = input('please enter two numbers separated by comma: ')
    num1 = int(s.split(',')[0].strip())
    num2 = int(s.split(',')[1].strip())
    res = num1 + num2
except ValueError as err:
    print('Value Error: {}'.format(err))
except IndexError as err:
    print('Index Error: {}'.format(err))
except:
    print('Other error')

print('continue')

please enter two numbers separated by comma: 1
Index Error: list index out of range
continue


注意，当程序中存在多个 except block 时，最多只有一个 except block 会被执行。换句话说，如果多个 except 声明的异常类型都与实际相匹配，那么只有最前面的 except block 会被执行，其他则被忽略。


### 异常处理中，还有一个很常见的用法是 finally

finally经常和 try、except 放在一起来用。无论发生什么情况，finally block 中的语句都会被执行，哪怕前面的 try 和 excep block 中使用了 return 语句。**在 finally 中，我们通常会放一些无论如何都要执行的语句。**

In [None]:
import sys
try:
    f = open('file.txt', 'r')
    .... # some data processing
except OSError as err:
    print('OS error: {}'.format(err))
except:
    print('Unexpected error:', sys.exc_info()[0])
finally:
    f.close()

当然这里的例子如果使用with open会更为简洁

## 用户自定义异常

下面这个例子，我们创建了自定义的异常类型 MyInputError，定义并实现了初始化函数和 str 函数（<font color=red>直接 print 时调用</font>）

In [12]:
class MyInputError(Exception):
    """
    Exception raised when there're errors in input
    """
    def __init__(self, value):
        # 自定义异常类型的初始化
        self.value = value
    def __str__(self):
        # 自定义异常类型的string表达式形式
        # repr(): Return the canonical string representation of the object.
        return "{} is invalid input".format(repr(self.value))

In [17]:
try:
    raise MyInputError(1)
except MyInputError as err:
    print('error: {}'.format(err))

error: 1 is invalid input


## 异常的使用场景与注意点

1. 通常来说，在程序中，如果我们不确定某段代码能否成功执行，往往这个地方就需要使用异常处理

另一例子：
大型社交网站的后台，需要针对用户发送的请求返回相应记录。用户记录往往储存在 key-value 结构的数据库中，每次有请求过来后，我们拿到用户的 ID，并用 ID 查询数据库中此人的记录，就能返回相应的结果。

数据库返回的原始数据，往往是 json string 的形式，这就需要我们首先对 json string 进行 decode（解码）

In [None]:
import json 
raw_data = queryDB(uid) # 根据用户的id，返回相应的信息
data = json.loads(raw_data)

这样的代码并不足够：在 json.loads() 函数中，输入的字符串如果不符合其规范，那么便无法解码，就会抛出异常，因此加上异常处理十分必要。

In [None]:
try:
    data = json.loads(raw_data)
    ...
except JSONDecodeError as err:
    print('JSONDecodeError: {}'.format(err))

但是我们不能滥用异常处理

In [18]:
d = {'name': 'jason', 'age': 20}
try:
    value = d['dob']
    print(value)
except KeyError as err:
    print('KeyError: {}'.format(err))

KeyError: 'dob'


这段代码没有bug，但是很迷糊和冗余。因此对于flow-control(流程控制)的代码逻辑，我们一般不用异常处理

In [None]:
if 'dob' in d:
    value = d['dob']

以上的字典这样写就行了

## 总结

- 异常，通常是指程序运行的过程中遇到了错误，终止并退出。我们通常使用 try except 语句去处理异常，这样程序就不会被终止，仍能继续执行。
- 处理异常时，如果有必须执行的语句，比如文件打开后必须关闭等等，则可以放在 finally block 中。
- 异常处理，通常用在你不确定某段代码能否成功执行，也无法轻易判断的情况下，比如数据库的连接、读取等等。正常的 flow-control 逻辑，不要使用异常处理，直接用条件语句解决就可以了。

## 思考题

最后，给你留一个思考题。在异常处理时，如果 try block 中有多处抛出异常，需要我们使用多个 try except block 吗？以数据库的连接、读取为例，下面两种写法，你觉得哪种更好呢？

In [None]:
# 第一种
try:
    db = DB.connect('<db path>') # 可能会抛出异常
    raw_data = DB.queryData('<viewer_id>') # 可能会抛出异常
except (DBConnectionError, DBQueryDataError) err:
    print('Error: {}'.format(err))

In [None]:
try:
    db = DB.connect('<db path>') # 可能会抛出异常
    try:
        raw_data = DB.queryData('<viewer_id>')
    except DBQueryDataError as err:
         print('DB query data error: {}'.format(err))
except DBConnectionError as err:
     print('DB connection error: {}'.format(err))

Hoo-Ah：
第一种写法更加简洁，易于阅读。而且except后面的错误类型先抛出数据库连接错误，之后才抛出查询错误，实现的异常处理和第二种一样。


作者回复: 正解