# Python基础

Python基础有很多内容，作为非CS专业的想快速上手的同学，没必要完全从头到尾学习，不过把握基本内容还是需要一定的系统性。

这部分结构主要参考了[Python programming guide for Earth Scientists](http://python.hydrology-amsterdam.nl/manuals/hydro_python_manual.pdf)。

内容上参考了<https://www.liaoxuefeng.com/wiki/1016959663602400>，但主要是记录一些自己平常见到的，又不同于其他编程语言比如Java的一些特点。

思路是这样的：

- 首先，所有语言的练习都离不开的基础：安装python，使用IDE；
- 其次熟悉基本的语法（变量常量、数据类型、运算、循环for/while、条件if等）；
- 接着就是函数及面向对象编程以及python中重要的函数式编程，还有就是异常，调试等内容；
- 另外，熟悉python的内置库，基础库的使用，这部分放在1.2-basic-python中；
- 最后是一些特别语法补充，放在1.3-basic-python中。

安装python及IDE就不赘述了，python安装anaconda即可，IDE可以直接使用anaconda自带的IPython或spider，个人推荐VScode和Pycharm社区版。

## 基础语法

整型、浮点型等特别基础的就不记录了，不过python中直接赋值、浅拷贝和深度拷贝是需要注意的。另外，重点记录一些字符串相关的内容等。

### 直接赋值、浅拷贝和深度拷贝

这部分参考了[Python 直接赋值、浅拷贝和深度拷贝解析](https://www.runoob.com/w3cnote/python-understanding-dict-copy-shallow-or-deep.html)。

- 直接赋值：其实就是对象的引用（别名）。
- 浅拷贝(copy)：拷贝父对象，不会拷贝对象的内部的子对象。
- 深拷贝(deepcopy)： copy 模块的 deepcopy 方法，完全拷贝了父对象及其子对象。

直接看例子，首先是浅拷贝：

In [1]:
a = {1: [1,2,3]}
b = a.copy()
a, b

({1: [1, 2, 3]}, {1: [1, 2, 3]})

In [2]:
a[1].append(4)
a, b

({1: [1, 2, 3, 4]}, {1: [1, 2, 3, 4]})

深度copy需要引入copy模块：

In [3]:
imp
c = copy.deepcopy(a)
a, c

({1: [1, 2, 3, 4]}, {1: [1, 2, 3, 4]})

In [4]:
a[1].append(5)
a, c

({1: [1, 2, 3, 4, 5]}, {1: [1, 2, 3, 4]})

b = a: 赋值引用，a 和 b 都指向同一个对象。

![](1489720931-7116-4AQC6.png)

b = a.copy(): 浅拷贝, a 和 b 是一个独立的对象，但他们的子对象还是指向统一对象（是引用）。

![](1489720930-6827-Vtk4m.png)

b = copy.deepcopy(a): 深度拷贝, a 和 b 完全拷贝了父对象及其子对象，两者是完全独立的。

![](1489720930-5882-BO4qO.png)

总结下例子：

In [5]:
import copy
a = [1, 2, 3, 4, ['a', 'b']] #原始对象
 
b = a                       #赋值，传对象的引用
c = copy.copy(a)            #对象拷贝，浅拷贝
d = copy.deepcopy(a)        #对象拷贝，深拷贝
 
a.append(5)                 #修改对象a
a[4].append('c')            #修改对象a中的['a', 'b']数组对象
 
print( 'a = ', a )
print( 'b = ', b )
print( 'c = ', c )
print( 'd = ', d )

a =  [1, 2, 3, 4, ['a', 'b', 'c'], 5]
b =  [1, 2, 3, 4, ['a', 'b', 'c'], 5]
c =  [1, 2, 3, 4, ['a', 'b', 'c']]
d =  [1, 2, 3, 4, ['a', 'b']]


### 字符串

首先，记录一些关于编码的问题。计算机只能处理数字，如果要处理文本，就必须先把文本转换为数字才能处理。最早只有**127个字符**被编码到计算机里，也就是大小写英文字母、数字和一些符号，这个编码表被称为**ASCII编码**，比如大写字母A的编码是65，小写字母z的编码是122。

但是要处理中文显然一个字节是不够的，至少需要两个字节，而且还不能和ASCII编码冲突，所以，中国制定了**GB2312编码**，用来把中文编进去。

全世界有上百种语言，各国有各国的标准，就会不可避免地出现冲突，Unicode应运而生。Unicode把所有语言都统一到一套编码里，最常用的是用两个字节表示一个字符（如果要用到非常偏僻的字符，就需要4个字节）。

但是，如果你写的文本基本上全部是英文的话，用Unicode编码比ASCII编码需要多一倍的存储空间，在存储和传输上就十分不划算。所以又出现了把Unicode编码转化为 **“可变长编码”的UTF-8编码**。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间UTF-8编码有一个额外的好处，就是ASCII编码实际上可以被看成是UTF-8编码的一部分，所以，大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。

现在计算机系统通用的字符编码工作方式：在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。

在最新的Python 3版本中，字符串是以Unicode编码的，也就是说，Python的字符串支持多语言。Python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes。以Unicode表示的str通过encode()方法可以编码为指定的bytes

In [6]:
'ABC'.encode('ascii')

b'ABC'

In [7]:
'中文'.encode('utf-8')

b'\xe4\xb8\xad\xe6\x96\x87'

反过来，如果我们从网络或磁盘上读取了字节流，那么读到的数据就是bytes。要把bytes变为str，就需要用decode()方法：

In [8]:
b'ABC'.decode('ascii')

'ABC'

In [9]:
b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')

'中文'

In [10]:
len('中文')

2

In [11]:
len('中文'.encode('utf-8'))

6

接下来字符串操作：

In [12]:
# 数据和字符串转换
print(chr(65))
print(ord('A'))

print(int('2'))

""" 字符串包含"""
test_string = 'helloworld'
if 'world' in test_string:
    print('Exist')
else:
    print('Not exist')

# 字符串的子字符串，不像java用substring，而是直接使用索引取值
print(test_string[5:])

# 大小写转换
print(test_string.upper())          # 把所有字符中的小写字母转换成大写字母
print(test_string.lower())          # 把所有字符中的大写字母转换成小写字母
print(test_string.capitalize())     # 把第一个字母转化为大写字母，其余小写
print(test_string.title())          # 把每个单词的第一个字母转化为大写，其余小写 

A
65
2
Exist
world
HELLOWORLD
helloworld
Helloworld
Helloworld


接着记录下关于格式化的内容。在Python中，采用的格式化方式和C语言是一致的，用%实现，常见的占位符有：%d	整数，%f	浮点数，%s	字符串。举例如下：

In [13]:
'Hi, %s, you have $%d.' % ('Michael', 1000000)

'Hi, Michael, you have $1000000.'

还有zfill()函数也常用：Python zfill() 方法返回指定长度的字符串，原字符串右对齐，前面填充0。

In [14]:
str = "this is string example....wow!!!";

print(str.zfill(40))
print(str.zfill(50))

00000000this is string example....wow!!!
000000000000000000this is string example....wow!!!


### 基本流程控制

倒序for循环的写法：

In [16]:
lista = [1,2,4,5]
for i in range(len(lista)-1,-1,-1):
    print(lista[i])  

5
4
2
1


如果if 语句有很多，想要使用类似switch的方式，可以类似下面这样写：

In [2]:
range_lst = ["0 - 0.0001", "0.0001 - 0.02", "0.02 - 0.05", "0.05 - 0.1", "0.1 - 0.2", "0.2 - 0.4", "0.4 - 0.8", "≥ 0.8"]

def a_range_name_func(value_tmp):
    switcher = {
        0 <= value_tmp < 0.0001: range_lst[0],
        0.0001 <= value_tmp < 0.02: range_lst[1],
        0.02 <= value_tmp < 0.05: range_lst[2],
        0.05 <= value_tmp < 0.1: range_lst[3],
        0.1 <= value_tmp < 0.2: range_lst[4],
        0.2 <= value_tmp < 0.4: range_lst[5],
        0.4 <= value_tmp < 0.8: range_lst[6],
        0.8 <= value_tmp: range_lst[7],
    }
    return switcher[True]
a_range_name_func(0.3)

'0.2 - 0.4'

### 基本数据结构

python几个最基本的数据结构有：

- list：可理解为可变大小的数组，python索引可以为负值，表示倒序。
- tuple：和list类似，区别是一经初始化就不能修改。
- dict：就是map，使用key-value存储，查找较快。
- set：和dict类似，也是一组key的集合，但不存储value，且由于key不能重复，这就意味着set中没有重复的元素。

接下来依次举例认识下几个基本数据结构。首先是list。

In [1]:
# list
a=[1,2,3]
b=[4,5,6]
# list拼接
print(a+b)
# list 索引：直接使用[]即可，一个例子：找出c中非0值编号对应的d中的数字， 
c=[0,0,1,1]
d=[1,2,3,4]
e=[d[i] for i in range(len(c)) if c[i]>0] # 使用列表生成式很方便
print(e)
print(1 in d)

[1, 2, 3, 4, 5, 6]
[3, 4]
True


给list添加元素：

In [2]:
li=['a', 'b']   
li.append([2,'d'])   
li.append('e')  
li

['a', 'b', [2, 'd'], 'e']

两个list拼接：

In [5]:
l1=[1,2,3]
l2=[4,5,6]
l1+l2

[1, 2, 3, 4, 5, 6]

list还能直接拆分字符串：

In [5]:
s = "Word to Split"
wordlist = list(s) # option 1, 
print(wordlist) 
wordlist = [ch for ch in s]      # option 2, list comprehension.
print(wordlist) 

['W', 'o', 'r', 'd', ' ', 't', 'o', ' ', 'S', 'p', 'l', 'i', 't']
['W', 'o', 'r', 'd', ' ', 't', 'o', ' ', 'S', 'p', 'l', 'i', 't']


删除list中的元素，注意不同方法是有区别的，remove是直接删元素，del是按索引。

In [6]:
del l1[2]
l1

[1, 2]

In [7]:
li = [1, 2, 3, 4]
li.remove(3)
li

[1, 2, 4]

这个remove操作是inplace的，即会改变原变量值的，如果想要获取一个新的删除某些元素的list，可以先复制一份，然后再执行remove操作，注意不要直接赋值：

In [1]:
a_list = [1,3,5,7]
b_list = a_list
b_list.remove(3)
print(a_list)
print(b_list)

[1, 5, 7]
[1, 5, 7]


需要这样操作（或者使用上面提到的copy方法）：

In [2]:
a_list = [1,3,5,7]
b_list = a_list[:]
b_list.remove(3)
print(a_list)
print(b_list)

[1, 3, 5, 7]
[1, 5, 7]


list中的最值：

In [1]:
l1=[1,2,3]
max(l1)

3

最值对应的元素index：

In [2]:
l1.index(max(l1))

2

找到指定元素的index

In [1]:
# vowels list
vowels = ['a', 'e', 'i', 'o', 'i', 'u']

# index of 'e' in vowels
index = vowels.index('e')
print('The index of e:', index)

# element 'i' is searched
# index of the first 'i' is returned
index = vowels.index('i')

print('The index of i:', index)

The index of e: 1
The index of i: 2


list排序：

In [2]:
aList = ['Google', 'Runoob', 'Taobao', 'Facebook'];
aList.sort()
aList

['Facebook', 'Google', 'Runoob', 'Taobao']

In [1]:
# 排序的set
mailto = ['cc', 'bbbb', 'afa', 'sss', 'bbbb', 'cc', 'shafa']
addr_to = list(set(mailto))
print(addr_to)
addr_to.sort(key=mailto.index)
print(addr_to)

[1, 2, 3, 4, 5, 6]
[3, 4]
['sss', 'afa', 'bbbb', 'shafa', 'cc']
['cc', 'bbbb', 'afa', 'sss', 'shafa']


python list数组是可以直接进行大小比较的，其基本比较逻辑是先比较第一位，如果第一位数字两个数字相等，就比较第二位，依次类推。max和min函数也有同样的作用

In [1]:
[1,2,3,4] > [0,5,6,7]

True

In [3]:
max([1,2,3,4],[0,5,6,7])

[1, 2, 3, 4]

In [4]:
max([0,5,6,7],[1,2,3,4])

[1, 2, 3, 4]

不过numpy的数组比较更多样，所以如果需要更多灵活的数组比较可以使用numpy。

如果是多个数组比较，可以参考下面的例子：

In [2]:
nums = [[1,2,3],[5,4,5],[5,5,6]]
max_of_nums = max(nums)
# print(max_of_nums)
# ([k for k, v in count.items() if v == highest])
# 先把索引和元素写成元组
tup = [(i, nums[i]) for i in range(len(nums))]
print([i for i, n in tup if n == max_of_nums])

[2]


如果是想要看多维的list中哪个数字最大，直接max就不行了，需要先flatten一下，可以利用itertools：

In [5]:
import itertools

list2d = [[1,2,3], [4,5,6], [7], [8,9]]
merged = list(itertools.chain(*list2d))
max(merged)

9

tuple是不能变长的数组，比如list的连接操作，tuple就不可以：

In [1]:
a = (2,3)
type(a)

tuple

In [2]:
a+(4)

TypeError: can only concatenate tuple (not "int") to tuple

很容易将tuple转换为list

In [3]:
list(a)

[2, 3]

字典初始化方式有多种，可以根据自己实际情况采用最方便的方式，具体可参考：[Python中字典创建的几种方法及适用场景](https://blog.csdn.net/Jerry_1126/article/details/78239530)

In [1]:
# 直接创建
d = {'age': 23, 'name': 'lala'}
print(d)
# 动态创建
d['school'] = 'nanhaizhongxue'
print(d)
# zip创建字典
d = dict(zip(['a', 'b'], [1, 2]))
print(d)
import numpy as np
# 可以利用numpy来帮助生成数组数据
d = dict(zip(['a', 'b'], np.full(2,0)))
print(d)
# 字典的key必须得是唯一的，但是values可以是多个
d_special = dict(zip(['a', 'b'], [[3,1], 2]))
print(d_special)

{'age': 23, 'name': 'lala'}
{'age': 23, 'name': 'lala', 'school': 'nanhaizhongxue'}
{'a': 1, 'b': 2}
{'a': 0, 'b': 0}
{'a': [3, 1], 'b': 2}


现在看看两个dict拼接，参考：[Python优雅的合并两个Dict](https://segmentfault.com/a/1190000010567015)

In [3]:
d = {}
x = {'a': 1, 'b': 2}
x = {**d, **x}
print(x)
y = {'b': 3, 'c': 4}
z = {**x, **y}
z

{'a': 1, 'b': 2}


{'a': 1, 'b': 3, 'c': 4}

对字典的循环操作可以使用两种方式：

In [6]:
d = {'x':1, 'y':2, 'z':3}
for key in d:
    print (key, 'corresponds to', d[key])

x corresponds to 1
y corresponds to 2
z corresponds to 3


In [7]:
for key, value in d.items():
    print (key, 'corresponds to', value)

x corresponds to 1
y corresponds to 2
z corresponds to 3


取出dict的所有keys：

In [15]:
dict = {'Name': 'Zara', 'Age': 7}
print ("Value : %s" %  dict.keys())
print (type(dict.keys()))

Value : dict_keys(['Name', 'Age'])
<class 'dict_keys'>


In [16]:
list(dict.keys())

['Name', 'Age']

所有value：

In [13]:
dict.values()

dict_values(['Zara', 7])

In [14]:
alist=list(dict.values())
alist

['Zara', 7]

判断dict的value最大值对应的key：

In [2]:
import operator
stats = {'a':1000, 'b':3000, 'c': 100}
max(stats.items(), key=operator.itemgetter(1))[0]

'b'

判断一个key是否在一个dict的keys中：

In [2]:
#生成一个字典
d = {'name':'Tom', 'age':10, 'Tel':110}
#打印返回值，其中d.keys()是列出字典所有的key
print ('name' in d.keys()) # 注意是keys()，不是keys。

True


字典按keys排序：

In [7]:
d = {'Name': 'Zara', 'Age': 7}
sorted(d.keys())

['Age', 'Name']

In [8]:
for key in sorted(d.keys()):
    print(key, d[key]) 

Age 7
Name Zara


In [9]:
d_sorted={}
for key in sorted(d.keys()):
    d_sorted[key]=d[key]
d_sorted

{'Age': 7, 'Name': 'Zara'}

想要格式化打印dict可以使用json包快速实现

In [4]:
import json
a_dict = {'Infomation': '成绩单',
        'Students': [{'Name': '小明', 'Age': 22, 'Grade': {'Chinese': 80, 'Math': 100, 'English': 90}},
                     {'Name': '小红', 'Age': 21, 'Grade': {'Chinese': 70, 'Math': 90, 'English': 80}}]}
print("普通输出：\n",a_dict)
print("格式化输出：\n",json.dumps(a_dict, indent=4, ensure_ascii=False))

普通输出
 {'Infomation': '成绩单', 'Students': [{'Name': '小明', 'Age': 22, 'Grade': {'Chinese': 80, 'Math': 100, 'English': 90}}, {'Name': '小红', 'Age': 21, 'Grade': {'Chinese': 70, 'Math': 90, 'English': 80}}]}
格式化输出
 {
    "Infomation": "成绩单",
    "Students": [
        {
            "Name": "小明",
            "Age": 22,
            "Grade": {
                "Chinese": 80,
                "Math": 100,
                "English": 90
            }
        },
        {
            "Name": "小红",
            "Age": 21,
            "Grade": {
                "Chinese": 70,
                "Math": 90,
                "English": 80
            }
        }
    ]
}


当需要dict中的元素有一定的顺序时，我们可以使用 OrderedDict：

In [1]:
from collections import OrderedDict
od = OrderedDict([('r', 1), ('s', 1), ('a', 1), ('n', 1), ('y', 1)])
od

OrderedDict([('r', 1), ('s', 1), ('a', 1), ('n', 1), ('y', 1)])

可以看到keys输出时也是有顺序的：

In [5]:
list(od.keys())

['r', 's', 'a', 'n', 'y']

遍历方法和普通的dict一致，如果想要带上数字序号，可以利用 enumerate：

In [3]:
for i, (key, value) in enumerate(od.items()):
    print(i, key, value)

0 r 1
1 s 1
2 a 1
3 n 1
4 y 1


### 基础运算

这里介绍一些python里面相对特殊的运算符。

#### "~"运算符

按位取反运算符：对数据的每个二进制位取反,即把1变为0,把0变为1 。~x 类似于 -x-1。

In [17]:
a = 60  # 60 = 0011 1100
c=~a
print(c) # -61 = 1100 0011
b1=True
d1=~b1
print(d1)
b2=False
d2=~b2
print(d2)

-61
-2
-1


#### "//"运算符

基本数学运算符中，整除符号是//

In [3]:
# a = 1
a = 11
b = 5
c = a // b
print("c 的值为：", c)

c 的值为： 2


#### "%"运算符

求余运算符。

In [4]:
a = 1
b = 5
c = a % b
print("c 的值为：", c)

c 的值为： 1


#### and/or运算符

python中不使用&&和||来表示与或运算符，而是使用and和or。

In [19]:
num = 9
if num >= 0 and num <= 10:    # 判断值是否在0~10之间
    print('hello')
# 输出结果: hello

hello


#### is和==的区别

主要参考：[Python中is和==的区别](https://juejin.im/entry/5a3b62446fb9a0451f311b5c)

在Python中一切都是对象。Python中对象包含的三个基本要素，分别是：id(身份标识)、type(数据类型)和value(值)。

对象之间比较是否相等可以用==，也可以用is，is和==都是对对象进行比较判断作用的，但对对象比较判断的内容并不相同。

- is比较的是两个对象的id值是否相等，也就是比较两个对象是否为同一个实例对象，是否指向同一个内存地址。
- ==比较的是两个对象的内容是否相等，默认会调用对象的__eq__()方法。

In [20]:
a = [1, 2, 3]
b = a
print(b is a) 
print(b == a)
b = a[:]
print(b is a) 
print(b == a)

True
True
False
True


算术运算，比如max,min

In [21]:
print(max(2,3))
print(min(2,3))

3
2


In [3]:
a=[3,3]
a.index(max(a))

0

max只能返回第一个最大值对应的index，不过有时候我们想要返回所有的index，参考：[Python 获取相同的多个最大值元素](https://zhuanlan.zhihu.com/p/64035516)，可以这样：

In [4]:
nums = [1,2,3,5,4,5,5,5]
max_of_nums = max(nums)
# print(max_of_nums)
# ([k for k, v in count.items() if v == highest])
# 先把索引和元素写成元组
tup = [(i, nums[i]) for i in range(len(nums))]
print([i for i, n in tup if n == max_of_nums])

[3, 5, 6, 7]


如果是对dict，可以有这样的例子：

In [5]:
count = {'a': 120, 'b': 120, 'c': 100}
highest = max(count.values())
print([k for k, v in count.items() if v == highest])

['a', 'b']


比如判断分子包含多少个分母：

In [22]:
a=5
b=2
c=int(a/b) if a%b==0 else int(a/b)+1
c

3

#### |= 运算符

这是一种不太常见的赋值运算符.

x |= 3 等价于 x = x | 3

即做一个OR的位运算.

In [1]:
2|5 # 010 | 101 = 111

7

In [2]:
x = 2
x |= 5
x

7

#### 一些特别情况

计算机的数学运算中会遇到一些平时手算时不会碰到的错误。

In [23]:
# RuntimeWarning: invalid value encountered in double_scalars
kss = 0.22917998605606738
kg = 0.832161545953715
period_num_1d = 24
# 开方运算会遇到根式下为负数的情况，会得到复数，如果数据类型是float，那么运算结果会为nan
kss_period = (1 - (1 - (kss + kg)) ** (1 / period_num_1d)) / (1 + kg / kss)
print(type(kss_period))
print(kss_period)

<class 'complex'>
(0.025353129962898846-0.025090480240928633j)


## 函数、函数式编程与面向对象编程

函数就是直接编写，在脚本中调用即可，相关内容可参考开头提供的guide文档。这里重点介绍python特别的函数形式以及面向对象的基本内容。

### 函数

#### With语句

有一些任务，可能事先需要设置，事后做清理工作。对于这种场景，Python的with语句提供了一种非常方便的处理方式。
一个很好的例子是文件处理，你需要获取一个文件句柄，从文件中读取数据，然后关闭文件句柄。

如果不用with语句，代码如下：

In [24]:
file = open("data.json")
data = file.read()
file.close()

这里有两个问题。一是可能忘记关闭文件句柄；二是文件读取数据发生异常，没有进行任何处理。下面是处理异常的加强版本。


In [25]:
file = open("data.json")
try:
    data = file.read()
finally:
    file.close()
    

虽然这段代码运行良好，但是太冗长了。这时候就是with一展身手的时候了。
除了有更优雅的语法，with还可以很好的处理上下文环境产生的异常。下面是with版本的代码


In [26]:
with open("data.json") as file:
    data = file.read()

with如何工作？

Python对with的处理还很聪明。基本思想是with所求值的对象必须有一个__enter__()方法，一个__exit__()方法。

紧跟with后面的语句被求值后，返回对象的__enter__()方法被调用，这个方法的返回值将被赋值给as后面的变量。
当with后面的代码块全部被执行完之后，将调用前面返回对象的__exit__()方法。

#### 回调函数

In [27]:
import time


def apply_async(func, args, *, callback):
    """回调函数的应用，python的函数很灵活，可以直接做函数参数"""
    # Compute the result
    result = func(*args)

    # Invoke the callback with the result
    callback(result)


def print_result(result):
    print('Got:', result)


def add(x, y):
    return x + y


apply_async(add, (2, 3), callback=print_result)

apply_async(add, ('hello', 'world'), callback=print_result)

Got: 5
Got: helloworld


#### 一些高级特性

切片比较简单，这里就不赘述。

迭代稍微说一下：python的for循环抽象程度是很高的，可以作用于任何可迭代对象上。比如dict的遍历，默认情况下，dict迭代的是key。如果要迭代value，可以用for value in d.values()，如果要同时迭代key和value，可以用for k, v in d.items()。

然后再补充一些常用的内置函数。

In [28]:
d = {'a': 1, 'b': 2, 'c': 3}
for key in d:
    print(key)

a
b
c


对list也可以实现类似Java那样的下标循环，Python内置的enumerate函数可以把一个list变成索引-元素对，这样就可以在for循环中同时迭代索引和元素本身：

In [29]:
seq = ['one', 'two', 'three']
for i, element in enumerate(seq):
    print(i, element)

0 one
1 two
2 three


python还有一个很强大的列表生成式，直接看代码：

In [30]:
[x * x for x in range(1, 11)]

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

for循环后面还可以加上if判断：

In [31]:
[x * x for x in range(1, 11) if x % 2 == 0]

[4, 16, 36, 64, 100]

通过列表生成式，我们可以直接创建一个列表。但是，受到内存限制，列表容量肯定是有限的。而且，创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。

所以，如果列表元素可以按照某种算法推算出来，那我们是否可以**在循环的过程中不断推算出后续的元素**呢？这样就不必创建完整的list，从而节省大量的空间。在Python中，这种**一边循环一边计算的机制，称为生成器**：generator。只要把一个列表生成式的[]改成()，就创建了一个generator。

generator保存的是算法，每次调用next(g)，就计算出g的下一个元素的值，直到计算到最后一个元素。更详细的信息在advanced-python一文中再解析。

In [32]:
g = (x * x for x in range(10))
g
for n in g:
    print(n)

0
1
4
9
16
25
36
49
64
81


而可以**被next()函数调用并不断返回下一个值的对象称为迭代器**：Iterator。

接下来补充一些常用的内置函数，主要跟迭代运算等相关。利用内置函数，可以有较快的运算速度。主要参考了[python 3 教程](https://www.runoob.com/python3/python3-tutorial.html)

all()函数也是一个常用的内置函数，用于判断给定的可迭代参数 iterable 中的所有元素是否都为 TRUE，如果是返回 True，否则返回 False。函数等价于：

``` python
def all(iterable):
    for element in iterable:
        if not element:
            return False
    return True
```

all()函数语法：all(iterable)

In [33]:
all(['a', 'b', 'c', 'd'])  # 列表list，元素都不为空或0

True

In [34]:
all([0, 1,2, 3])          # 列表list，存在一个为0的元素

False

zip() 函数用于将可迭代的对象作为参数，**将对象中对应的元素打包成一个个元组**，然后返回由这些元组组成的对象，这样做的好处是节约了不少的内存。zip就是解压，所以有时候会在python中说到解压，不是指的文件那个解压，而是这个zip函数的反向操作，即从一个序列里把数据分离。

In [35]:
a = [1,2,3]
b = [4,5,6]
c = [4,5,6,7,8]
zipped = zip(a,b)     # 返回一个对象
print(zipped)
print("list of zipped tuples:",list(zipped) )
print("list of zipped tuples:",list(zip(a,c))  )

<zip object at 0x000002717516DBC8>
list of zipped tuples: [(1, 4), (2, 5), (3, 6)]
list of zipped tuples: [(1, 4), (2, 5), (3, 6)]


In [36]:
# 与 zip 相反，zip(*) 可理解为解压，返回二维矩阵式
a1, a2 = zip(*zip(a,b)) 
print(list(a1))
print(list(a2))

[1, 2, 3]
[4, 5, 6]


### 函数式编程

函数式编程思想更接近数学计算，是一种抽象程度很高的编程范式，纯粹的函数式编程语言编写的函数没有变量，因此任意一个函数只要输入是确定的，输出就是确定的。python允许使用变量，所以不是纯函数式编程语言。

函数式编程的一个特点就是允许把函数本身作为参数传入另一个函数，还允许返回一个函数。比如：

In [37]:
def add(x, y, f):
    return f(x) + f(y)

print(add(-5, 6, abs))

11


#### 一些高阶函数

python内建了map和reduce函数。

map()函数接收两个参数，**一个是函数，一个是Iterable**，map将传入的函数**依次作用到序列的每个元素**，并把结果作为新的Iterator返回。

map()作为高阶函数，事实上它把运算规则抽象了.

In [38]:
def f(x):
    return x * x

r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])
list(r)

[1, 4, 9, 16, 25, 36, 49, 64, 81]

reduce函数类似于迭代积累的效果。

In [39]:
from functools import reduce
def fn(x, y):
    return x * 10 + y

def char2num(s):
    digits = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}
    return digits[s]

reduce(fn, map(char2num, '13579'))

13579

上式可以整理为如下形式。

In [40]:
from functools import reduce

DIGITS = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}

def str2int(s):
    def fn(x, y):
        return x * 10 + y
    def char2num(s):
        return DIGITS[s]
    return reduce(fn, map(char2num, s))

python的filter()函数可以用于过滤序列。和map()类似，filter()也接收一个函数和一个序列。和map()不同的是，filter()把传入的函数依次作用于每个元素，然后根据返回值是True还是False决定保留还是丢弃该元素。

In [41]:
def is_odd(n):
    return n % 2 == 1

list(filter(is_odd, [1, 2, 4, 5, 6, 9, 10, 15]))

[1, 5, 9, 15]

#### 闭包
闭包概念：在一个内部函数中，对外部作用域的变量进行引用，(并且一般外部函数的返回值为内部函数)，那么内部函数就被认为是闭包。比如：

In [46]:
def outer():
    var = 3

    def inner():
        print("the func is used: var=" + str(var))

    return inner

以上，函数inner和自有变量var的“引用”共同构成了闭包。var对于inner来说是自由变量。在一个内部函数中，对外部作用域的变量进行引用，并且外部函数的返回值为内部函数，那么内部函数就被认为是闭包。

闭包的作用是可以保存当前的运行环境。

In [43]:
def create(pos=[0, 0]):
    def go(direction, step):
        new_x = pos[0] + direction[0] * step
        new_y = pos[1] + direction[1] * step
        pos[0] = new_x
        pos[1] = new_y
        return pos

    return go


player = create()
print(player([1, 0], 10))
print(player([0, 1], 20))
print(player([-1, 0], 10))

[10, 0]
[10, 20]
[0, 20]


闭包可以帮助实现lazy的运算。比如求和，不需要立刻求和，而是在调用之后再求和。

In [44]:
def lazy_sum(*args):
    def sum():
        ax = 0
        for n in args:
            ax = ax + n
        return ax
    return sum

f = lazy_sum(1, 3, 5, 7, 9)
f

<function __main__.lazy_sum.<locals>.sum()>

In [45]:
f()

25

#### 匿名函数

当我们在传入函数时，有些时候，不需要显式地定义函数，直接传入匿名函数更方便。

在Python中，对匿名函数提供了有限支持。还是以map()函数为例，计算f(x)=x2时，除了定义一个f(x)的函数外，还可以直接传入匿名函数：

In [47]:
list(map(lambda x: x * x, [1, 2, 3, 4, 5, 6, 7, 8, 9]))

[1, 4, 9, 16, 25, 36, 49, 64, 81]

关键字lambda表示匿名函数，冒号前面的x表示函数参数。匿名函数有个限制，就是只能有一个表达式，不用写return，返回值就是该表达式的结果。

### 面向对象

Python中，所有数据类型都可以视为对象，当然也可以自定义对象。自定义的对象数据类型就是面向对象中的类（Class）的概念。

Python中类名一般首字母大写。创建实例通过类名+括号即可实现。

定义类中的方法第一个参数是self，其他的就和普通函数是一样的了。调用函数时，self不用传入实参，剩下的和普通函数一样。

In [48]:
class Student(object):

    def __init__(self, name, score):
        self.name = name
        self.score = score

    def print_score(self):
        print('%s: %s' % (self.name, self.score))
        
bart = Student('Bart Simpson', 59)
lisa = Student('Lisa Simpson', 87)
bart.print_score()
lisa.print_score()

Bart Simpson: 59
Lisa Simpson: 87


In [49]:
class Student(object):
    def __init__(self, name, score):
        self.name = name
        self.score = score

    def get_grade(self):
        if self.score >= 90:
            return 'A'
        elif self.score >= 60:
            return 'B'
        else:
            return 'C'

lisa = Student('Lisa', 99)
bart = Student('Bart', 59)
print(lisa.name, lisa.get_grade())
print(bart.name, bart.get_grade())

Lisa A
Bart C


python中可以设置私有变量，用双下划线前置命名变量即可。私有变量是无法从外部访问的，比如下面代码最后一句是会报错的。不过和java一样，也是可以通过设置get/set方法来实现外部变量的访问。

In [50]:
class Student(object):

    def __init__(self, name, score):
        self.__name = name
        self.__score = score

    def print_score(self):
        print('%s: %s' % (self.__name, self.__score))
        
    def get_name(self):
        return self.__name

    def get_score(self):
        return self.__score
    
    def set_score(self, score):
        if 0 <= score <= 100:
            self.__score = score
        else:
            raise ValueError('bad score')
        
bart = Student('Bart Simpson', 59)
print(bart.get_name())
bart.__name

Bart Simpson


AttributeError: 'Student' object has no attribute '__name'

python的面向对象和java有所不同。python是一种动态编程语言，根据[动态语言与鸭子类型](https://juejin.im/post/59ae5865f265da249517b484)一文所述，动态语言就是只有等到程序运行时才知道一切，变量（严格来说叫名字，就像人的名字一样）不需要指定类型，变量本身没有任何类型信息，类型信息在对象身上，对象是什么类型，必须等到程序运行时才知道，动态类型语言的优点在于方便阅读，不需要写很多类型相关的代码；缺点是不方便调试，命名不规范时会造成读不懂，不利于理解等。

动态语言中经常提到鸭子类型，所谓鸭子类型就是：如果所有数据类型都可以视为对象，当然也可以自定义对象。自定义的对象数据类型就是面向对象中的类（Class）的概念。走起路来像鸭子，叫起来也像鸭子，那么它就是鸭子（If it walks like a duck and quacks like a duck, it must be a duck）。鸭子类型是编程语言中动态类型语言中的一种设计风格，一个对象的特征不是由父类决定，而是通过对象的方法决定的。

In [51]:
# python3
class Foo:
    def __iter__(self):
        pass

    def __next__(self):
        pass

from collections import Iterable
from collections import Iterator

print(isinstance(Foo(), Iterable)) # True
print(isinstance(Foo(), Iterator)) # True

True
True


  if __name__ == '__main__':
  # Remove the CWD from sys.path while we load stuff.


我们并不需要继承 Iterator 就可以实现迭代器的功能。当有一函数希望接收的参数是 Iterator 类型时，但是我们传递的是 Foo 的实例对象，其实也没问题，换成是Java等静态语言，就必须传递 Iterator或者是它的子类。鸭子类型通常得益于"不"测试方法和函数中参数的类型，而是依赖文档、清晰的代码和测试来确保正确使用，这既是优点也是缺点，缺点是需要通过文档才能知道参数类型，为了弥补这方面的不足，Python3.6引入了类型信息，定义变量的时候可以指定类型

In [52]:
def greeting(name: str) -> str:
    """该函数表示接收str类型的参数，并返回str类型的值"""
    return 'Hello ' + name

接下来简要了解python内置类属性，参考[Python中常见几个内置类属性](https://www.jianshu.com/p/b23e1a1c4026)，创建一个类之后，系统就自带了一些属性，叫内置类属性。

常见的内置类属性

1. __dict____ : 类的属性（包含一个字典，由类的数据属性组成）
2. __doc____ : 类的文档字符串
3. __name____: 类名
4. __module____: 类定义所在的模块（类的全名是'__main____.className'，如果类位于一个导入模块mymod中，那么className.__module____ 等于 mymod）
5. ____bases____ : 类的所有父类构成元素（包含了一个由所有父类组成的元组）

In [53]:
class Employee:
   '所有员工的基类'
   empCount = 0
 
   def __init__(self, name, salary):
        self.name = name
        self.salary = salary
        Employee.empCount += 1
   
   def displayCount(self):
        print ("Total Employee %d" % Employee.empCount)
 
   def displayEmployee(self):
         print ("Name : ", self.name,  ", Salary: ", self.salary)

print( "Employee.__doc__:", Employee.__doc__)
print( "Employee.__name__:", Employee.__name__)
print ("Employee.__module__:", Employee.__module__)
print ("Employee.__bases__:", Employee.__bases__)
print( "Employee.__dict__:", Employee.__dict__)

Employee.__doc__: 所有员工的基类
Employee.__name__: Employee
Employee.__module__: __main__
Employee.__bases__: (<class 'object'>,)
Employee.__dict__: {'__module__': '__main__', '__doc__': '所有员工的基类', 'empCount': 0, '__init__': <function Employee.__init__ at 0x0000027175182DC8>, 'displayCount': <function Employee.displayCount at 0x0000027175182E58>, 'displayEmployee': <function Employee.displayEmployee at 0x0000027175182EE8>, '__dict__': <attribute '__dict__' of 'Employee' objects>, '__weakref__': <attribute '__weakref__' of 'Employee' objects>}


### 面向对象高级编程

有时候当类的层次复杂时，也会用到多重继承，比如：

In [56]:
class Animal(object):
    pass

class Mammal(Animal):
    pass

class Runnable(object):
    def run(self):
        print('Running...')

class Flyable(object):
    def fly(self):
        print('Flying...')
        
class Dog(Mammal, Runnable):
    pass

class Bat(Mammal, Flyable):
    pass

通过多重继承，一个子类就可以**同时获得多个父类的所有功能**。

在设计类的继承关系时，通常，主线都是单一继承下来的，例如，Ostrich继承自Bird。但是，如果**需要“混入”额外的功能**，通过多重继承就可以实现，比如，让Ostrich除了继承自Bird外，再同时继承Runnable。这种设计通常称之为**MixIn**。

MixIn的目的就是给一个类增加多个功能，这样，在设计类的时候，我们**优先考虑通过多重继承来组合多个MixIn的功能**，而**不是设计多层次**的复杂的继承关系。

接下来看看多态的使用，这是继承后，调用子类时常用的东西。

In [57]:
class Animal(object):
    def run(self):
        print('Animal is running...')

class Dog(Animal):
    def run(self):
        print('Dog is running...')

class Cat(Animal):
    def run(self):
        print('Cat is running...')
        
class Human(Animal):
    def think(self):
        print("He/She is thinking")

def run_twice(animal):
    animal.run()
    animal.run()

a = Animal()
d = Dog()
c = Cat()

print('a is Animal?', isinstance(a, Animal))
print('a is Dog?', isinstance(a, Dog))
print('a is Cat?', isinstance(a, Cat))

print('d is Animal?', isinstance(d, Animal))
print('d is Dog?', isinstance(d, Dog))
print('d is Cat?', isinstance(d, Cat))

run_twice(c)

h= Human()
h.run()
h.think()

a is Animal? True
a is Dog? False
a is Cat? False
d is Animal? True
d is Dog? True
d is Cat? False
Cat is running...
Cat is running...
Animal is running...
He/She is thinking


关于__slots__，正常情况下，定义一个class，并创建其实例**后**，可以给实例**绑定任何属性和方法**。

In [58]:
class Student(object):
    pass
s = Student()
s.name = 'Michael' # 动态给实例绑定一个属性
print(s.name)

def set_age(self, age): # 定义一个函数作为实例方法
    self.age = age
from types import MethodType
s.set_age = MethodType(set_age, s) # 给实例绑定一个方法
s.set_age(25) # 调用实例方法
s.age # 测试结果

Michael


25

但是，给一个实例绑定的方法，对另一个实例是不起作用的：

In [59]:
s2 = Student() # 创建新的实例
s2.set_age(25) # 尝试调用方法

AttributeError: 'Student' object has no attribute 'set_age'

为了给所有实例都绑定方法，可以给class绑定方法：

In [60]:
def set_score(self, score):
    self.score = score
Student.set_score = set_score
s.set_score(100)
s.score

100

In [61]:
s2.set_score(99)
s2.score

99

通常情况下，上面的set_score方法可以直接定义在class中，但动态绑定允许我们**在程序运行的过程中动态给class加上功能**，这在静态语言中很难实现。

但是，如果我们想要限制实例的属性怎么办？比如，只允许对Student实例添加name和age属性。

为了达到限制的目的，Python允许在定义class的时候，定义一个特殊的__slots__变量，来限制该class实例能添加的属性：

In [62]:
class Student(object):
    __slots__ = ('name', 'age') # 用tuple定义允许绑定的属性名称
s = Student() # 创建新的实例
s.name = 'Michael' # 绑定属性'name'
s.age = 25 # 绑定属性'age'

In [63]:
s.score = 99 # 绑定属性'score'

AttributeError: 'Student' object has no attribute 'score'

由于'score'没有被放到__slots__中，所以不能绑定score属性，试图绑定score将得到AttributeError的错误。

使用__slots__要注意，__slots__定义的属性仅对当前类实例起作用，对继承的子类是不起作用的：

In [64]:
class GraduateStudent(Student):
    pass
g = GraduateStudent()
g.score = 9999

除非在子类中也定义__slots__，这样，子类实例允许定义的属性就是自身的__slots__加上父类的__slots__。

### 错误、调试和测试

程序运行的错误有多种。其中有一类是完全无法在程序运行过程中预测的，比如从网络抓取数据，网络突然断掉了，这类错误也称为异常，在程序中通常是必须处理的，否则，程序会因为各种问题终止并退出。

Python内置了一套异常处理机制，来帮助我们进行错误处理。

此外，我们也需要跟踪程序的执行，查看变量的值是否正确，这个过程称为调试。Python的pdb可以让我们以单步方式执行代码。

#### 错误处理

一般错误处理机制是try...except...finally...

In [65]:
try:
    print('try...')
    r = 10 / 0
    print('result:', r)
except ZeroDivisionError as e:
    print('except:', e)
finally:
    print('finally...')
print('END')

try...
except: division by zero
finally...
END


错误应该有很多种类，如果发生了不同类型的错误，应该由不同的except语句块处理。没错，可以有多个except来捕获不同类型的错误：

In [66]:
try:
    print('try...')
    r = 10 / int('a')
    print('result:', r)
except ValueError as e:
    print('ValueError:', e)
except ZeroDivisionError as e:
    print('ZeroDivisionError:', e)
finally:
    print('finally...')
print('END')

try...
ValueError: invalid literal for int() with base 10: 'a'
finally...
END


Python的错误其实也是class，所有的错误类型都继承自BaseException，所以在使用except时需要注意的是，它不但捕获该类型的错误，还把其子类也“一网打尽”。比如：

``` python
try:
    foo()
except ValueError as e:
    print('ValueError')
except UnicodeError as e:
    print('UnicodeError')
```

第二个except永远也捕获不到UnicodeError，因为UnicodeError是ValueError的子类，如果有，也被第一个except给捕获了。

常见的错误类型和继承关系看[这里](https://docs.python.org/3/library/exceptions.html#exception-hierarchy)。

使用try...except捕获错误还有一个巨大的好处，就是可以跨越多层调用，比如函数main()调用foo()，foo()调用bar()，结果bar()出错了，这时，只要main()捕获到了，就可以处理

In [67]:
def foo(s):
    return 10 / int(s)

def bar(s):
    return foo(s) * 2

def main():
    try:
        bar('0')
    except Exception as e:
        print('Error:', e)
    finally:
        print('finally...')

如果错误没有被捕获，它就会一直往上抛，最后被Python解释器捕获，打印一个错误信息，然后程序退出。

In [68]:
# err.py:
def foo(s):
    return 10 / int(s)

def bar(s):
    return foo(s) * 2

def main():
    bar('0')

main()

ZeroDivisionError: division by zero

出错并不可怕，**可怕的是不知道哪里出错了**。解读错误信息是定位错误的关键。根据上述信息－－错误类型ZeroDivisionError，我们判断，int(s)本身并没有出错，但是int(s)返回0，在计算10 / 0时出错，至此，找到错误源头。

能捕获错误，就可以把错误堆栈打印出来，然后分析错误原因，同时，让程序继续执行下去。

Python内置的logging模块可以非常容易地记录错误信息，同样是出错，但程序打印完错误信息后会继续执行，并正常退出。

In [69]:
# err_logging.py

import logging

def foo(s):
    return 10 / int(s)

def bar(s):
    return foo(s) * 2

def main():
    try:
        bar('0')
    except Exception as e:
        logging.exception(e)

main()
print('END')

ERROR:root:division by zero
Traceback (most recent call last):
  File "<ipython-input-69-50dd10eca926>", line 13, in main
    bar('0')
  File "<ipython-input-69-50dd10eca926>", line 9, in bar
    return foo(s) * 2
  File "<ipython-input-69-50dd10eca926>", line 6, in foo
    return 10 / int(s)
ZeroDivisionError: division by zero


END


如果要抛出错误，首先根据需要，可以定义一个错误的class，选择好继承关系，然后，用raise语句抛出一个错误的实例：

In [70]:
# err_raise.py
class FooError(ValueError):
    pass

def foo(s):
    n = int(s)
    if n==0:
        raise FooError('invalid value: %s' % s)
    return 10 / n

foo('0')

FooError: invalid value: 0

只有在必要的时候才定义我们自己的错误类型。如果可以选择Python已有的内置的错误类型（比如ValueError，TypeError），尽量使用Python内置的错误类型。

#### 调试

程序能一次写完并正常运行的概率很小，总会有各种各样的bug需要修正。有的bug很复杂，我们需要知道出错时，哪些变量的值是正确的，哪些变量的值是错误的，因此，需要一整套调试程序的手段来修复bug。

简单直接粗暴有效，就是用print()把可能有问题的变量打印出来看看。用print()最大的坏处是将来还得删掉它，想想程序里到处都是print()，运行结果也会包含很多垃圾信息。

所以，又有第二种方法：凡是用print()来辅助查看的地方，都可以用**断言（assert）**来替代。

In [71]:
def foo(s):
    n = int(s)
    assert n != 0, 'n is zero!'
    return 10 / n

def main():
    foo('0')

assert的意思是，表达式n != 0应该是True，否则，根据程序运行的逻辑，后面的代码肯定会出错。

如果断言失败，assert语句本身就会抛出AssertionError.

程序中如果到处充斥着assert，和print()相比也好不到哪去。不过，启动Python解释器时可以用-O参数来关闭assert.

``` bash
$ python -O err.py
```

关闭后，你可以把所有的assert语句当成pass来看。

把print()替换为logging是第3种方式，和assert比，logging不会抛出错误，而且可以输出到文件。另外，虽然用IDE调试起来比较方便，但是最后会发现，logging才是终极武器。

In [72]:
import logging
logging.basicConfig(level=logging.INFO)
s = '0'
n = int(s)
logging.info('n = %d' % n)
print(10 / n)

ZeroDivisionError: division by zero

logging允许你指定记录信息的级别，有debug，info，warning，error等几个级别，当我们指定level=INFO时，logging.debug就不起作用了。同理，指定level=WARNING后，debug和info就不起作用了。这样一来，你可以放心地输出不同级别的信息，也不用删除，最后统一控制输出哪个级别的信息。

logging的另一个好处是通过简单的配置，一条语句可以同时输出到不同的地方，比如console和文件。

#### 单元测试

单元测试是用来对一个模块、一个函数或者一个类来进行正确性检验的测试工作。把测试用例放到一个测试模块里，就是一个完整的单元测试。以**测试为驱动的开发模式**最大的好处就是确保一个程序模块的行为符合我们设计的测试用例。在将来修改的时候，可以极大程度地保证该模块行为仍然是正确的。

为了编写单元测试，需要引入Python自带的unittest模块。编写单元测试时，我们需要编写一个测试类，从unittest.TestCase继承。

以**test开头的方法就是测试方法**，不以test开头的方法不被认为是测试方法，测试的时候不会被执行。

对**每一类测试都需要编写一个test_xxx()方法**。由于unittest.TestCase提供了很多**内置的条件判断**，我们只需要调用这些方法就可以断言输出是否是我们所期望的。

- 最常用的断言就是assertEqual();
- 另一种重要的断言就是期待抛出指定类型的Error；
- 通过d.empty访问不存在的key时，我们期待抛出AttributeError等

可以把mydict_test.py当做正常的python脚本运行:

In [73]:
!python mydict_test.py

.....
----------------------------------------------------------------------
Ran 5 tests in 0.000s

OK


另一种方法是在命令行通过参数-m unittest直接运行单元测试，这是推荐的做法，因为这样可以**一次批量运行很多单元测试**，并且，有很多工具可以**自动来运行这些单元测试**。

In [74]:
!python -m unittest mydict_test

.....
----------------------------------------------------------------------
Ran 5 tests in 0.000s

OK


最后补充一点个人对测试的理解。

首先，单元测试并不能代替调试，否则也不需要调试了。测试和调试时两个概念，这部分可以参考这些[post](https://www.zhihu.com/question/24085524)的介绍。

程序运行前要尽量定义好接口，把程序模块化，然后每块之间的耦合不特别高，这样在一个用例下进行测试，每个模块都调试到让自己满意的结果。

这个时候有了一组期待的结果后，就可以针对每个模块编写测试代码了，小到每个函数，大到整个模块。

然后再来就可以修改代码了，每次修改之后，就可以执行测试，看看计算结果是不是合理的。

这样的思路是比较高效的思路。 简而言之，就是得有一个work的case，然后再一点点调试，一点点地测试，看看和期待结果是否一致。这样是最稳的。

另外，可以在单元测试中编写两个特殊的**setUp()和tearDown()** 方法。这两个方法会分别在每调用一个测试方法的前后分别被执行。

setUp()和tearDown()方法有什么用呢？设想你的测试需要启动一个数据库，这时，就可以在setUp()方法中连接数据库，在tearDown()方法中关闭数据库，这样，不必在每个测试方法中重复相同的代码。代码形如：

In [77]:
import unittest
class TestDict(unittest.TestCase):

    def setUp(self):
        print('setUp...')

    def tearDown(self):
        print('tearDown...')

另外，在unttest框架中，testcase中间不共享变量的值，不过有时候需要使用全局变量，如何处理？

可以从setupclass里面读取统一的变量值，可以setup时候设置全局变量，不同的case之间就可以共享这个变量了。这里参考：[python unittest TestCase间共享数据（全局变量的使用）](https://blog.csdn.net/chenmozhe22/article/details/81302780#4setupclass_XXX_109)。代码如下：

In [78]:
import unittest
class AlienTest(unittest.TestCase):
    status = 200

    @classmethod
    def setUpClass(cls):
        cls.url = "http://www.baidu.com"
        globals()['status'] = 300

    def test_1_alien(self):
        print("test_1_status：", self.status)

    def test_2_alien(self):
        self.status = 404
        print("test_2_status", self.status)

    def test_4_alien(self):
        print("test_4_global_status", globals()['status'])
        print("test_4_status", self.status)


if __name__ == '__main__':
    unittest.main()

E
ERROR: C:\Users\wvo5024\AppData\Roaming\jupyter\runtime\kernel-55c1bfb9-afca-4d71-a440-ea11e898d4b1 (unittest.loader._FailedTest)
----------------------------------------------------------------------
AttributeError: module '__main__' has no attribute 'C:\Users\wvo5024\AppData\Roaming\jupyter\runtime\kernel-55c1bfb9-afca-4d71-a440-ea11e898d4b1'

----------------------------------------------------------------------
Ran 1 test in 0.001s

FAILED (errors=1)


SystemExit: True

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


#### 文档测试

很多文档都有示例代码。Python内置的 **“文档测试”（doctest）模块可以直接提取注释中的代码并执行测试**。

In [79]:
!python mydict2.py

什么输出也没有。这说明我们编写的doctest运行都是正确的。