本文学习于《Effective Python:编写高质量Python代码的59个有效方法》，作者:布雷特.斯拉特金;整理:Weiyang,微信号:damo894127201,Time:2019.01.31

一门语言的编程习惯是由用户来确定的，而以最佳方式完成常见的Python编程工作便是Pythonic方式。

# 确认自己所用的Python版本

Python社区把开发重点放在Python3上，因此在开发项目时应优先使用Python3;而Python2的功能开发已经冻结，只会进行bug修复，安全增强以及移植等工作，以便开发者能顺利从Python2迁移到Python3。

#查看Python版本

命令: python --version

In [1]:
import sys

print(sys.version_info)
print(sys.version)

sys.version_info(major=3, minor=6, micro=2, releaselevel='final', serial=0)
3.6.2 |Anaconda custom (64-bit)| (default, Sep 22 2017, 02:03:08) 
[GCC 7.2.0]


# 遵循PEP 8 风格指南

《Python Enhancement Proposal #\8》(8号Python增强提案)又称为PEP8，它是针对Python代码格式而编订的风格指南。

下面几条是绝对应该遵守的规则

## 空白

1. 使用space(空格)来表示缩进，而不要用tab(制表符)
2. 和语法相关的每一层缩进都用4个空格来表示
3. 每行的字符数不超过79个
4. 对于占据多行的长表达式来说，除了首行之外的其余各行都应该在通常的缩进级别之上再加4个空格
5. 文件中的函数与类之间应该用两个空行隔开
6. 在同一个类中，各方法之间应该用一个空行隔开
7. 在使用下标来获取列表元素，调用函数或给关键字参数赋值的时候，不要在两旁添加空格
8. 为变量赋值的时候，赋值符号的左侧和右侧应该各自写上一个空格，而且只写一个就好

## 命名

PEP 8 提倡采用不同的命名风格来编写Python代码中的各个部分，以便在阅读代码时可以根据这些名称看出它们在Python语言中的角色。

1. 函数，变量及属性应该用小写字母来拼写，各单词之间以下划线相连，例如，lowercase_underscore
2. 受保护的实例属性，应该以单个下划线开头，例如，\_leading_underscore
3. 私有的实例属性，应该以两个下划线开头，例如，\__double_leading_underscore
4. 类与异常，应该以每个单词首字母均大写的形式来命名，例如，CapitalizedWord
5. 模块级别的常量，应该全部采用大写字母来拼写，各单词之间以下划线相连，例如，ALL_CAPS
6. 类中的实例方法(instance method)，应该把首个参数命名为self,以表示该对象本身
7. 类方法(class method)的首个参数，应该命名为cls，以表示该类本身

## 表达式和语句

每件事都应该有直白的做法，而且最好只有一种。PEP 8在制定表达式和语句风格时，就试着体现了这种思想。

1. 采用内联形式的否定词，而不要把否定词放在整个表达式的前面，例如，应该写if a is not b而不是if not a is b
2. 不要通过检测长度的方法(如 if len(somelist) == 0)来判断somelist是否为[]或''等空值，而是应该采用if not somelist这种写法来判断，它会假定:空值将自动评估为False

In [2]:
somelist1 = [[]]
somelist2 = ['']
somelist3 = []
print('somelist1 length : ',len(somelist1))
print('somelist2 length : ',len(somelist2))
print('somelist3 length : ',len(somelist3))
if not somelist1:
    print('somelist1 is None')
if not somelist2:
    print('somelist2 is None')
if not somelist3:
    print('somelist3 is None')

somelist1 length :  1
somelist2 length :  1
somelist3 length :  0
somelist3 is None


1. 检测somelist是否为[1]或'hi'等非空值时，也应该如此，if somelist语句默认会把非空的值判断为True
2. 不要编写单行的if语句，for循环,while循环及except复合语句，而是应该把这些语句分成多行来书写，以示清晰
3. import语句应该总是放在文件开头
4. 引入模块的时候，总是应该使用绝对名称，而不应该根据当前模块的路径来使用相对名称。例如，引入bar包中的foo模块时，应该完整地写出from bar import foo，而不应该简写为import foo
5. 如果一定要以相对名称来编写import语句，那就采用明确的写法: from . import foo
6. 文件中的那些import语句应该按顺序划分成三个部分，分别表示标准库模块，第三方模块以及自用模块。在每一部分中，各import语句应该按模块的字母顺序来排列

# 了解bytes、str与unicode的区别

原始的8位值，表示原始的字节，由于每个字节有8个二进制位，故称原生8位值，它们是二进制数据

## Python2中两种表示字符序列的类型

1. str,包含原始的8位值
2. unicode，包含Unicode字符

## Python3中两种表示字符序列的类型

1. bytes，包含原始的8位值
2. str，包含Unicode字符

Python3的str实例和Python2的unicode实例都没有和特定的**二进制编码形式**相关联。要想把Unicode字符转换成二进制数据（原生8位值），就必须使用encode方法；要想把二进制数据转换成Unicode字符，则必须decode。

在编写Python程序时，一定要把编码和解码操作放在界面最外围来做，而程序的核心部分应该使用Unicode字符类型(也就是Python3的str，Python2的unicode)，而不要对字符编码做任何假设。这种方式既可以令程序接受多种类型的文本编码，又可以保证输出的文本信息只采用一种编码形式，最好是utf-8。

在Python3中，bytes是一种包含8位值的序列，str是一种包含Unicode字符的序列。开发者不能以>或+等操作符来混同操作bytes和str实例。

在Python2中，str是一种包含8位值的序列，unicode是一种包含Unicode字符的序列。如果str只含有7位的ASCII字符，那么可以通过相关的操作来同时使用str与unicode。

# 用辅助函数来取代复杂的表达式

表达式如果变得比较复杂，那就应该考虑将其拆解成小块，并把这些逻辑移入辅助函数中。这会令代码更加易读，它比原来那种密集的写法更好。编写Python程序时，不要一味追求过于紧凑的写法，那样会写出非常复杂的表达式。

请把复杂的表达式移入辅助函数中，如果要反复使用相同的逻辑，那就更应该这么做。

使用if/else表达式，要比用or或and这样的Boolean操作符写成的表达式更加清晰。

# 了解切割序列的方法

Python提供了一种把序列切割成小块的写法，这种切片(slice)操作，使得开发者能够轻易地访问由序列中的某些元素所构成的子集。

切割操作的基本写法是somelist[start:end]，其中start（起始索引） 所指的元素涵盖在切割后的范围内，而end(结束索引)所指的元素则不包含在切割结果之内。

In [3]:
a = [1,2,3,4,5,6,7,8]

从列表头部获取切片，start应该省略

In [4]:
a[:5]

[1, 2, 3, 4, 5]

如果切片一直取到列表末尾，则end应该省略

In [5]:
a[3:]

[4, 5, 6, 7, 8]

若要从列表尾部向前获取元素，可用负值来表示相关偏移量

In [6]:
a[-1:],a[-2:],a[-5:],a[-2:-5],a[-5:-2]

([8], [7, 8], [4, 5, 6, 7, 8], [], [4, 5, 6])

切割列表时，即便start和end索引越界也不会出问题，利用这一特性便可以限定输入序列的最大长度

In [7]:
first_twenty_items = a[:20]
first_twenty_items

[1, 2, 3, 4, 5, 6, 7, 8]

访问单个元素时，下标不能越界

对原列表进行切割后，会产生另外一份全新的列表。系统依然维护着指向原列表中各个对象的引用。因此，在切割后得到的新列表上进行修改，不会影响原列表。

在赋值时对左侧列表使用切片操作，会把该列表中处在指定范围的对象替换为新值，并且两侧的值的个数可以不等，因此列表会根据新值的个数相应地扩张或收缩

In [8]:
a[2:6] = [0,0]
a

[1, 2, 0, 0, 7, 8]

如果将start和end都省略，那就会产生一份原列表的拷贝

In [9]:
b = a[:]
a is b

False

对列表重新赋值

In [10]:
a[:] = [2,3,4]
a

[2, 3, 4]

# 在单词切片操作内，不要同时指定start、end和stride

除了基本的切片操作之外，Python还提供了**步进式**切割，即每n个元素取1个，somelist[start:end:stride]

In [11]:
a = ['red','orange','yellow','green','blue','purple']

偶数索引处的元素

In [12]:
a[::2]

['red', 'yellow', 'blue']

奇数索引处的元素

In [13]:
a[1::2]

['orange', 'green', 'purple']

如果stride=-1,则会将列表反转

In [14]:
a[::-1]

['purple', 'blue', 'green', 'yellow', 'orange', 'red']

为避免代码难以阅读，我们不应该把stride与start和end同时写在一起。如果非要用stride，则尽量用正值；如果一定要配合start或end索引来使用stride，则尽量分成两步：先做范围切割[1:9]，再在结果上做步进式切片[::2]

# 用列表推导来取代map和filter

Python提供了一种精炼的写法，可以根据一份列表来制作另一份，这种表达式便是list comprehension(列表推导)。

用列表中每个元素的平方值构建另一份列表

In [15]:
[i**2 for i in [1,2,3]]

[1, 4, 9]

除非是调用只有一个参数的函数，否则，对于简单的情况来说，列表推导要比内置的map函数更清晰。要使用map，就要创建lambda函数，以便计算新列表中各个元素的值。

In [16]:
b = map(lambda x:x**2,[1,2,3])
list(b)

[1, 4, 9]

列表推导可以直接过滤原列表中不符合要求的元素，使得生成的新列表不会包含对应的计算结果

In [17]:
[i**2 for i in [1,2,3,4,5] if i % 2 == 0]

[4, 16]

把内置的filter函数与map结合起来，也能达到同样的效果，但代码会复杂

In [18]:
b = map(lambda x:x**2,filter(lambda x:x % 2 == 0,[1,2,3,4,5]))
list(b)

[4, 16]

字典dict与集合set，也有和列表类似的推导机制

In [19]:
{value:key for key,value in {'a':1,'b':2}.items()}

{1: 'a', 2: 'b'}

In [20]:
b = (i for i in [1,2,3])
b

<generator object <genexpr> at 0x7f06201acba0>

# 不要使用含有两个以上表达式的列表推导

列表推导支持多重循环

In [21]:
matrix = [[1,2,3],[4,5,6],[7,8,9]]
flat = [x for row in matrix for x in row] # 先遍历每行，再遍历每行中每个元素
flat

[1, 2, 3, 4, 5, 6, 7, 8, 9]

根据输入列表来创建有两层深度的新列表

In [22]:
b = [[x**2 for x in row] for row in matrix]
b 

[[1, 4, 9], [16, 25, 36], [49, 64, 81]]

列表推导支持多个if条件，处在同一循环级别中的多项条件，彼此之间默认形成and表达式。每一级循环的for表达式后面都可以指定条件。

In [23]:
a = [1,2,3,4,5,6,7,8,9]
b = [x for x in a if x > 4 if x % 2 == 0]
c = [x for x in a if x > 4 and x % 2 == 0]
d = [x for x in a if x > 4 or x % 2 == 0]
b,c,d

([6, 8], [6, 8], [2, 4, 5, 6, 7, 8, 9])

在列表推导中，最好不要使用两个以上的表达式。可以使用两个条件，两个循环或一个条件搭配一个循环。如果要写的代码比这还复杂，那就应该使用普通的if和for语句，并编写辅助函数。

# 用生成器表达式来改写数据量较大的列表推导

列表推导的缺点是，在推导过程中，对于输入序列中的每个值来说，可能都要创建仅含一项元素的全新列表。当输入的数据比较少时，不会出现问题，但如果输入的数据非常多，那么可能会消耗大量内存，并导致程序崩溃。

为了解决此问题，Python提供了**生成器表达式**(generator expression),它是对列表推导和生成器的一种泛化。生成器表达式在运行的时候，并不会把整个输出序列都呈现出来，而是会估值为**迭代器**(iterator)，这个迭代器每次可以根据生成器表达式产生一项数据。

生成器表达式实现方法:

把实现列表推导所用的那种写法放在一对圆括号中，就构成了生成器表达式。生成器表达式会返回一个迭代器。

In [24]:
it = (len(x) for x in ['aa','b','dddd'])
it

<generator object <genexpr> at 0x7f06201ac2b0>

以刚才的迭代器为参数，逐次调用内置的next()函数，即可使其按照生成器表达式来输出下一个值。可以根据自己的需要，多次命令迭代器根据生成器表达式来生成新值，而不用担心内存用量激增。

In [25]:
next(it)

2

使用生成器表达式还有个好处便是，生成器之间可以互相结合。将某个生成器表达式所返回的迭代器，放在另一个生成器表达式的for子表达式中，即可将二者结合起来。下面这行代码便利用了上面那个生成器所返回的迭代器来创造另一个生成器

In [26]:
roots = ((x,x**0.5) for x in it)
roots

<generator object <genexpr> at 0x7f06201acaf0>

外围的迭代器每次前进时，都会推动内部那个迭代器，这就产生了连锁反应，使得执行循环，评估条件，对接输入和输出等逻辑都组合在一起了。注意，由于生成器表达式所返回的那个迭代器是**有状态的**，用过一轮后，就不要反复使用了。

# 尽量用enumerate取代range

1. enumerate()函数提供了一种精简的写法，可以在遍历迭代器时获知每个元素的索引
2. 尽量用enumerate()来改写那种将range与下标访问相结合的序列遍历代码
3. 可以给enumerate()提供第二个参数，以指定开始计数时所用的值(默认为0)

In [27]:
flavor_list = ['vanilla','chocolate','pecan','strawberry']
for i,flavor in enumerate(flavor_list):
    print('%d: %s'%(i,flavor))
print()
for i,flavor in enumerate(flavor_list,1):
    print('%d: %s'%(i,flavor))

0: vanilla
1: chocolate
2: pecan
3: strawberry

1: vanilla
2: chocolate
3: pecan
4: strawberry


# 用zip函数同时遍历两个迭代器

1. 内置的zip函数可以平行地遍历多个迭代器
2. Python3中的zip函数相当于生成器，会在遍历过程中逐次产生元组；Python2中的zip函数则是直接把这些元素完全生成好，并一次性地返回整份列表，在数据量大时，会占用很多内存
3. 如果提供的迭代器(或列表)长度不等，那么只要有一个耗尽，zip就会自动提前终止，不再产生元组
4. itertools内置模块中的zip_longest函数可以平行遍历多个迭代器，而不用在乎它们的长度是否相等；此函数在Python2中叫izip_longest

In [28]:
names = ['Cecilia','Lise','Marie']
letters = [len(n) for n in names]

max_letters = 0 # 最长的名字长度
longest_name = None
for name,count in zip(names,letters):
    if count > max_letters:
        longest_name = name
        max_letters = count
longest_name,max_letters

('Cecilia', 7)

# 不要在for和while 循环后面写else模块

1. Python有种特殊语法，可在for及while循环的内部语句块之后紧跟一个else块
2. **只有当整个循环主体都没有遇到break语句时，循环后面的else块才会执行**
3. 不要在循环后面使用else块，因为这种写法既不直观，又费解

for循环中没有遇到break语句，会执行else块

In [29]:
a,b = 4,9
for i in range(2,min(a,b) + 1):
    print('Testing',i)
    if a % i == 0 and b % i == 0:
        print('Not coprime')
        break
else:
    print('Coprime')

Testing 2
Testing 3
Testing 4
Coprime


for 循环中没有遇到break语句，会执行else块

In [30]:
for i in range(3):
    print('Loop %d'% i)
else:
    print('Else block !')

Loop 0
Loop 1
Loop 2
Else block !


for 循环语句中遇到break语句，不会执行else块

In [31]:
for i in range(3):
    print('Loop %d'% i)
    if i == 1:
        break
else:
    print('Else block!')

Loop 0
Loop 1


for 循环遍历的序列是空的，会执行else块

In [32]:
for x in []:
    print('Never runs')
else:
    print('For Else block !')

For Else block !


while循环的初始循环条件为False,会执行else块

In [33]:
while False:
    print('Never runs')
else:
    print('While Else block !')

While Else block !


# 合理利用try/except/else/finally结构中的每个代码块

Python程序的异常处理可能要考虑四种不同的时机。这些时机可以用try,except,else和finally块来表述。复合语句中的每个块都有特定的用途，它们可以构成很多组合方式。

## try块

异常可能发生的地方，用于检测异常发生的部分

## except块

处理try块中可能发生的异常

## else块

如果不发生异常，便会执行此代码块。因此我们可以将try中代码块的代码尽量挪到此处。

try/except/else

## finally块

无论是否发生异常，该代码块必然会执行，我们可以将一些清理工作放在这里，这样可以保证，比如文件句柄必然会被关闭。

try/finally 块既可以将异常向上传播，又可以在异常发生时执行清理工作。