# Python编码规范（PEP 8）
PEP 8官网 [python.org](https://peps.python.org/pep-0008/)  
Python PEP8 编码规范中文版 [cnblogs.com](https://cnblogs.com/bymo/p/9567140.html)


## Introduction
The Zen of Python [https://peps.python.org/pep-0020/](https://peps.python.org/pep-0020/)  
>Beautiful is better than ugly.  
Explicit is better than implicit.  
Simple is better than complex.  
Complex is better than complicated.  
Flat is better than nested.  
Sparse is better than dense.  
Readability counts.  
Special cases aren't special enough to break the rules.  
Although practicality beats purity.  
Errors should never pass silently.  
Unless explicitly silenced.  
In the face of ambiguity, refuse the temptation to guess.  
There should be one-- and preferably only one --obvious way to do it.  
Although that way may not be obvious at first unless you're Dutch.  
Now is better than never.  
Although never is often better than *right* now.  
If the implementation is hard to explain, it's a bad idea.  
If the implementation is easy to explain, it may be a good idea.  
Namespaces are one honking great idea -- let's do more of those!  

In [15]:
import this
s = ''
for c in this.s:
    try:
        s += this.d[c]
    except:
        s += c
print(s)

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


## 尽信书不如无书
不要为了遵守PEP约定而破坏兼容性！  


## 代码布局Code lay-out

### 1.缩进Indentation
每一级缩进使用4个空格  
续行应该与其包裹元素对齐，要么使用圆括号、方括号和花括号内的隐式行连接来垂直对齐，要么使用挂行缩进对齐3。当使用挂行缩进时，应该考虑到第一行不应该有参数，以及使用缩进以区分自己是续行。  
Continuation lines should align wrapped elements either vertically using Python’s implicit line joining inside parentheses, brackets and braces, or using a hanging indent. When using a hanging indent the following should be considered; there should be no arguments on the first line and further indentation should be used to clearly distinguish itself as a continuation line:

In [None]:
# Correct:

# 与左括号对齐
# Aligned with opening delimiter.
foo = long_function_name(var_one, var_two,
                         var_three, var_four)

# 增加一级缩进与其他行区分
# Add 4 spaces (an extra level of indentation) to distinguish arguments from the rest.
def long_function_name(
        var_one, var_two, var_three,
        var_four):
    print(var_one)

# 挂行缩进应再换一行
# Hanging indents should add a level.
foo = long_function_name(
    var_one, var_two,
    var_three, var_four)

# also correct: 四空格规则对续行是可选的，右括号的不同位置也都是可接受的
foo = long_function_name(
  var_one, var_two,
  var_three, var_four)
foo = long_function_name(
    var_one, var_two,
    var_three, var_four
    )
foo = long_function_name(
    var_one, var_two,
    var_three, var_four
)

### 2.Tabs or Spaces
建议使用空格缩进，混用空格和制表符是不行的  
但是现代IDE应该会处理好这个问题

### 3.行的长度Maximum Line Length
限制所有行长度在79个字符  
文档字符或注释则限制在72个字符  
多行优先使用隐式续行方式（在括号内折行），但是反斜杠的方式有时候也是很有用的，例如多个with语句

In [None]:
with open('/path/to/some/file/you/want/to/read') as file_1, \
     open('/path/to/some/file/being/written', 'w') as file_2:
    file_2.write(file_1.read())

### 4.二元运算符前换行
在二元运算符后换行会影响可读性

In [None]:
# Correct:
# easy to match operators with operands
income = (gross_wages
          + taxable_interest
          + (dividends - qualified_dividends)
          - ira_deduction
          - student_loan_interest)

### 5.空行Blank Lines
顶层函数和类的定义，前后用两个空行隔开。  
类里的方法定义用一个空行隔开。  
相关的功能组可以用额外的空行（谨慎使用）隔开。一堆相关的单行代码之间的空白行可以省略。  
在函数中使用空行来区分逻辑段（谨慎使用）。

### 6.源文件编码
默认UTF-8

### 7.导入
不同模块一般分开导入，导入多个子模块可以使用一行  
导入总是位于文件的顶部，在模块注释和文档字符串之后，在模块的全局变量与常量之前。 
导入应该按照以下顺序分组：
1. 标准库导入
2. 相关第三方库导入
3. 本地应用/库特定导入  

你应该在每一组导入之间加入空行。  
避免通配符导入（from import *），因为这样做会不知道命名空间中存在哪些名字，会使得读取接口和许多自动化工具之间产生混淆。

In [None]:
# Correct:
import os
import sys
# Wrong:
import sys, os
# It’s okay to say this though:
# Correct:
from subprocess import Popen, PIPE

### 8.模块级双下划线变量名Module Level Dunder Names
>*“Dunder” method name is the common pronunciation for python’s built-in method names that start and end with double underscores. Since “Dunder” is easier to say than “double underscore”, the name stuck.*

dunders需要在docstring后，\_\_future\_\_ import 后

In [None]:
"""This is the example module.

This module does stuff.
"""

from __future__ import barry_as_FLUFL

__all__ = ['a', 'b', 'c']
__version__ = '0.1'
__author__ = 'Cardinal Biggles'

import os
import sys

## 字符串引号String Quotes
在Python中，单引号和双引号字符串是相同的。PEP不会为这个给出建议。选择一条规则并坚持使用下去。当一个字符串中包含单引号或者双引号字符的时候，使用和最外层不同的符号来避免使用反斜杠，从而提高可读性。 

对于三引号字符串，总是使用双引号字符来与PEP 257中的文档字符串约定保持一致。

## 空格Whitespace in Expressions and Statements

### 讨厌的事Pet Peeves
Avoid extraneous whitespace in the following situations:

#### 1.Immediately inside parentheses, brackets or braces:

In [None]:
# 避免紧跟在小括号，中括号或者大括号后。
# Correct:
spam(ham[1], {eggs: 2})
# Wrong:
spam( ham[ 1 ], { eggs: 2 } )

#### 2.Between a trailing comma and a following close parenthesis:

In [None]:
# 避免在逗号和右括号之间。
# Correct:
foo = (0,)
# Wrong:
bar = (0, )

#### 3.Immediately before a comma, semicolon, or colon:
避免在逗号分号冒号前；  
但是在数组切片中除外，在切片中的原则是最能让人看清楚。

In [None]:
# Correct:
if x == 4: print(x, y); x, y = y, x
# Wrong:
if x == 4 : print(x , y) ; x , y = y , x

# Correct:
ham[1:9], ham[1:9:3], ham[:9:3], ham[1::3], ham[1:9:]
ham[lower:upper], ham[lower:upper:], ham[lower::step]
ham[lower+offset : upper+offset]
ham[lower + offset : upper + offset]
ham[: upper_fn(x) : step_fn(x)], ham[:: step_fn(x)]

#### 4.Immediately before the open parenthesis that starts the argument list of a function call:

In [None]:
# 避免紧跟在调用函数的左括号前
# Correct:
spam(1)
# Wrong:
spam (1)

#### 5.Immediately before the open parenthesis that starts an indexing or slicing:

In [None]:
# 避免紧跟在索引或切片的左括号前
# Correct:
dct['key'] = lst[index]
# Wrong:
dct ['key'] = lst [index]

#### 6.More than one space around an assignment (or other) operator to align it with another:

In [None]:
# 避免为了对齐等号添加额外空格
# Correct:
x = 1
y = 2
long_variable = 3
# Wrong:
x             = 1
y             = 2
long_variable = 3

### 其他建议
* 避免在尾部添加空格
* 总是在二元运算符**两边**加一个空格：赋值（=），增量赋值（+=，-=），比较（==,<,>,!=,<>,<=,>=,in,not,in,is,is not），布尔（and, or, not）。
* 如果使用具有不同优先级的运算符，请考虑在具有最低优先级的运算符周围添加空格。有时需要通过自己来判断；但是，不要使用一个以上的空格，并且在二元运算符的两边使用相同数量的空格。


In [None]:
# Correct:
i = i + 1
submitted += 1
x = x*2 - 1
hypot2 = x*x + y*y
c = (a+b) * (a-b)
# Wrong:
i=i+1
submitted +=1
x = x * 2 - 1
hypot2 = x * x + y * y
c = (a + b) * (a - b)

* 在制定关键字参数或者默认参数值的时候，不要在=附近加上空格。 

In [None]:
# Correct:
def complex(real, imag=0.0):
    return magic(r=real, i=imag)
# Wrong:
def complex(real, imag = 0.0):
    return magic(r = real, i = imag)

* 功能型注释应该使用冒号的一般性规则，并且在使用->的时候要在两边加空格。（参考下面的功能注释得到能够多信息） 

In [None]:
# Correct:
def munge(input: AnyStr): ...
def munge() -> PosInt: ...
# Wrong:
def munge(input:AnyStr): ...
def munge()->PosInt: ...

* 当给**有类型备注**的参数赋值的时候，在=两边添加空格（仅针对那种有类型备注和默认值的参数）。

In [None]:
from typing import AnyStr
# Correct:
def munge(sep: AnyStr = None): ...
def munge(input: AnyStr, sep: AnyStr = None, limit=1000): ...
# Wrong:
def munge(input: AnyStr=None): ...
def munge(input: AnyStr, limit = 1000): ...

* 复合语句通常不允许  
Compound statements are generally discouraged  
但一些很短的语句（如单个if，for，while）放在同一行没什么问题

In [None]:
# Correct:
if foo == 'blah':
    do_blah_thing()
do_one()
do_two()
do_three()

# Wrong (Rather not):
if foo == 'blah': do_blah_thing()
do_one(); do_two(); do_three()
for x in lst: total += x
while t < 10: t = delay()

# Wrong (Definately not):
if foo == 'blah': do_blah_thing()
else: do_non_blah_thing()

try: something()
finally: cleanup()

do_one(); do_two(); do_three(long, argument,
                             list, like, this)

if foo == 'blah': one(); two(); three()

## 何时使用",)" When to use trailing commas
trailing commas通常是可选的，除非指定变量为tuple的情况，此时应使用括号包围

In [2]:
a = ('hello')
b = ('world',)
c = '!', # 此时也是tuple，但不推荐
print(type(a),type(b),type(c))

<class 'str'> <class 'tuple'> <class 'tuple'>


trailing commas在版本控制中有用，通常拆分为多行，见下例

In [None]:
# Correct:
FILES = [
    'setup.cfg',
    'tox.ini',
    ] # 方便在后续版本中添加和删除
initialize(FILES,
           error=True,
           )
# Wrong:
FILES = ['setup.cfg', 'tox.ini',]
initialize(FILES, error=True,)

## 注释Comments
* 与代码相矛盾的注释比没有注释还糟，当代码更改时，优先更新对应的注释！   
* 注释应该是完整的句子。如果一个注释是一个短语或句子，它的第一个单词应该大写，除非它是以小写字母开头的标识符(永远不要改变标识符的大小写！)。  
* 如果注释很短，结尾的句号可以省略。块注释一般由完整句子的一个或多个段落组成，并且每句话结束有个句号。  
* 在注释的句号后使用两个空格，除非是注释的最后一句。  
* 确保注释易懂
* 在非英语国家的Python程序员，请使用英文写注释，除非你120%的确信你的代码不会被使用其他语言的人阅读。

### 块注释Block Comments
块注释(这里与docstring区分)通常用来注释紧接其后的代码，因此与其后代码保持相同缩进  
块注释以#和一个空格开始  
块注释中的段落用只含一个#的空行隔开

### 行内注释Inline Comments
有节制地（sparingly）使用行内注释。
行内注释是与代码语句同行的注释。行内注释和代码至少要有两个空格分隔。注释由#和一个空格开始。
事实上，如果状态明显的话，行内注释是不必要的，反而会分散注意力。

In [None]:
# wrong, too obvious
x = x + 1                 # Increment x
# Correct
x = x + 1                 # Compensate for border

### Docstring
Conventions for writing good documentation strings (a.k.a. “docstrings”) are immortalized in [PEP 257](https://peps.python.org/pep-0257/).  
写文档说明是一个好习惯  
要为所有的公共模块，函数，类以及方法编写文档说明。非公共的方法没有必要，但是应该有一个描述方法具体作用的注释。这个注释应该在def那一行之后。  
PEP 257 描述了写出好的文档说明相关的约定。特别需要注意的是，多行文档说明使用的结尾三引号应该自成一行，单行文档则保持一行，例如：  

In [None]:
def foo():
    """Return a foobang

    Optional plotz says to frobnicate the bizbaz first.
    """
    pass
def bar():
    """Return nothing"""
    pass

## 命名规则Naming Conventions
TODO 有点多

## 编程建议Programming Recommendations
* 代码应该用不损害其他Python实现的方式去编写（PyPy，Jython，IronPython，Cython，Psyco 等）。例如不要依赖CPython中的字符串连接语句**a += b**或**a = a + b**，而是用**a.join(b)**来实现，以确保在不同实现中均以线性时间完成。  
* 单例对象进行比较时应始终使用is或is not，永远不要用==  
* 使用 is not 运算符，而不是 not … is 。虽然这两种表达式在功能上完全相同，但前者更易于阅读，所以优先考虑。  
* 始终使用def表达式，而不是用赋值语句将lambda表达式绑定到一个变量。  
* 从Exception继承异常，而不是BaseException。直接继承BaseException的异常适用于几乎不用来捕捉的异常。  
* 适当地使用异常链接。在Python 3里，为了不丢失原始的根源，可以显式指定“raise X from Y”作为替代。

* 使用 ”.startswith() 和 ”.endswith() 代替通过字符串切割的方法去检查前缀和后缀。  
startswith()和endswith()更干净，出错几率更小。比如：
> 推荐: if foo.startswith('bar'):  
糟糕: if foo[:3] == 'bar':

* 对于序列来说（strings，lists，tuples），可以使用空序列为false的情况。  
>正确: if not seq:  
糟糕: if not len(seq):  
更糟: if len(seq)==0:  

* 不要用==和True或False比较  
> 正确: if greeting:  
糟糕: if greeting == True:  
更糟: if greeting is True:  
