+ **Python代码风格**
  1. 缩进
  2. 空格
  3. 行
  4. 空行
  5. 注释
  6. 命名
 
 
 + **高效Python**
   1. 序列解包
   2. 拼接字符串
   3. Python内建函数——zip和enumerate
   4. Lazy if-evaluation
   5. Python的各种推导式
   6. Python内建函数——lambda, map, filter
   7. 查找元素
   8. for循环的优化
   9. 检查相等性的替代方法
   10. 多写函数
   11. 初始化的陷阱
   12. 推荐使用pandas和NumPy

In [1]:
import pandas as pd
import numpy as np

<br/>

# <center>Python Tips</center>
<br/>
<br/>
<br/>
<br/>
<br/>
<br/>
<br/>

##### <center>*李兵*</center>  

# <font color='red'>Main Contents</font>
1. **Style Guide for Python Code**

2. **Effective Python**

3. **Introduction to Jupyter Nbextensions**

# <center><font color='blue'>1. Style Guide for Python Code</font></center>

**主要内容**
1. 缩进
2. 空格
3. 行
4. 空行
5. 注释
6. 命名

Ref: 
1. [PEP 8](https://www.python.org/dev/peps/pep-0008/);
2. [Google开源项目风格指南（Python）](https://zh-google-styleguide.readthedocs.io/en/latest/google-python-styleguide/contents/)

## <font color='green'>1.1 缩进</font>
+ 用4个空格来缩进，不要用tab键来缩进;
+ 对于行连接的情况，可以使用垂直对齐换行或使用4个空格悬挂式缩进.

```py
# Yes
foo = long_func_name(param1, param2,
                     param3, param4)

# No
foo = long_func_name(param1, param2,
    param3, param4)

# Yes
bar = {
    'name': 'Bob',
    'age': 18,
}

# No
bar = {
  'name': 'Bob',
  'age': 18
}
```   

## <font color='green'>1.2 空格</font>
+ 在二元运算符两边各一个空格，比如赋值`=`, 比较(`==`, `<`, `>`, `!=`, `<>`, `<=`, `>=`, `in`, `not in`, `is`, `is not`), 布尔(`and`, `or`, `not`);

```py
# Yes
a = 1
i = i + 1
a < 1

# No
a=1
i=i+1
a<1
```

+ 当`=`用于指示关键字参数或默认参数值时, 不要在其两侧使用空格;

```py
# Yes
def complex(real, imag=.0):
    return magic(r=real, i=imag)

# No
def complex(real, imag = .0):
    return magic(r = real, i = imag)
```

+ 不要用空格来垂直对齐多行间的标记, 因为会增加维护的负担(适用于:, `#`, `=`等);

```py
# Yes
foo = 100  # Comment
long_name = 2  # Comment that should not be aligned

dictionary = {
    'foo': 100,
    'long_name': 2,
}

# No
foo       = 100  # Comment
long_name = 2    # Comment

dictionary = {
    'foo'      : 100,
    'long_name': 2
}
```

+ 不要在逗号, 分号, 冒号前面加空格, 但应该在它们后面加(除了在行尾).

## <font color='green'>1.3 行</font>
+ 每行尽量不超过79个字符;
  + 长的导入模块语句可以除外;
  + 注释里的url可以除外;
  + 注释和文档字符串尽量不超过72个字符.

In [2]:
name = 'libing'

from sklearn.preprocessing import PolynomialFeatures, PowerTransformer, StandardScaler
 
# See details at
# https://zh-google-styleguide.readthedocs.io/en/latest/google-python-styleguide/contents/

+ `()`, `[]`, `{}`可以隐式地实现行连接;
+ 使用反斜杠`\`换行，二元运算符`+` `.`等应出现在行末或长且多个`with`语句.

```py
long_seq = ('This is a long long long'
            'long long long long long string')

with open(os.path.join(DATA_PATH, 'li.txt') as f1, \
     open(os.path.join(DATA_PATH, 'bing.txt'), 'w') as f2:
    f2.write(f1.read())
```

## <font color='green'>1.4 空行</font>
+ 顶级定义之间空两行，如函数和类;
+ 方法定义之间、类定义与第一个方法定义之间空一行;
+ 在函数或方法或代码块中，可以使用空行来分离逻辑.

```py
class ClassName:

    def method_name(self, x):
        pass

    def method_name_2(self, y):
        pass


def function_name():
    pass
```

## <font color='green'>1.5 注释</font>
+ 块注释和行注释;
+ 文档字符串;
+ 在代码中复杂/关键地方，记得写上注释;
+ 注释内容不应该描述代码.

```py
# 假装这一句很复杂、有技巧，看不懂😂，得写一段/句注释
# Block comment, #后空一格
a += 1

# 假装不能一目了然🤦‍♂️，Inline comment, 与代码至少空两格
if a:  # True a not None
```

**文档字符串Docstring**

package、module、function、method中的第一个语句，可以通过`xx.__doc__`被提取。惯例是使用三重引号。


函数必须有docstring，除非：
+ 外部不可见
+ 简单明了
+ 非常短小

In [None]:
print(pd.read_csv.__doc__)

按shift-tab显示文档

## <font color='green'>1.6 命名</font>

|<font size=5>Type</font>|<font size=5>&emsp;Public</font>|<font size=5>&emsp;Private</font>|
| : -- |:--: | --: |
|<font size=5>包&emsp;</font>|<font size=5>&emsp;lower_with_under&emsp;</font>|<font size=5>&emsp;\_low_with_under&emsp;</font>|
|<font size=5>模块</font>|<font size=5>&emsp;lower_with_under&emsp;</font>||
|<font size=5>类</font>|<font size=5>&emsp;CapWords&emsp;</font>|<font size=5>&emsp;\_CapWords</font>&emsp;|
|<font size=5>异常</font>|<font size=5>&emsp;CapWords&emsp;</font>||
|<font size=5>函数</font>|<font size=5>&emsp;lower_with_under()&emsp;</font>|<font size=5>&emsp;\_low_with_under()&emsp;</font>|
|<font size=5>全局/类常量</font>|<font size=5>&emsp;CAPS_WITH_UNDER&emsp;</font>|<font size=5>&emsp;\_CAPS_WITH_UNDER&emsp;</font>|
|<font size=5>全局/类变量</font>|<font size=5>&emsp;lower_with_under&emsp;</font>|<font size=5>&emsp;\_lower_with_under&emsp;</font>|
|<font size=5>实例变量</font>|<font size=5>&emsp;lower_with_under&emsp;</font>|<font size=5>&emsp;\_lower_with_under or \_\_lower_with_under (private)&emsp;</font>|
|<font size=5>方法名</font>|<font size=5>&emsp;lower_with_under()&emsp;</font>|<font size=5>&emsp;\_lower_with_under or \_\_lower_with_under (private)</font>&emsp;|
|<font size=5>函数/方法参数</font>|<font size=5>&emsp;lower_with_under&emsp;</font>||
|<font size=5>局部变量</font>|<font size=5>&emsp;lower_with_under&emsp;</font>||

```py
def func_name():

class SouChe:
    
an_integer = 4

DATA_PATH = '/home/..'
```

# <center><font color='blue'>2. Effective Python</font></center>

## <font color='green'>2.1 解包（Unpack）</font>

```py
a, b = b, a

a, (b, c) = 1, (2, 3)
```

In [4]:
a, *rest = [1, 2, 3]
rest

[2, 3]

In [5]:
a, *rest, c = (1, 2, 3, 4)
rest

[2, 3]

In [6]:
a, _, c = ['da', 2, 'souche']  # 起名真是太难了😢
print(a, c)

da souche


## <font color='green'>2.2 拼接字符串</font>
<br/>

使用`join`而不是`+`连接字符串.

<br/>



In [7]:
string_list = list('abcdefghiklmnopqrstuvwxyz')

In [8]:
%timeit ''.join(string_list)

238 ns ± 9.44 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [9]:
%%timeit 
s = ''
for ele in string_list:
    s += ele

1.22 µs ± 76 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


## <font color='green'>2.3 Python内建函数——zip和enumerate</font>

In [10]:
# 同时遍历两个可迭代的对象
a_list = ['da', 'sou', 'che']
b_tuple = (1, 2, 3)

for a, b in zip(a_list, b_tuple):
    print(a, b)

da 1
sou 2
che 3


In [11]:
# 遍历索引和值
a_list = ['da', 'souc', 'che']
for index, value in enumerate(a_list):
    print(index, value)

0 da
1 souc
2 che


## <font color='green'>2.4 Lazy if-evaluation</font>

```py
if condition:
    pass
```

```py
# No
if complex_condition and other_complex_condition:
    pass

# Yes
cond1 = complex_condition
cond2 = other_complex_condition

if cond1 and cond2:
    pass
```

多个条件时，将不容易满足的条件放在第一个位置，可以节省不必要的计算/判断。

## <font color='green'>2.5 Python的各种推导式</font>

+ 列表推导式
```py
a_list = [1, 2, 3, 4]
[ele ** 2 for ele in a_list if a % 2 == 0]
```

+ 生成器表达式
```py
a_list = [1, 2, 3, 4]
# 如果接下来要loop，这样可以节省内存
(ele **2 for ele in a_list if a % 2 == 0)
```

+ 字典推导式

```py
dict_1 = {'a': 10, 'b': 20}
dict_2 = {v: k for k, v in dict_1.items()}

a_string = list('abcd')
dict_3 = {k: v for v, k in enumerate(a_string)}
```

+ 集合推导式

```py
a_string = ['a', 'is', 'with', 'if', 'file', 'exception']
{len(s) for string in a_string}
```

## <font color='green'>2.6 Python内建函数——lambda, map, filter</font>

In [12]:
def even(x):
    return x%2 == 0

# map应用到整个对象中
list(map(even, range(10)))

[True, False, True, False, True, False, True, False, True, False]

In [13]:
# lambda可以代替一个简单的函数
list(map(lambda x: x%2 == 0, range(10)))

[True, False, True, False, True, False, True, False, True, False]

In [14]:
# filter可以用来过滤
list(filter(lambda x: x%2 == 0, range(10)))

[0, 2, 4, 6, 8]

## <font color='green'>2.7 查找元素</font>

```py
# Yes
'foo' in d:  # d is a dict

x = list(('foo', 'foo', 'bar', 'baz'))
# No
'foo' in x

y = set(('foo', 'foo', 'bar', 'baz'))
# Yes
'foo' in y
```

`'foo' in y`借助了哈希表特性（python中字典和集合以哈希表实现），上面这两个查找性能是不同的。对于list，Python将逐个遍历匹配其中的元素，非常耗时O(N)，而set使用哈希查询可以很快找到O(1).

set的`union`， `intersection`，`difference`操作要比list的迭代要快。因此如果涉及到求list交集，并集或者差的问题可以转换为set来操作.

## <font color='green'>2.8 for循环的优化</font>

+ 对循环的优化所遵循的原则是尽量减少循环过程中的计算量，有多重循环的尽量将内层的计算提到上一层.

```py
a_list, b_list = [...], [...]

# No
for i in range(len(a_list)):
    for j in range(len(b_list)):
        pass

# Yes
a_list_len = len(a_list)
b_list_len = len(b_list)
for i in range(a_list_len):
    for j in range(b_list_len):
        pass
```

## <font color='green'>2.9 检查相等性的替代方法</font>
当不必明确将一个值与`True`、`None`或0作比较时，可以将这个值直接应用到`if`语句中.
```py
# No
if attr == True:
    print("True")

if attr == None:
    print('None')
    
# Yes
if attr:   # 直接检查值
    print('True')

if not attr:   # 检查条件相反
    print('False')

if attr is True:  # 只想值为True
    print('True')

if attr is None:  # 显示检查值为None
    print("None")
```

在上述的条件中加上`()`是多余的。

## <font color='green'>2.10 多写函数</font>
1. 可复用
2. 可以避免全局变量空间变得混乱

```py
# No
param1 = 1.0
param2 = 100.

x = 10

step1 = x * param1
step1 * param2

# Yes
def computation(x, param1=1., param2=100.):
    step1 = x * param1
    return step1 * param2
```

## <font color='green'>2.11 初始化的陷阱</font>
```py
# 使用Python列表的额*操作符来创建一个包含相同不可变元素的列表.
four_nones = [None] * 4
>>>[None, None, None, None]
```

In [15]:
# 列表是可修改的，*将创建一个包含N个指向同一列表的列表
# No
four_lists = [[]] * 4   # four_lists = [[], [], [], []]
four_lists[0].append('Ni')
four_lists

[['Ni'], ['Ni'], ['Ni'], ['Ni']]

In [16]:
four_lists = [[] for _ in range(4)]  # [[], [], [], []]
four_lists[0].append('Ni')
four_lists

[['Ni'], [], [], []]

## <center><font color='green'>2.12 推荐使用**pandas**和**NumPy**</font></center>
<br/>
<br/>

[利用Python进行数据分析](https://seancheney.gitbook.io/python-for-data-analysis-2nd/)

![](https://raw.githubusercontent.com/libingallin/learning-notes/master/figs/22d600040d8af1e5d77f.jpeg)

# <center><font color='blue'>3. Introduction to Jupyter Nbextensions</font></center>

$P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}$

『动态类型一时爽，代码重构火葬场』，说的是：动态语言在初期开发比较爽，但是到后期维护起来比较困难。Python 作为动态语言之一，自然也会有这样的缺点。其实说『火葬场』，也没有那么严重，只要严格的遵守一组规范，也能做到『重构的时候，也一样爽』。
不以规矩不成方圆，规范自然是十分重要的，而在动态语言中，尤其重要（很多人拿Python写脚本，基本是随心所欲地写，自然后期维护困难）。所谓『兵马未动粮草先行』，我们应该在写代码前，就做好充足的 “表面功夫”。