# 簡潔的 Python 程式碼

為提高大家的程式碼品質，我們特別設計了本章節，讀完你會學到：
- 提高你的程式碼易讀性
- 容易維護
- 減少技術債
- 程式碼會朝向 pythonic ，比較優雅

## 1. PEP

Python Enhancement Proposals，規範與定義 Python 的技術規格，讓開發社群有共同遵循的標準。

https://www.python.org/dev/peps/

https://cflin.com/wordpress/603/pep8-python%E7%B7%A8%E7%A2%BC%E8%A6%8F%E7%AF%84%E6%89%8B%E5%86%8A

![image.png](attachment:image.png)

## 2. PEP-8 優點
- 1. 一致性： 程式碼具備一樣的格式，讓閱讀的人可以輕鬆許多。
- 2. 程式品質： 閱讀結構化的程式碼，可以更快找到 bug 的地方。

## 3. 範例說明

參考資料：https://www.python.org/dev/peps/pep-0008/

### 縮排
均使用4個空白

### 斷行

正確案例

- 同左括號對齊
  ```
  foo = long_function_name(var_one, var_two,
                           var_three, var_four)

  ```
- 垂直縮排續行多縮排一級以同其他代碼區別
  ```
  def long_function_name(
          var_one, var_two, var_three,
          var_four):
      print(var_one)
  ```
- 垂直縮排需要多縮進一級
  ```
  foo = long_function_name(
      var_one, var_two,
      var_three, var_four)
  ```
  
錯誤示範

- 垂直縮排首行不能有引數
  ```
  foo = long_function_name(var_one, var_two,
    var_three, var_four)
  ``` 
- 垂直縮排，首行不能有引數；若後面還有程式碼，斷行要添加一層縮排，讓它可以跟其他程式碼區隔
  ```
  def long_function_name(
    var_one, var_two, var_three,
    var_four):
    print(var_one)
  ```

### if 語句
PEP-8 沒有明確規定，以下都可以

In [None]:
# 不採用額外縮排
if (this_is_one_thing and
    that_is_another_thing):
    do_something()

# 增加一行註解，在編輯器中顯示時能有所區分
if (this_is_one_thing and
    that_is_another_thing):
    # 註解隔開
    do_something()

# 在條件語句的續行增加一級縮排
if (this_is_one_thing
        and that_is_another_thing):
    do_something()

### 多行結束小括號、中括號、大括號

In [None]:
my_list = [
    1, 2, 3,
    4, 5, 6,
    ]
result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
    )

# 和第一行的第一個字符對齊
my_list = [
    1, 2, 3,
    4, 5, 6,
]
result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
)

# 上面兩種排版的方式都可以

### tab還是空白?
python 3 不允許混用 tab 和 空白來縮排，空白鍵是比較堆鍵的縮排方式

### 每行字符數
每行不超過80個字符，對於較少結構限制的長文本（如 docstrings 或註釋），行長應限制為 72 個字符。

若團隊成員都同意使用長行，則可以增加到不超過100個字符，但是 docstings和註釋還是都要72個字符

建議第一種，除非第一種無法採用
- 利用 Python 小括號、中括號和大括號中的隱式續行
- 使用反斜槓，例如，with 語句不能採用隱式續行
```
with open('/path/to/some/file/you/want/to/read') as file_1, \
     open('/path/to/some/file/being/written', 'w') as file_2:
    file_2.write(file_1.read())
```

### 運算符號的位置

```
income = (gross_wages
          + taxable_interest
          + (dividends - qualified_dividends)
          - ira_deduction
          - student_loan_interest)
```

### 空行方式

In [3]:
# 在 class 定義用兩個空行
class A():
    pass


class B():
    pass

# 在方法定義用一個空行
class A():
    def a():
        pass

    def b():
        pass

### import

宣告位置
- 程式碼文件的開頭
- module 註解和文檔字符串之後
- 全局變數 (globals) 和 常數 (constants) 宣告之前

順序
- 用空行隔開
- 標準庫 imports
- 相關第三方 imports
- 本地應用/庫的特定 imports


避免使用 from module import *

In [None]:
# 每行 import 只導入一個模組
# 正確:
import os
import sys
# 錯誤：
import sys, os
# 正確：同一模組中的內容可以在同一行導入
from subprocess import Popen, PIPE

### 字符串引用
- 不混用單引號 或 雙引號
- 三引號只使用雙引號（即是 """ 而不是 ''' ）

### 表達式和語句中的空格

避免用太多的空白，通常是逗點或冒號後空白一格，最後則不要有空格

In [None]:
## Good
hello(var1[1], {var2: 2})

## Bad
hello( var1[ 1 ], { var2: 2 } )

In [None]:
# , ; : 之前不要有空格，如：

# 正確：
if x == 4: print x, y; x, y = y, x

# 錯誤：
if x == 4 : print x , y ; x , y = y , x

In [None]:
# 以下是正確的風格：
ham[1:9], ham[1:9:3], ham[:9:3], ham[1::3], ham[1:9:]
ham[lower:upper], ham[lower:upper:], ham[lower::step]
ham[lower+offset : upper+offset]
ham[: upper_fn(x) : step_fn(x)], ham[:: step_fn(x)]
ham[lower + offset : upper + offset]

# 以下是錯誤的風格：
ham[lower + offset:upper + offset]
ham[1: 9], ham[1 :9], ham[1:9 :3]
ham[lower : : upper]
ham[ : upper]

In [None]:
# 函數調用的 () 及索引的 [] 前不要加空格，如：

# 正確風格：
spam(1)
dct['key'] = lst[index]

# 錯誤風格：
spam (1)
dct ['key'] = lst [index]

In [None]:
#不要在賦值語句中加入額外的空格來對齊，如：

# 正確的風格：
x = 1
y = 2
long_variable = 3

# 錯誤的風格:
# 為了對齊下面變數而多加上很多空白
x             = 1
y             = 2
long_variable = 3

In [None]:
# 運算符
# 不同優先級的運算符，優先級較低的運算符增加空白，且不超過 1 個空格
# 兩側的空白數量一樣

## GOOD
i = i + 1
submitted += 1
x = x*2 - 1
hypot2 = x*x + y*y
c = (a+b) * (a-b)

## BAD
i=i+1
submitted +=1
x = x * 2 - 1
hypot2 = x * x + y * y
c = (a + b) * (a - b)

In [None]:
# 關鍵字參數
## GOOD
def complex(real, imag=0.0):
    return magic(r=real, i=imag)
## BAD
def complex(real, imag = 0.0):
    return magic(r = real, i = imag)

### 註解

- 和代碼矛盾的註解還不如沒有
- 當代碼有改動時，優先更改註解使其保持最新
- 註解應該是完整的多個句子
- 註解是一個短語或一個句子，其首字母應該大寫
- 除非是小寫字母開頭的 identifier（永遠不要更改 identifier 的大小寫）
- 塊註解很短，結束的句號可以被忽略。
- 一塊註解通常由一段或幾段完整的句子組成，每個句子都應該以句號結束
- 來自非英語國家的 Python 程序員們，請使用英文來寫註解
  除非你 120% 確定你的代碼永遠不會被不懂你所用語言的人閱讀到

#### 塊註解
- 寫在對應代碼之前
- 和對應代碼有同樣的縮排
- 以 # 和一個空格開頭（除非該文本是在註解內縮排對齊的）
- 空行用只含有單個 # 的一行隔開

In [None]:
# 這是一個註解
#
# 這是第二個註解

#### 行內註解
行內註解是和代碼語句寫在一行內的註解
- 儘量少用
- 和代碼語句之間有 2 個空格的間隔
- 以 # 和一個空格開始

In [None]:
# 這個非必要，看程式碼也會懂
x = x + 1                 # Increment x

# 這個有意義
x = x + 1                 # fix this number becasuse of ...

#### 文檔字符串
- 所有的 public module，function，class 和 method 都應有 doc strings
- 非公共方法，文檔字符串不是必要的，但應留有註解說明功能
- 該註解應當出現在 def 的下一行
- 以單行 """ 結尾，不能有其他字符
- 只有單行的， """ 應寫在同一行

In [None]:
def foo(var1: str, var2: int) -> str:
    """
    Notes: this is my function, it will do ...
    Args:
        var1:  
        var2:
    Returns:
        result:
    """
    return result

### 如何查詢 docstring

- 使用 help
- 使用 doc
- 按 shift + tab

In [5]:
import pandas
help(pandas)

Help on package pandas:

NAME
    pandas

DESCRIPTION
    pandas - a powerful data analysis and manipulation library for Python
    
    **pandas** is a Python package providing fast, flexible, and expressive data
    structures designed to make working with "relational" or "labeled" data both
    easy and intuitive. It aims to be the fundamental high-level building block for
    doing practical, **real world** data analysis in Python. Additionally, it has
    the broader goal of becoming **the most powerful and flexible open source data
    analysis / manipulation tool available in any language**. It is already well on
    its way toward this goal.
    
    Main Features
    -------------
    Here are just a few of the things that pandas does well:
    
      - Easy handling of missing data in floating point as well as non-floating
        point data.
      - Size mutability: columns can be inserted and deleted from DataFrame and
        higher dimensional objects
      - Automatic an

In [6]:
print(pandas.__doc__)


pandas - a powerful data analysis and manipulation library for Python

**pandas** is a Python package providing fast, flexible, and expressive data
structures designed to make working with "relational" or "labeled" data both
easy and intuitive. It aims to be the fundamental high-level building block for
doing practical, **real world** data analysis in Python. Additionally, it has
the broader goal of becoming **the most powerful and flexible open source data
analysis / manipulation tool available in any language**. It is already well on
its way toward this goal.

Main Features
-------------
Here are just a few of the things that pandas does well:

  - Easy handling of missing data in floating point as well as non-floating
    point data.
  - Size mutability: columns can be inserted and deleted from DataFrame and
    higher dimensional objects
  - Automatic and explicit data alignment: objects can be explicitly aligned
    to a set of labels, or the user can simply ignore the labels and

![image5.png](attachment:image.png)

### 命名方式

沒有推薦的風格，但是別人要能從你的程式碼中看出你用的是什麽風格，常用的風格如下：

- b 單個小寫字母
- B 單個大寫字母
- lowercase
- lower_case_with_underscores
- UPPERCASE
- UPPER_CASE_WITH_UNDERSCORES
- CapitalizedWords, 這種風格中，對於縮寫詞應全部用大寫，如
  HTTPServerError 比 HttpServerError 好
- mixedCase
  Capitalized_Words_With_Underscores，這個太醜，不要用這種！
- st_mode、st_mtime 等前綴，一般是系統接口返回，如果自己寫的程式碼不推薦用這種
- _single_leading_underscore : 弱 “內部使用” 指示器，這種對象用 from M import * 不會被導入
- single_trailing_underscore_ : 可以用來和 Python 關鍵詞進行區分，如 Tkinter.Toplevel(master, class_=’ClassName’)
- \__double_leading_underscore : 命名一個類屬性時，可以進行命名矯正，例如 class FooBar 內的 \__boo 會變成 _FooBar\__boo
- double_leading_and_trailing_underscore : “magic” 對象，不要自己發明這種對象

### 命名習慣
- 避免使用數字和英文不容易區分: 像是小寫 l，大寫 O 或大寫 I
- 類別名：用 CapWords 風格，e.g. CaptainAmerica
- 異常名：用 CapWords 風格，一般應該有 Error 後綴，e.g. KeyError
- 函數名：應該用全部用小寫，單詞間可以用 _ 分隔，如 my_func，不推薦用 mixedCase 風格
- 函數和方法的參數：實例方法的第一個參數用 self, 類別方法的第一個參數用 cls，如果參數與關鍵字衝突，在參數名後加 _ 後綴，如 class_
- 實例變數和方法： 用小寫字符和 _, 非公開的實例變數和方法用一個 _ 做前綴; 避免與子類別中的名字衝突，類的變數可用兩個 _ 作前綴，例如
  class FooBar 內的 \__boo 會變成只能通過 FooBar._FooBar\__boo 讀取
- 常數：全部大寫，可用 _ 分隔，如 MAX_OVERFLOW、TOTAL

### 設計建議
- 字符串連接不要用 a += b 或者 a = a + b, 用 “.join(), 後者性能更好
- 跟 None 的比較用 is 和 is not，不要用 ==
- 如果你想判斷 if x is not None, 不要縮寫成 if x 
- 把 not 放在 is 後面

  (O) if foo is not None
  
  (X) if not foo is None，前者更加易讀
  
- 宣告 fucntion:總是使用 def，debug 訊息較為明確

  (O) def f(x): return 2*x
  
  (X) f = lambda x: 2*x
 
- Exception
  - 清楚明白什麼錯誤該怎麼處理
  
    (1) 盡量可以的指明異常名，如：
    ```
    try:
        import platform_specific_module
    except ImportError:
        platform_specific_module = None
    ```
    
    (2) 避免使用無異常名的 except: 語句，它會捕獲全部的異常（如 Ctrl C）。
    ```
    try:
        process_data()
    except Exception as exc:
        raise DataProcessingFailedError(str(exc))

    ```   
  - try/except 儘可能簡單明瞭
  
    (1) 正確方式
    ```
    try:
        value = collection[key]
    except KeyError:
        return key_not_found(key)
    else:
        return handle_value(value)
        
    ```
    (2) 錯誤方式
    ```
    try:
        # Too broad!
        return handle_value(collection[key])
    except KeyError:
        # Will also catch KeyError raised by handle_value()
        return key_not_found(key)
    ```
- 儘量使用 with 呼叫 local resource
  - 像是讀寫檔，確保即時清理，try/finally 也是可以使用
  - 要明確了解 with 要關閉的東西是什麼
  
  (1)正確方式
  ```
  with conn.begin_transaction():
    do_stuff_in_transaction(conn)
  ```
  
  (2)錯誤方式
  ```
  with conn:
    do_stuff_in_transaction(conn)
  ```

- 沒有值也需要 return None
  - 正確方式
    ```
    def foo(x):
        if x >= 0:
            return math.sqrt(x)
        else:
            return None

    def bar(x):
        if x < 0:
            return None
        return math.sqrt(x)
    ```
  - 錯誤方式
    ```
    def foo(x):
        if x >= 0:
            return math.sqrt(x)

    def bar(x):
        if x < 0:
            return
        return math.sqrt(x)
    ```
- 字串
  - 使用 “.startswith() 和 “.endswidth() 而不用 slicing 來檢查前綴和後綴：
  
    正確：
    
    ```
    if foo.startswith(‘bar’):
    ```
    
    錯誤：
    ```
    if foo[:3] == ‘bar’:
    ```
  - 判斷對象的類型用 isinstance 而不直接 type 比較，如：
    
    正確：
    ```
    if isinstance(obj, int):
    ```
    
    錯誤:
    ```
    if type(obj) is type(1):
    ```
  - 對序列是否空的判斷不用 len
  
    正確：
    ```
    if not seq:
    if seq:
    ```
    
    錯誤:
    ```
    if len(seq):
    if not len(seq):
    ```   
  - 布林值的判斷:
    
    正確：
    ```
    if greeting:
    ```
    
    錯誤:
    ```
    if greeting == True:
    if greeting is True:
    ```   

## 4. 好用套件

### autopep8

autopep8 是一個開源的命令行工具，它能夠將 Python 代碼自動格式化為 PEP8 風格。autopep8 使用 pycodestyle 工具來確定代碼中哪一部分需要被格式化，修復這部分問題的 pycodestyle 工具版。 autopep8 製造也是一個 Python 語言寫寫的工具，因此，我們可以直接使用 pip 進行：
```
pip install autopep8
```

原本的程式碼
```
import os, sys  
 
def main():  
    print [item for item in os.listdir('.') if item.endswith('.py')];  
    print (sys.version)  
 
if __name__ == '__main__':  
    main()
```

更改後
```
autopep8 test01.py
```
![image1.png](attachment:image.png)

如果沒有 --in-place，則不會覆蓋檔案

```
autopep8 --in-place test01.py
```

#### 課堂練習
請自己利用 autopep8 執行看看 test02.py

### flake8
Flake8是由Python官方發布的輔助檢測Python代碼是否規範的工具，相對於當前熱比較高的Pylint，Flake8檢查規則靈活，支持集成額外插件，擴展性強。

```
pip install autopep8
```
實際使用看看
![image2.png](attachment:image.png)

### pylint
為您的程式碼品質打上分數!!
pylint是一個Python代碼風格的檢查工具, 它依據的標準是 PEP8。

```
pip install pylint
```
實際使用看看
![image3.png](attachment:image.png)