<p style="text-align:center">
    <a href="https://nbviewer.jupyter.org/github/twMr7/Python-Machine-Learning/blob/master/03-Syntax_Overview_2.ipynb">
        Open In Jupyter nbviewer
        <img style="float: center;" src="https://nbviewer.jupyter.org/static/img/nav_logo.svg" width="120" />
    </a>
</p>

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/twMr7/Python-Machine-Learning/blob/master/03-Syntax_Overview_2.ipynb)

#  3. 語法概要（下） Syntax Overview 2

本章節介紹 Python 程式語言常見的語法規則。

+ [**3.1 陳述句（Statements）**](#statements)
+ [**3.2 迴圈及流程控制（Loops and Control flow）**](#loops-control-flow)
+ [**3.3 函式（Functions）**](#functions)


<a id="statements"></a>

## 3.1 陳述句 Statements

+ 以換行結束一個陳述句。
+ 需要跨越多行的陳述句，可以在換行之前用反斜線 **‘\\’** 字元結束。
+ 需要跨越多行的陳述句，若述句中有成對出現的大、中、小括號，可以在第一個括號 **‘{’**、**‘[’**、**‘(’** 尚未用對應的第二個括號關閉前換行。
+ 多個簡單述句可以寫在同一行，述句間使用分號 **‘;’** 字元分隔。

In [1]:
# 兩個指派陳述句
a = 'good'
b = 'bad'

In [2]:
# 這是省略了 tuple () 括號的單一陳述句
a, b = 'good', 'bad'

In [3]:
# 這是跨越兩行的單一陳述句
a, b = 'good',\
       'bad'

In [4]:
# 這也是跨越兩行的單一陳述句
a, b = ('good2',
        'bad2')

In [5]:
# 這是寫在同一行的兩個陳述句
a = 'good'; b = 'bad'

### § 命名原則

以下原則適用於變數、函式、類別、類別方法、類別屬性等命名。

+ 名字一定只能用底線 **‘_’** 或字母開始，後面則可接底線、字母、或數字。
+ 有區分字母大小寫，例如： speed 和 Speed 是兩個不同的名字。
+ 名字不能使用程式語言本身的保留字，例如： class, True, break, ... 等。

以下慣例不是強制要求的原則，但實際一般設計都是會遵循這樣的原則。

+ 避免使用開始及結束都有兩個底線的名字，如： `__name__`，這通常是 Python 系統本身的定義在使用的。 
+ 兩個底線開始的名字，如： `__x`，定義在類別中代表是該類別私有（private）的。
+ 一個底線開始的名字，如： `_x`，不會被 `from module import *` 這樣的述句 import。
+ 避免使用單一底線 `_` 這個名字，因為這是在互動式運算時，Python 用來儲存前一次運算結果的。

### § 擴增指派 Augmented Assignment

2.2 節中列出的算數運算子，除了 NOT **‘~’** 是一元運算子（uniary operator）以外，其他的運算子都是二元運算子（binary operator）。 針對兩個運算元（operand）的二元運算，常見將運算結果直接指派給其中一個運算元的同一個變數，例如：
```
x = x + y
```
這樣的指派陳述可以使用擴增的述句來取代：
```
x += y
```
視不同的資料類型而定，這樣的擴增述句有時也隱含著就地變更的最佳化處理。 


In [6]:
x, y = 3, 5
x -= 1; y **= x
print('x =', x, ', y =', y)

x = 2 , y = 25


### § 延伸可迭代卸載 Extended Iterable Unpacking

2.4 節中介紹過一般的卸載，任何序列或可迭代（iterable）物件的值可以直接指派給一個變數名字的序列，只要對應的元素數量是一樣的就可以。 基本的語法如：
```
a, b, c, d = [1, 2, 3, 4]
```
Python 提供了延伸的語法，在變數名字前加上前置星號 **‘\*’** ，就允許等號左邊的變數數量可任意調整：

| 延伸可迭代卸載             | 結果                      |
|----------------------------|---------------------------|
| `a, *b = [1, 2, 3, 4]`     | a = 1, b = [2, 3, 4]      |
| `a, *b, c = [1, 2, 3, 4]`  | a = 1, b = [2, 3], c = 4  |
| `*a, b = [1, 2, 3, 4]`     | a = [1, 2, 3], b = 4      |


In [7]:
# range 是可迭代物件，一樣適用延伸語法的卸載
x, *y = range(10)
x, y

(0, [1, 2, 3, 4, 5, 6, 7, 8, 9])

### § 刪除物件 del 述句

`del` 述句可以用來刪除變數、物件、物件屬性、序列的元素、序列的片段等。

In [8]:
# 刪除序列片段元素
L = list(range(10))
print('原來 L =', L)
del L[:10:2]
print('刪除某元素後 L =', L)

原來 L = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
刪除某元素後 L = [1, 3, 5, 7, 9]


In [9]:
# 刪除變數（及物件）
del L
print(L)

NameError: name 'L' is not defined

### § 斷言 assert 述句

`assert` 主要用於除錯目的。 程式碼的組織，通常會依據功能切割成不同的小區塊。 每個區塊的運算或多或少會假設某些前提，這些前提可能是在其他區塊已經處理過的結果，可能是系統必需要提供的資源，而在滿足前提的狀況下才得以繼續完成運算。

`assert(條件)` 就是用來檢查這樣必要滿足的前提條件；若滿足斷言，程式繼續執行；若不滿足斷言條件，Python 會發出 AssertionError 的錯誤，然後中斷執行。

In [10]:
# 斷言序列長度一定滿足某個數量
L = list(range(10))
assert(len(L) == 10)

### § 區塊 Blocks

Python 程式的語法中，區塊的程式碼使用 ***space*** 或 ***tab*** 縮排的層次來區隔不同執行條件的陳述句。 以下列的 `if` 條件述句為例，所有在 `x > y` 條件成立才會執行的程式區塊，都同樣放在4個 spaces（預設等於1個tab）的第一層縮排裡。
```
if x > y:
    z = x - y
    x = x + y
```
這樣的區塊陳述式，都會有一個以冒號 **‘：’** 結尾的區塊標頭陳述式。 如上例中的 `if x > y:`。 若需要巢狀的區塊陳述式，可以透過增加縮排的層次來達成。

### § 文件字串 Documentation string

除了前置 **‘#’** 符號用來註解外，Python 另外支援連續三個單引號或雙引號的區塊性文字註解。這樣的區塊性文字註解，若置於模組檔案、類別、函式、的最前面，稱為 ***docstrings***（其實這才是這語法設計的本意），會被儲存於該物件的 `__doc__` 屬性中。

<a id="loops-control-flow"></a>

## 3.2 迴圈及流程控制 Loops and Control flow

對於一般陳述句，Python 會一行一行往下執行，直到碰到改變流程的陳述句：

+ `if-elif-else`： 條件陳述式，選擇性執行。
+ `while-else`： 條件式迴圈，迭代執行。
+ `for-else`： 序列式迴圈，迭代執行。
+ `pass`： 佔位述句。
+ `break`： 中斷。
+ `continue`： 繼續。
+ `try-except-finally`： 例外處理。
+ `raise`： 觸發例外狀況。

### § if-elif-else 條件陳述式

`if-elif-else` 條件陳述式由一個 `if` 邏輯測試條件，中間可有可無的 `elif` 測試條件，以及最後也是可有可無的 `else` 條件所組成。 每個條件都有對應的陳述式區塊，在條件測試為 True 時會被執行。 一般的形式像：
```
if test1:
    statements1
elif test2:
    statements2
else:
    statements3
```

簡單的 if-else 指派陳述如：
```
if test:
    x = a
else:
    x = b
```
可以簡化成一行**三元運算**的陳述句：
```
x = a if test else b
```


In [11]:
a, b = 'good', 'bad'
# 試著改變 x = 'good', 或 x = 'bad' 看看條件測試的結果
x = 'excellent'
#x = 'good'
#x = 'bad'
if x == a:
    print('x is also good')
elif x == b:
    print('x is bad')
else:
    print('neither good nor bad, x is {}'.format(x))

neither good nor bad, x is excellent


In [12]:
# 三元運算陳述句
print(a if x != 'bad' else b)

good


### § while-else  條件式迴圈

`while` 迴圈包含了一個標頭的邏輯條件測試式，一個或多個縮排的區塊陳述式；以及一個可有可無的 `else` 條件，當迴圈不是被 `break` 離開的時候會被執行。
```
while test:
    statements
else:
    loop_not_break_statements
```


In [13]:
# 一個一個字元複製直到字串完全相等
x = 'excellent'
e = ''
while e != x:
    e += x[len(e)]

print(e)

excellent


In [14]:
# 註： Python 的空字串會被視為是其他字串的子字串
while e in x:
    print('"{}"'.format(e))
    if len(e) > 1:
        e = e[:-1]
    elif len(e) == 1:
        # 試看看 e = '0' 和 e = '' 的結果有甚麼不同？
        e = '0'
    else:
        break
else:
    print('exit while loop without break')

print('e =', e)

"excellent"
"excellen"
"excelle"
"excell"
"excel"
"exce"
"exc"
"ex"
"e"
exit while loop without break
e = 0


### § for-else  序列式迴圈

`for` 迴圈是一個通用的迭代器（iterator），可以用來走訪任何***序列容器的元素***或***可迭代（iterable）物件***。 `for` 迴圈區塊標頭從要走訪的 iterable_object 中循序指派內容物參考到 item，然後針對每個 item 重複執行區塊中的陳述句。
```
for item in iterable_object:
    statements
else:
    statements
```

於 while-else 相同，`for` 後面接著的 `else` 條件也是可有可無，當迴圈不是被 `break` 離開的時候會被執行。

In [15]:
for c in x:
    print(c)

e
x
c
e
l
l
e
n
t


In [16]:
for c in x:
    # 試看看在 '0123456789' 字串中加入任意一個 'e', 'x', 'c', 'l', 'n', 't' 的字元，結果有甚麼不同？
    if c not in '0123456789l':
        print(c)
    else:
        break
else:
    print('all elements in x are iterated without break')

e
x
c
e


### § pass 佔位述句

什麼事都沒作，通常只是為了暫時滿足語法規則，用來佔個位置的述句。 
```
while True:
    pass
```

In [17]:
# 沒作甚麼事，單純占用 CPU 時間的迴圈
for i in range(2**25):
    pass

### § break  中斷

跳離最近的 `for` 或 `while` 迴圈，以及與其相伴的 `else` 區塊（如果有的話）。

In [18]:
for i in range(10):
    if i > 5: break
    print(i)

0
1
2
3
4
5


### § continue 繼續

在迴圈中出現時，忽略以下所有述句，回到迴圈標頭繼續下一輪迴圈。

In [19]:
n = list(range(10))
for i in n:
    if i < 5: continue
    print(i)

5
6
7
8
9


### § try-except-finally 例外處理

程式時若發生非預期的例外狀況，Python會中斷執行並發出錯誤訊息。 若要避免非預期的程式中斷執行，可以將可能會出現錯誤的程式碼包在 `try` 區塊中，然後指定 `except` 例外處理子句。 如果沒有錯誤發生，則 `else`（optional）區塊的陳述會被執行。 不管錯誤有沒有發生，`finally` 子句永遠會被執行，用來處理善後事宜。基本的句型在 `try` 之後至少要有一個 `except` 或 `finally`。
```
try:
    statements
except type:
    statements
```
，或
```
try:
    statements
finally:
    statements
```
，或完整述句
```
try:
    statements
except:
    statements
else:
    statements
finally:
    statements
```

`except` 子句後若沒有指定例外的類型，則任何未被處理的例外都會在此處理。

In [20]:
# 注意： 為了展示 try-except-finally 語法，Divide() 函式回傳型態不一致，但這不是好的函式寫法
def Divide(x, y):
    try:
        result = x / y
    except ZeroDivisionError:
        return 'divided by zero!'
    else:
        return result
    finally:
        print('executing finally clause')

print(Divide(6, 3))
print(Divide(6, 0))

executing finally clause
2.0
executing finally clause
divided by zero!


### § raise 觸發例外狀況

使用 `raise` 述句主動觸發例外狀況。

In [21]:
# 改寫上面的範例，加入任意主動觸發例外，並新增處理任何尚未處理的例外的子句。
def Divide(x, y):
    try:
        #result = x / y
        raise IndexError
    except ZeroDivisionError:
        return 'divided by zero!'
    except:
        print('some exception raised')
    else:
        return result
    finally:
        print('executing finally clause')

print(Divide(6, 3))

some exception raised
executing finally clause
None


<a id="functions"></a>

## 3.3 函式 Functions

初學者最直覺也最常用的程式結構，就是一行一行程式碼循序往下寫直到結束。 這種寫法用來解決一般稍微複雜的問題時，就很容易遇到難以維護或可讀性不佳的問題。 工程上我們常會採用一種簡化問題的技巧： Divide and Conquer，這樣的手法在軟體程式設計的領域到處可見。 在程式中使用函式，是將大問題拆解成小問題的一個基本步驟。 所以經常可以看到一個大型一點的程式，內容的結構其實就是一堆小工具函式的集合。 Python 中用來定義函式的關鍵保留字如下：

+ `def`： 函式定義。
+ `return`： 函式運算結果返回。
+ `lambda`： 匿名函式。
+ `yield`： 定義生成函式的返回結果。


### § def  函式定義

函式以 `def` 關鍵字及指定的函式名字起始，後面使用小括號接著函式運算需要的所有參數。 區塊陳述包含函式所需的運算，運算結果的值使用 `return` 述句返回，若未明確指定，預設返回值為 `None`。

```
def name(arg,..., arg=value):
    statements
    return value
```

| 可用參數定義格式 | 格式說明                                  |
|------------------|-------------------------------------------|
| `arg`            | 一般參數，以位置或名字匹配                |
| `arg=value`      | 同一般參數，明確指定預設值                |


**函式呼叫**
```
name(arg,... arg=value,... *iterable_arg, **dict_arg)
```

| 可用參數定義格式 | 格式說明                                       |
|------------------|------------------------------------------------|
| `arg`            | 以位置匹配傳遞參數                             |
| `arg=value`      | 以名字匹配傳遞參數                             |
| `*iterable_arg`  | 以序列或可迭代物件傳遞，並根據位置順序卸載匹配 |
| `**dict_arg`     | 以 dict 傳遞，並根據 key 卸載匹配              |


In [22]:
# 定義一個函式 Add(): 印出兩個輸入參數相加的結果
def Add(a, b, c):
    print(a + b - c)

# 一般參數傳遞
Add(2, 3, 4)

# 位置及名字匹配
Add(2, c=4, b=3)

# 序列卸載匹配
larg = [2, 3, 4]
Add(*larg)

# 可迭代物件卸載匹配
Add(*range(2,5))

# dict 卸載匹配
darg = {'a':2, 'b':3, 'c':4}
Add(**darg)

1
1
1
1
1


In [23]:
# 定義一個函式 Multiply(): 返回兩個輸入參數相乘的結果
def Multiply(a, b):
    return a * b

print(Multiply(2, 3))

6


### § 參數傳遞的基本認識

1. 參數的傳遞，是物件的參考指派給了函式的 local 變數名字； 意即函式***參數所指向物件與呼叫端是同一物件***。
2. 在函式內，重新指派新的物件參考給參數變數名字，不會影響呼叫端。
3. 如果參數物件是可就地變更的類別，在函式內異動物件內容，呼叫端也會跟着改變。

在設計程式時，建議遵循以下原則：
1. 在函式中，避免更改參數物件的元素內容。
2. 如果有需要返回運算值覆蓋原物件內容，請利用 `return` 返回多個值。

In [24]:
# 2. 指派新物件不影響呼叫端
def f(a):
    a = 9

b = 5
f(b)
print(b)

5


In [25]:
# 3. 可就地變更的類別，兩邊內容是同一份
def change(a, b):
    a = 9
    b[0] = 'changed'

x = 1
y = [2, 3]
change(x, y)
x, y

(1, ['changed', 3])

In [26]:
# 返回多個值，明確覆寫指定物件
def multiple(a, b):
    a = 9
    b = 10
    c = [4, 5, 6]
    return b, c 

x = 1
y = [2, 3]
x, y = multiple(x, y)
x, y

(10, [4, 5, 6])

### § lambda 匿名函式

`lambda` 通常用來定義非常簡短的函式，以及需要 callback 函式的參數傳遞。 基本形式為：
```
lambda arg1, ..., argN: expression
```
`lambda` 匿名函式的內容是單一運算，而不是區塊陳述句，設計的原意本來就不是用來執行複雜的運算。

In [27]:
# 匿名函式沒有名字，但匿名函式的物件還是可以把參考指定給變數
func_add = lambda x, y: x + y
func_multiply = lambda x, y: x * y

print(func_add(2 ,3))
print(func_multiply(2, 3))

5
6


In [28]:
# lambda 常見用來傳遞函式物件，當成 callback function 
def calc(op_func, a, b):
    return op_func(a, b)

print(calc(func_add, 2, 3))
print(calc(func_multiply, 2, 3))

5
6


### § Generator 生成函式

一般函式用 `return` 返回一次性的運算結果，相同的輸入參數可以預期得到相同的運算結果。 生成函式返回的是一個迭代子（iterator），使用 `yield` 返回每次迭代運算的結果。 生成函式的呼叫要使用 `for` 迴圈或內建函式 `next()`。
```
def name(arg,..., arg=value):
    statements
    yield value
```

In [29]:
# 小於某數的偶數數列生成函式
def evenrange(n):
    for i in range((n + 1) // 2):
        yield i * 2


In [30]:
# 在 for 迴圈中使用
for ei in evenrange(7):
    print(ei, end=', ')

0, 2, 4, 6, 

In [31]:
# 使用內建函式 next()
evengen = evenrange(7)
print(next(evengen), ', ', next(evengen), ', ', next(evengen), ', ', next(evengen))

# 超過數列盡頭會發出 StopIteration 的例外狀況
print(next(evengen))

0 ,  2 ,  4 ,  6


StopIteration: 

### § Generator Expressions 生成運算表示

生成運算表示使用小括號將一個緊接著 `for` 的運算表示句包起來，對於序列容器或可迭代物件 S 進行操作，返回一個迭代子（iterator）。

| 生成運算表示                      | 說明                                  |
|---------------------------------  |---------------------------------------|
| `(運算表示句 for x in S)`         | 針對每個 S 的成員 x 做運算            |
| `(運算表示句 for x in S if 條件)` | 針對每個***符合條件***的成員 x 做運算 |

當生成運算表示用在函式呼叫的參數，而且只有一個參數時，括號可以省略。

In [32]:
# 小於某數的奇數數數列生成運算表示
n = 7
oddgen = (i * 2 + 1 for i in range((n + 1) // 2))

print(oddgen)
list(oddgen)

<generator object <genexpr> at 0x000001A609DA12B0>


[1, 3, 5, 7]

In [33]:
# 生成運算表示直接使用在函式參數中
list(i * 2 + 1 for i in range((n + 1) // 2))

[1, 3, 5, 7]