# Python 的 50+ 練習：資料科學學習手冊

> 使用函數組織程式碼

[數據交點](https://www.datainpoint.com/) | 郭耀仁 <yaojenkuo@datainpoint.com>

## 這個章節會登場的保留字與函數

- `def` 保留字。
- `return` 保留字。

## 組織程式碼的機制

## 什麼是組織程式碼？

面對不同目的以及應用場景，我們會有組織程式碼的需求，簡單來說，是希望程式碼可以簡潔且有效率地完成任務。

## 組織程式碼希望達到的目標最主要有兩個：

1. 提升程式碼的「可利用性」。
2. 減少程式碼的「重複」。

## Python 提供三種機制供使用者組織程式碼

視應用範疇由小到大依序為：

- 函數（Function）
- 類別（Class）
- 模組/套件（Module/Library）

## 如何理解程式碼組織機制

- 數行程式碼可以組織為一個函數。
- 數個函數可以組織為一個類別。
- 數個類別可以組織為一個模組。
- 數個模組可以組織為一個功能更多的模組。

## 程式碼，組織！

![](https://media.giphy.com/media/LOFT5Jd31ON1b5kLtP/giphy.gif)

來源：<https://gph.is/g/4bWWoxv>

## 自行定義函數

## 什麼是函數

一段被賦予名稱的程式碼，能夠完成某一個文字處理或者數值計算任務，使用（呼叫）某個函數之前，必須先確定這個函數在執行的範疇中已經被定義妥善。

## 「哈囉世界」Hello, World!

In [1]:
print("Hello, World!")

Hello, World!


## 「哈囉世界」中所使用的 `print` 是什麼？

- `print` 是 Python 的「內建函數」。
- 「內建」所指的意思是不需要先行「定義」就可以使用的函數。
- Python 的內建函數：<https://docs.python.org/3/library/functions.html>

## 一個函數由四個元件組成

1. 函數名稱
2. 輸入、參數
3. 函數主體
4. 輸出

## 函數運作的過程就像買一杯珍珠奶茶

![Imgur](https://i.imgur.com/6gpJebm.jpg?1)

來源: Google 圖片

## 函數有四個來源

- 來自「內建函數」：<https://docs.python.org/3/library/functions.html>
- 來自標準模組（套件）：<https://docs.python.org/3/library>
- 來自第三方模組（套件）。
- 來自使用者的定義。

## 來自內建函數可以直接使用

<https://docs.python.org/3/library/functions.html>

In [2]:
print(pow(5, 3))

125


## 來自標準模組必須先載入再使用

<https://docs.python.org/3/library>

```python
import standard_module
from standard_module import modules_function

standard_module.modules_function()
modules_function()
```

In [3]:
from random import randint

print(randint(1, 11))

11


## 來自第三方模組必須確認安裝妥當才載入使用

```bash
pip install third_party_module
```

In [4]:
from numpy.random import randint

print(randint(1, 10, size=5))

[7 5 2 3 2]


## 來自使用者的定義

In [5]:
def power(x, n):
    out = x**n
    return out

print(power(5, 3))

125


## 輸入與參數在函數定義與使用（呼叫）時的差別

- 定義時稱為輸入（Inputs）或參數（Parameters）。
- 使用（呼叫）函數時稱為引數（Arguments）。

In [6]:
def power(x, n):
    out = x**n # Parameters
    return out

a = 5 # Argument
b = 3 # Argument
print(power(a, b)) # Arguments

125


## 參數與引數的差別

- 在自行定義的函數 `power(x, n)` 中 `x` 與 `n` 稱為輸入（Inputs）或參數（Parameters）。
- 在呼叫自行定義的函數 `power(a, b)` 中 `a` 與 `b` 稱為引數（Arguments）。

## 如何自行定義函數

- `def` 用來定義函數的名稱。
- `return` 用來標註函數的輸出。
- 縮排用來標註函數的主體。

## 自行定義函數的結構


```python
def function_name(INPUTS, PARAMETERS, ...):
    # body of function_name
    """
    docstring: print documentation when help is called
    """
    # sequence of statements
    return OUTPUTS
```

## `return` 的作用

- 回傳函數的預期輸出。
- 為函數的主體畫下終止符。

## 回傳函數的預期輸出

In [7]:
def power(x, n):
    """
    Equivalent to x raised to the power of n.
    """
    out = x**n

print(power(5, 3))

None


## 為函數的主體畫下終止符

In [8]:
def power(x, n):
    """
    Equivalent to x raised to the power of n.
    """
    print(x)
    print(n)
    out = x**n
    return out

print(power(5, 3))

5
3
125


## 即便寫在縮排的函數主體中，在 `return` 後所寫的程式並沒有作用

In [9]:
def power(x, n):
    """
    Equivalent to x raised to the power of n.
    """
    out = x**n
    return out
    print(x)
    print(n)

print(power(5, 3))

125


## 利用練習題大量地自行定義函數，學會程序化程式設計（Procedural programming）

把即將要執行的程式碼組織為函數，並依序呼叫這些函數來完成任務。

```python
def function_one():
    ...
    return ...
def function_two():
    ...
    return ...

function_one()
function_two()
```

## 作用域（Scope）

## 什麼是作用域

> 在電腦程式設計中，作用域是名字與實體的繫結保持有效的那部分電腦程式。

來源：<https://en.wikipedia.org/wiki/Scope_(computer_science)>

## 簡而言之，存在有自行定義函數的狀態下，變數具有兩種類型

1. 區域（local）
2. 全域（global）

## 在函數的縮排中被宣告的是區域變數，僅有在縮排中才有效

In [10]:
def power(x, n):
    out = x**n
    print(x)
    print(n)
    print(out)
    return out

print(power(5, 3))

5
3
125
125


## 不是在函數縮排中被宣告的是全域變數，在任何地方都有效

In [11]:
x = 4
n = 2
out = x**n
def power():
    return out

print(x)
print(n)
print(out)
print(power())

4
2
16
16


## 輸入與輸出的對應關係

- 多個輸出
- 多個輸入

## 「多個輸出」對應關係以資料結構處理

- 預設以 `tuple` 資料結構應對多個輸出。
- 可以自行調整偏好的資料結構。

In [12]:
def first_three_characters(x):
    if len(x) < 3:
        return "Cannot extract the first three characters from input string."
    first_char, second_char, third_char = x[0], x[1], x[2]
    return first_char, second_char, third_char

print(first_three_characters("Python"))
print(type(first_three_characters("Python")))

('P', 'y', 't')
<class 'tuple'>


In [13]:
def first_three_characters(x):
    if len(x) < 3:
        return "Cannot extract the first three characters from input string."
    first_char, second_char, third_char = x[0], x[1], x[2]
    out = [first_char, second_char, third_char]
    return out

print(first_three_characters("Python"))
print(type(first_three_characters("Python")))

['P', 'y', 't']
<class 'list'>


In [14]:
def first_three_characters(x):
    if len(x) < 3:
        return "Cannot extract the first three characters from input string."
    first_char, second_char, third_char = x[0], x[1], x[2]
    out = {"1st": first_char,
           "2nd": second_char,
           "3rd": third_char}
    return out

print(first_three_characters("Python"))
print(type(first_three_characters("Python")))

{'1st': 'P', '2nd': 'y', '3rd': 't'}
<class 'dict'>


## 「多個輸入」對應關係以資料結構或彈性參數處理

- 使用資料結構作為一個輸入名稱。
- 使用彈性參數：
    - `*args`
    - `**kwargs`

In [15]:
def sum_and_square(x):
    summation = sum(x)
    out = summation**2
    return out

print(sum_and_square([2, 3, 5]))
print(sum_and_square((2, 3, 5, 7)))

100
289


## 彈性參數 `args` 可以在函數主體中以 `tuple` 形式運用

In [16]:
def sum_and_square(*args):
    print(type(args)) # tuple
    summation = sum(args)
    out = summation**2
    return out

print(sum_and_square(2, 3, 5))
print(sum_and_square(2, 3, 5, 7))

<class 'tuple'>
100
<class 'tuple'>
289


## 彈性參數 `kwargs` 可以在函數主體中以 `dict` 形式運用

In [17]:
def print_country_capital(**kwargs):
    print(type(kwargs)) # dict
    for key, value in kwargs.items():
        print("Country: {:<7} Capital: {}".format(key, value))

print_country_capital(Japan="Tokyo", USA="Washington D.C.", Taiwan="Taipei")

<class 'dict'>
Country: Japan   Capital: Tokyo
Country: USA     Capital: Washington D.C.
Country: Taiwan  Capital: Taipei
