# 鍛鍊你的資料分析力 | Python 程式設計

> 函式

郭耀仁 <yaojenkuo@datainpoint.com> from [DATAINPOINT](https://www.datainpoint.com/)

> One way to organize our Python code and make it more readable and reusable is functions.

## 程式封裝的層級

- 套件（Libraries）
    - 模組（Modules）
        - 類別（Classes）
            - **函式（Functions）**

## 為什麼需要封裝程式

- 結構化程式碼
- 重複使用程式碼
- 規模化程式碼

## 程式封裝的層級

- **將數行程式碼組合為一個函式（Function）**
- 將數個函式組合為一個類別（Class）
- 將數個類別組合為一個模組（Module）
- 將數個模組組合為一個套件（Library）

## 大綱

- 預設參數
- 多個輸出
- 不定個數輸入：彈性參數
- `lambda`
- 錯誤與例外
- 全域（Global）與區域（Local）
- 遞迴（Recursion）

## 預設參數

## 給函式一個最常使用的參數設定，但又賦予讓使用者更動的彈性

## 寫作一個函式 `get_circle_metrics()` 預設計算面積、但亦可以計算周長

\begin{equation}
\text{Circle Area} = \pi r^2 \\
\text{Circle Perimeter} = 2 \pi r
\end{equation}

In [1]:
def get_circle_metrics(r, is_area=True):
    """
    依據半徑計算圓形面積或周長
    """
    pi = 3.14156
    if is_area:
        return pi*r**2
    else:
        return 2*pi*r
help(get_circle_metrics)
print(get_circle_metrics(3))
print(get_circle_metrics(3, False))

## 多個輸出

## 函式若需要多個輸出可以仰賴預設的 `tuple`

```python
def function_name():
    # 生成多個輸出
    return output_0, output_1, ...
```

## 寫作一個函式 `get_circle_metrics()` 計算面積以及周長

In [2]:
def get_circle_metrics(r):
    """
    依據半徑計算圓形面積以及周長
    """
    pi = 3.14156
    area = pi*r**2
    perimeter = 2*pi*r
    return area, perimeter
print(get_circle_metrics(3))
print(type(get_circle_metrics(3)))

In [3]:
circle_area, circle_perimeter = get_circle_metrics(3)
print(circle_area)
print(circle_perimeter)

## 亦可以利用其他資料結構回傳

- `list`
- `dict`
- `set`

## 不定個數輸入：彈性參數

## 有時我們的函式不確定使用者會想輸入幾個參數

## `*args` 讓使用者可以傳入可迭代的 tuple 物件

In [4]:
def get_args(*args):
    return args

get_args(5, 5, 6, 6)

(5, 5, 6, 6)

## `**kwargs` 讓使用者可以傳入可迭代的 dict-like 物件

In [5]:
def get_kwargs(**kwargs):
    return kwargs

get_kwargs(中正區=100, 大同區=103, 中山區=104)

{'中正區': 100, '大同區': 103, '中山區': 104}

## `lambda`

## 不使用 `def` 保留字與 `return` 自訂函式

In [6]:
# Define
modulo_of_2 = lambda x: x%2
# Use
modulo_of_2(0)

0

## 常與 `lambda` 一起使用的函式型函式（functional functions）

- `map()`
- `filter()`

In [7]:
help(map)

Help on class map in module builtins:

class map(object)
 |  map(func, *iterables) --> map object
 |  
 |  Make an iterator that computes the function using arguments from
 |  each of the iterables.  Stops when the shortest iterable is exhausted.
 |  
 |  Methods defined here:
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __new__(*args, **kwargs) from builtins.type
 |      Create and return a new object.  See help(type) for accurate signature.
 |  
 |  __next__(self, /)
 |      Implement next(self).
 |  
 |  __reduce__(...)
 |      Return state information for pickling.



In [8]:
help(filter)

Help on class filter in module builtins:

class filter(object)
 |  filter(function or None, iterable) --> filter object
 |  
 |  Return an iterator yielding those items of iterable for which function(item)
 |  is true. If function is None, return the items that are true.
 |  
 |  Methods defined here:
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __new__(*args, **kwargs) from builtins.type
 |      Create and return a new object.  See help(type) for accurate signature.
 |  
 |  __next__(self, /)
 |      Implement next(self).
 |  
 |  __reduce__(...)
 |      Return state information for pickling.



In [9]:
map(lambda x: x%2, range(10))

<map at 0x7fe16263e3c8>

In [10]:
filter(lambda x: x%2, range(10))

<filter at 0x7fe16263e5c0>

## `map()` 與 `filter()` 的輸出是一種特殊類別，稱為產生器（Generator）

產生器類別的輸出必須搭配使用資料結構函式，常用的是 `list()`。

In [11]:
list(map(lambda x: x%2, range(10)))

[0, 1, 0, 1, 0, 1, 0, 1, 0, 1]

In [12]:
list(filter(lambda x: x%2, range(10)))

[1, 3, 5, 7, 9]

## 許多的內建函式輸出都是產生器（Generator）類別

- `map()`
- `filter()`
- `enumerate()`
- `zip()`

In [13]:
first_five_primes = [2, 3, 5, 7, 11]
enumerate(first_five_primes)

<enumerate at 0x7fe1626473f0>

In [14]:
list(enumerate(first_five_primes))

[(0, 2), (1, 3), (2, 5), (3, 7), (4, 11)]

In [15]:
first_five_odds = [1, 3, 5, 7, 9]
zip(first_five_primes, first_five_odds)

<zip at 0x7fe1625be5c8>

In [16]:
list(zip(first_five_primes, first_five_odds))

[(2, 1), (3, 3), (5, 5), (7, 7), (11, 9)]

## 使用產生器（Generator）類別時要注意兩件事

- 需要將輸出實體化
- 實體化僅能進行一次

In [17]:
map_object = map(lambda x: x%2, range(10))
print(list(map_object))
print(list(map_object))

[0, 1, 0, 1, 0, 1, 0, 1, 0, 1]
[]


## 如何自訂一個產生器？

使用類似 List comprehension 的語法，將中括號 `[]` 改為小括號 `()`。

In [18]:
my_generator = (i%2 for i in range(10))
print(my_generator)
print(list(my_generator))

<generator object <genexpr> at 0x7fe162639c50>
[0, 1, 0, 1, 0, 1, 0, 1, 0, 1]


## 如何自訂一個生成產生器的函式

使用 `yield` 保留字。

In [19]:
def my_generator(x):
    for i in range(x):
        yield i%2
print(my_generator(10))
print(list(my_generator(10)))

<generator object my_generator at 0x7fe162639c50>
[0, 1, 0, 1, 0, 1, 0, 1, 0, 1]


## 錯誤與例外

## 三種基本的錯誤

- Syntax errors：語法錯誤
- Runtime errors：直譯錯誤
- Semantic errors：邏輯錯誤

In [20]:
# Syntax errors
print("Hello World!"

SyntaxError: unexpected EOF while parsing (<ipython-input-20-29e7c6121434>, line 2)

## 常見的 Runtime errors

- `NameError`
- `TypeError`
- `IndexError`
- `ZeroDivisionError`
- ...etc.

In [21]:
# Runtime error: NameError
msg = "Hello World"
print(Msg)

NameError: name 'Msg' is not defined

In [22]:
# Runtime error: TypeError
"55" + 66

TypeError: must be str, not int

In [23]:
# Runtime error: IndexError
avengers_movies = ["The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame"]
avengers_movies[4]

IndexError: list index out of range

In [24]:
def divide(x, y):
    """
    將輸入的兩個數字相除
    """
    return x / y

In [25]:
print(divide(55, 66))
print(divide(5566, 0))

0.8333333333333334


ZeroDivisionError: division by zero

## 使用 `try...except...` 處理錯誤與例外

In [26]:
def safe_divide(x, y):
    """
    將輸入的兩個數字相除
    """
    try:
        return x / y
    except:
        return "Something went wrong..."

In [27]:
print(safe_divide(55, 66))
print(safe_divide(5566, 0))

0.8333333333333334
Something went wrong...


## 在 `except` 後面連接錯誤的種類捕捉特定錯誤

In [28]:
def safe_divide(x, y):
    """
    將輸入的兩個數字相除
    """
    try:
        return x / y
    except ZeroDivisionError:
        return "Demoninator should not be zero!"
    except TypeError:
        return "Numerator and demoninator should not be strings!"

In [29]:
print(safe_divide(5566, 0))
print(safe_divide(55, '66'))

Demoninator should not be zero!
Numerator and demoninator should not be strings!


## 以 `raise` 告知使用者函式不支援的功能

In [30]:
def is_prime(x):
    """
    判斷輸入的正整數 x 是否為質數
    """
    if x < 0:
        raise ValueError("x must be positive!")
    elif isinstance(x, float):
        raise ValueError("x must be an integer!")
    divisor_cnt, i = 0, 1
    while i <= x:
        if x % i == 0:
            divisor_cnt += 1
        if divisor_cnt > 2:
            break
        i += 1
    return divisor_cnt == 2

In [31]:
is_prime(89.0)

ValueError: x must be an integer!

In [32]:
is_prime(-5566)

ValueError: x must be positive!

## 全域（Global）與區域（Local）

## 什麼是全域與區域？

- 在函式的程式碼結構以外所建立的物件屬於全域
- 在函數的程式碼結構中建立的物件屬於區域

## 全域物件與區域物件的差別？

- 區域物件**僅可**在區域中使用
- 全域物件可以在全域以及區域中使用

In [33]:
# 區域物件僅可在區域中使用
def get_squared(x):
    squared_x = x**2 # Local
    return squared_x

print(get_squared(2))
print(squared_x) # Local object cannot be accessed in global

4


NameError: name 'squared_x' is not defined

In [34]:
# 全域物件可以在全域以及區域中使用
squared_x = 4
print(squared_x) # Global object can be accessed in global, of course
def get_squared():
    return squared_x

print(get_squared()) # Global object can be accessed in local

4
4


## 遞迴（Recursion）

## 什麼是遞迴

![Imgur](https://i.imgur.com/AU19SYx.png)

## 在定義函式的同時就呼叫「正在」定義的函式

## 常見的遞迴示範：階乘（factorial）函式

$$n! = 1 \times 2 \times ... \times (n-1) \times n$$

In [35]:
def factorial(n):
    if n == 0:
        return 1
    elif n == 1:
        return 1
    else:
        return n*factorial(n-1) # recursive happens here

In [36]:
print(factorial(0))
print(factorial(1))
print(factorial(2))
print(factorial(3))

1
1
2
6


## 另一個常見的遞迴示範：Fibonacci 函式

$$F_0 = 0 \\
F_1 = 1 \\
F_n = F_{n-1} + F_{n-2}
$$

In [37]:
def fibonacci(n):
    if n == 0:
        return 0
    elif n == 1:
        return 1
    else:
        return fibonacci(n-1) + fibonacci(n-2) # recursive happens here

In [38]:
print(fibonacci(0))
print(fibonacci(1))
print(fibonacci(2))
print(fibonacci(3))

0
1
1
2


## 隨堂練習

## 隨堂練習：定義一個函式 `product(*args)` 能回傳 `*args` 所組成之數列的乘積

- 預期輸入：彈性參數 `*args`
- 預期輸出：一個數值

In [39]:
def product(*args):
    """
    >>> product(0, 1, 2)
    0
    >>> product(1, 2, 3, 4, 5)
    120
    >>> product(1, 3, 5, 7, 9)
    945
    """

## 隨堂練習：定義一個函式 `iso_country(**kwargs)` 能讓使用者創建國家的 Alpha-3 code 與國家名稱的對應 dict

<https://en.wikipedia.org/wiki/List_of_ISO_3166_country_codes。

- 預期輸入：彈性參數 `**kwargs`
- 預期輸出：一個 dict

In [40]:
def iso_country(**kwargs):
    """
    >>> iso_country(TWN='Taiwan')
    {'TWN': 'Taiwan'}
    >>> iso_country(TWN='Taiwan', USA='United States of America')
    {'TWN': 'Taiwan', 'USA': 'United States of America'}
    >>> iso_country(TWN='Taiwan', USA='United States of America', JPN='Japan')
    {'TWN': 'Taiwan', 'USA': 'United States of America', 'JPN': 'Japan'}
    """

## 隨堂練習：定義一個函式 `mean(*args)` 能回傳 `*args` 所組成之數列的平均數

\begin{equation}
\mu = \frac{\sum_{i=1}^n x_i}{n}
\end{equation}

- 預期輸入：彈性參數 `*args`
- 預期輸出：一個數值

In [41]:
def mean(*args):
    """
    >>> mean(1, 3, 5, 7, 9)
    5.0
    >>> mean(3, 4, 5, 6, 7)
    5.0
    >>> mean(3)
    3.0
    """

## 隨堂練習：定義一個函式 `std(*args)` 回傳 `*args` 所組成之數列的樣本標準差

\begin{equation}
\sigma = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2}
\end{equation}

<https://en.wikipedia.org/wiki/Standard_deviation>

- 預期輸入：彈性參數 `*args`
- 預期輸出：一個數值或文字

In [42]:
def std(*args):
    """
    >>> std(1, 3, 5, 7, 9)
    3.1622776601683795
    >>> std(3, 4, 5, 6, 7)
    1.5811388300841898
    >>> std(3)
    'Please input at least 2 numbers.'
    """

## 隨堂練習：定義一個函式 `fibonacci_list(N, f0=0, f1=1)` 回傳長度為 `N`、前兩個數字分別為 `f0` 與 `f1` 的費氏數列

\begin{equation}
F_0 = 0, F_1 = 1 \\
F_n = F_{n-1} + F_{n-2} \text{ , For } n > 1
\end{equation}

<https://en.wikipedia.org/wiki/Fibonacci_number>

- 預期輸入：三個整數
- 預期輸出：一個長度為 N 的 list

In [43]:
def fibonacci_list(N, f0=0, f1=1):
    """
    >>> fibonacci_list(5)
    [0, 1, 1, 2, 3]
    >>> fibonacci_list(5, 1, 2)
    [1, 2, 3, 5, 8]
    >>> fibonacci_list(10, 1, 2)
    [1, 2, 3, 5, 8, 13, 21, 34, 55, 89]
    """

## 執行測試

In [None]:
%load ../test_cases/test_cases_07.py