# R 語言的五十道練習

> 函數

[數據交點](https://www.datainpoint.com) | 郭耀仁 <yaojenkuo@datainpoint.com>

## 什麼是函數

## 什麼是函數

在電腦科學中，函數是一段有命名的程式碼，每當呼叫函數作用時，就會請該段程式碼運作，依據輸入讓函數能夠回傳對應的輸出。

## 函數的組成有五個要件

1. 函數名稱
2. 輸入
3. 參數
4. 函數主體
5. 輸出

## 函數運作的過程就像買一杯珍珠奶茶

![Imgur](https://i.imgur.com/6gpJebm.jpg?1)

圖片來源: Google 圖片

## 如何使用函數

## 在「起步走」單元中我們已經使用了許多內建函數

- `print`
- `length`
- `class`
- ...等。

## 以函數的「名稱」呼叫，並在小括號中寫進「輸入」或者「參數」

In [1]:
hello_world <- "Hello, World!"
print(hello_world)
print(length(hello_world))
print(class(hello_world))

[1] "Hello, World!"
[1] 1
[1] "character"


## 有些函數設計為「不需要」輸入或者參數，小括號留空，例如：

- `getwd` 函數顯示 R 語言的工作目錄。
- `sessionInfo` 函數顯示 R 語言的版本與相關資訊。

## `getwd` 顯示 R 語言的工作目錄

電腦中應用程式所在的目錄，程式語言在此目錄之下能夠以「相對路徑」存取檔案。

In [2]:
print(getwd()) # get working directory

[1] "/Users/kuoyaojen/classroom-rfifty/04-functions"


## `sessionInfo` 函數顯示 R 語言的版本與相關資訊 

注意 `sessionInfo` 函數中的 `Info` 是大寫 `I`。

In [3]:
print(sessionInfo())

R version 4.0.5 (2021-03-31)
Platform: x86_64-apple-darwin17.0 (64-bit)
Running under: macOS Big Sur 10.16

Matrix products: default
BLAS:   /Library/Frameworks/R.framework/Versions/4.0/Resources/lib/libRblas.dylib
LAPACK: /Library/Frameworks/R.framework/Versions/4.0/Resources/lib/libRlapack.dylib

locale:
[1] C/UTF-8/C/C/C/C

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

loaded via a namespace (and not attached):
 [1] compiler_4.0.5  ellipsis_0.3.2  IRdisplay_0.7.0 pbdZMQ_0.3-3.1 
 [5] tools_4.0.5     htmltools_0.5.0 pillar_1.4.7    base64enc_0.1-3
 [9] crayon_1.4.1    uuid_0.1-4      IRkernel_1.2    jsonlite_1.7.2 
[13] digest_0.6.27   lifecycle_1.0.0 repr_1.1.0      rlang_0.4.11   
[17] evaluate_0.14  


## 函數的輸入或參數採取三種機制識別

1. 依位置識別。
2. 依名稱識別（根據[風格指南](https://style.tidyverse.org/)多數時候我們推薦使用依名稱識別的機制）。
3. 採預設值時可以省略不用輸入。

## 以內建函數 `sub` 為例

`pattern`、`replacement` 與 `x` 依序為兩個參數、一個輸入。

```
sub(pattern, replacement, x)
```

## 依位置識別

In [4]:
# positional arguments
luke_skywalker <- "Luke Skywalker"
print(sub("Luke", "Anakin", luke_skywalker))

[1] "Anakin Skywalker"


## 依名稱識別

In [5]:
# named arguments
luke_skywalker <- "Luke Skywalker"
print(sub(pattern = "Luke", replacement = "Anakin", luke_skywalker))

[1] "Anakin Skywalker"


## 以內建函數 `paste` 為例

`...` 與 `sep` 依序為一個輸入、一個預設值為 `" "` 的參數。

```
paste(..., sep = " ")
```

## 採預設值時可以省略不用輸入

In [6]:
# default arguments
luke <- "Luke"
skywalker <- "Skywalker"
print(paste(luke, skywalker))
print(paste(luke, skywalker, sep = " "))

[1] "Luke Skywalker"
[1] "Luke Skywalker"


## 函數被設計為有「回傳」機制

我們可以用物件儲存函數所回傳的輸出，後續加以運用。

In [7]:
luke_skywalker <- "Luke Skywalker"
anakin_skywalker <- sub(pattern = "Luke", replacement = "Anakin", luke_skywalker)
print(anakin_skywalker)

[1] "Anakin Skywalker"


## 如何使用 R 語言的非內建函數

## R 語言的函數有三個來源

1. 來自 `base`、`stats` 與 `utils` 等預先已載入套件的函數，又被稱為內建函數。
2. 來自其他未被預先載入之套件的函數。
3. 來自使用者的自行定義。

## 使用內建函數之前不需要任何前置作業

In [8]:
luke_skywalker <- "Luke Skywalker"
anakin_skywalker <- sub(pattern = "Luke", replacement = "Anakin", luke_skywalker)
print(anakin_skywalker)

[1] "Anakin Skywalker"


## 如何使用未被預先載入之套件的函數

先以 `library` 函數載入套件後，再使用函數。

```r
library("package_name")
```

In [9]:
library("stringr")

luke_skywalker <- "Luke Skywalker"
anakin_skywalker <- str_replace(pattern = "Luke", replacement = "Anakin", luke_skywalker)
print(anakin_skywalker)

[1] "Anakin Skywalker"


## 使用 `library` 函數載入套件時遭遇到錯誤該如何處理

- 表示該套件還尚未安裝。
- 確認電腦有連網路後，以 `install.packages` 函數安裝套件。

```r
install.packages("package_name")
```

## 如何使用 R 語言不同套件中「同名」的函數

- R 語言的機制預設為「後載入套件」的函數會取代先前的函數。
- 想要使用不同套件中「同名」的函數，必須在函數名稱前面加上套件名稱。

```r
package_name::function_name()
```

## 例如內建函數 `filter`

In [10]:
# Before library("dplyr")
function_env <- environment(filter)
function_env_name <- environmentName(function_env)
print(function_env_name)

[1] "stats"


## 載入 `dplyr` 套件後會被其中同名的 `filter` 函數取代

In [11]:
# After library("dplyr")
library("dplyr", warn.conflicts = FALSE)

function_env <- environment(filter)
function_env_name <- environmentName(function_env)
print(function_env_name)

[1] "dplyr"


## 在函數名稱前面加上套件名稱就可以區隔同名的 `filter` 函數

In [12]:
filter_from_stats <- environmentName(environment(stats::filter))
filter_from_dplyr <- environmentName(environment(dplyr::filter))
print(filter_from_stats)
print(filter_from_dplyr)

[1] "stats"
[1] "dplyr"


## 使用自行定義的函數需要先完成宣告

自行定義函數必須要指定五個組成要件：

1. 函數名稱 `function_name`。
2. 輸入 `INPUTS`。
3. 參數 `ARGUMENTS`。
4. 函數主體。
5. 輸出 `OUTPUTS`。

## 自行定義函數

透過 `function` 與 `return` 保留字自行定義函數。

```r
function_name <- function(INPUTS, ARGUMENTS) {
    # function's body
    # ...
    return(OUTPUTS)
}
```

## 自行定義的 `power`  函數

In [13]:
# define
power <- function(x, n){
    out <- x**n
    return(out)
}
# call
print(power(5, 3))

[1] 125


## 物件的作用域（scope）

> 在電腦程式設計中，作用域是物件名與資料值繫結保持有效的那部分電腦程式。

Source: https://en.wikipedia.org/wiki/Scope_(computer_science)

## 簡而言之，存在有自行定義函數的情況下，物件分為兩種類型

1. 區域（local）
2. 全域（global）

## 區域物件

- 輸入 `INPUTS`。
- 參數 `ARGUMENTS`。
- 在函數主體中被宣告的物件。
- 僅有在函數主體中才有效。

In [14]:
power <- function(x, p){
    out <- x**p
    return(out)
}
#print(x)
#print(p)
#print(out)

## 全域物件

- 在函數主體**之外**被宣告的物件。
- 在程式碼的任何地方都有效，但在函數主體中會被同名的區域物件取代。

In [15]:
# 在程式碼的任何地方都有效
x <- 4
p <- 2
out <- x**p
power <- function(x, p){
    out <- x**p
    return(out)
}
print(x)
print(p)
print(out)
print(power(x, p))

[1] 4
[1] 2
[1] 16
[1] 16


In [16]:
# 在函數主體中會被同名的區域物件取代
x <- 4
p <- 2
out <- x**p
power <- function(x, p){
    out <- x**p
    return(out)
}
print(x)
print(p)
print(out)
print(power(5, 3))

[1] 4
[1] 2
[1] 16
[1] 125


## `return` 的作用

- 明確指定函數的回傳。
- 為函數的主體畫下終止符。

## 明確指定函數的回傳

R 語言自行定義的函數預設會將函數主體最後一行的物件回傳。

In [17]:
# define
power <- function(x, p){
    out <- x**p
    # return(out)
}
# call
print(power(5, 3))

[1] 125


## 為函數的主體畫下終止符

In [18]:
# define
power <- function(x, p){
    print(x)
    print(p)
    out <- x**p
    return(out)
}
# call
print(power(5, 3))

[1] 5
[1] 3
[1] 125


## 即便程式碼寫在函數主體中，只要在 `return` 後所寫的程式碼在函數被使用時無效

In [19]:
# define
power <- function(x, p){
    out <- x**p
    return(out)
    print(x)
    print(p)
}
# call
print(power(5, 3))

[1] 125


## 重點統整

- 以函數的「名稱」呼叫，並在小括號中寫進「輸入」或者「參數」來使用函數。
- 函數的輸入或參數採取三種機制識別
    - 依位置識別。
    - 依名稱識別（**推薦**）。
    - 採預設值時可以省略不用輸入。

## 重點統整（續）

R 語言的函數有三個來源：

1. 來自 `base`、`stats` 與 `utils` 等預先已載入套件的函數，又被稱為內建函數。
2. 來自其他未被預先載入之套件的函數。
3. 來自使用者的自行定義。

## 重點統整（續）

自行定義函數必須要指定五個組成要件：

1. 函數名稱 `function_name`。
2. 輸入 `INPUTS`。
3. 參數 `ARGUMENTS`。
4. 函數主體。
5. 輸出 `OUTPUTS`。