# R 程式設計

> 函數型程式設計

[數據交點](https://www.datainpoint.com/) | 郭耀仁 <yaojenkuo@datainpoint.com>

> The way R works is pretty straightforward, you apply functions to objects.
>
> Greg Martin

## 常用的 R 內建函數

## 內建數值函數

## `abs()`

取絕對值。

In [1]:
abs(-5566)
abs(5566)

## `sqrt()`

取平方根。

In [2]:
sqrt(2)
sqrt(3)

## `ceiling()`

無條件進位。

In [3]:
ceiling(sqrt(2))
ceiling(sqrt(3))

## `floor()`

無條件捨去。

In [4]:
floor(sqrt(2))
floor(sqrt(3))

## `round()`

四捨五入。

In [5]:
round(sqrt(2))
round(sqrt(3))

## `exp()`

\begin{equation}
exp(x) = e^x \\
\text{where } e = 2.71828...
\end{equation}

In [6]:
exp(1)
exp(2)

## `log()`

以 $e$ 為底的對數函數。

In [7]:
e = exp(1)
ee = exp(2)
log(e)
log(ee)

## `log10()`

以 10 為底的對數函數。

In [8]:
log10(10)
log10(10**2)

## 內建描述性統計函數

## `mean()`

平均數。

In [9]:
mean(1:10)

## `sd()`

標準差。

In [10]:
sd(1:10)

## `median()`

中位數。

In [11]:
median(1:9)

## `range()`

最大值與最小值。

In [12]:
range(11:100)

## `sum()`

加總。

In [13]:
sum(1:100)

## `max()`

最大值。

In [14]:
max(11:100)

## `min()`

最小值。

In [15]:
min(11:100)

## 內建文字處理函數

## `unique()`

取獨一值。

In [16]:
cities <- c("New York", "Boston", "Tokyo", "Kyoto", "Taipei")
countries <- c("United States", "United States", "Japan", "Japan", "Taiwan")
unique(cities)
unique(countries)

## `toupper()`

轉換為大寫。

In [17]:
toupper("Luke, use the Force!")

## `tolower()`

轉換為小寫。

In [18]:
tolower("Luke, use the Force!")

## `substr()`

擷取部分字串。

In [19]:
luke <- "Luke, use the Force!"
substr(luke, start = 1, stop = 4)
substr(luke, start = 11, stop = nchar(luke))

## `grep()`

回傳指定特徵有出現的索引值。

In [20]:
avengers <- c("The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame")
grep(pattern = "Avengers", avengers)
grep(pattern = "Endgame", avengers)

## `sub()`

取代指定特徵。

In [21]:
skywalker <- "Anakin Skywalker"
sub(pattern = "Anakin", replacement = "Luke", skywalker)

## `strsplit()`

依據指定特徵分割文字。

In [22]:
avengers <- c("The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame")
strsplit(avengers, split = " ")
strsplit(avengers, split = ":")

## `paste()` 與 `paste0()`

連接文字。

In [23]:
paste("Avengers:", "Endgame")
paste0("Avengers:", "Endgame")

## `trimws()`

消除前（leading）或後（trailing）的空白。

In [24]:
luke <- "     Luke, use the Force!     "
trimws(luke)
trimws(luke, which = "left")
trimws(luke, which = "right")

## 自訂函數的輸入與輸出個數

## 單一輸入

將攝氏溫度轉換為華氏溫度的函數 `celsius_to_fahrenheit()`

\begin{equation}
Fahrenheit_{(°F)} = Celsius_{(°C)} \times \frac{9}{5} + 32
\end{equation}

In [25]:
celsius_to_fahrenheit <- function(x) {
    return(x*9/5 + 32)
}
celsius_to_fahrenheit(20)

## 兩個以上輸入

In [26]:
get_bmi <- function(height, weight) {
    return(weight / (height*0.01)**2)
}
get_bmi(216, 147)

## 參數有預設值

In [27]:
temperature_convert <- function(x, to_fahrenheit = TRUE) {
    if (to_fahrenheit) {
        return(x*9/5 + 32)
    } else {
        return((x - 32)*5/9)
    }
}
temperature_convert(20)
temperature_convert(68, to_fahrenheit = FALSE)

## 多個輸出

In [28]:
get_bmi_and_label <- function(height, weight) {
    bmi <- weight / (height/100)**2
    if (bmi > 30) {
        label <- "Obese"
    } else if (bmi < 18.5) {
        label <- "Underweight"
    } else if (bmi > 25) {
        label <- "Overweight"
    } else {
        label <- "Normal weight"
    }
    bmi_and_label <- list(
        bmi = bmi,
        bmi_label = label
    )
    return(bmi_and_label)
}

In [29]:
get_bmi_and_label(216, 147) # Shaquille O'Neal
get_bmi_and_label(203, 113) # LeBron James
get_bmi_and_label(191, 82) # Steve Nash
get_bmi_and_label(231, 91) # Manute Bol

## 全域（Global）與區域（Local）

## 什麼是全域與區域？

- 在函式的大括號（Block）以外所建立的物件屬於全域
- 在函式的大括號（Block）以內所建立的物件屬於區域

## 全域與區域的差別？

- 區域物件**僅可**在區域中使用
- 全域物件可以在全域以及區域中使用

In [30]:
# 區域物件僅可在區域中使用
sum_and_square <- function(x) {
    summation <- sum(x)
    square_summation <- summation**2
    return(square_summation)
}

sum_and_square(c(5, 6))
summation        # Local object cannot be accessed in global
square_summation # Local object cannot be accessed in global

ERROR: Error in eval(expr, envir, enclos): object 'summation' not found


In [31]:
# 全域物件可以在全域以及區域中使用
x <- c(5, 6)
summation <- sum(x)

sum_and_square <- function() {
    square_summation <- summation**2
    return(square_summation)
}
sum_and_square()

## 向量化函數

## 什麼是向量化函數？

利用函數型函數（Functional functions）將指定函數**向量化**至某個資料結構的技巧。

In [32]:
# 將一個 list 中的每個數字都平方
my_list <- list(
    11,
    12,
    13,
    14,
    15
)
my_list

## 老實說，我們會有個衝動這樣寫

In [33]:
my_list**2

ERROR: Error in my_list^2: non-numeric argument to binary operator


## 注意這是一個 `list` 而不是向量

In [34]:
for (i in my_list) {
    print(i**2)
}

[1] 121
[1] 144
[1] 169
[1] 196
[1] 225


## 使用 `lapply()` 將 `get_squared()` 函數向量化至 `my_list` 之上

In [35]:
get_squared <- function(x) {
    return(x**2)
}

lapply(my_list, FUN = get_squared)

## 搭配匿名函數（Anonymous functions）將平方運算向量化至 `my_list` 之上

```r
# Named function
named_function <- function(INPUTS) {
    # sequence of statements
    # sequence of statements
    return(OUTPUTS)
}
# Anonymous function
function(INPUTS) return(OUTPUTS)
```

In [36]:
lapply(my_list, FUN = function(x) return(x**2))

## R 常用的函數型函數（Functional functions）

- `lapply()`
- `sapply()`
- `apply()`
- `mapply()`

## `sapply()`

- Simplified apply
- 回傳向量而非 `list`

In [37]:
sapply(my_list, FUN = function(x) return(x**2))

## `apply()`

將函數向量化至二維的資料結構（`matrix` 與 `data.frame`）

In [38]:
my_matrix <- matrix(1:12, nrow = 2)
my_matrix
apply(my_matrix, MARGIN = 1, FUN = sum)
apply(my_matrix, MARGIN = 2, FUN = sum)

0,1,2,3,4,5
1,3,5,7,9,11
2,4,6,8,10,12


## `mapply()`

將具有多個輸入的函數向量化

In [39]:
weights <- list(91, 82, 113, 147)
heights <- list(231, 191, 203, 216)
bmis <- mapply(FUN = function(h, w) return(w/(h*0.01)**2), heights, weights)
bmis