# R 程式設計

> 認識向量

[數據交點](https://www.datainpoint.com/) | 郭耀仁 <yaojenkuo@datainpoint.com>

## 數值運算

## 7 個基本數值運算符

- `+` 加號
- `-` 減號
- `*` 乘號
- `/` 除號
- `**` 或 `^` 次方
- `%%` 餘數
- `%/%` 商數

## 數值運算的先後順序

- 小括號 `()` 優先
- `**` 或 `^` 次方其次
- `*` 乘號與 `/` 除號次之
- `+` 加號與 `-` 減號
- 運算順序若是相同，則由左至右依序運算

In [1]:
0*9/5 + 32

In [2]:
(32-32)*5/9

## 賦值運算符

## 推薦使用 `<-` 作為賦值運算符

- `=` 也可以進行賦值，但是絕大部分的 R 使用者習慣 `<-`
- 在 RStudio 可以按 `Alt + -` 來獲得 `<-`

In [3]:
lucky_number <- 5566
lucky_number
lucky_number = 5566
lucky_number

## 使用 `#` 作為註解

單行註解或者行末註解

In [4]:
# 5566 is my lucky number
lucky_number <- 5566 # 5566 is my lucky number

## 該如何寫出與多數使用者相符的 R 程式？

參考 R 的風格指南：<https://style.tidyverse.org/>

## 馬上就能派上用場的內建函數

## 以 `rm()` 移除物件

In [5]:
rm(lucky_number)
lucky_number

ERROR: Error in eval(expr, envir, enclos): object 'lucky_number' not found


## 以 `help()` 查詢函式或資料的說明文件

In [6]:
help(rm) # ?rm will do

In [7]:
help(cars) # ?cars will do

## 以 `q()` 離開 RStudio，不需要儲存工作空間圖案

## 使用 `class()` 得知向量的類型

In [8]:
movie_title <- "The Dark Knight"
movie_rating <- 9.0
is_a_good_movie <- TRUE
class(movie_title)
class(movie_rating)
class(is_a_good_movie)

## `numeric` 是主要的數值向量

In [9]:
class(5566)
class(55.66)
class(0)
class(-5566)

## R 有非常豐富的內建函數，但這些函數不可能滿足我們的「所有」需求

## 這時候我們會求助於「自訂函數」

顧名思義是由使用者定義的函數。

```r
function_name <- function(INPUTS) {
    # 函數主體的程式敘述...
    # 將「輸入」轉換為「輸出」的規則以 R 程式表達...
    return(OUTPUTS)
}
```

## 自訂函數的組成：自由發揮的部分

- `function_name`: 自訂函數的名稱，由使用者自行取名，建議採用動詞。
- `INPUTS`: 輸入的變數名稱。
- `OUTPUTS`: 輸出的變數名稱。

## 自訂函數的組成：規範的部分

- `function`: 保留字，告知 R 這個物件是一個函數。
- `{}`: 定義「程式區塊」的範圍，區隔出輸入與輸出的可作用範圍。
- `return()`: 告知 R 這個函數的輸出變數為何。

## 能夠將公里轉換為英里函數：`convert_km_to_mile`

$$Miles = Kilometers \times 0.62137$$

In [10]:
convert_km_to_mile <- function(km) {
    mile <- km * 0.62137
    return(mile)
}

## 定義完畢以後必須要「呼叫」才能產生作用

In [11]:
convert_km_to_mile(42.195)
convert_km_to_mile(21.095)

## 文字向量

## 使用 `''` 或 `""` 宣告文字向量

In [12]:
movie_title <- "Avengers: Endgame"
class(movie_title)

## 多數的時候使用 `''` 或 `""` 都沒有差異，不過...

In [13]:
#shaq <- 'Shaquille O'Neal' # error
shaq <- 'Shaquille O\'Neal' # \ is the escape symbol
shaq <- "Shaquille O'Neal"

## 使用 `sprintf()` 函式進行在文字向量中嵌入變數

In [14]:
user_name <- "Jovyan"
sprintf("Hello, %s!", user_name)

## 邏輯值向量

## 創建邏輯值向量的三種方式

- 直接輸入邏輯值向量。
- 使用比較運算符。
- 使用邏輯運算符。

In [15]:
class(TRUE)
class(FALSE)
#class(True)  # error
#class(False) # error
#class(true)  # error
#class(false) # error

## 比較運算符

- `>` 大於
- `>=` 大於等於
- `<` 小於
- `<=` 小於等於
- `==` 等於
- `!=` 不等於
- `%in%` 屬於

In [16]:
8 > 7
8 >= 7
8 < 7
8 <= 7
8 == 7
8 !=7
5 %in% c(5, 5, 6, 6)

## 邏輯運算符

- `!` 非
- `&` 交集
- `|` 聯集

In [17]:
!TRUE
TRUE & TRUE
FALSE | FALSE

## 操作向量

## 截至目前為止，我們都在面對長度為 1 的向量

為什麼在 Console 印資料前面都會顯示 `[1]`？

In [18]:
print("Hello world")

[1] "Hello world"


## 對於 R 來說，最小的資料單位是長度為 1 的向量，而不是純量

## 創建

## 使用 `c()` 函數來創建長度大於 1 的向量

In [19]:
avengers <- c("The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame")
avengers_ratings <- c(8.0, 7.3, 8.4, 8.4)
avengers
avengers_ratings

## 快速創建向量的函數

- `seq()`
- `rep()`

In [20]:
seq(from = 11, to = 21) # same as 11:21
seq(from = 11, to = 21, by = 2)
seq(from = 11, to = 21, length.out = 6)

In [21]:
rep(5, times = 6)
rep("5566", times = 5)
rep(TRUE, times = 4)

## 索引與切割

## 使用 `length()` 函數得知向量長度

In [22]:
avengers <- c("The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame")
length(avengers)

## 使用 `[INDEX]` 進行索引

In [23]:
avengers <- c("The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame")
avengers[1]
avengers[2]
avengers[3]
avengers[length(avengers)] # in case we have a long vector

## 使用 `[c(INDICES)]` 進行切割

In [24]:
avengers <- c("The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame")
avengers
avengers[c(1, 3, 4)]

## 更新與刪除

## 修正向量資料

In [25]:
avengers <- c("the avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame")
avengers
avengers[1] <- "The Avengers"
avengers

## 新增向量資料

In [26]:
avengers <- c("The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War")
avengers
avengers <- c(avengers, "Avengers: Endgame")
avengers

## 使用負的索引值刪除向量資料

In [27]:
avengers <- c("The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame")
avengers
avengers <- avengers[-2]
avengers

## 亦可以選擇「不要刪除」的向量資料

In [28]:
avengers <- c("The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame")
avengers
avengers <- avengers[c(1, 3, 4)]
avengers

## 向量特性

## 向量有這幾個值得注意的特性

- 元素級別的運算。
- 資料同質。
- 可以使用邏輯值對資料篩選。

## 元素級別的運算

In [29]:
avengers_ratings <- c(8.0, 7.3, 8.4, 8.4)
avengers_ratings > 8

## 資料同質

In [30]:
endgame <- c(8.4, "Avengers: Endgame")
class(endgame)
endgame

## 可以使用邏輯值對資料篩選

In [31]:
avengers <- c("The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame")
avengers_ratings <- c(8.0, 7.3, 8.4, 8.4)
avengers_ratings > 8
avengers[avengers_ratings > 8]

## 判斷與轉換向量類型

## 使用 `is.向量類型()` 函數判斷

- `is.numeric()`：判斷是否為數值向量類型
- `is.character()`：判斷是否為文字向量類型
- `is.logical()`：判斷是否為邏輯值向量類型

In [32]:
# is.numeric()
is.numeric(87)
is.numeric("87")

# is.character()
is.character("TRUE")
is.character(TRUE)

# is.logical()
is.logical(FALSE)
is.logical("FALSE")

## 使用 `as.向量類型()` 函數轉換

- `as.numeric()`：轉換為數值向量類型
- `as.character()`：轉換為文字向量類型
- `as.logical()`：轉換為邏輯值向量類型

In [33]:
as.numeric(TRUE)
as.numeric(FALSE)
as.logical("TRUE")
as.logical("FALSE")
as.character(TRUE)
as.character(FALSE)