# 成為初級資料分析師 | R 程式設計與資料科學應用

> 運算符與向量

## 郭耀仁

> There are only two hard things in Computer Science: cache invalidation and naming things.
>
> Phil Karlton

## 大綱

- 賦值運算符
- 數值運算符與數值向量
- 文字向量
- 邏輯運算符與邏輯向量

## 賦值運算符

## 使用 `<-` 作為賦值運算符

- `=` 也可以，但我比較推薦 `<-`
- 在 RStudio 可以按 `Alt + -` 來獲得 `<-`

In [1]:
lucky_number <- 5566
lucky_number
lucky_number = 5566
lucky_number

## 使用 `#` 作為註解

單行或者行末註解

In [2]:
# Luke, use the Force!
lucky_number <- 5566 # My lucky number is 5566

## R 的風格指南

<http://adv-r.had.co.nz/Style.html>

## 馬上就要派上用場的內建函數

## 以 `rm()` 移除物件

In [3]:
rm(lucky_number)
lucky_number

ERROR: Error in eval(expr, envir, enclos): object 'lucky_number' not found


## 以 `help()` 查詢函數或資料的說明文件

In [4]:
help(rm) # ?rm will do

In [5]:
help(cars) # ?cars will do

## 以 `q()` 離開 RStudio，我不推薦儲存工作空間圖案

```r
q()
```

## 使用 `class()` 獲知物件儲存資料的型態

![Imgur](https://i.imgur.com/3sGTb1H.png)

In [6]:
movie_title <- "Avengers: Endgame"
movie_rating <- 8.7
class(movie_rating)
class(movie_title)

## 數值運算符與數值向量

## 7 個基本數值運算符

- `+` 加號
- `-` 減號
- `*` 乘號
- `/` 除號
- `**` 或 `^` 次方
- `%%` 餘數
- `%/%` 商數
- 使用 `()` 設定優先運算順序

In [7]:
5**6
9**1/2
9**(1/2)
66 %% 55
66 %/% 55

## 以 `numeric` 作為主要的數值向量

In [8]:
class(5566.0) # numeric
class(-5566) # numeric
class(0) # numeric

## 以 `L` 來宣告整數向量

In [9]:
lucky_number <- 5566
class(lucky_number) # numeric
lucky_integer <- 5566L
class(lucky_integer) # integer

## 隨堂練習：公里轉換為英里

$$Miles = Kilometers \times 0.62137$$

In [10]:
marathon_km <- 42.195
# marathon_mile

In [11]:
marathon_mile <- marathon_km * 0.62137

In [12]:
marathon_mile

## 隨堂練習：攝氏轉換華氏

$$Fahrenheit_{(°F)} = Celsius_{(°C)} \times \frac{9}{5} + 32$$

In [13]:
current_temp_c <- 20
# current_temp_f

In [14]:
current_temp_f <- current_temp_c*9/5 + 32

In [15]:
current_temp_f

## 隨堂練習：林書豪（191cm / 91kg）的 BMI

$$BMI = \frac{weight_{kg}}{height_{m}^2}$$

In [16]:
jeremy_lin_height <- 191
jeremy_lin_weight <- 91
# jeremy_lin_bmi

In [17]:
jeremy_lin_bmi <- jeremy_lin_weight / (jeremy_lin_height/100)**2

In [18]:
jeremy_lin_bmi

## 文字向量

## 使用 `''` or `""` 宣告文字向量

In [19]:
movie_title <- "Avengers: Endgame"
class(movie_title)

In [20]:
movie_title <- 'Avengers: Endgame'
class(movie_title)

## 多數的時候使用 '' 或 "" 都沒有差異，不過...

```r
# Try to assign one of the greatest center in NBA history
shaq <- Shaquille O'Neal # use '' or ""?
```

In [21]:
#shaq <- 'Shaquille O'Neal' # error
shaq <- 'Shaquille O\'Neal' # \ is the escape symbol
shaq <- "Shaquille O'Neal"

## 隨堂練習：What did Ross Geller say?

```r
Let's put aside the fact that you "accidentally" pick up my grand mother's ring.
```

In [22]:
ross_said <- "Let's put aside the fact that you \"accidentally\" pick up my grand mother's ring."

In [23]:
ross_said

In [24]:
ross_said <- 'Let\'s put aside the fact that you "accidentally" pick up my grand mother\'s ring.'

In [25]:
ross_said

## 使用 `sprintf()` 函數進行 Character interpolation

In [26]:
jeremy_lin_height <- 1.91
jeremy_lin_weight <- 91
jeremy_lin_bmi <- jeremy_lin_weight / jeremy_lin_height**2
sprintf("Jeremy Lin's BMI is %s", jeremy_lin_bmi)

## 使用 `sprintf()` 函數進行 Printing with format

- `%s`: 純文字
- `%f`: 浮點數

In [27]:
jeremy_lin_height <- 1.91
jeremy_lin_weight <- 91
jeremy_lin_bmi <- jeremy_lin_weight / jeremy_lin_height**2
sprintf("Jeremy Lin's BMI is %.2f", jeremy_lin_bmi)

## 邏輯運算符與邏輯值向量

## 邏輯運算符

- `>` 大於
- `>=` 大於等於
- `<` 小於
- `<=` 小於等於
- `==` 等於
- `!=` 不等於
- `%in%` 屬於
- `!` 非
- `&` 交集
- `|` 聯集

In [28]:
8 > 7
8 >= 7
8 < 7
8 <= 7
8 == 7
8 !=7
!(8 != 7)

## 大小寫敏感

In [29]:
class(TRUE)
class(FALSE)
#class(True)  # error
#class(False) # error
#class(true)  # error
#class(false) # error

## 俠客歐尼爾是否過重？

這取決於我們對「過重」的定義。

- BMI > 30 **而且**體脂率 > 25%
- BMI > 30 **或**體脂率 > 25%

In [30]:
shaq_bmi <- 31
shaq_body_fat <- 0.15
shaq_bmi > 30 & shaq_body_fat > 0.25

In [31]:
shaq_bmi <- 31
shaq_body_fat <- 0.15
shaq_bmi > 30 | shaq_body_fat > 0.25