# R 程式設計

> 迭代資料

[數據交點](https://www.datainpoint.com/) | 郭耀仁 <yaojenkuo@datainpoint.com>

> When you’ve given the same in-person advice 3 times, write a blog post.
>
> David Robinson

## 迭代

> 程式語言中用來解決需要反覆執行、大量手動複製貼上程式碼的語法結構。

## 迭代能夠幫我們將資料結構中的資料一筆一筆取出來

- `while` 迴圈
- `for` 迴圈

## 組成迴圈的三個要件

- 起始值（start）：迭代資料的起點在哪裡？
- 終止值（stop）：迭代資料的終點在哪裡？
- 間隔（step）：從起點移動到終點的步幅為多少？

## `while` 迴圈的程式區塊

- 保留字 `while`
- 起始值（start）
- 終止值（stop）：被評估為邏輯值向量的敘述 `CONDITION`
- 間隔（step）

```r
i <- start # start
while (CONDITION) {  # stop
  # Codes written here will be ran repeatedly
  # until EXPR is evaluated as FALSE
  i <- i + step # step
}
```

## `for` 迴圈的程式區塊

- 保留字 `for` 與 `in`
- ITERATOR 迭代子
- ITERABLE 可迭代的物件（指派了 start、stop 與 step）
- 重複任務

```r
for (i in ITERABLE) { # start/stop/step
  # Codes written here will be ran repeatedly
  # until i reaches the end of ITERABLE
}
```

## 常見的迴圈任務

- `print()`
- 加總（Summation）
- 計數（Counter）
- 乘積（Product）
- 合併（Combine）

## 嚴格說來，如果我們面對的是向量，多數的任務不需要撰寫迴圈

- 加總（Summation）
- 計數（Counter）
- 乘積（Product）

## 面對向量，我們尋找的是函數

In [1]:
# 加總（Summation）
vec <- 6:10
sum(vec)

In [2]:
# 計數（Counter）
vec <- 6:10
length(vec)

In [3]:
# 乘積（Product）
vec <- 6:10
prod(vec)

## 多數的情況下，需要我們去迭代的對象是

- `list`
- `data.frame`

## 如何以 `while` 迭代一個 `list`

In [4]:
a_list <- list(6, 7, 8, 9, 10)
i <- 1
while (i <= length(a_list)) {
    print(a_list[[i]])
    i <- i + 1
}

[1] 6
[1] 7
[1] 8
[1] 9
[1] 10


## 如何以 `for` 迭代一個 `list`

In [5]:
a_list <- list(6, 7, 8, 9, 10)
for (item in a_list) {
    print(item)
}

[1] 6
[1] 7
[1] 8
[1] 9
[1] 10


## 如何以 `while` 迭代一個 `data.frame` 的列（rows）

In [6]:
avengers <- c("The Avengers", "Avengers: Age of Ultron", "Avengers: Infinity War", "Avengers: Endgame")
ratings <- c(8.0, 7.3, 8.4, 8.4)
release_year <- c(2012, 2015, 2018, 2019)
is_good <- ratings >= 8
avengers_df <- data.frame(title = avengers, rating = ratings, release_year, is_good)

In [7]:
i <- 1
while (i <= nrow(avengers_df)) {
    print(avengers_df[i, ])
    i <- i + 1
}

         title rating release_year is_good
1 The Avengers      8         2012    TRUE
                    title rating release_year is_good
2 Avengers: Age of Ultron    7.3         2015   FALSE
                   title rating release_year is_good
3 Avengers: Infinity War    8.4         2018    TRUE
              title rating release_year is_good
4 Avengers: Endgame    8.4         2019    TRUE


## 如何以 `while` 迭代一個 `data.frame` 的欄（columns）

In [8]:
i <- 1
while (i <= ncol(avengers_df)) {
    print(avengers_df[, i])
    i <- i + 1
}

[1] "The Avengers"            "Avengers: Age of Ultron"
[3] "Avengers: Infinity War"  "Avengers: Endgame"      
[1] 8.0 7.3 8.4 8.4
[1] 2012 2015 2018 2019
[1]  TRUE FALSE  TRUE  TRUE


## 如何以 `for` 迭代一個 `data.frame` 的列

In [9]:
for (i in 1:nrow(avengers_df)) {
    print(avengers_df[i, ])
}

         title rating release_year is_good
1 The Avengers      8         2012    TRUE
                    title rating release_year is_good
2 Avengers: Age of Ultron    7.3         2015   FALSE
                   title rating release_year is_good
3 Avengers: Infinity War    8.4         2018    TRUE
              title rating release_year is_good
4 Avengers: Endgame    8.4         2019    TRUE


## 如何以 `for` 迭代一個 `data.frame` 的欄

In [10]:
for (i in 1:ncol(avengers_df)) {
    print(avengers_df[, i])
}

[1] "The Avengers"            "Avengers: Age of Ultron"
[3] "Avengers: Infinity War"  "Avengers: Endgame"      
[1] 8.0 7.3 8.4 8.4
[1] 2012 2015 2018 2019
[1]  TRUE FALSE  TRUE  TRUE


## 所有的 `for` 都可以用 `while` 重現，但反之不然

- 確定重複運行次數的情境：採用 `for`
- 不確定重複運行次數的情境：採用 `while`

## 不確定重複運行次數的情境，包含

- 不確定性（Uncertainty）
- 隨機性（Randomness）