# R 語言的五十道練習

> 載入資料

[數據交點](https://www.datainpoint.com/) | 郭耀仁 <yaojenkuo@datainpoint.com>

## 練習題指引

- 第一個程式碼儲存格會將可能用得到的套件以及單元測試 `testthat` 載入。
- 如果練習題需要載入檔案，檔案與練習題存放在同個資料夾中，意即我們可以指定工作目錄來載入。
- 練習題已經定義好函數的名稱以及參數名稱，我們只需要寫作主體。
- 函數名稱下面幾行的註解部分是在描述測試如何進行。
- 觀察函數名稱下面幾行的註解部分能夠暸解輸入以及預期輸出之間的關係，幫助我們更暸解題目。
- 在 `### BEGIN SOLUTION` 與 `### END SOLUTION` 這兩個單行註解之間撰寫函數的主體。
- 可以先在 RStudio 寫出跟預期結果相同的程式後再複製貼上到練習題。
- 執行測試的方式為點選上方選單的 Kernel -> Restart & Run All -> Restart and Run All Cells。
- 可以每寫一題就執行測試，也可以全部寫完再執行測試。
- 練習題閒置超過 10 分鐘會自動斷線，這時只要重新點選練習題連結即可重新啟動。

In [1]:
library("testthat")
library("readxl")
library("jsonlite")
library("DBI")

## 自行定義函數 `read_players_csv` 載入工作目錄的 `players.csv`。

- 預期輸入：一個文字向量。
- 預期輸出：一個外型為 `(484, 18)` 的資料框。

In [2]:
read_players_csv <- function(file_path) {
    # players_csv <- read_players_csv("players.csv")
    # dim(players_csv)
    # [1] 484  18
    ### BEGIN SOLUTION
    out <- read.csv(file_path)
    return(out)
    ### END SOLUTION
}

## 自行定義函數 `read_teams_xlsx` 載入工作目錄的 `teams.xlsx`。

- 預期輸入：一個文字向量。
- 預期輸出：一個外型為 `(30, 18)` 的資料框。

In [3]:
read_teams_xlsx <- function(file_path) {
    # teams_xlsx <- read_teams_xlsx("teams.xlsx")
    # dim(teams_xlsx)
    # [1] 30  12
    ### BEGIN SOLUTION
    out <- read_excel(file_path)
    return(out)
    ### END SOLUTION
}

## 自行定義函數 `read_career_summaries_json` 載入工作目錄的 `career_summaries.json`。

- 預期輸入：一個文字向量。
- 預期輸出：一個外型為 `(484, 31)` 的資料框。

In [4]:
read_career_summaries_json <- function(file_path) {
    # career_summaries_json <- read_career_summaries_json("career_summaries.json")
    # dim(career_summaries_json)
    # [1] 484  31
    ### BEGIN SOLUTION
    out <- fromJSON(file_path)
    return(out)
    ### END SOLUTION
}

## 自行定義函數 `read_all_tables_in_nba_db` 載入工作目錄的 `nba.db` 中的兩個資料表：`teams` 與 `career_summaries`。

- 預期輸入：一個文字向量。
- 預期輸出：一個長度為 2 的清單。

In [5]:
read_tables_in_nba_db <- function(file_path) {
    # tables_in_nba_db <- read_tables_in_nba_db("nba.db")
    # class(tables_in_nba_db)
    # [1] "list"
    # dim(tables_in_nba_db$teams)
    # [1] 30  12
    # dim(tables_in_nba_db$career_summaries)
    # [1] 484  31
    ### BEGIN SOLUTION
    con <- dbConnect(RSQLite::SQLite(), "nba.db")
    out <- list()
    out[["teams"]] <- dbReadTable(con, "teams")
    out[["career_summaries"]] <- dbReadTable(con, "career_summaries")
    return(out)
    ### END SOLUTION
}

## 執行測試

Kernel -> Restart & Run All. -> Restart and Run All Cells. 

In [6]:
test_read_players_csv <- tryCatch({
    test_that("test_read_players_csv", {
        expect_equal(dim(read_players_csv("players.csv")), c(484, 18))   
    })
    }, error = function(e) {
        FALSE
})
test_read_teams_xlsx <- tryCatch({
    test_that("test_read_teams_xlsx", {
        expect_equal(dim(read_teams_xlsx("teams.xlsx")), c(30, 12))   
    })
    }, error = function(e) {
        FALSE
})
test_read_career_summaries_json <- tryCatch({
    test_that("test_read_career_summaries_json", {
        expect_equal(dim(read_career_summaries_json("career_summaries.json")), c(484, 31))   
    })
    }, error = function(e) {
        FALSE
})
test_read_tables_in_nba_db <- tryCatch({
    test_that("test_read_tables_in_nba_db", {
        expect_type(read_tables_in_nba_db("nba.db"), "list")
        expect_equal(dim(read_tables_in_nba_db("nba.db")$teams), c(30, 12))
        expect_equal(dim(read_tables_in_nba_db("nba.db")$career_summaries), c(484, 31))
    })
    }, error = function(e) {
        FALSE
})

all_tests <- c(test_read_players_csv,
               test_read_teams_xlsx,
               test_read_career_summaries_json,
               test_read_tables_in_nba_db
              )
passed_tests <- sum(all_tests)

[32mTest passed[39m 😸
[32mTest passed[39m 🥳
[32mTest passed[39m 🌈
[32mTest passed[39m 🌈


In [7]:
sprintf("在 %s 題練習中，您總共答對了 %s 題。", length(all_tests), passed_tests)