## Iteration with purrr

よく使うループ処理はそれ自体が関数となっている. 
関数プログラミングを用いることで, ループ処理を隠蔽しよう. 


In [1]:
library (tidyverse)

Loading tidyverse: ggplot2
Loading tidyverse: tibble
Loading tidyverse: tidyr
Loading tidyverse: readr
Loading tidyverse: purrr
Loading tidyverse: dplyr
Conflicts with tidy packages ---------------------------------------------------
filter(): dplyr, stats
lag():    dplyr, stats


### For Loop

普通のループは次のような処理となる. 

In [9]:
# set data
df <- lapply(1:4, rnorm, n=50) %>%
      set_names(letters[1:4]) %>%
      as_tibble()

# calc
output <- vector("double", ncol(df))
for (ii in seq_along(df)) {
    output[[ii]] <- median (df[[ii]])
}
output

### purrr
##### shortcut

In [13]:
# 無名関数はチルダ等を駆使して書き換えることが可能である
models <- 
    mtcars %>%
    split(.$cyl) %>%
    map(~lm (mpg ~ wt, data=.))
models

$`4`

Call:
lm(formula = mpg ~ wt, data = .)

Coefficients:
(Intercept)           wt  
     39.571       -5.647  


$`6`

Call:
lm(formula = mpg ~ wt, data = .)

Coefficients:
(Intercept)           wt  
      28.41        -2.78  


$`8`

Call:
lm(formula = mpg ~ wt, data = .)

Coefficients:
(Intercept)           wt  
     23.868       -2.192  



In [14]:
# 属性名を与えることで, 属性を取り出すことも可能のである
models %>%
    map(summary) %>%
    map("r.squared")

In [26]:
# 要素位置を与えることでも抽出が可能である
x <- list(list (1:3), list (4:6), list (7:9))
x %>% map( ~ map(., 2))

### Dealing with Failure

大量のループ処理が, 一カ所の失敗でなにも返されないのは衝撃的むかつく. 
そこで`safely()`関数を利用して関数を修正することを提案する.　
safelyは次の二つを返す. 

- result: 演算結果. エラーがあった場合にはそこをNULLとして返す
- error: エラーオブジェクト. resultの反対で成功している場合にはNULLとなる




In [31]:
x <- -2:2
safe_log <- safely(log)
y <- safe_log(x) # 警告が出るが,　yには演算結果が取得できている. 
print (y)

" 計算結果が NaN になりました "

$result
[1]       NaN       NaN      -Inf 0.0000000 0.6931472

$error
NULL



In [34]:
# possibillyはsafelyのシンプル版で, quietlyはエラーを削除する
x %>% map(possibly(log, NA_real_))
x %>% map(quietly(log))

" 計算結果が NaN になりました "

###  Mapping over Multiple Arguments

In [38]:
Filter(is.numeric, iris) %>% pmap(max) %>% flatten_dbl

### Invoking Different Functions

In [39]:
f <-  c("runif", "rnorm", "rpois")
param <- list (
    list (min = -1, max = 1), 
    list (sd = 5), 
    list (lambda = 10)
)
invoke_map(f, param, n = 5) %>% str

List of 3
 $ : num [1:5] 0.7991 0.8913 -0.6126 -0.0797 -0.061
 $ : num [1:5] 2.23 -1.87 -3.57 -3.6 3.79
 $ : int [1:5] 9 8 7 8 12


In [42]:
sim <- tribble (
    ~f, ~params, 
    "runif", list(min=-1,max=1), 
    "rnorm", list(sd=5), 
    "rpois", list(lambda=10)
)
sim %>%
    mutate (sim = invoke_map(f, params, n = 10)) %>%
    print()

# A tibble: 3 x 3
      f     params        sim
  <chr>     <list>     <list>
1 runif <list [2]> <dbl [10]>
2 rnorm <list [1]> <dbl [10]>
3 rpois <list [1]> <int [10]>


### Walk

副作用がないmapです. プロットを保存する際などに便利です. 

### Other Paterns of For Loop

In [47]:
iris %>% 
    keep(is.factor) %>%
    head()

Species
setosa
setosa
setosa
setosa
setosa
setosa


In [48]:
iris %>%
    discard(is.factor) %>%
    head()

Sepal.Length,Sepal.Width,Petal.Length,Petal.Width
5.1,3.5,1.4,0.2
4.9,3.0,1.4,0.2
4.7,3.2,1.3,0.2
4.6,3.1,1.5,0.2
5.0,3.6,1.4,0.2
5.4,3.9,1.7,0.4


In [49]:
iris %>%
    some(is.factor)

In [50]:
iris %>%
    every(is.numeric)

In [53]:
# detectは条件を満たす最初の値, 
# detect_indexはその要素位置
iris %>% detect( ~ is.factor(.)) %>% head()
iris %>% detect_index( ~ is.factor(.))