# Programmation fonctionnelle sur R

## Motivation

Considérons de problème suivant: vous avez fini de nétoyer vos données et vous voulez avoir un résumé des variables. Vous pourez écrire un code qui resemblait à ça

In [None]:
mean(df$a)
median(df$a)
sd(df$a)
mad(df$a)
IQR(df$a)

mean(df$b)
median(df$b)
sd(df$b)
mad(df$b)
IQR(df$b)
.
.
.
erc

Une autre consist à écrire une fonction résumé qui sera appliqué à toutes les variables. C'est plus efficace

In [None]:
summary <- function(x) {
  c(mean(x), median(x), sd(x), mad(x), IQR(x))
}
lapply(df, summary)

## Les fonctions annonymes

Les fonctions annonymes sont des fonctions qui n'ont pas de nom. On utilise ces fonctions lorsqu'il n'est pas necessaire nommer la fonction avant de l'utiliser

In [None]:
lapply(mtcars, function(x) length(unique(x)))
Filter(function(x) !is.numeric(x), mtcars)
integrate(function(x) sin(x) ^ 2, 0, pi)

## Closures

ce sont des fonction qui renvoit une fonction comme resultat

In [None]:
power <- function(exponent) {
  function(x) {
    x ^ exponent
  }
}

square <- power(2)

In [None]:
bc <- function(lambda) {
  if (lambda == 0) {
    function(x) log(x)
  } else {
    function(x) (x ^ lambda - 1) / lambda
  }
}

## la famille Apply

**` apply()`**

Renvoie un vecteur ou un tableau ou une liste de valeurs obtenues en appliquant une fonction aux marges d'un array ou d'une matrice

`apply(X, MARGIN, FUN, …)`

In [None]:
mymatrix<-matrix(1:9,nrow=3)

In [None]:
apply(mymatrix,1,sum) #somme des lignes

apply(mymatrix,2,sum) #somme des colonnes

# on peut aussi inclure les arguments de la fonction
apply(mymatrix,1,sum,na.rm=TRUE)

**`lapply()`**

syntaxe : `lapply(X, FUN,…)`

lapply renvoie une <font color="red">liste</font> de même longueur que X, dont chaque élément est le résultat de l'application de FUN à l'élément correspondant de X.

<font color="red">Pas besoin de marges</font>

In [None]:
mylist<-list(A=matrix(1:9,nrow=3),B=1:5,C=8)

lapply(mylist,sum)

unlist(lapply(mylist,sum))

avec une fonction annonyme

In [None]:
lapply(mylist,function(x) x*20)

**`sapply()`**

sapply est une version conviviale de lapply qui retourne par défaut un vecteur, une matrice ou, si simplify = "array", un tableau si nécessaire, en appliquant simplify2array().

`sapply(x, f, simplify = FALSE, USE.NAMES = FALSE)`  est la même chose que `lapply(x, f)`

In [None]:
sapply(mylist,sum)

**`mapply()`**

m représente multi-variante apply.



In [None]:
x<-c(A=20,B=1,C=40)
 y<-c(J=430,K=50,L=10)

simply<-function(u,v){
  (u+v)*2
}
mapply(simply,x,y)

**`tapply()`**


Appliquez une fonction à chaque cellule d'un tableau en escalier, c'est-à-dire à chaque groupe (non vide) de valeurs données par une combinaison unique des niveaux de certains facteurs.

In [None]:
tapply(iris$Sepal.Length,iris$Species,max)
setosa versicolor  virginica

### En résumé

**`apply()`**:- Applique une fonction sur les marges d'un tableau.

**`lapply()`**:- Boucle sur une liste et évalue une fonction sur chaque élément.

**`sapply()`**:- Identique à lapply mais en essayant de simplifier le résultat.

**`mapply()`**:- Version multivariée de lapply

**`tapply()`**:-Applique une fonction sur des sous-ensembles d'un vecteur.

## La famille Map,reduce,walk

In [None]:
install.packages("purr")
library(purrr)


# map

Elle prend un vecteur et une fonction, appelle la fonction une fois pour chaque élément du vecteur, et renvoie les résultats dans une liste. En d'autres termes,` map(1:3, f)` est équivalent à `list(f(1), f(2), f(3))`.
<table bgcolor="white">
    <tr><td><img src='https://d33wubrfki0l68.cloudfront.net/f0494d020aa517ae7b1011cea4c4a9f21702df8b/2577b/diagrams/functionals/map.png'>
        </td><td><img src='https://d33wubrfki0l68.cloudfront.net/e1b3536a7556aef348f546a79277125c419a5fdc/0c0a1/diagrams/functionals/map-arg.png'></td>
    <td><img src='https://d33wubrfki0l68.cloudfront.net/a468c847ea8aca9a6131492e1e7431f418259eaf/ce4e0/diagrams/functionals/map-arg-recycle.png'></td></tr>
</table>

In [1]:
triple <- function(x) x * 3
map(1:3, triple)
# possible d'utiliser une fonction annonyme

ERROR: Error in map(1:3, triple): impossible de trouver la fonction "map"


   Et on on crée notre propre fonction map

In [None]:
simple_map <- function(x, f, ...) {
  out <- vector("list", length(x))
  for (i in seq_along(x)) {
    out[[i]] <- f(x[[i]], ...)
  }
  out
}

Il y'a 4 variantes spécifiques de `map()`: `map_lgl()`, `map_int()`, `map_dbl()`, and `map_chr()`. Chacune retourne un vecteur atomique du type spécifié :

In [None]:
# map_chr() always returns a character vector
map_chr(mtcars, typeof)

In [None]:
# map_lgl() always returns a logical vector
map_lgl(mtcars, is.double)

In [None]:
# map_int() always returns a integer vector
n_unique <- function(x) length(unique(x))

In [None]:
# map_dbl() always returns a double vector
map_dbl(mtcars, mean)

### des racourcis

In [None]:
map(1:3, ~ runif(2))

![](https://d33wubrfki0l68.cloudfront.net/a468c847ea8aca9a6131492e1e7431f418259eaf/ce4e0/diagrams/functionals/map-arg-recycle.png)

In [2]:
plus <- function(x, y) x + y

x <- c(0, 0, 0, 0)
map_dbl(x, plus, 3)

ERROR: Error in map_dbl(x, plus, 3): impossible de trouver la fonction "map_dbl"


## map2

<table bgcolor="white">
    <tr><td><img src='https://d33wubrfki0l68.cloudfront.net/f5cddf51ec9c243a7c13732b0ce46b0868bf8a31/501a8/diagrams/functionals/map2.png'>
        </td><td><img src='https://d33wubrfki0l68.cloudfront.net/7a545699ff7069a98329fcfbe6e42b734507eb16/211a5/diagrams/functionals/map2-arg.png'></td></tr>
</table>

In [None]:
map2_dbl(xs, ws, weighted.mean)

### pmap

<table bgcolor="white">
    <tr><td><img src='https://d33wubrfki0l68.cloudfront.net/e426c5755e2e65bdcc073d387775db79791f32fd/92902/diagrams/functionals/pmap.png'>
        </td><td><img src='https://d33wubrfki0l68.cloudfront.net/2eb2eefe34ad6d114da2a22df42deac8511b4788/5a538/diagrams/functionals/pmap-arg.png'></td>
    <td><img src='https://d33wubrfki0l68.cloudfront.net/e698354d802ce16f83546db63c45a19b8d51f45e/43de7/diagrams/functionals/pmap-3.png'></td></tr>
</table>


In [None]:
pmap_dbl(list(xs, ws), weighted.mean, na.rm = TRUE)


params <- tibble::tribble(
  ~ n, ~ min, ~ max,
   1L,     0,     1,
   2L,    10,   100,
   3L,   100,  1000
)

pmap(params, runif)

## walk

<table bgcolor="white">
    <tr><td><img src='https://d33wubrfki0l68.cloudfront.net/d16783978b0d33756af9951ad3fba2596eb8e934/233ba/diagrams/functionals/walk.png'>
        </td><td><img src='https://d33wubrfki0l68.cloudfront.net/19d5f7d265107c81dded3e98319d48ec01821308/b8621/diagrams/functionals/walk2.png'></td></tr>
</table>

Pas besoin de sortie



In [None]:
welcome <- function(x) {
  cat("Welcome ", x, "!\n", sep = "")
}
names <- c("Elize", "Khady")

map(names, welcome)


In [None]:
temp <- tempfile()
dir.create(temp)

cyls <- split(mtcars, mtcars$cyl)
paths <- file.path(temp, paste0("cyl-", names(cyls), ".csv"))
walk2(cyls, paths, write.csv)

dir(temp)

Ici le walk2() est équivalent à `write.csv(cyls[[1]], paths[[1]])`, `write.csv(cyls[[2]], paths[[2]])`, `write.csv(cyls[[3]], paths[[3]])`.

# Reduce
reduce() prend un vecteur de longueur n et produit un vecteur de longueur 1 en appelant une fonction avec une paire de valeurs à la fois : `reduce(1:4, f)` est équivalent à `f(f(f(1, 2), 3), 4)`.

## walk

<table bgcolor="white">
    <tr><td><img src='https://d33wubrfki0l68.cloudfront.net/9c239e1227c69b7a2c9c2df234c21f3e1c74dd57/eec0e/diagrams/functionals/reduce.png'>
        </td><td><img src='https://d33wubrfki0l68.cloudfront.net/3f81c662fd1b426d7ce21e9369a10adcaa776272/f4809/diagrams/functionals/reduce-arg.png'></td></tr>
</table>

Pas besoin de sortie



In [3]:
l <- map(1:4, ~ sample(1:10, 15, replace = T))

reduce(l, intersect)

reduce(l, union)

ERROR: Error in parse(text = x, srcfile = src): <text>:4:4: unexpected symbol
3: reduce(l, intersect)
4: La première
      ^


### accumulate
La première variante de reduce(), accumulate(), est utile pour comprendre le fonctionnement de reduce, car au lieu de renvoyer uniquement le résultat final, elle renvoie également tous les résultats intermédiaires :

In [None]:
accumulate(l, intersect)

In [None]:
x <- c(4, 3, 10)
reduce(x, `+`)

accumulate(x, `+`)
