In [1]:
source("../utils.R")
options(repr.plot.width = 10, repr.plot.height = 10)

‚ÄúNAs introduced by coercion‚Äù


# Packaging üì¶

<div class="subtitle1" id="coursename">
Techniques avanc√©es en programmation statistique <strong>R</strong>
</div>
<div class="subtitle2" id="author">
Patrick Fournier<br>
Automne 2021<br>
Universit√© du Qu√©bec √Ä Montr√©al<br>
</div>

## Cours 5: Packaging
1. Qu'est-ce qu'un package?
2. Structure d'un package **R**
3. Documentation et namespaces

## Qu'est-ce qu'un package?

* Description compl√®te: [Writing R Extensions](https://cran.r-project.org/doc/manuals/r-release/R-exts.html)
* Peu d'exigences:
    + Un r√©pertoire
    + Nom du r√©pertoire $ = $ nom du package (convention)
    + Un fichier nomm√© `DESCRIPTION`
    + `DESCRIPTION` contient les m√©ta informations (nom, auteurs, description, ...)
* Un tel package minimal n'est pas d'une grande utilit√©

### Terminologie

* *Package*: R√©pertoire de fichiers ajoutant des fonctionnalit√©s √† **R**
    + *source*: L'ensemble des fichiers utilis√©s pour le d√©veloppement d'un package
    + *bundle*: Tarball (archive) contenant le package
    + *installed*: Ce que l'on obtient en ex√©cutant `R CMD INSTALL` sur un package
    + *binary package* ü™ü: zip ou tarball contenant les fichiers d'un package install√©

### Outils

* Parfaitement possible de cr√©er un package √† la main
* Package [devtools](https://devtools.r-lib.org/) simplifie le travail
    + [R√©f√©rence rapide (cheat sheet)](https://raw.githubusercontent.com/rstudio/cheatsheets/master/package-development.pdf)
* Plusieurs fonctionalit√©s de devtools sont int√©gr√©es √† **R**Studio

## Structure d'un package **R**
### Squelette de **R**Studio

* `.gitignore`: Fichiers ignor√©s par git
* `.Rbuildignore`: Fichiers ignor√©s lors de la cr√©ation du bundle
* `<nom du projet>.Rproj`: Fichier de configuration de **R**Studio
* `DESCRIPTION`: M√©tadonn√©es du package
* `NAMESPACE`: Symboles import√©s/export√©s
* `man`: Documentation
* `R`: Code **R**

### `DESCRIPTION`
<div class="subtitle1">
    champs obligatoires
</div>

* `Package`: Nom du package
* `Version`: Version du package
* `License`: Licence sous laquelle votre package est distribu√©
* `Title`: Description courte du package
* `Description`: Description longue du package
* `Author`: Auteurs du package (nom, e-mail et [roles](https://journal.r-project.org/archive/2012-1/RJournal_2012-1_Hornik~et~al.pdf))
* `Maintainer`: Responsable (unique) du package (nom et e-mail)

Par ailleurs,
* Possible et *recommand√©* de fournir un seul champ `Authors@R` en remplacement de `Author` et `Maintainer`
* [Liste compl√®te des codes MARC (pour les roles)](https://www.loc.gov/marc/relators/relaterm.html)

[D√©tails](https://r-pkgs.org/description.html)

### `DESCRIPTION`
<div class="subtitle1">
    champs facultatifs usuels
</div>

* `Copyright`: D√©tenteur du copyright (si diff√©rent de l'auteur)
* `Date`: Date de sortie du package (yyyy-mm-dd)
* `Depends`: D√©pendances *attach√©es* du package
    + √Ä utiliser uniquement pour sp√©cifier la version de **R** requise
* `Suggest`: Packages utiles dont ne d√©pend pas le package courrant
* `Imports`: D√©pendances *non attach√©es* du package
* `Collate`: Ordre de chargement des fichiers **R**
    + Par d√©faut, ordre alphab√©tique
* `URL`: Liste d'URL li√©s au package
* `BugReports`: URL pour la soumission des rapports de bugs
* `LazyData`: Les donn√©es doivent-elles √™tre charg√©es paresseusement (i.e. √† la demande)?
* `ByteCompile`: Les package doit-il √™tre byte compil√©?
    + Par d√©faut, `true`
* `BuildVignette`: Les vignettes doivent-elles √™tre construites?
    + Par d√©faut, `true`
* `NeedsCompilation` Le package n√©cessite-t-il une phase de compilation (yes/no)?

### `DESCRIPTION`
<div class="subtitle1">
    Recommandations
</div>

* Possibilit√© d'utiliser des champs arbitraires
* `Depends`ne devrait √™tre utilis√© que pour sp√©cifier une version minimal de **R**
    + Exemple: `Depends: R(>= 4.1)`
* Les champs `Imports`, `Suggests`, `Enhances` et `Linkingto` ne devraient *jamais* √™tre modifi√©s √† la main $ \Rightarrow $ `usethis::use_package`
* Le champ `Authors@R` doit contenir un vecteur d'objets de classe `person`
* [Liste compl√®te des champs utilis√©s par **R**](https://cran.r-project.org/doc/manuals/r-release/R-exts.html#The-DESCRIPTION-file)

## Documentation et namespace

* Le r√©pertoire `man/` contient la documentation
* Pas n√©cessaire/souhaitable de la modifier par nous-m√™mes
* Package *roxygen2* g√©n√®re la documentation automatiquement
    + Rep√®re les commentaires comme√ßant par `'` et les transforme en documentation
* Mise √† jour: `devtools::document`

[D√©tails](https://r-pkgs.org/man.html)

### Exemple

In [2]:
#' Titre
#'
#' Le second paragraphe est toujours la description. Le premier
#' paragraphe est le titre et ne devrait pas √™tre plus long
#' qu'une phrase. Ce paragraphe donne une description g√©n√©rale
#' de l'objet √† documenter.
#'
#' L'ensemble des paragraphes suivants contient les d√©tails
#' de l'objet √† documenter.

### Documentation

* Il est d'usage de documenter le package lui-m√™me
* Documenter la cha√Æne de caract√®re `"_PACKAGE"`

### Documentation
<div class="subtitle1">
    Tags Roxygen
</div>

Pour les fonctions:
* `@param name description`: D√©crit un des arguments d'une fonction
* `@examples`: Code **R** valide
* `@return`: Description de la valeur de retour d'une fonction

S3 (g√©n√©riques et m√©thodes): se documentent comme des fonctions (puisque ce sont des fonctions)

### Exemple 
<div class="subtitle1">
    Shadowing
</div>

In [3]:
address <- function() "PK-5323"
x <- 42
address()

In [4]:
pryr::address(x)

In [5]:
library(pryr)


Attaching package: ‚Äòpryr‚Äô


The following object is masked _by_ ‚Äò.GlobalEnv‚Äô:

    address




In [6]:
address(x)

ERROR: Error in address(x): unused argument (x)


### Namespace

* La plupart des packages rendent disponible certains symboles
* Pour √©viter les conflits, chaque package poss√®de son propre *namespace*
* `library(pkg)`: *attache* `pkg`
    + Symboles export√©s par `pkg` disponible de l'*environement global*
    + $ \Rightarrow $ risque de conflit
* Possibilit√© de *charger* un package sans l'attacher
    + Symboles: disponibles
    + N√©cessit√© d'y r√©f√©rer explicitement: `::`
    
[D√©tails](https://r-pkgs.org/namespace.html)

### Namespace
<div class="subtitle1">
    En pratique
</div>

* Control√© par le fichier `NAMESPACE`
    + Ne devrait *Jamais* √™tre modifi√© √† la main
* Peut √™tre g√©r√© √† partir de commentaires roxygen2 ü§î
* $ \Rightarrow $ Chaque modification doit √™tre suivie d'un `devtools::document()` pour prendre effet

### Namespace
<div class="subtitle1">
    Importation
</div>

* 99% du temps: `Import` et `::`
    + `Import: pkg` s'assure que `pkg` est install√©
    + `pkg::obj` charge automatiquement `pkg` sans l'attacher
* Possible impact sur la performance caus√© par `::`
* Solution: attacher `obj`
    + Roxygen: `@importFrom pkg obj`

### Namespace
<div class="subtitle1">
    Exportation
</div>

* Exportation $ \Rightarrow $ ajouter une entr√©e dans `NAMESPACE`
* Encore une fois, on utilise Roxygen!
* Tag: `@export`
* D√©termine automatiquement si fonction "normale", m√©thode S3, etc.