# Int**R**oduction générale

<div class="subtitle1" id="coursename">
Techniques avancées en programmation statistique <strong>R</strong>
</div>
<div class="subtitle2" id="author">
Patrick Fournier<br>
Automne 2021<br>
Université du Québec À Montréal<br>
</div>

## Cours 1: Introduction
1. Un peu d'histoire
2. Niveaux de langage
3. Paradigmes endossés par **R**
3. Git et GitHub

## Un peu d'histoire
<div class="subtitle1">
La partie relax du cours
</div>

### Bell Lab
* Fondé en 1925 par la American Telephone & Telegraph Company (AT&T)
* 9 prix Nobels et 4 prix Turing
* Mecque du développement technologique au 20<sup>e</sup> siècle
 

### Ordinateur binaire (1939)
<center>
<img src="https://images.computerhistory.org/revonline/images/500004321-03-01.jpg?w=600"
 alt="Complex Number Calculator">
</center>

[Détails](https://history-computer.com/people/george-stibitz/)

### Transistor (1947)
<center>
<img src="https://media-bell-labs-com.s3.amazonaws.com/timeline/20160317_2221/1947_Transistor.jpg.810x785_q85_crop_upscale.jpg"
 alt="Vieux transistor">
</center>

[Détails](https://www.bell-labs.com/timeline/#/1940/1/open/)

### Téléphonie cellulaire (1947)
<center>
<img src="https://i.insider.com/4dc3f9c04bd7c8b8752c0000?width=700&format=jpeg&auto=webp"
 alt="Vieux cell">
</center>

[Détails](http://www.wb6nvh.com/MTSfiles/Carphone1.htm)

### Cellule photovoltaïque (1954)
<center>
<img src="https://i.kinja-img.com/gawker-media/image/upload/c_fit,f_auto,g_center,pg_1,q_60,w_965/ztvqbjoeelgunbojrlgn.jpg"
 alt="Vieux paneau solaire">
</center>

[Détails](https://gizmodo.com/60-years-ago-today-bell-labs-unveiled-the-solar-cell-1567543841)

### Laser (1957)
<center>
<img src="https://physics.aps.org/assets/8f0adce5-f395-486c-8a0c-2f42a6dc95c9/e24_1.jpg"
 alt="Vieux laser">
</center>

[Détails](https://physics.aps.org/story/v26/st24)

### Satellite de communication (1962)
<center>
<img src="https://d1p0gxnqcu0lvz.cloudfront.net/images/nbl-history-timeline-telstar-800x450.original.jpg"
 alt="Vieux satellite">
</center>

[Détails](https://www.bell-labs.com/about/history/innovation-stories/telstar-1/)

### Unix, C (1969 - 1972)
<center>
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/8/8f/Ken_Thompson_%28sitting%29_and_Dennis_Ritchie_at_PDP-11_%282876612463%29.jpg/1280px-Ken_Thompson_%28sitting%29_and_Dennis_Ritchie_at_PDP-11_%282876612463%29.jpg"
 alt="Ken & Den">
</center>

[Détails](https://unix.org/what_is_unix/history_timeline.html)

### C++ (années 1980)
<center>
<img src="https://upload.wikimedia.org/wikipedia/commons/d/da/BjarneStroustrup.jpg"
 alt="Bjarne">
</center>

[Détails](https://www.cplusplus.com/info/history/)

### S
* Inventé par John Chambers au sein des Bell labs
  + Seconde moitié des années 1970
* Développé pour la programmation statistique
  + Auparavant, Fortran
* Objectif: «To turn ideas into software, quickly and faithfully»
  + L'emphase n'est pas sur la performance

### **R** vs. S
* S est un langage de programmation (*spécification*) avec 3 *implémentations* majeures:
  + vieux S,
  + nouveau S,
  + **R**.
  
[Détails](https://cran.r-project.org/doc/FAQ/R-FAQ.html#What-are-the-differences-between-R-and-S_003f)

## Niveaux de langage
<div class="subtitle1">
Entre binaire et anglais
</div>

* Compromis entre *performance* et *convivialité*
* Par exemple:
    1. Langage machine
    2. Langage assembleur
    3. Langage de bas niveau
    4. Langage de haut niveau

### Langage machine
* *Directement* exécuté par la machine
* Très difficile à comprendre pour un humain

Exemple: Calcul d'un nombre de Fibonacci sur x86:
```
8B542408 83FA0077 06B80000 0000C383
FA027706 B8010000 00C353BB 01000000
B9010000 008D0419 83FA0376 078BD989
C14AEBF1 5BC3
```

### Langage de haut niveau
* Éloigné du langage machine, n'a presque rien à voir avec celui-ci
* Concu pour être *indépendant de l'architecture* et faciliter la vie du programmeur

Exemple: Addition de polynômes (sur $ \mathbb Z $) en Haskell:
```haskell
type Poly = [(Int, Int)]
-- Supposés ordonnés en ordre croissant
-- de puissances.

addPoly :: Poly -> Poly -> Poly
addPoly [] ys = ys
addPoly xs [] = xs
addPoly ((a, b):xs) ((c, d):ys)
    | a == c = ((a, b + d):(addPoly xs ys))
    | a < c = ((a, b):(addPoly xs ((c, d):ys)))
    | a > c = ((c, d):(addPoly ((a, b):xs) ys))
```

[Détails](https://wiki.haskell.org/Add_polynomials)

### Compilation vs. interprétation
* Ordinateur: exécute uniquement du code machine
* Autres langages doivent être «traduits»: *compilation*
* Autre possibilité: exécuter directement le code en utilisant un logiciel auxiliaire (préalablement compilé)
    + Logiciel auxiliaire: *interpréteur*
* **R** fonctionne ainsi

### Bref
**R** est
- Un langage de *haut niveau*
    + Vise à être plus près du langage mathématique que du langage machine
- Un langage *interprété*
    + Les scripts **R** sont interprétés, pas compilés
- Une *implémentation* de S
    + S est un ensemble de spécifications implémentées (entre autres) par **R**

## Paradigmes endossés par **R**
<div class="subtitle1">
<strong>R</strong> vs. les autres languages
</div>

* Paradigme: ensemble de caractéristiques d'un langage
* **R** est *multiparadigme* $ \Rightarrow $ flexibilité

### Programmation impérative
* Logiciel $ \Leftrightarrow $ modification successives de son propre *état*

In [3]:
autocor1 <- function(x) {
    covariance <- numeric(length(x))
    norm <- numeric(1)

    x <- scale(x)
    covariance <- crossprod(x, c(x[-1], x[1]))
    norm <- crossprod(x)

    covariance / norm
}

set.seed(42)
autocor1(rnorm(1000))

0
0.002118689


### Programmation fonctionnelle
* Logiciel $ \Leftrightarrow $ application de *fonctions*

In [2]:
library(purrr)

autoCor1_fun <- compose(
    function(x) crossprod(x, c(x[-1], x[1])) / crossprod(x),
    scale)

set.seed(42)
autoCor1_fun(rnorm(1000))

0
0.002118689


### Programmation réflective
* Un logiciel peut *examiner et modifier* sa structure

In [3]:
add1 <- function(x) x + 1
add1()

ERROR: Error in add1(): argument "x" is missing, with no default


In [4]:
formals(add1) <- pairlist(x = 42)
add1()

### Programmation orientée objet
* Le concept d'*objet* joue un rôle central.

In [5]:
v <- structure(1:5, class = c("monvecteur", "integer"))

summary.monvecteur <- function(x, ...) { 
        cat("Je suis le vecteur de Patrick!!!\n")
        NextMethod()
}
  
summary(v)

Je suis le vecteur de Patrick!!!


   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
      1       2       3       3       4       5 

### Array programming
* Opérations sur des *ensembles* de valeurs.

In [6]:
n <- 1000L

set.seed(666L)
sims <- replicate(n,
                  expr = lm(dist ~ I(speed + rnorm(50L)) - 1, cars),
                  simplify = FALSE)
β <- sapply(sims, coef)

wilcox.test(β, mu = coef(lm(dist ~ speed - 1, cars)))


	Wilcoxon signed rank test with continuity correction

data:  β
V = 133375, p-value < 2.2e-16
alternative hypothesis: true location is not equal to 2.909132


### Modèles de calcul
* *Kurt Gödel*: Fonction récursive
    + On Undecidable Propositions of Formal Mathematical Systems (1934)
* *Alonzo Church*: $ \lambda $-calcul
    + An Unsolvable Problem of Elementary Number Theory (1936) (Fonction récursive $ \Leftrightarrow $ $ \lambda $-calcul)
* *Alan Turing*: Machine de Turing («Logical computing machine»)
    + On Computable Numbers, with an Application to the Entscheidungsproblem (1937) ($ \lambda $-calcul $ \Leftrightarrow $ Machine de Turing)
* *Thèse de Church-Turing*: Ces trois modèles sont équivalents au sens où la classe des fonctions calculables est la même pour chacun.

## Git et GitHub
<div class="subtitle1">
Collaborer au 21<sup>e</sup> siècle.
</div>

* Système de gestion des versions:
    + Gérer l'ensemble des versions d'un groupe de fichiers.
* Git $ \neq $ GitHub.
* [Glosaire Git](https://git-scm.com/docs/gitglossary).
* [RTFM](https://git-scm.com/docs).
    + [git clone](https://git-scm.com/docs/git-clone).
    + [git add](https://git-scm.com/docs/git-add).
    + [git commit](https://git-scm.com/docs/git-commit).
    + [git pull](https://git-scm.com/docs/git-pull).
    + [git push](https://git-scm.com/docs/git-push).
    + [git remote](https://git-scm.com/docs/git-remote).

### Dépôt Git
* «Repository», «repo»
* Conteneur pour un ensemble de fichiers, par exemple:
    + Répertoire sur votre ordinateur
    + Dépôt GitHub
* Copie d'un dépôt: *clône*
* Cas typique:
    + Un dépôt sur GitHub
    + Un clône local

### Workflow typique
1. Mise à jour du dépôt local: `git pull`
1. Modifications dépôt local
2. Commettre les modifications: `git commit`
3. Rincer et répéter
4. Envoie des modifications locales vers GitHub: `git push`

### `git clone`
![Clone box](pictures/clone-box.png)

[![git clone](pictures/git-clone.svg)](https://asciinema.org/a/433615)

### `git commit`
[![git commit](pictures/git-commit.svg)](https://asciinema.org/a/433618)

### `git push`
[![git push](pictures/git-push.svg)](https://asciinema.org/a/433620)

### `git pull`
S'il y a des changements en amont:

[![git push](pictures/git-pull.svg)](https://asciinema.org/a/433621)