# Les bases de la programmation R

R est un langage de programmation « interprété » (en opposition avec « compilé »).
C’est-à-dire que dès que l’on tape une ligne de code, on la valide et on voit immédiatement le résultat.
On n’a pas besoin de l’étape de compilation : le code est compilée à la volée.
C’est souvent beaucoup plus facile pour corriger les erreurs que l’on fait en écrivant le code.

Exemple de lagage interprété : Matlab, ENVI, Java, Python...

Exemple de langage compilé : C, C++, Fortran, Pascal...

### Mes premiers pas en R sous Jupyter

Taper un chiffre dans la boite ci dessous et appuyer sur les touches **MAJ+Entrée** pour voir le résultat. Le résultat doit apparaitre sous la boite.

In [None]:
2

Soyons rassurés, le logiciel retourne le même résultat. 

Entrez maintenant une valeur décimale de votre choix (n'oubliez pas de taper sur **MAJ+Entrée** pour afficher le résultat).

Attention, une valeur décimale s'écrit avec un point et non une virgule !

### Opérations arithmétiques

Comme une calculatrice, il est possible de faire des opérations arithmétiques simples avec R, comme par exemple : l'addition, la soustraction, la multiplication et la division. 

Un exemple est présent dans la boite ci dessous, exécutez le code (cad, tapez sur **MAJ+Entrée**) pour voir le résultat. Ceci est valable pour toutes les autres boites que vous allez rencontrer dans ce document.

In [None]:
(10*3+4)/(78-5)

**Exercice** : C'est les soldes ! Un pull à 50 euros est vendu avec une réduction de 30%. Combien vous a coûté le pull ?

Le reste de la division s'obtient :

In [None]:
10%%3

La puissance d'un nombre :

In [None]:
5^6

## Les variables

Lorsque l'on programme, on a besoin de stocker les résultats quelque part. C'est pour cela que l'on utilise des variables. Chaque variable a un nom unique, et deux variables ne peuvent pas avoir le même nom.

Les variables servent à stocker des informations qui peuvent prendre plusieurs formes: une valeur numérique (cad un nombre), du texte, un tableau, un vecteur ou encore une matrice.

Une variable peut être crée avec l'opérateur "assigner" qui s'écrit avec le sympole "inférieur à" (<) composée d'un signe moins (-) accollé. 
Dans l'exemple suivant, on crée une variable de nom "a" et qui contient le nombre 43

In [None]:
a <- 43

**Exercice** : créer une variable de nom "toto" qui contient le chiffre 6

Vous pouvez choisir n'importe quels noms pour vos variables à condition de respecter les règles suivantes :

- Les noms des variables doivent commencer par une lettre
- La casse (caractère en minuscule ou majuscule) est importante (« A » est différent de « a »)
- Le nom des variables peuvent contenir des chiffres et des caractères spéciaux (mais pas en 1er caractère)
- Les variables ne peuvent pas être appelés avec des noms déjà utilisés par R

Il est fortement recommandé d'utiliser un nom de variable qui décrit l'information que l'on y stocke. Par exemple, plutôt que d'écrire :    

In [None]:
titi <- 25

Il est préférable d'écrire :

In [None]:
NombreDeFromagesEnStock <- 25

Ou (c'est question de goût) :

In [None]:
nombre_de_fromages_en_stock <- 25

Essayons maintenant avec une chaine de caractère :

In [None]:
message_de_bienvenue <- "bonjour"

**Exercice** : créer une variable nommée "message_en_anglais" qui contient la chaine de caractère : Hello

Vous venez donc de créer plusieurs variables. Pour afficher toutes les variables créées pendant cette session, il faut utiliser la fonction ls() 

In [None]:
ls()

Pour voir la valeur prise par une variable, il faut utiliser la fonction print() en mettant dans la paranthèse le nom de la variable dont on veut connaitre sa valeur

In [None]:
print(a)

**Exercice** : Quelle est la valeur de message_de_bienvenue ?

## Les fonctions

Dans R, il existe déjà de nombreuses fonctions, ce sont :
- Outils mathématiques (calcul de la moyenne, somme d’une colonne, etc)
- Outils pratique (sauvegarde d’un tableau…)
- Outils propre au langage (afficher de l’aide…)

Ces outils sont déjà créés dans R (on n’a pas à re-coder)
- Ce qui nous fait gagner du temps
- Mais, il faut les connaitre

On vient déjà d'utiliser deux fonctions : ls() et print()

Par contre, on ne peut pas connaitre par coeur toutes les fonctions de R : il faut utiliser l’aide (en utilisant une fonction !)
Pour afficher l'aide (en anglais) :

In [None]:
help()

Ou encore si vous voulez afficher l'aide de la fonction "ls"

In [None]:
help(ls)

ou encore :

In [None]:
?ls

Une fonction est caractérisée par 2 composantes :
- Son nom 
- Liste d’arguments : information dont la fonction a besoin pour travailler. Selon les fonctions, il y a un ou plusieurs arguments.

Syntaxe : nom(arguments)

**Exercice** : Exprimer la racine carrée de 25 sachant que :
- le nom de la fonction est : sqrt()
- l'argument est le nombre dont on souhaite connaitre la racine carré.

**Exemple** : Créer une variable "lulu" qui contient un chiffre de votre choix et prenez-en le logarithme népérien.
Afficher le résultat.

Remarquez que l'on peut écrire plusieurs ligne dans une même boite.

In [None]:
lulu <- 5
print(log(lulu))

**Exercice** : créer une variable "fifi" qui contient la valeur pi/4 et calculer le sinus et le cosinus de cette variable. Afficher le résultat

**Exercice** : à quoi servent les fonctions mathématiques suivantes ?
- floor()
- ceiling()
- round()

Testez-les avec des nombres décimaux !

## Les vecteurs

Un vecteur est un élément de base du langage R.
C’est une liste d’éléments qui sont tous du même type.
C’est une structure qui permet de stocker plusieurs nombres dans une même variable.
Le vecteur "titi" est un vecteur de taille 4 contenant les chiffres : 1,2,3,5

In [None]:
titi = c(1,2,3,5)
print(titi)

Il est souvent utile de vérifier la taille de nos vecteurs :

In [None]:
length(titi)

Le vecteur titi est bien de taille 4 !
Garder en tête qu'un nombre est un vecteur de taille 1.

Selon le contexte, il existe beaucoup de solution pour créer un vecteurs sous R : 

In [None]:
# concatener(i.e coller) des vecteurs
vec <- c(1,45,6,78)
print(vec)

In [None]:
# générer une suite de 1 à 10 
vec <- 1:10
print(vec)

In [None]:
# générer une suite de 1 à 10 par pas de 2
vec <- seq(1,10,by=2)
print(vec)

In [None]:
# générer une suite composée de 13 éléments avec le plut petit égal à 1 et le plus grand égal à 20
vec <- seq(1,20,length=13)
print(vec)

Dans ces quatre dernières boites, les lignes commençant par # sont des commentaires : ce sont des lignes non interprétées par R qui permettent d'expliquer le code.

**Exercice** : Créer un vecteur de taille 40, nommé gégé, dont les 20 premiers éléments sont une suite de 11 à 30 et les 20 derniers éléments, une suite décroissante de 40 à 21.

Comment fait-on pour obtenir le 4ème élément du vecteur ?

In [None]:
# création d'un vecteur 
vec <- 11:20
# création d'une nouvelle variable qui contient le 4ème élément du vecteur vec
a <- vec[4]
# affichage du résultat
print(a)

**Exercice** : Quel est la valeur du 33ème terme du vecteur "gégé". Afficher le résultat.

### Des vecteurs et des fonctions !

Nous allons tester différentes fonctions sur un vecteur. Commençons par créer un vecteur de taille 10 contenant des nombres choisis aléatoirement avec la fonction sample()

In [None]:
youpi <- sample(10)
print(youpi)

Quelle est l'utilité des fonctions suivantes :

**Exercice** : répondez à la question en utilisant la boite ci dessous

### Premier petit exemple
Nous allons travailler sur la masse de 4 individus :
- Marc : 77 kg
- Sophie : 58 kg
- Julie : 66 kg
- Blaise : 83 kg

Etape 1 : créer un vecteur "masse" contenant la masse des 4 individus 

Etape 2 : créer un vecteur "nom" contenant le nom des 4 individus

Etape 3 : construire un graphique avec la masse et le nom de chaque individu. Pour cela utiliser la fonction barpot(). Si vous ne savez pas l'utiliser, consultez l'aide !

## Les boucles et conditions

Sous R, on peut programmer des suites d’analyses qui se font successivement. C'est un des intérêts de la programmation.
Il existe 3 cas principaux :

### La boucle FOR

La boucle FOR permet d'exécuter une instruction sur certaines valeurs (que l'on connait !).

**Exemple** : imaginons un vecteur aléatoire de taille 15. On veut ajouter le chiffre 2 à tous les nombres du vecteur à partir du rang 3 jusqu'au 10ème rang. Du rang 1 à 2 et à partir du rang 11, on ne fait rien.
Pour cela utilisons la boucle FOR

In [None]:
# création du vecteur aléatoire
vec <- sample(15)
print(vec)

# Avant de faire une boucle, il faut préparer le vecteur qui va recevoir le résultat.
# Cela s'appelle une allocation de mémoire
# Dans notre cas, on va recopier le vecteur vec
vec2 <- vec

# boucle FOR  : le résultat est le vecteur vec2
for(ii in 3:10){vec2[ii] <- vec[ii]+2}
print(vec2)

Pour la boucle for, il faut bien respecter la synthaxe (i.e. mettre les parenthèses et les acolades au bon endroit) sinon le code ne fonctionne pas.

La variable ii dans la boucle for va prendre successivement toutes les valeurs entre 3 et 10 (i.e : 3,4,5,6,7,8,9,10). Dans ce code, ces valeurs correspondent au rang du vecteur.

**Exercice** : Créer deux vecteurs aléatoires "u" et "v" de taille 8 chacun. Additionner ces deux vecteurs dans un troisième vecteur nommé "w" en utilisant une boucle for. Afficher le résultat.

Cet exercice est pûrement pédagogique et peut se faire de beaucoup d'autres façons...

**Exercice (plus dur !)** : L'objectif de cet exercice est de coder la suite de Fibonacci. C'est une suite de nombres entiers très connue. Les deux premiers termes de la suite sont 0 (1er terme) et 1 (2ème terme). Le 3ème terme est la somme du 1er et 2ème terme. Si l'on généralise, on dit que le n-ième terme est la somme du (n-1)ième terme et du (n-2)ième terme.

Le début de la suite de Fibonacci est donc : 0,1,1,2,3,5,8,13...

Coder la suite de Fibonacci pour les 100 premiers termes de la suite. Donner la valeur du 100ième terme de la suite.

### La condition "Tant que"

La condition "tant que" ("while" en anglais) permet d'exécuter une instruction tant qu'une condition est vraie. 

Dans l'exemple suivant, on veut sommer deux entiers (s et n) et cela tant que l'entier "s" est plus petit ou égal à 100. A chaque itération, on ajoute 1 à l'entier "n" et "s" prend une nouvelle valeur correspondant à la somme de "s" et de "n".

In [None]:
# initialisation des variables
seuil <- 100
n <- 0
s <- 0
# condition "tant que"
while (s <= seuil) {
  n <- n + 1
  s <- s + n }
# affichage du résultat
print(c(n,s))

**Exercice** : Considérons une plante de 1 an qui mesure 10 centimètres et qui grandit de 10 % tous les ans jusqu’à atteindre 2 mètres. Combien lui faut-il d'années pour atteindre 2 mètres ? A vous de coder le problème pour trouver la solution

### La condition IF

L'instruction IF permet d'exécuter du code si une condition est remplie.

Par exemple, on va écrire "Hello" que pour des nombres inférieurs à 5. Pour choisir ce nombre, on va utiliser la fonction runif() qui tire aléatoirement un nombre dans une distribution uniforme comprise entre un nombre min (1 pour nous) et max (10 pour nous). Selon le nombre choisi, le code retournera "Hello" ou rien ! Exécuter le code plusieur fois pour voir la différence.

In [None]:
# nombre aléatoire
x <- runif(1, min = 1, max = 10)
print(x)
# condition if
if (x <5) {print("Hello")}

En utilisant la commande "IF.... ELSE", on peut ajouter une condition : si la condition est remplie, on exécute une instruction sinon (else) on en exécute une différente.

Reprennons l'exemple précédent et ajoutons la condition else : si le nombre est supérieur ou égal à 5, on affiche "bye".

In [None]:
# nombre aléatoire
x <- runif(1, min = 1, max = 10)
print(x)
# condition if
if (x <5) {print("Hello")} else 
{print("Bye")}

Attention, lorsque l’on fait des regroupements et qu’on utilise la structure if et else, il est nécessaire d’écrire le mot else sur la même ligne que la parenthèse fermante du groupe d’instructions à réaliser dans le cas où la condition du if est vérifiée.

**Exercice** : On va créer aléatoirement un nombre entier compris entre 1 et 10. L'objectif est de créer un code permettant à l'utilisateur de savoir si ce nombre est pair ou impair. Le code doit afficher le résultat.

Aide : pour créer aléatoirement un nombre entier compris entre 1 et 10, utiliser la fonction suivante : sample(x = 1:10, size = 1)

Les trois conditions (IF, FOR, WHILE) peuvent également être combinées pour traiter des problèmes plus complexes.

**Exercice (plus dur !)** : Créer deux vecteurs aléatoires "u" et "v" avec la fonction sample(). On veut savoir si, pour chaque terme, le résultat de "u+v" est divisible par 3 ou pas. Afficher clairement le résultat.

## Créer des fonctions
Si vous êtes arrivé à lire ces mots sans vous endormir ou sans sur-chauffer, vous avez déjà utilisé des fonctions R (print, sample, runif, barplot...)
Mais, on peut aussi créer nos propres fonctions dans le but de les réutiliser mais en modifiant des paramètres.

Dans cet exemple, on va créer une fonction qui retourne un graphique pour y = cos( a.x ) avec x
allant de 1 à 20.
On veut pouvoir exécuter le code en spécifiant la valeur de « a » (c'est l'intérêt de créer une fonction !).
Cette fonction se nommera cosA et demandera un paramètre d’entrée : a

In [None]:
cosA <- function(a){
    x <- seq(1,20,by=0.2)
    y <- cos(a*x)
    plot(x,y,type='l')
}

La fonction est créée et s'appelle cosA. Notez bien la synthaxe utilisée pour créer une fonction.

Il faut maintenant l'éxécuter pour voir le résultat (i.e. taper le nom de la fonction dans une boite). Cette fonction nécessite un paramètre d'entrée (a). Ne pas oublier de mettre se chiffre pour exécuter la fonction.

In [None]:
cosA(3)

On peut essayer avec d'autres valeurs de "a". Observer le résultat.

**Exercice** : Lors des soldes, un commerçant cherche à appliquer des réductions sur ses produits mais il ne sait pas encore quel pourcentage appliquer. Commençons par un article à 99 euros. Créer une fonction avec un paramètre permettant de tester différentes réductions sur l'article. Soyez explicite dans les sorties de la fonction. C'est à dire, indiquez le pourcentage appliqué et le prix de revient de l'article.

Exécutez votre fonction là :

**Exercice** (plus dur !) : Une fonction peut avoir plusieurs paramètres en entrée. Ajouter un paramètre à la fonction précédente pour pouvoir utiliser la fonction quelque soit le prix des articles. Ne pas utiliser le même nom que la fonction précédente.

Exécuter votre fonction là :