# Les bases de la programmation R

R est un langage de programmation « interprété » (en opposition avec « compilé »).
C’est-à-dire que dès que l’on tape une ligne de code, on la valide et on voit immédiatement le résultat.
On n’a pas besoin de l’étape de compilation : le code est compilée à la volée.
C’est souvent beaucoup plus facile pour corriger les erreurs que l’on fait en écrivant le code.

Exemple de lagage interprété : Matlab, ENVI, Java, Python...

Exemple de langage compilé : C, C++, Fortran, Pascal...

### Mes premiers pas en R sous Jupyter

Taper un chiffre dans la boite ci dessous et cliquer sur le bouton **Exécuter** en haut de l'écran pour voir le résultat. Le résultat doit apparaitre sous la boite.

In [None]:
2

Soyons rassurés, le logiciel retourne le même résultat. 

Entrez maintenant une valeur décimale de votre choix (n'oubliez d'exécuter le code pour afficher le résultat).

Attention, sous R, une valeur décimale s'écrit avec un point et non une virgule !

### Opérations arithmétiques

Comme une calculatrice, il est possible de faire des opérations arithmétiques simples avec R, comme par exemple : l'addition, la soustraction, la multiplication et la division. 

Un exemple est présent dans la boite ci dessous, exécutez le code pour voir le résultat. Ceci est valable pour toutes les autres boites que vous allez rencontrer dans ce document.

In [None]:
(10*3+4)/(78-5)

**Exercice** : C'est les soldes ! Un pull à 50 euros est vendu avec une réduction de 30%. Combien vous a coûté le pull ?

Le reste de la division s'obtient :

In [None]:
10%%3

La puissance d'un nombre :

In [None]:
5^6

## Les variables

Lorsque l'on programme, on a besoin de stocker les résultats quelque part. C'est pour cela que l'on utilise des variables. Chaque variable a un nom unique, et deux variables ne peuvent pas avoir le même nom.

Les variables servent à stocker des informations qui peuvent prendre plusieurs formes: une valeur numérique (cad un nombre), du texte, un tableau, un vecteur ou encore une matrice.

Une variable peut être crée avec l'opérateur "assigner" qui s'écrit avec le sympole "inférieur à" (<) composée d'un signe moins (-) accollé. 
Dans l'exemple suivant, on crée une variable de nom "a" et qui contient le nombre 43

In [None]:
a <- 43

**Exercice** : créer une variable de nom "toto" qui contient le chiffre 6

L'ordinateur stocke en mémoire la valeur numérique assignée à "a" et "toto". On peut continuer à faire des opérations avec ces variables. Par exemple, ajoutons 2 à la variable "a" et stockons ce résultat dans une nouvelle variable nommé "a2".

In [None]:
a2 <- a + 2

Vous pouvez choisir n'importe quels noms pour vos variables à condition de respecter les règles suivantes :

- Les noms des variables doivent commencer par une lettre
- La casse (caractère en minuscule ou majuscule) est importante (« A » est différent de « a »)
- Le nom des variables peuvent contenir des chiffres et des caractères spéciaux (mais pas en 1er caractère)
- Les variables ne peuvent pas être appelés avec des noms déjà utilisés par R

Il est fortement recommandé d'utiliser un nom de variable qui décrit l'information que l'on y stocke. Par exemple, plutôt que d'écrire :    

In [None]:
titi <- 25

Il est préférable d'écrire :

In [None]:
NombreDeFromagesEnStock <- 25

Ou (c'est question de goût) :

In [None]:
nombre_de_fromages_en_stock <- 25

Essayons maintenant avec une chaine de caractère :

In [None]:
message_de_bienvenue <- "bonjour"

**Exercice** : créer une variable nommée "message_en_anglais" qui contient la chaine de caractère : Hello

Vous venez donc de créer plusieurs variables. Pour afficher toutes les variables créées pendant cette session, il faut utiliser la fonction ls() 

In [None]:
ls()

Pour voir la valeur prise par une variable, il faut utiliser la fonction print() en mettant dans la paranthèse le nom de la variable dont on veut connaitre sa valeur

In [None]:
print(a)

**Exercice** : Quelle est la valeur de message_de_bienvenue ?, de la variable "a" ? de "titi" ?

**Exercice** : Additionner la variable "titi" et la variable "a" dans une nouvelle variable nommée "tmp". Afficher le résultat.

## Les fonctions

Dans R, il existe déjà de nombreuses fonctions, ce sont :
- Outils mathématiques (calcul de la moyenne, somme d’une colonne, etc)
- Outils pratique (sauvegarde d’un tableau…)
- Outils propre au langage (afficher de l’aide…)

Ces outils sont déjà créés dans R (on n’a pas à re-coder)
- Ce qui nous fait gagner du temps
- Mais, il faut les connaitre

On vient déjà d'utiliser deux fonctions : ls() et print()

Par contre, on ne peut pas connaitre par coeur toutes les fonctions de R : il faut utiliser l’aide (en utilisant une fonction !)
Pour afficher l'aide (en anglais) :

In [None]:
help()

Ou encore si vous voulez afficher l'aide de la fonction "ls"

In [None]:
help(ls)

ou encore :

In [None]:
?ls

Une fonction est caractérisée par 3 composantes :
- Son nom 
- Liste d’arguments : information dont la fonction a besoin pour travailler. Selon les fonctions, il y a un ou plusieurs arguments.
- Le résultat issu de la fonction

Syntaxe : nom(arguments)

**Exercice** : Exprimer la racine carrée de 25 sachant que :
- le nom de la fonction est : sqrt()
- l'argument est le nombre dont on souhaite connaitre la racine carré.

**Exemple** : La variable "lulu" contient le chiffre 5. On calcule le logarithme népérien et on affiche le résultat.

In [None]:
lulu <- 5
print(log(lulu))

Rq1 : on a combiné deux fonctions : print (afficher le résultat) et log (logarithme népérien).

Rq2 : on peut écrire plusieurs ligne dans une même boite.

**Exercice** : créer une variable "fifi" qui contient la valeur pi/4 et calculer le sinus et le cosinus de cette variable. Afficher le résultat

**Exercice** : à quoi servent les fonctions mathématiques suivantes ?
- floor()
- ceiling()
- round()

Testez-les avec des nombres décimaux !

## Les vecteurs

Un vecteur est un élément de base du langage R.
C’est une liste d’éléments qui sont tous du même type.
C’est une structure qui permet de stocker plusieurs nombres dans une même variable.
Le vecteur "titi" est un vecteur de taille 4 contenant les chiffres : 1,2,3,5 (4 chiffres). La fonction "c" permet de concatener  (i.e. coller) les differents chiffres du vecteur.

In [None]:
titi = c(1,2,3,5)
print(titi)

Il est souvent utile de vérifier la taille de nos vecteurs :

In [None]:
length(titi)

Le vecteur titi est bien de taille 4 !
Garder en tête qu'un nombre est un vecteur de taille 1.

Selon le contexte, il existe beaucoup de solution pour créer un vecteurs sous R : 

In [None]:
# concatener(i.e coller) des nombres pour en faire un vecteur
vec1 <- c(1,45,6,78)
print(vec1)

In [None]:
# générer une suite de 1 à 10 
vec2 <- 1:10
print(vec2)

In [None]:
# générer une suite de 1 à 10 par pas de 2
vec3 <- seq(1,10,by=2)
print(vec3)

In [None]:
# générer une suite composée de 13 éléments avec le plut petit égal à 1 et le plus grand égal à 20
vec4 <- seq(1,20,length=13)
print(vec4)

In [None]:
# coller deux vecteurs
vec5 <- c(vec3,vec4)
print(vec5)

Dans ces quatre dernières boites, les lignes commençant par # sont des commentaires : ce sont des lignes non interprétées par R qui permettent d'expliquer le code.

**Exercice** : Créer un vecteur de taille 40, nommé gégé, dont les 20 premiers éléments sont une suite de 11 à 30 et les 20 derniers éléments, une suite décroissante de 40 à 21.

**Exercice** : Générer le vecteur suivant : 2,4,6,8 de deux manières différentes.

Première manière :

Seconde manière :

Comment fait-on pour obtenir le 4ème élément d'un vecteur ?

In [None]:
# création d'un vecteur 
vec <- 11:20
# création d'une nouvelle variable qui contient le 4ème élément du vecteur vec
a <- vec[4]
# affichage du résultat
print(a)

**Exercice** : Quelle est la valeur du 33ème terme du vecteur "gégé". Afficher le résultat.

**Exercice** : Quelle est la valeur du 4ème élément du vecteur "titi". Afficher le résultat.

### Des vecteurs et des fonctions !

Nous allons tester différentes fonctions sur un vecteur. Commençons par créer un vecteur de taille 10 contenant des nombres choisis aléatoirement avec la fonction sample()

In [None]:
youpi <- sample(10)
print(youpi)

Quelle est l'utilité des fonctions suivantes :

**Exercice** : répondez à la question en utilisant la boite ci dessous

### Premier petit exemple
Nous allons travailler sur la masse de 4 individus :
- Marc : 77 kg
- Sophie : 58 kg
- Julie : 66 kg
- Blaise : 83 kg

Etape 1 : créer un vecteur "masse" contenant la masse des 4 individus 

In [None]:
masse <- c(77,58,66,83)

Etape 2 : créer un vecteur "nom" contenant le nom des 4 individus

In [None]:
nom <- c("Marc","Sophie","Julie","Blaise")

Etape 3 : construire un graphique avec la masse et le nom de chaque individu. C'est l'étape la plus compliquée mais aussi la plus intéressante. Pour construire le graphique, nous avons besoin d'un paquet nommé "ggplot2" qu'il faut charger à la première utilisation de la journée. Pour cela, exécuter la ligne suivante : 

In [None]:
library(ggplot2)

Avant de créer le graphique, nous devons organiser les données dans un dataframe (un tableau permettant le lier la masse et le nom de chaque personne) : 

In [None]:
df <- data.frame(Noms = nom, Masses = masse)

Affichons le dataframe : 

In [None]:
df

Avez-vous compris comment est construit le dataframe ? Faire le lien entre le tableau et la ligne de commande.

Construisons le graphique : 

In [None]:
p<-ggplot(data=df, aes(x=Noms, y=Masses)) + geom_bar(stat="identity")

Cette ligne est à connaitre et à adapter selon les différents cas : df contient les données à afficher et la commande aes(x = ,y = ) permet d'afficher le nom de l'axe x et y.

Affichons maintenant ce beau graphique !

In [None]:
p

Il est possible de personnaliser le graphique : changer les couleurs des barres, de l'arrière plan, l'orientation du graphique, etc... Allez visiter la doc ici : http://www.sthda.com/french/wiki/ggplot2-barplots-guide-de-demarrage-rapide-logiciel-r-et-visualisation-de-donnees

Grâce à cette doc, personnaliser votre graphique.

## A vous de jouer ! ## 

On va créer un graphique comprenant les notes en Histoire, Biologie et Sport de 4 étudiants. Pierre a respectivement eu 8, 9 et 15. Nathalie a obtenu respectivement 17,12 et 13. Jacques a eu 11, 15 et 7 et Julie a obtenu 5, 12 et 19.

A l'aide de ggplot, faire un barplot des notes de Pierre les étudiants et personnaliser le.

Calculer la moyenne des notes pour chaque étudiants (sans calculatrice !) : créer un vecteur comprenant les notes de chaque étudiant et utiliser la fonction "mean".

Faire un graphique affichant la moyenne des notes pour chaque étudiant. 