# **Bases du langage R**
## Objectifs
- Expression en ligne de commande.
- Affectation d'une valeur à une variable.
- Convention pour les noms d'objets.
- Types de données.
- Structure de données.

---
Toute commande R est soit une **expression**, soit une **affectation**.

**Une expression:**

Normalement, une expression est immédiatement évaluée et le résultat est affiché à l’écran.


On peut utiliser les opérateurs arithmétiques avec lesquels tout le monde est familier : `+`, `-`, `*` et `/` pour les quatre opérations de base. 


Il existe aussi `^` pour l’exponentiation, `%%` pour le reste et `%/%` pour la division entière.

R peut reconnaitre certaines constantes intégrées. `pi`, `LETTERS`, `letters`, `month.abb`.

---

**Une affectation:**
Deux signes sont acceptés en R pour affecter une valeur à une variable : `=` et `<-`


Lors d’une affectation, une expression est évaluée, le résultat est stocké dans un objet (variable) `a = 5` et rien n’est affiché à l’écran. 

Pour afficher ce que contient la variable à l'écran on a simplement à écrire le nom de la variable avec la fonction `print()`.

In [None]:
a = 5 + 2

In [None]:
print(a)

## Autres techniques pour afficher le résultat:
1. On peut utiliser print(paste()) pour lier du texte et des variables.
2. Pour afficher simultanément le résultat d'une affectation, on met le tout entre parenthèses.
3. On peut aussi simplement écrire la variable.
   
Pour écrire un commentaire, on ajoute un #.

In [None]:
print(paste("La valeur de a est:", a)) # Exemple avec print(paste).
(a = 2 + 3)
a

---
## Conventions pour les noms d’objets (variables).

- On commence par une **lettre minuscule**.
- On sépare les mots d'une variable avec un `_`.
- On utilise seulement des lettres minuscules, le `_` et des chiffes.
- Les noms d’objets ne peuvent commencer par un chiffre. 
- S’ils commencent par un point, le second caractère ne peut être un chiffre.

Le R est sensible à la casse, ce qui signifie que `foo`, `Foo` et `FOO` sont trois objets distincts.


Certains noms et mots sont utilisés par le système R, mais aussi vaut-il mieux éviter de les utiliser.


 `c`, `q`, `t`, `C`, `D`, `I`, `diff`, `length`, `mean`, `pi`, `range`, `var`, `break`, `else`, `for`, `function`, `if`, `in`, `next`, `repeat`, `return`, `while`, `TRUE`, `FALSE`, `Inf`, `NA`, `NaN`, `NULL`, `NA_integer_`, `NA_real_`, `NA_complex_`, `NA_character_`, `...`, `..1`, `..2`, etc.

In [None]:
weight0 = 0  # valide
0weight = 1  # invalide

---

## **Exercice-1**: 
Affecter une opération numérique à une variable et l'afficher.

---

## **Exercice-2**: 
Après avoir exécuté les 4 lignes suivantes. Quelle valeur sera associée à `mass` et `âge`?

In [None]:
mass = 47.5
age = 122
mass = mass * 2.0
age = age - 20

---
## **Les types de données.**
Tout dans le langage R est un objet.
R a 6 types de base. (Le type raw ne sera pas couvert ici.)
- *character*: "a", 'swc'
- *numeric*: 2, 15.5
- *integer*: 2L (Le L indique à R de sauvegarder à titre de nombre entier (*integer*))
- *logical*: TRUE, FALSE (booléen)
- *complex*: 1+4i 

Le R possède plusieurs fonctions pour examiner les caractéristiques des vecteurs ou autres objets. 

- `class()` - quel est le type de l'objet ?
- `typeof()` - quel type de donnée ?
- `length()` - quelle est la longueur?
- `attributes()` - retourne la liste des attributs, NULL si aucun.

---

## **Exercice-3:** 
Afficher le type de la variable x.

---
## **Les structures de données.**

- *atomic vector* (vecteur)
- *list* (vecteur)
- *matrix*
- *data frame*
- *factors* (pour les valeurs catégorielles (masculin, féminin), (type sanguin))

## **Deux types de vecteurs**:
1. **Vecteurs atomiques** (*character*, *logical*, *integer* ou *numeric*).

In [None]:
print(vector("character", length = 5))

In [None]:
x = numeric(5) # Un vecteur numérique
print(x)
print(class(x))

On peut aussi créer un vecteur en spécifiant directement son contenu.

On utilise la fonction `c()` pour "*combine*" ou combiner.

In [None]:
nombres1 = c(0, 1, 2, 3)

In [None]:
print(nombres1)
print(length(nombres1))

On peut ajouter un élément à notre vecteur.

In [None]:
nombres1 = c(nombres1, 4)
print(nombres1)

In [None]:
nombres1 = append(nombres1, 5, after=3) # En R on commence à compter à partir de 1. 
print(nombres1)

On peut trouver le maximum, le minimum et la moyenne.

On peut utiliser des opérations arithmétiques: doubler les valeurs, additionner, multiplier...

On peut créer un vecteur avec des séquences de nombres:

In [None]:
print((series = 1:10))

print(seq(10))

print(seq(1, 10, by = 0.1))

---

## **Exercice-4:**  
Créer un vecteur avec des données entre 0 et 100 avec un bon de 0.5.

---
2. **Les listes**

Contrairement aux vecteurs atomiques, les listes ne sont pas restreintes à un seul mode.

In [None]:
liste1 = list(1, "a", TRUE, 1+4i)

On peut créer une liste vide avec la fonction vector.

In [None]:
liste2 = vector("list", length = 5) # La liste sera vide.
print(length(liste2))

On peut aller chercher le contenu d'un élément de la liste.

Je peux accéder à un élément par un index:

In [None]:
print(liste1[c(1,2)])

---

## **Exercice-5:** 
Créer une liste avec 3 types de données: un intervalle, un character et un booléen.

Imprimer l'index de la postition 3.

---
## **La matrice**
Le R étant un langage spécialisé pour les calculs mathématiques, il supporte tout naturellement et de manière intuitive les matrices et, plus généralement, les tableaux à plusieurs dimensions.

C'est simplement un vecteur atomic avec dimensions (rangées et colonnes).

Les éléments doivent être de même type.

Ces objets sont donc stockés, et peuvent être manipulés, exactement comme des vecteurs simples.

In [None]:
v = 1:10

print(v)
print(class(v))

In [None]:
dim(v) = c(2, 5) # On prend le vecteur v, on distribue les valeurs en 2 rangées, 5 colonnes.

print(v)

In [None]:
n = matrix(c(1:4),2,2) # deux dimensions avec un intervalle 1 à 4.
print(class(n))
print(n)

On peut aller chercher un élément de la matrice: nom[rangée, colonne]

Une matrice de plus de 2 dimensions est appelée tableau (*array*).

In [None]:
vector1 = c(5, 9, 3, 4)
vector2 = c(10, 11, 12, 13, 14, 15)
resultat = array(c(vector1, vector2), dim = c(2, 3, 4)) # rangée, colonne, dimension
print(resultat)

On peut aller chercher un élément dans un tableau.

nom[rangée, colonne, dimension]

---

## **Exercice-6:** 
Que doit-on modifier pour avoir une matrice en trois dimensions?

In [None]:
vector1 = c(5, 9, 3, 4)
vector2 = c(10, 11, 12, 13, 14, 15)
resultat = array(c(vector1, vector2), dim = c(3, 3, 2))
print(resultat)

---
## ***Data frame***
Le *data frame* est une importante structure de donnée pour le R.

C'est le type de structure pour la plupart des données tabulées utilisées en statistique.

On peut créer un *data frame* avec les fonctions `read.csv()` ou `read.table()` quand on importe des données.

On peur créer un *data frame* avec la fonction `data.frame()`.

In [None]:
dat = data.frame(id = letters[1:10], x = 1:10, y = 11:20) # letters => constante vue plus haut.
print(dat)

### Fonctions utiles pour le *data frame*.
- `head()` - Retourne les 6 premières rangées.
- `tail()` - Retourne les 6 dernières rangées.
- `dim()` - Retourne les dimensions du *data frame* (le nombre de rangées et de colonnes).
- `nrow()` - Retourne le nombre de rangées.
- `ncol()` - Retourne le nombre de colonnes.
- `str()` - Retourne le nom et type de donnée avec un résumé de chaque colonne.
- `summary()` - Résume avec mean, max, median sur les colonnes.
- `names()` or `colnames()` - Retourne les noms des attributs pour le *data frame*.
- `sapply(dataframe, class)` - Retourne la classe de chaque colonne dans le *data frame*.

---

## **Exercice-7:** 
Construire un *data frame* de 2 colonnes.

---
## En Résumé :

- Expression en ligne de commande.
- Affectation d'une valeur à une variable.
- Convention pour les noms d'objets.
  
Les types de données de base sont:
- *character*, *numeric*, *integer*, *logical*, *complex*

Les structures de donnée sont:


| Dimensions  | Homogène  |  Hétérogène |   
|---|---|---|
| 1-D	|  atomic vector | list  |     
|  2-D	 | matrix  | data frame |

 Les objets ont des attributs:
-  *name*, *dimension*, *class*

Fonctions pour aller chercher de l'information sur les vecteurs ou objets: 

-  `class()` , `typeof()`, `length()`, `attributes()`.

---