# Introduction
## Qu'est ce que R? 
R est un système d'analyse statistique et graphique créé par Ross Ihaka et Robert Gentleman.
R est à la fois un logiciel et un langage interprété dont la conception dérive du langage S développé au sein des laboratoires AT&T Bell dans les années 80 et disponible actuellement sous la forme du logiciel S-PLUS commercialisé par la compagnie Insightful. Il y a des différences dans la conception de R et celle de S, pour en savoir plus sur ce point, se reporter au [R-FAQ3](https://cran.r-project.org/doc/FAQ/R-FAQ.html).

Le langage R possède aujourd'hui une communauté mature d'utilisateurs et de développeurs qui ont créé et partagé des milliers de package via le _Comprehensive R Archive Network_ (CRAN, https://cran.r-project.org).

R comporte de nombreuses fonctions pour les analyses statistiques, les
graphiques, le traitement et le stockage des données. Les graphiques sont visualisés à l'écran ou sur papier et peuvent être exportés sous divers formats (jpg, png, bmp, ps, pdf, emf, pictex,
xfig); les formats disponibles peuvent dépendre du système d'exploitation.
Les résultats des analyses statistiques sont affichés à l'écran ou peuvent être sauvegardés ou exportés dans un fichier pour être utilisés dans des analyses ultérieures.

R est un langage de programmation simple et efficace qui permet à l'utilisateur d'écrire ses propres algorithmes en utilisant le traitement conditionnel, les boucles, la récursivité, les fonctions intrinsèques et utilisateurs et des fonctions d'entrée /sorties. 

R comprend une suite d'opérateurs pour les calculs sur des tableaux, en particulier des matrices.

R offre les possibilités d'améliorer ses performances en convertisant le haut niveau d'interprétation du code R en un langage compilé écrit en C, C++ ou Fortran (**RCPP**,...)
R permet de s'adapter à l'architecture des processeurs multi-coeurs et aux clusters de plusieurs noeuds en fournissant des outils aux développeurs qui lui permet d'utiliser des techniques de programmation parallèle (**parallel**,**multicore**,**snow**,...)

Un dernier point important, les statisticiens ont implémentés dans R sous forme de packages directement intégrées dans R, des centaines de procédures adaptées à une grande variété d'applications.


## Pourquoi R?
### Avantages

R a des avantages majeurs
* Il est gratuit et le restera puisqu'il est distribué librement sous les termes de la [GNU General Public Licence](http://www.gnu.org/)
* Il est disponible sur Internet, via un grand réseau de serveurs.
* Il fonctionne sur de nombreux systèmes d'exploitation Unix et dérivés incluant
Darwin, Mac OS X, Linux, FreeBSD et Solaris; sur 
Microsoft Windows; Apple Macintosh OS .
* Il est le produit d'une collaboration internationale entre
statisticiens et informaticiens;
* Il ne limite pas l'utilisateur à un ensemble de procédures ou d'options tout en utilisant les packages déjà intégrés dans R.

6. It can work on objects of unlimited size and complexity with a consistent,
logical expression language;
7. It is supported by comprehensive technical documentation and usercontributed
tutorials (§9). There are also several good textbooks on
statistical methods that use R (or S) for illustration.
8. Every computational step is recorded, and this history can be saved
for later use or documentation.
9. It stimulates critical thinking about problem-solving rather than a
“push the button” mentality.
10. It is fully programmable, with its own sophisticated computer language
(§4). Repetitive procedures can easily be automated by user-written scripts (§3.5). It is easy to write your own functions (§B),
and not too difficult to write whole packages if you invent some new
analysis;
11. All source code is published, so you can see the exact algorithms being
used; also, expert statisticians can make sure the code is correct;
12. It can exchange data in MS-Excel, text, fixed and delineated formats
(e.g. CSV), so that existing datasets are easily imported (§6), and results
computed in R are easily exported (§7).
13. Most programs written for the commercial S-PLUS program will run
unchanged, or with minor changes, in R (§2.3.1

### Inconvénients
R présentent quelques inconvénients:

* L'utilisateur doit définir lui-même la séquence des analyses et les exécuter pas à pas, cependant, il est facile de créer des scripts avec toutes les étapes dans les éditeurs des interfaces utilisateurs de R (dans ce cours RStudio).
* L'utilisateur doit apprendre à penser autrement la gestion de ses données, de penser les objets R comme des classes ce qui lui permettra de bénéficier des avantages des langages objet. Les méthodes opérant sur un objet en fonction de sa classe.
* L'utilisateur doit apprendre un langage, à la fois pour les commandes mais aussi pour la spécification des analyses statistiques.

### Alternatives
There are many ways to do computational statistics; this section discusses
them in relation to R. None of these programs are open-source, meaning
that you must trust the company to do the computations correctly.
#### S-PLUS
#### Statistical packages :  SPSS, BMDP,SAS, Statistica, Minitab, Systat,Genstat,...
#### Applied mathematics programs


## Installer R
R est distribué librement sous les termes de la [GNU General Public Licence](http://www.gnu.org/)
; son développement et sa distribution sont assurés par plusieurs statisticiens
rassemblés dans le **R Development Core Team**.

R est disponible sous plusieurs formes : 
* des exécutables précompilés pour Windows, Linux et OSX (Macintosh).
* de sources(écrit principalement en C et certaines routines en Fortran) qu'il faudra compiler avant de les utiliser.

Les fichiers pour installer R, à partir des sources ou des exécutables, sont distribués à partir de sites internet du [CRAN](https://cran.r-project.org) où se trouvent aussi les instructions à suivre pour l'installation sur chaque système. 

## Utiliser R (Rossiter-RIntro-ITC.pdf)
Il y a plusieurs méthodes pour travailler avec R

* En mode commande (CLI).
* à partir de l'interface de développement(IDE) RSudio.
* en utilisant le module ESS(Emacs Speaks Statistics) de l'éditeur **emacs**.
Il existe d'autres interfaces de développement, suivant les systèmes d'exploitation. On utilisera dans ce cours **RStudio** qui est l'IDE la plus couramment utilisée.
## Interface Utilisateur

### Mode Console
#### Running the R console GUI
#### Setting up a workspace in Windows
#### Saving your analysis steps
#### Saving your graphs
### Travailler en mode commande
#### Lancer la console R

bash% R

# R comme calculatrice
2+3
log(7)
runif(5)
ls()
# R comme langage interprete
a <- runif(5)
a
ls()
n <- 7
log(n)
ls()
rm(a)
ls()

### Documentation sous la console
help(round)
<img src="fenetreRStudio.jpg",width=60,height=60>


 ![truc](fenetreRStudio.jpg)

# Les objets R
## Qu'est-ce qu'un objet dans R?
## Les vecteurs
## Les matrices
## Les listes
## Les facteurs
## Les data-frame

# Manipuler des données dans R
- Importer des données
- Sauvegarder des données ou des résultats
- Générer des données
- Manipuler des objets
- Quelques traitements statistiques

# Programmer avec R
## Les expressions conditionnelles (if et else)
## Les boucles (for ou while)
## Les fonctions
## Les boucles implicites (apply,lapply,...)


# Représenter des données
## Les graphiques de base
## Ajout à un graphique
## Présentation d'une distribution
## Personalisation des graphisuqes
## Exportation de graphiques
## Graphiques à plusieurs dimensions
## Les fonction graphiques avec lattice
## Introduction au package ggplot2