Introduction √† Rust

# Gestion de la m√©moire en Rust ü¶Äü¶Ä


[Pierre-Antoine Champin](http://champin.net/)

D√©partement Info Doua ‚Äì [IUT Lyon 1](http://iut.univ-lyon1.fr/)

### Rappel¬†: la pile et le tas

La pile

- contient les donn√©es des variables,
- de taille connue √† la compilation (statique),
- g√©r√©es de mani√®re *Last in, first out* par le compilateur (quel que soit le langage)
    
Le tas

- contient des donn√©es de taille connue √† l'ex√©cution (dynamique),
- g√©r√©es diff√©remment selon les langages.

#### Gestion du tas

En C
- le d√©veloppeur a la responsabilit√© de lib√©rer la m√©moire,
- ce qui peut donner lieu √† des erreurs (m√©moire lib√©r√©e trop t√¥t, trop tard, jamais...).

En Java
- le ramasse-miettes (*garbage collector*) se charge de lib√©rer la m√©moire √† l'ex√©cution,
- ce qui peut entra√Æner des probl√®mes de performances.

#### Gestion du tas en Rust

En Rust
- le **compilateur** se charge de lib√©rer la m√©moire.
- Cela suppose de lui fournir assez d'information pour qu'il le fasse,
- d'o√π les concepts sp√©cifiques de **propri√©t√©** et d'**emprunt**. ü¶Äü¶Ä

### La s√©mantique *move*

Dans la plupart des langages de programmation,
l'affectation a une s√©mantique de copie.

```c
v1 = init();
v2 = v1;
// v1 et v2 contiennent ¬´¬†la m√™me chose¬†¬ª
```

En Rust, l'affectation a une semantique de *d√©placement* (*move*):

* conceptuellement, l'affectation *d√©place* la valeur de `v1` dans `v2`.
* apr√®s l'affectation, `v1` est consid√©r√©e comme non-initialis√©e.


#### Illustration¬†: le type `Vec`

In [3]:
let v1: Vec<i32> = vec![22, 44, 66];

<div style="text-align: center">
<img alt="String en m√©moire" src="images/trpl04-01.svg" style="display: inline; width: 12em;">
</div>

#### Avec la s√©mantique *copy* du C

```c
Vec v1 = init_vec();
Vec v2 = v1;
```

<div style="text-align: center"> <img alt="Shallow copy" src="images/trpl04-02.svg" style="display: inline; width: 12em;"> </div>

#### Avec la s√©mantique *move* de Rust ü¶Ä

In [33]:
let v1: Vec<i32> = vec![22, 44, 66];
println!("v1={:?}", &v1);
let v2 = v1;
println!("v2={:?}", &v2);
//println!("v1={:?}", &v1); // NE COMPILE PAS

v1=[22, 44, 66]
v2=[22, 44, 66]


<div style="text-align: center">
<img alt="String en m√©moire" src="images/trpl04-04.svg" style="display: inline; width: 12em;">
</div>

#### Copie (profonde) explicite

In [24]:
// copie profonde EXPLICITE avec la m√©thode clone
let v1: Vec<i32> = vec![22, 44, 66];
let v2 = v1.clone();
println!("v1={:?} v2={:?}", &v1, &v2);

v1=[22, 44, 66] v2=[22, 44, 66]


<div style="text-align: center">
<img alt="Copie profonde" src="images/trpl04-03.svg" style="display: inline; width: 12em;">
</div>

### Copie implicite

Bien que la s√©mantique *move* soit la r√®gle,
il existe des exceptions.

En particulier, les affectations pour tous les types de base (entiers, flottants, bool√©ens, caract√®res)
ont la s√©mantique *copy*,
car le compilateur sait que cette copie est s√ªre (*safe*).

In [8]:
let x = 42;
let y = x; // copy instead of move
println!("x={} y={}", x, y);

x=42 y=42


Plus g√©n√©ralement,
tout type impl√©mentant le [trait `Copy`](https://doc.rust-lang.org/stable/std/marker/trait.Copy.html)
utilise la s√©mantique *copy*.

Il est possible de faite impl√©menter `Copy` aux types d√©finis par nous.

### Propri√©t√© (*ownership*) ü¶Äü¶Ä

* Toute donn√©e est la **propri√©t√©** d'exactement une variable (ou champ de structure).

* Conceptuellement, l'affectation d'une variable √† une autre **d√©place** (*move*) les donn√©es,
  et transf√®re la propri√©t√© √† la nouvelle variable.
  
* Lorsqu'une variable disparait,
  (i.e. lorsqu'on quitte son scope),
  si elle est encore propri√©taire de ses donn√©es,
  celles-ci sont **lib√©r√©es**.

In [7]:
fn fibo(nb: usize) -> Vec<i32> {
    let mut v1 = vec![];                  // 1. Le vecteur est cr√©√© ici
    for i in 0..nb {
        if i < 2 { v1.push(1); }
        else     { v1.push(v1[i-2] + v1[i-1]); }
    }
    v1                                    // 2. Sa propri√©t√© est transmise au code appelent
}

fn somme(v2: Vec<i32>) -> i32 {
    v2.into_iter().sum()
}                                         // 5. La variable 'v' arrive au bout de son scope,
                                          //    et elle poss√®de toujours le vecteur,
                                          //    qui est donc lib√©r√©e.

{ 
    let n = 7;
    let mut v3 = fibo(n);                 // 3. Le vecteur est r√©cup√©r√©e depuis la fonc. fibo
    let s = somme(v3);                    // 4. Le vecteur est transf√©r√©e √† la fonc. somme
    println!("la somme des {} premiers termes vaut {}", n, s);
    //println!("{:?}", v3); // NE COMPILE PAS
};

la somme des 7 premiers termes vaut 33


### Emprunts (*borrow*) ü¶Äü¶Ä

In [9]:
let v1: Vec<i32> = vec![22, 44, 66];
{
    let v2 = &v1;
    println!("v1={:?} v2={:?}", &v1, &v2);
}
println!("v1={:?}", &v1);

v1=[22, 44, 66] v2=[22, 44, 66]
v1=[22, 44, 66]


<div style="text-align: center">
<img alt="String en m√©moire" src="images/trpl04-05.svg" style="display: inline; width: 16em;">
</div>

Pour tout type `T`, les variables de type `&T` sont des **r√©f√©rences** vers un `T`.

* Physiquement, les r√©f√©rences sont des pointeurs.
* Conceptuellement, les r√©f√©rences ne *poss√®dent pas* les donn√©es vers lesquelles elles pointent,
* la disparition de la r√©f√©rence n'entra√Æne donc pas la lib√©ration des donn√©es.
* En cons√©quence, plusieurs r√©f√©rences vers les m√™me donn√©es peuvent *co-exister*.

In [10]:
let v1: Vec<i32> = vec![22, 44, 66];
{
    let v2 = &v1;
    let v3 = &v1;
    println!("v1={:?} v2={:?} v3={:?}", &v1, &v2, &v3);
}
println!("v1={:?}", &v1);

v1=[22, 44, 66] v2=[22, 44, 66] v3=[22, 44, 66]
v1=[22, 44, 66]


NB¬†: Les r√©f√©rences de type `&T` sont immutables.

In [11]:
let mut v1: Vec<i32> = vec![22];
v1.push(44);
{
    let v2 = &v1;
    //v2.push(66); // NE COMPILE PAS
    println!("v1={:?} v2={:?}", &v1, &v2);
}
v1.push(88);
println!("v1={:?}", &v1);

v1=[22, 44] v2=[22, 44]
v1=[22, 44, 88]


Pour que l'exemple ci-dessus fonctionne, il faut utiliser une **r√©f√©rence mutable**,
de type `&mut T`.

In [12]:
let mut v1: Vec<i32> = vec![22];
v1.push(44);
{
    let v = &mut v1;
    v.push(66); // NE COMPILE PAS
}
v1.push(88);
println!("v1={:?}", &v1);

v1=[22, 44, 66, 88]


### R√®gles sur les r√©f√©rences

On ne peut pas avoir en m√™me temps

* plusieurs r√©f√©rences mutables, ni
* une r√©f√©rence mutable et une (ou plusieurs) r√©f√©rence(s) immutable(s).

En effet, il faut √©viter

* que deux parties du code modifient les m√™mes donn√©es simultan√©ment, et
* qu'une partie du code lise des donn√©es en cours de modification.

In [13]:
let mut v1: Vec<i32> = vec![22];
v1.push(44);
{
    let v2 = &mut v1;
    //v1.push(66); // NE COMPILE PAS
    //let v3 = &v1; // NE COMPILE PAS
    println!("v2={:?}", &v2);
}
v1.push(88);
println!("v1={:?}", &v1);

v2=[22, 44]
v1=[22, 44, 88]


### Choix des passages de param√®tres des fonctions

In [14]:
// ma fonction n'a pas besoin de modifier les donn√©es¬†: &T
fn compte_zeros(v: &Vec<i32>) -> usize {
    let mut c = 0;
    for i in v {
        if *i == 0 {
            c += 1;
        }
    }
    c
}
// NB: cette version n'est pas tr√®s idiomatique...

In [15]:
// ma fonction a besoin de modifier les donn√©es¬†: &mut T
fn ajoute_un(v: &mut Vec<i32>) {
    for i in v {
        *i += 1;
    }
}

In [16]:
// ma fonction "consomme" les donn√©es (rare) / les donn√©es sont `Copy`¬†: T
fn fact(n: usize) -> usize {
    if n <= 1 { 1 } else { n*fact(n-1) }
}

### Diff√©rence conceptuelle entre pointeur et r√©f√©rence


In [17]:
let a = 42;
let b = 41 + 1;
let test = (&a == &b);
test

true

* la ¬´¬†valeur¬†¬ª d'une r√©f√©rence n'est **pas** l'adresse en m√©moire, c'est la valeur point√©e.

    * Ne pas penser `&T` comme ¬´¬†un pointeur vers un `T`¬†¬ª mais comme ¬´¬†un `T` emprunt√© √† quelqu'un d'autre¬†¬ª.
    * `T` et `&T` restent malgr√© tout deux types diff√©rents...

* En Rust, une r√©f√©rence n'est **jamais** un pointeur null. ü¶Ä

### Dur√©es de vie

Un composant du compilateur (le *borrow checker*)
v√©rifie qu'aucun emprunt ne dure plus longtemps que la dur√©e de vie du propri√©taire.

(puisqu'√† la ¬´¬†mort¬†¬ª du propri√©taire, les donn√©es sont lib√©r√©es)

In [18]:
// NE COMPILE PAS
{
    let emprunteur: &Vec<i32>;
    {
        let proprietaire2 = vec![44, 66];
        emprunteur = &proprietaire2;
    }
    println!("{:?}", emprunteur);
}

Error: `proprietaire2` does not live long enough

Dans certaines situations, le compilateur a besoin qu'on lui donne des indications sur les dur√©es de vie respectives des diff√©rentes r√©f√©rences (¬´¬†qui doit vivre aussi longtemps que qui ?¬†¬ª).

On utilise alors la syntaxe `&'a T` ou `&'a mut T`.