Introduction √† Rust

# S√©ance 2 ‚Äì Structures de donn√©es et Gestion de la m√©moire

[Pierre-Antoine Champin](http://champin.net/)

D√©partement Info Doua ‚Äì [IUT Lyon 1](http://iut.univ-lyon1.fr/)

## Gestionnaire de projet `cargo`

L'outil `cargo` est un outil central pour le d√©veloppement rust.

Il sert notamment √†¬†:

* cr√©er un nouveau projet (`cargo new <dirname>`)
* compiler un projet (`cargo build`)
* ex√©cuter un projet (`cargo run`) ‚Äì en le compilant pr√©alablement si n√©cessaire
* ex√©cuter les tests unitaires (`cargo test`)
* g√©n√©rer la documentation (`cargo doc`)

### Anatomie d'un projet cr√©√© par cargo

```
myproject
 \_ .git
 \_ .gitignore
 \_ Cargo.toml
 \_ src
     \_ main.rs
```

Le fichier `Cargo.toml`:

```toml
[package]
name = "myproject"
version = "0.1.0"
authors = ["Pierre-Antoine Champin <pierre-antoine.champin@univ-lyon1.fr>"]
edition = "2018"

# See more keys and their definitions at https://doc.rust-lang.org/cargo/reference/manifest.html

[dependencies]
```

## Tableaux et cha√Ænes

### Tranches (*slices*)

In [2]:
let mut a = ["foo", "bar", "baz"];
a.len()

3

In [3]:
a[2]

"baz"

In [4]:
a[2] = "BAZ";
a

["foo", "bar", "BAZ"]

In [5]:
&a[..2]

["foo", "bar"]

In [6]:
a.contains(&"BAZ")

true

In [7]:
a.sort();
a

["BAZ", "bar", "foo"]

In [8]:
// Autre possiblit√© pour cr√©er une slice
let b = [0; 1000];
b.len()

1000

Documentation compl√®te¬†: https://doc.rust-lang.org/std/primitive.slice.html

### Vecteur `Vec<T>`

Un vecteur est un tableau de taille variable.

Ce concept est impl√©ment√© par le type g√©n√©rique `Vec<T>` (o√π `T` est le type des √©l√©ments du vecteur).

In [9]:
// cr√©ation d'un vecteur vide
let mut v = Vec::new();

// remplissage d'un vecteur
v.push(3.14);
v.push(101e-1);
v.push(-1.0);
v

[3.14, 10.1, -1.0]

NB: le compilateur inf√®re `T` gr√¢ce aux √©l√©ments ins√©r√©s lignes 5 √† 7.

La macro `vec!` permet de cr√©er un vecteur plus simplement.

In [10]:
let v1 = vec![3.14, 101e-1, -1.0];
let v2 = vec![0; 1000];

Les vecteurs peuvent √™tre utilis√©s comme des tranches, ils ¬´¬†h√©ritent¬†¬ª de leurs m√©thodes.

In [11]:
let mut v = vec!["foo", "bar", "baz"];
v.len()

3

In [12]:
v[2]

"baz"

In [13]:
v[2] = "BAZ";
v

["foo", "bar", "BAZ"]

In [14]:
&v[..2]  // ‚ö† ceci est une tranche, PAS un vecteur

["foo", "bar"]

In [15]:
v.sort();
v

["BAZ", "bar", "foo"]

M√©thodes sp√©cifiques des vecteurs

In [16]:
// ajoute un √©l√©ment √† la fin du vecteur
v.push("A");
v

["BAZ", "bar", "foo", "A"]

In [17]:
// supprime le dernier √©l√©ment du vecteur
v.pop();
v

["BAZ", "bar", "foo"]

In [18]:
// ins√®re un √©l√©ment √† une position donn√©e
// en d√©calant vers la droite les √©l√©ments suivants
v.insert(1, "X");
v

["BAZ", "X", "bar", "foo"]

In [19]:
// retire un √©l√©ment √† une position donn√©e
// en d√©calant vers la gauche les √©l√©ments suivants
let e = v.remove(1);
println!("{:?}", e);
v

"X"


["BAZ", "bar", "foo"]

In [20]:
// vide le vecteur
v.clear();
v

[]

Documentation compl√®te¬†: https://doc.rust-lang.org/std/vec/struct.Vec.html

### Cha√Æne de caract√®res `str`

Une `str` est une cha√Æne de caract√®res de longueur fixe.

C'est le type des cha√Ænes litt√©rales, comme par exemple `"hello world"`.
Il supporte l'ensemble des  caract√®res [Unicode](https://fr.wikipedia.org/wiki/Unicode).

‚ö† `str` n'est **pas** √©quivalent √† `[char]`.
Il utilise en interne le codage [UTF-8](https://fr.wikipedia.org/wiki/UTF-8),
qui a la particularit√© de coder les caract√®re sur diff√©rents nombres d'octets. Par exemple¬†:

* `'a'` est cod√© sur 1 octet
* `'√†'` est cod√© sur 2 octets
* `'‚òÉ'` est cod√© sur 3 octets

Par cons√©quent, `str` ne permet pas d'acc√©der directement √† un caract√®re¬†:

In [21]:
let txt = "hello world";
//let c = txt[1]; // NE COMPILE PAS

La m√©thode `len` de `str` retourne le nombre d'**octets**.

In [22]:
"hello world".len()

11

In [23]:
"‚òÉ‚ùÑ".len()

6

La m√©thode `chars` retourne un it√©rateur de `char`.

In [24]:
for c in "‚òÉ‚ùÑ".chars() {
    println!("{:?}", c)
};

'‚òÉ'
'‚ùÑ'


Les m√©thodes de cet it√©rateur permettent notamment de calculer le nombre de caract√®res, ou de construire un `Vec<char>`.

In [25]:
"‚òÉ‚ùÑ".chars().count()

2

In [26]:
let v: Vec<char> = "‚òÉ‚ùÑ".chars().collect();
v[1]

'‚ùÑ'

Le type `str` poss√®de de nombreuses m√©thodes de manipulation de cha√Ænes¬†:

* `contains` indique si la cha√Æne contient une sous-cha√Æne,
* `trim` retourne une sous-cha√Æne en supprimant les espaces au d√©but et √† la fin,
* `split` retourne un it√©rateur de sous-cha√Ænes, d√©limit√©es par un s√©parateur donn√©,
* `replace` retourne une nouvelle cha√Æne en rempla√ßant les occurences d'une sous-cha√Æne par un texte donn√©,
* `make_ascii_uppercase`, `make_ascii_lowercase` modifie la cha√Æne en changeant la casse des caract√®res ASCII,
* ...

Documentation compl√®te¬†: https://doc.rust-lang.org/std/primitive.str.html

### Cha√Æne mutable `String`

Une `String` est une cha√Æne de caract√®res de taille variable.

In [27]:
// cr√©ation d'une String vide
let mut s = String::new();

// remplissage d'une String
s.push('H');
s.push_str("ello");
s.push_str(" world");
s

"Hello world"

In [28]:
// cr√©ation d'une String √† partir d'une str
let s = "Hello world".to_string();
s

"Hello world"

Les `String` peuvent √™tre utilis√©es comme des `str`, elles ¬´ h√©ritent ¬ª de leurs m√©thodes.

In [29]:
let s = "Winter is coming ‚ùÑ".to_string();
s.contains("coming")

true

In [30]:
s.len() // Attention, il s'agit toujours du nombre d'OCTETS

20

Documentation compl√®te¬†: https://doc.rust-lang.org/std/string/struct.String.html

## Types complexes `struct`

### D√©claration d'un type strutur√©

In [31]:
// similaire aux `struct` du C

struct Person {
    given_name: String,
    family_name: String,
    age: u8,
}

struct Color {
    r: u8,
    g: u8,
    b: u8,
}

### Initialisation d'une valeur structur√©e

In [32]:
let black = Color { r: 0, g: 0, b: 0};

// si la valeur d'un champ est une variable du m√™me nom,
// inutile de r√©p√©ter le nom

let (r, g, b) = (50, 100, 150);
let mut mycolor = Color { r, g, b };

### Acc√®s aux champs

In [33]:
println!("{}", mycolor.b);
mycolor.r = 200;

150


### Type structur√© g√©n√©rique

In [34]:
struct GColor<T> {
    r: T,
    g: T,
    b: T,
}

let gray: GColor<f64> = GColor { r: 0.5, g: 0.5, b: 0.5};

NB: `String` et `Vec<T>` sont d√©finis comme des `struct`s.

On verra lors d'une prochaine s√©ance comment munir nos `struct`s de *m√©thodes*,
comme c'est le cas pour `String` et `Vec<T>`.

Notez cependant que les `struct` ne sont *pas* des classes au sens de la programmation OO.
En particulier, un type `struct` ne *peut pas* h√©riter d'un autre.

## Gestion de la m√©moire ü¶Äü¶Ä

### Rappel¬†: la pile et le tas

La pile

- contient les donn√©es des variables,
- de taille connue √† la compilation (statique),
- g√©r√©es de mani√®re *Last in, first out* par le compilateur (quel que soit le langage)
    
Le tas

- contient des donn√©es de taille connue √† l'ex√©cution (dynamique),
- g√©r√©es diff√©remment selon les langages.

#### Gestion du tas

En C
- le d√©veloppeur a la responsabilit√© de lib√©rer la m√©moire,
- ce qui peut donner lieu √† des erreurs (m√©moire lib√©r√©e trop t√¥t, trop tard, jamais...).

En Java
- le ramasse-miettes (*garbage collector*) se charge de lib√©rer la m√©moire √† l'ex√©cution,
- ce qui peut entra√Æner des probl√®mes de performances.

#### Gestion du tas en Rust

En Rust
- le **compilateur** se charge de lib√©rer la m√©moire.
- Cela suppose de lui fournir assez d'information pour qu'il le fasse,
- d'o√π les concepts sp√©cifiques de **propri√©t√©** et d'**emprunt**. ü¶Äü¶Ä

### Illustration¬†: le type `String`

In [35]:
let s1 = "hello".to_string();

<div style="text-align: center">
<img alt="String en m√©moire" src="images/trpl04-01.svg" style="display: inline; width: 12em;">
</div>

In [36]:
let s1 = "hello".to_string();
let s2 = s1;
// Quelles est la structure en m√©more de s1 et s2 ?

<div style="text-align: center"> <img alt="Shallow copy" src="images/trpl04-02.svg" style="display: inline; width: 12em;"> &nbsp;&nbsp;&nbsp;/&nbsp;&nbsp;&nbsp; <img alt="Deep copy" src="images/trpl04-03.svg" style="display: inline; width: 12em;"> ? </div>

In [37]:
// copie profonde EXPLICITE avec la m√©thode clone
let mut s1 = "hello".to_string();
let s2 = s1.clone();
println!("{:?} {:?}", s1, s2);

"hello" "hello"


<div style="text-align: center">
<img alt="Copie profonde" src="images/trpl04-03.svg" style="display: inline; width: 12em;">
</div>

In [38]:
let s1 = "hello".to_string();
let s2 = s1;
//println!("{}", s1); // NE COMPILE PAS

<div style="text-align: center">
<img alt="String en m√©moire" src="images/trpl04-04.svg" style="display: inline; width: 12em;">
</div>

### Propri√©t√© ü¶Äü¶Ä

* Toute donn√©e est la **propri√©t√©** d'exactement une variable (ou champ de structure).

* Conceptuellement, l'affectation d'une variable √† une autre **d√©place** (*move*) les donn√©es,
  et transf√®re la propri√©t√© √† la nouvelle variable.
  
* Lorsqu'une variable est supprim√©e, si elle est encore propri√©taire de ses donn√©es,
  celles-ci sont **lib√©r√©es**.

In [39]:
fn produit(nom: &str) -> String {
    let mut msg = "Bonjour ".to_string(); // 1. La cha√Æne est allou√©e ici
    msg.push_str(nom);
    msg                                   // 2. La cha√Æne est transf√©r√©e au code appelant
}

fn consomme(s: String) {
    println!("Le message contient {} octets", s.len());
}                                         // 5. La variable 's' arrive au bout de son scope,
                                          //    et elle poss√®de toujours la cha√Æne,
                                          //qui est donc lib√©r√©e.


{ 
    let mut txt = produit("Alice");       // 3. La cha√Æne est r√©cup√©r√©e depuis la fonc. produit
    txt.push_str(" !");
    consomme(txt);                        // 4. La cha√Æne est transf√©r√©e √† la fonc. consomme
    //txt.len() // NE COMPILE PAS
};

Le message contient 15 octets


#### Cas particulier des types atomiques

Les types de base (entiers, flottants, bool√©ens, caract√®res)
peuvent √™tre copi√©s implicitement,
car le compilateur sait que cette copie est s√ªre (*safe*) et rapide.

In [40]:
let x = 42;
let y = x; // copy instead of move
println!("{} {}", x, y);

42 42


NB: il est possible d'√©tendre ce comportement √† d'autres types (e.g. le type `Color` d√©fini plus haut).

### Emprunts (*borrow*) ü¶Äü¶Ä

In [41]:
let s1 = "hello".to_string();
{
    let s: &String = &s1;
    println!("{} {}", s1, s);
}
println!("{}", s1);

hello hello
hello


()

<div style="text-align: center">
<img alt="String en m√©moire" src="images/trpl04-05.svg" style="display: inline; width: 16em;">
</div>

Pour tout type `T`, les variables de type `&T` sont des **r√©f√©rences** vers un `T`.

* Physiquement, les r√©f√©rences sont des pointeurs.
* Conceptuellement, les r√©f√©rences ne *poss√®dent pas* les donn√©es vers lesquelles elles pointent,
* la disparition de la r√©f√©rence n'entra√Æne donc pas la lib√©ration des donn√©es.
* En cons√©quence, plusieurs r√©f√©rences vers les m√™me donn√©es peuvent *co-exister*.

In [42]:
let s1 = "hello".to_string();
{
    let s2: &String = &s1;
    let s3: &String = &s1;
    println!("{} {} {}", s1, s2, s3);
}
println!("{}", s1);

hello hello hello
hello


()

NB¬†: Les r√©f√©rences de type `&T` sont immutables.

In [43]:
let mut s1 = "hello".to_string();
{
    let s2: &String = &s1;
    //s2.push('!'); // NE COMPILE PAS
}
s1.push('!');
println!("{}", s1);

hello!


()

Pour que l'exemple ci-dessus fonctionne, il faut utiliser une **r√©f√©rence mutable**,
de type `&mut T`.

In [44]:
let mut s1 = "hello".to_string();
{
    let s2 = &mut s1;
    s2.push('!');
}
s1.push('!');
println!("{}", s1);

hello!!


()

### R√®gles sur les r√©f√©rences

On ne peut pas avoir en m√™me temps

* plusieurs r√©f√©rences mutables, ni
* une r√©f√©rence mutable et une (ou plusieurs) r√©f√©rence(s) immutable(s).

En effet, il faut √©viter

* que deux parties du code modifient les m√™mes donn√©es simultan√©ment, et
* qu'une partie du code lise des donn√©es en cours de modification.

In [45]:
let mut s1 = "hello".to_string();
{
    let s2 = &s1;
    //s1.push('?'); // NE COMPILE PAS
    println!("{}", s2);
}
s1.push('!');

hello


()

In [46]:
let mut s1 = "hello".to_string();
{
    let s2 = &mut s1;
    /* NE COMPILE PAS
    let s3 = &mut s1;
    println!("{} {}", s2, s3);
    */
    
}
s1.push('!');

()

### Choix des passages de param√®tres des fonctions

In [47]:
// ma fonction n'a pas besoin de modifier les donn√©es¬†: &T
fn compte_e(txt: &String) -> usize {
    let mut c = 0;
    for i in txt.chars() {
        if i == 'e' {
            c += 1;
        }
    }
    c
}

In [48]:
// ma fonction a besoin de modifier les donn√©es¬†: &mut T
fn exclame(txt: &mut String) {
    if !txt.ends_with("!") {
        txt.push('!')
    }
}

In [49]:
// ma fonction "consomme" les donn√©es (rare) / les donn√©es sont "copiables"¬†: T
fn fact(n: usize) -> usize {
    if n <= 1 { 1 } else { n*fact(n-1) }
}

### Diff√©rence conceptuelle entre pointeur et r√©f√©rence


In [50]:
let a = 42;
let b = 41 + 1;
let test = &a == &42;

In [51]:
test

true

* la ¬´¬†valeur¬†¬ª d'une r√©f√©rence n'est **pas** l'adresse en m√©moire, c'est la valeur point√©e.

    * Ne pas penser `&T` comme ¬´¬†un pointeur vers un `T`¬†¬ª mais comme ¬´¬†un `T` emprunt√© √† quelqu'un d'autre¬†¬ª.
    * `T` et `&T` restent malgr√© tout deux types diff√©rents...

* En Rust, une r√©f√©rence n'est **jamais** un pointeur null. ü¶Ä

In [52]:
let a = 42;
let b = 41 + 1;
// let test = &a == b; // NE COMPILE PAS
// let test = &a == 42; // NE COMPILE PAS
let test = &a == &42; // on imagine bien que &42 n'est pas un pointeur
{
    let c = &a;
    let test = *c == 42;  // on peut aussi l'√©crire ainsi (* est l'oppos√© de &)
};

### Dur√©es de vie

Un composant du compilateur (le *borrow checker*)
v√©rifie qu'aucun emprunt ne dure plus longtemps que la dur√©e de vie du propri√©taire.

(puisqu'√† la ¬´¬†mort¬†¬ª du propri√©taire, les donn√©es sont lib√©r√©es)


In [53]:
// NE COMPILE PAS
let emprunteur;
{
    let proprietaire = "hello".to_string();
    emprunteur = &proprietaire;
}
println!("{}", emprunteur);

Error: `proprietaire` does not live long enough

Dans certaines situations, le compilateur a besoin qu'on lui donne des indications sur les dur√©es de vie respectives des diff√©rentes r√©f√©rences (¬´¬†qui doit vivre aussi longtemps que qui ?¬†¬ª).

On utilise alors la syntaxe `&'a T` ou `&'a mut T`.

In [54]:
// NE COMPILE PAS
fn without_prefix(txt: &str, prefix: &str) -> &str {
    if txt.starts_with(prefix) {
        &txt[prefix.len()..]
    } else {
        txt
    }
}

without_prefix("bonjour", "bon")

Error: missing lifetime specifier

Mais dans ce module, nous ferons en sorte d'√©viter ces situations.

In [55]:
fn without_prefix<'a>(txt: &'a str, prefix: &str) -> &'a str {
//               ^^^^       ^^                        ^^
    if txt.starts_with(prefix) {
        &txt[prefix.len()..]
    } else {
        txt
    }
}

without_prefix("bonjour", "bon")

"jour"