<!-- LTeX: language=fr -->

Cours 4‚ÄØ: Indexation, listes et it√©ration
=========================================

**Lo√Øc Grobol** [<lgrobol@parisnanterre.fr>](mailto:lgrobol@parisnanterre.fr)

2022-02-01

Dans ce notebook, on introduit les concepts suivants‚ÄØ:

- L'op√©ration *index* et les types de donn√©es indic√©s
- Le type de donn√©e `list`
- La boucle de parcours `for`

Ce cours est inspir√© des cours [*Control flow and
indexing*](https://github.com/aniellodesanto/Utah_CompLang21/blob/main/02_control_flow_and_indexing.ipynb)
et [*Lists and for
loops*](https://github.com/aniellodesanto/Utah_CompLang21/blob/main/03_lists_and_for_loops.ipynb)
d'Aniello de Santo, merci infiniment √† lui.

## Index

In [None]:
"Bonjour"[0]

In [None]:
"Bonjour"[3]

In [None]:
print("Bonjour"[4])

D'apr√®s vous, qu'afficherait le programme suivant‚ÄØ?

```python
print("Bonjour"[2])
```

### Principe de base

L'op√©ration not√©e par des crochets, qu'on appelle en anglais _**indexing**_ (et qui en fran√ßais n'a
pas vraiment de nom conventionnel, mais on dira *indexer*), permet d'extraire des √©l√©ments √† partir
d'objets composites.

En l'occurrence, une cha√Æne de caract√®re est bien un objet **composite**‚ÄØ: c'est une suite de
caract√®res. Elle poss√®de √©galement un **ordre**‚ÄØ: `"bestial"` et `"baliste"`, ce n'est pas la m√™me
chose‚ÄØ:

In [None]:
"bestial" == "baliste"

Ces deux propri√©t√©s font qu'il est possible d'acc√©der √† n'importe lequel des caract√®res d'une cha√Æne
de caract√®re via sa **position**‚ÄØ: `"Bonjour"[i]` renvoie le `i`-√®me caract√®re de la cha√Æne, le
caract√®re dont l'**indice** (ou *index*) est `i`.

On dit que les cha√Ænes de caract√®res sont des **s√©quences**, ou encore que ce sont des types (ou
structures) de donn√©es **indic√©es**.

Les entiers, les flottants et les bool√©ens ne sont pas des s√©quences‚ÄØ:

In [None]:
1964[2]

On peut bien s√ªr indexer dans une variable contenant une cha√Æne de caract√®res‚ÄØ:

In [None]:
ma_chaine = "Je reconnais l'existence du kiwi."
print(ma_chaine[0])
print(ma_chaine[1])
print(ma_chaine[2])
print(ma_chaine[3])
print(ma_chaine[4])

Et on peut utiliser une variable ou une expression comme indice‚ÄØ:

In [None]:
ma_chaine = "Je reconnais l'existence du kiwi."
position = 11
print(ma_chaine[position])
print(ma_chaine[position-1])

Dernier point‚ÄØ: **en Python, les indices commencent √† `0`**.

Ce n'est pas forc√©ment intuitif, et d'ailleurs ce n'est pas le cas de tous les langages de
programmation. Tout le monde se plante de temps en temps, mais il faut le retenir.


### üî≠ Entra√Ænement üî≠

Demandez un mot et un indice `i` √† l'utilisateurice. Si le mot a un `i`-√®me caract√®re, affichez ce caract√®re,
sinon affichez un message d'erreur.

Indice‚ÄØ: vous savez d√©terminer la longueur d'une cha√Æne de caract√®res.

In [None]:
mot = input("Dis-moi un mot‚ÄØ: ")
position = int(input("Dis-moi un nombre‚ÄØ: "))

# √Ä vous de jouer‚ÄØ: ajoutez du code ici pour r√©pondre √† la question.

In [None]:
mot = input("Dis-moi un mot‚ÄØ: ")
position = int(input("Dis-moi un nombre‚ÄØ: "))

if position >= len(mot) or position < 0:
    print("Indice", position, "incorrect pour un mot de longueur", len(mot))
else:
    print(mot[position])

### *Slices*

√Ä votre avis, que va afficher la cellule suivante‚ÄØ? Essayez de deviner avant de tester.

In [None]:
print("Bonjour"[2:5])

Et celle-ci‚ÄØ?

In [None]:
print("Universit√© Paris Nanterre"[5:10])

√Ä votre avis que signifie cette syntaxe‚ÄØ?

---

L'op√©ration dite _**slice**_ (*tranche*) est une extension de l'indexage‚ÄØ: au lieu d'extraire un
√©l√©ment de la s√©quence, on en extrait une plage, un intervalle, une **sous-s√©quence**. Pr√©cis√©ment‚ÄØ:

`ma_chaine[start:end]`, c'est la sous-chaine compos√©e des caract√®res de `ma_chaine` dont les indices
sont compris entre `start` (inclus) et `end` (exclus).

In [None]:
print("Merveilleux"[3:8])

Si `start` vaut `0`, ou que `end` est sup√©rieur ou √©gal √† la longueur de la cha√Æne, on peut les
omettre‚ÄØ:

In [None]:
print("Merveilleux"[:8])

In [None]:
print("Merveilleux"[3:])

### Indices n√©gatifs

Python autorise aussi les indices n√©gatifs. Pouvez-vous en deviner le sens et dire ce que va
afficher la cellule suivante‚ÄØ?

In [None]:
print("Pomme"[-1])

On peut √©galement faire des tranches avec des indices n√©gatifs, M√™me si √ßa devient rapidement prise
de t√™te‚ÄØ:

In [None]:
print("Pomme"[-4:-1])
print("Pomme"[1:4])

En revanche, ceci est fr√©quent

In [None]:
print("supercallifragilisticexpialidocious"[-3:])

### *Step*

En plus des param√®tres `start` et `end`, il y a aussi un param√®tre optionnel `step` (le *pas*) qui
permet de s√©lectionner des sous-cha√Ænes discontinues.

In [None]:
"Merveilleux"[2:5:3]

In [None]:
"Merveilleux"[::3]

Ce pas peut √™tre n√©gatif, auquel cas on parcourt la cha√Æne √† l'envers‚ÄØ:

In [None]:
"Merveilleux"[8:2:-3]

Est-ce que vous pouvez en d√©duire une fa√ßon d'inverser une cha√Æne en utilisant que la syntaxe de
*slice*‚ÄØ?

In [None]:
# √Ä vous de jouer

(C'est en v√©rit√© de loin l'usage le plus fr√©quent de `step`).

### La m√©thode `find`

La fonction `str.find(chaine, sous_chaine)` renvoie l'indice de d√©part de `sous_chaine` dans
`chaine` ou `-1` si on ne l'y trouve pas.

In [None]:
str.find("Une pomme", "pom")

In [None]:
str.find("Une pomme", "poi")

Si la sous-cha√Æne est pr√©sente plusieurs fois, seule la premi√®re sera prise en compte‚ÄØ:

In [None]:
str.find("rock and roll", "ro")

**Note** Les fonctions comme `find`, `upper`‚Ä¶ sont plus pr√©cis√©ment des **m√©thodes**, c'est-√†-dire
des fonctions attach√©es √† un type d'objet en particulier (ici les cha√Ænes de caract√®res). On peut
les appeler via leur type (`str`) ou via un objet‚ÄØ:

In [None]:
"Une pomme".find("pom")

On reviendra plus en d√©tails sur ces notions plus tard dans le cours.

## Listes

On a vu qu'une cha√Æne de caract√®res √©tait une **s√©quence** de caract√®res.

Il existe d'autres types de s√©quences en Python. Le plus √©l√©mentaire est la **liste**, un objet du
type `list`.

Il s'agit d'un conteneur g√©n√©rique qui peut contenir des s√©quences de n'importe quel type d'objets.

On cr√©e une liste avec la syntaxe suivante (oui, encore des crochets)

In [None]:
a = [1, 2, 3]
print(a)

In [None]:
type(a)

In [None]:
a = [0.1, 12.5, 13.0]
print(a)
print(type(a))

In [None]:
a = ["Je", "reconnais", "l'", "existence", "du", "kiwi"]
print(a)
print(type(a))

On peut √©galement m√©langer les types

In [None]:
l = [1, "machin", True, 0.000001]
print(l)
print(type(l))

Et les √©l√©ments peuvent eux-aussi √™tre des listes. Dans l'exemple suivant, `l` est une liste de
trois √©l√©ments, le dernier se trouvant √™tre une liste lui-m√™me.

In [None]:
l = [1, "machin", [0, 2]]
print(l)
print(type(l))

Comme les cha√Ænes de caract√®res, les listes sont **ordonn√©es**

In [None]:
[1, 2, 3] == [3, 1, 2]

Elles sont donc √©galement indic√©es‚ÄØ:

In [None]:
ma_liste= ["Je", "reconnais", "l'", "existence", "du", "kiwi"]

print(ma_liste[0])
print(ma_liste[1])
print(ma_liste[-1])
print(ma_liste[1:4])

Et on peut obtenir leur longueur

In [None]:
ma_liste= ["J'", "aime", "les", "√©pinards"]
len(ma_liste)

Et donc v√©rifier que je n'ai pas menti

In [None]:
len([1, "machin", [0, 2]])

√Ä votre avis, qu'affiche la cellule suivante‚ÄØ?

In [None]:
ma_liste = [1, "machin", [9, 2]]
print(ma_liste[2][0])

Enfin, une liste peut avoir un seul √©l√©ment

In [None]:
une_autre_liste = ["tout seul"]

voire √™tre vide

In [None]:
une_autre_liste = []

Attention donc √† bien identifier les √©l√©ments‚ÄØ: qu'affiche la cellule suivante‚ÄØ?

In [None]:
ma_liste= ["J', aime, les, √©pinards"]
print(len(ma_liste))

### Modifier des listes

Les listes sont **mutables**, on peut les modifier avec les m√©thodes suivantes

#### `append`

`append` ajoute un nouvel √©l√©ment √† une liste existante‚ÄØ:

In [None]:
ma_liste = [1, 2, 3]
ma_liste.append("un de plus")
print(ma_liste)

In [None]:
one_list = [1, 2, 3]
another_list = [True, "linguistique"]
one_list.append(another_list)
print(one_list)

Combien d'√©l√©ments a `one_list`‚ÄØ?

In [None]:
print(one_list, "a", len(one_list), "√©l√©ments")

#### `extend`

`extend` ajoute √† une liste tous les √©l√©ments d'une autre liste‚ÄØ:

In [None]:
one_list = [1, 2, 3]
another_list = [True, "linguistique"]
one_list.extend(another_list)
print(one_list)

est donc √©quivalent √†

In [None]:
one_list = [1, 2, 3]
another_list = [True, "linguistique"]
one_list.append(another_list[0])
one_list.append(another_list[1])
print(one_list)

#### `insert`

Enfin, `insert` permet d'ins√©rer des √©l√©ments √† une position arbitraire dans une liste

In [None]:
states = ["California", "New York", "Arizona"]
states.insert(1, "Colorado")
print(states)

On √©vite en g√©n√©ral de s'en servir quand on peut utiliser `append` √† la place.

#### `remove` et `pop`

`remove` √¥te la premi√®re occurrence d'un √©l√©ment

In [None]:
states = ["California", "New York", "Arizona"]
states.remove("Arizona")
print(states)

Mais **seulement** la premi√®re‚ÄØ:

In [None]:
states = ["California", "New York", "Arizona", "New York"]
states.remove("New York")
print(states)

Pour supprimer un √©l√©ment en donnant sa position on utilise `pop`‚ÄØ:

In [None]:
print(states)
states.pop(1)
print(states)

On peut aussi modifier la valeur d'un √©l√©ment par position de la fa√ßon suivante‚ÄØ:

In [None]:
cities = ["NYC", "LA"]
cities[0] = "SF"
print(cities)

### üõ†Ô∏è Entra√Ænement üõ†Ô∏è

Voici une liste de lettres‚ÄØ:

In [None]:
letters = ["d", "b", "c", "n"]

Ins√©rez `"x"` en position `3`, puis retirez `"c"`, ajoutez `"e"` √† la fin, supprimez l'√©l√©ment
d'indice `2`, et, finalement remplacez l'√©l√©ment en position `1` par `"o"`. Puis affichez le contenu
de la liste

## Boucle `for`

Nous disposons √† pr√©sent de **s√©quences**‚ÄØ: les cha√Ænes de caract√®res et les listes. Il nous manque
un outil pour pouvoir faire des choses vraiment int√©ressantes avec.

Observez les cellules suivantes

In [None]:
for char in "Chocolat":
    print(char)  

In [None]:
for el in ["a", "e", "i", "o", "u"]:
    print(el)

Pouvez-vous en d√©duire ce qu'affichent les cellules suivantes‚ÄØ?

In [None]:
for c in "Seitan":
    print(c)

In [None]:
for i in [1, 2, 3, 4, 5]:
    print(i)

Et la cellule suivante‚ÄØ?

In [None]:
for i in [1, 2, 3, 4, 5]:
    j = 2*i
    print(j)
print("hello")

---

Le mot-cl√© `for` permet de d√©finir une **boucle** (sp√©cifiquement une boucle d'it√©rateur)‚ÄØ: un bloc
de code qui sera ex√©cut√© pour chacun des √©l√©ments d'une s√©quence, et dans lequel on a acc√®s √† la
valeur de cet √©l√©ment.

Il s'agit comme pour les blocs `if`-`elif`-`else` d'une **structure de contr√¥le**.

Le bloc de code qui est r√©p√©t√© (le **corps de la boucle**) est marqu√© l√† encore par des alin√©as.

La syntaxe formelle exacte est

```text
for <nom-de-variable> in <sequence>:
    Instruction 1
    Instruction 2
    ‚Ä¶
```

Notez bien les `:` √† la fin de la ligne `for`. L√† encore, c'est comme pour `if`.

On peut combiner boucles et tests

In [None]:
voyelles = ["a", "e", "i", "o", "u"]
for char in "linguistique":
    if char in voyelles:
        print("J'ai trouv√© une voyelle‚ÄØ:", char)

Et les boucles peuvent √™tre imbriqu√©es‚ÄØ:


In [None]:
cities = ["NYC", "LA", "SF"]

for city in cities:
    print("La ville est", city)
    print("Ses lettres sont‚ÄØ:")

    for letter in city:
        print("\t", letter)

## Exercices

R√©pondre √† ces exercices directement dans le notebook, le sauvegarder sous un nom de la forme
`03_index_listes_iter_PRENOM_NOM.ipynb` (pour Morgan Lefeuvre par exemple, ce serait
`03_index_listes_iter_Morgan_Lefeuvre.ipynb`) et me le transmettre avant dimanche soir prochain
(2022-02-06).

- De pr√©f√©rence via [Cours en Ligne](https://coursenligne.parisnanterre.fr/course/view.php?id=7694)
  (cl√© d'inscription `rossum`)
- √Ä d√©faut, par mail, √† `<lgrobol@parisnanterre.fr>`

Attention‚ÄØ: **l'extension doit √™tre `.ipynb`**.

## Exercice 1

Voici deux listes

In [None]:
cities = ["NYC", "LA", "SF"]
small_cities = ["Stony Brook", "Provo"]

# Codez ici

Modifiez la cellule suivante de sorte √† modifier `cities` pour que son contenu soit `["NYC", "LA",
"Stony Brook", "Provo", "SF"]`

## Exercice 2

Voici une liste

In [None]:
villes = ["Paris", "Nanterre", "Orl√©ans", "Uppsala"]

En utilisant cette liste, √©crivez un programme qui affiche la sortie suivante

```text
Paris Paris
Paris Nanterre
Paris Orl√©ans
Paris Uppsala
Nanterre Paris
Nanterre Nanterre
Nanterre Orl√©ans
Nanterre Uppsala
Orl√©ans Paris
Orl√©ans Nanterre
Orl√©ans Orl√©ans
Orl√©ans Uppsala
Uppsala Paris
Uppsala Nanterre
Uppsala Orl√©ans
Uppsala Uppsala
```


In [None]:
# codez ici

### Exercice 3

Voici quelques mots de la [Liste Swadesh](https://fr.wikipedia.org/wiki/Liste_Swadesh).

In [None]:
words = ["soleil", "lune", "terre", "eau", "nouriture", "ciel"]

Imaginez que vous √™tes un‚ãÖe linguiste de terrain en train de collecter du vocabulaire pour
documenter une langue‚ÄØ:

- Cr√©ez une liste vide dans une variable `traduction`.
- Pour chacun des mots de la liste `words`, demandez √† l'utilisateurice d'entrer sa traduction et
  sauvegardez cette entr√©e dans `traductions`.
- Une fois que vous avez termin√©, affichez la valeur de `traductions`.

### R√©flexion

Quelques questions sur votre travail‚ÄØ:

- Combien de temps avez-vous pass√© √† faire ces exercices‚ÄØ?
- Combien de temps avez-vous pass√© √† relire le cours (ou les cours pr√©c√©dents)‚ÄØ?
- Avez-vous l'impression d'avoir bien m√©moris√© les concepts et les techniques vus jusqu'ici‚ÄØ?
- Qu'est-ce qui vous para√Æt le plus compliqu√©‚ÄØ?
- √Ä votre avis, pourquoi‚ÄØ?

Merci de bien r√©pondre √† chacune de ces questions‚ÄØ: elles me permettent d'ajuster le cours en
fonction de vos besoins, avec un peu de chance, elles devraient √©galement vous aider √† guider votre
travail et √† appr√©cier votre progression.