## 1.4 Chaînes de Caractères
### Plus de Types
Nous utilisons également beaucoup de texte en programmation, et nous avons un nom spécial pour ce type de données ; il s'appelle une **chaîne de caractères**.

Les chaînes de caractères en Python sont écrites avec une paire de symboles de guillemets. Vous pouvez utiliser `"` ou `'`, tant que vous utilisez le même au début et à la fin de la chaîne. Python est assez intelligent pour vous permettre d'utiliser des guillemets simples à l'intérieur d'une chaîne terminée par des guillemets doubles, ou vice versa.

Voici quelques chaînes de caractères valides en Python :
```python
"Ceci est une chaîne"
'Ceci est aussi une chaîne'
"N'est-ce pas merveilleux que nous puissions utiliser des guillemets simples à l'intérieur de guillemets doubles ?"
```

Nous pouvons également effectuer certaines opérations sur les chaînes de caractères. Si nous ajoutons deux chaînes de caractères, elles sont *concaténées* :

In [1]:
"chaîne un" + "chaîne deux"

'chaîne unchaîne deux'

Remarquez que cette opération est littérale : elle n'insérera pas d'espace pour vous si vous n'en demandez pas !

Nous pouvons aussi multiplier une chaîne de caractères par un nombre pour répéter plusieurs fois une chaîne :

In [2]:
"Cette formation est géniale ! " * 4

'Cette formation est géniale ! Cette formation est géniale ! Cette formation est géniale ! Cette formation est géniale ! '

Nous pouvons *indexer* une chaîne de caractères en utilisant des crochets `[` et `]`. Il est courant en informatique de commencer à compter les séquences à partir de zéro, et non pas un. Donc, le premier caractère d'une chaîne est l'élément zéro, le deuxième caractère est l'élément un, et ainsi de suite. Donc :

In [3]:
"chaîne"[0]

'c'

In [4]:
"chaîne"[1]

'h'

In [5]:
"chaîne"[5]

'e'

Encore une fois, veuillez essayer de modifier le code dans ces cellules et de les relancer. Essayez différentes valeurs, essayez une autre chaîne, devinez ce que le résultat sera avant d'appuyer sur exécuter. Et que se passe-t-il si l'indice est trop grand ?

Nous pouvons trouver la longueur d'une chaîne en utilisant une autre fonction utile : `len(x)`

In [6]:
len("chaîne")

6

Ainsi, le code suivant affiche le dernier caractère de ce qui est stocké dans la variable appelée `texte` (essayez de changer la chaîne et de relancer la cellule) :

In [7]:
texte = "chaîne"
texte[len(texte)-1]

'e'

Comme nous l'avons mentionné précédemment, toute valeur qui est écrite en entier est appelée un **littéral**. `2` est un littéral entier, `"bonjour"` est un littéral de chaîne. Il est inhabituel de voir des crochets utilisés pour indexer un littéral de chaîne. Pourquoi écrire `"chaine"[0]` quand vous pouvez simplement écrire `"c"` ? Inhabituel, mais ça marche ! N'oubliez pas notre objectif d'être toujours capable de lire le code, même s'il est inhabituel !

Indexer une chaîne avec des crochets est très courant sur les variables, comme le montrent les exemples ci-dessus et ci-dessous.

Python nous donne également un petit raccourci sympa : nous pouvons utiliser des indices *négatifs* pour indexer à partir du *côté droit* de la chaîne. Donc `-1` est le dernier élément, `-2` est l'avant-dernier, et ainsi de suite :


In [8]:
texte = "chaîne"
texte[-1]

'e'

In [9]:
texte[-2]

'n'

Mais soyez prudent : si vous dépassez la longueur de la chaîne dans les deux sens, vous obtiendrez une erreur !

In [10]:
texte = "chaîne"
texte[-7]

IndexError: string index out of range

Vous êtes peut-être encore en train de vous habituer à voir ces erreurs, mais ne vous inquiétez pas, cela deviendra bientôt une activité quotidienne ! Encore une fois, l'erreur elle-même fournit beaucoup d'informations, mais cela peut être un peu accablant au début. Les informations les plus importantes sont sur la dernière ligne, donc commencez là. Le type d'erreur est une erreur d'indice, et l'explication est que l'indice de la chaîne est hors de portée. Espérons que c'est assez explicite !

Enfin, vous pouvez accéder à une plage d'indices à partir d'une chaîne (également appelée sous-chaîne). Si `texte` est une variable de chaîne, alors écrire
```python
texte[x:y]
```
vous donnera la sous-chaîne de la position `x` *jusqu'à mais pas incluant la position* `y`.

Dans l'exemple ci-dessous, remarquez comment `texte[2:4]` retourne les caractères avec les indices 2 et 3 (mais pas 4) de la chaîne :

In [11]:
texte = "sandwich"
texte[2:4]

'nd'

Essayez de changer les nombres ci-dessus et de voir comment ils affectent le résultat. Cela pourrait aider :

```
01234567
sandwich
```

Vous pouvez omettre complètement `x` ou `y` pour obtenir une sous-chaîne qui va jusqu'au début ou jusqu'à la fin de la chaîne, respectivement.

In [12]:
texte = "sandwich"
texte[2:]

'ndwich'

In [13]:
texte
texte[:4]

'sand'

Vous pouvez également demander une sous-chaîne d'un littéral de chaîne, mais encore une fois, nous ne sommes pas susceptibles de le faire en pratique :

In [14]:
"sandwich"[:4]

'sand'

Il existe un type spécial de chaîne appelé une *chaîne vide*. Les chaînes sont des séquences qui contiennent un nombre quelconque de caractères, y compris zéro. Nous pouvons écrire une chaîne vide comme vous pourriez l'imaginer, en incluant les guillemets mais sans texte : `''` ou `""`. Cela peut sembler étrange, mais nous avons réellement besoin de chaînes vides pour que certains codes fonctionnent bien. Vous verrez des exemples de cela en temps voulu, mais pour l'instant, considérez ce qui se passerait si nous essayions de prendre une sous-chaîne en utilisant `[x:y]` où les deux valeurs sont les mêmes. Plutôt que de provoquer une erreur, une chaîne vide est plus utile :

In [15]:
texte[3:3]

''

#### Nombres dans les Chaînes
Maintenant, je vous garantis, à un moment donné, vous tenterez de concaténer un nombre dans une chaîne :
```python
"Ceci est la chaîne numéro " + 6
```
mais cela résultera en une erreur :

In [16]:
"Ceci est la chaîne numéro " + 6

TypeError: can only concatenate str (not "int") to str

C'est souvent le premier endroit où les débutants trébuchent car ils ne comprennent pas pleinement les types. Mais vous savez mieux ! En pensant aux *types* impliqués, vous pourriez déjà être capable de repérer le problème.

Si ce n'est pas le cas, ne vous inquiétez pas. Encore une fois, rappelez-vous, les informations importantes dans une erreur sont en bas. Celle-ci dit que nous avons une erreur de type. La concaténation avec `+` est définie pour deux chaînes, mais pas pour une chaîne et un entier.

Pour résoudre ce problème, nous pouvons convertir manuellement l'entier en chaîne :

In [17]:
"Ceci est la chaîne numéro " + str(6)

'Ceci est la chaîne numéro 6'

Cela donne le résultat que nous attendons. Maintenant, vous pouvez voir pourquoi il est si important que vous compreniez les types de vos données, même si Python s'en occupe tout seul lorsqu'il s'agit d'assigner des types aux variables.

Vous finirez souvent par vouloir insérer des nombres dans des chaînes lorsque vous écrivez du code, et c'est en fait pénible de devoir continuellement couper la chaîne. Supposons que vous vouliez écrire quelque chose comme ceci – en réalité vous utiliserez des variables, mais restons avec des littéraux pour l'instant :

In [18]:
"c'est la tentative " + str(5) + " sur " + str(10) + ", votre score actuel est " + str(30) + " sur " + str(100) + "."

"c'est la tentative 5 sur 10, votre score actuel est 30 sur 100."

Le code est un peu désordonné même si nous obtenons ce que nous voulons. Comme c'est si courant, Python a d'autres moyens de traiter cela.

⚠️ *Ne sentez pas que vous devez apprendre cela maintenant.* Lisez cette section mais ne vous sentez pas obligé de la mémoriser. Ensuite, lorsque vous voudrez faire cela à l'avenir, revenez à cette page.

Vous verrez cela utilisé couramment :

In [19]:
"c'est la tentative {} sur {}, votre score actuel est {} sur {}".format(5, 10, 30, 100)

"c'est la tentative 5 sur 10, votre score actuel est 30 sur 100"

À partir de Python 3.6, vous pouvez également écrire ceci :

In [20]:
f"c'est la tentative {5} sur {10}, votre score actuel est {30} sur {100}"

"c'est la tentative 5 sur 10, votre score actuel est 30 sur 100"

Remarquez le `f` juste avant le début de la chaîne. Lorsque nous plaçons ce `f` avant la chaîne, tout ce qui est écrit entre `{` et `}` sera évalué. Ainsi, vous pouvez insérer des variables ou même des calculs arithmétiques ici aussi. Voici à quoi notre code ressemblerait plus probablement en pratique.

In [21]:
tentative = 5
max_tentatives = 10
score = 30
max_score = 100

f"c'est la tentative {tentative} sur {max_tentatives}, votre score actuel est {score} sur {max_score}"

"c'est la tentative 5 sur 10, votre score actuel est 30 sur 100"

In [22]:
f"la tentative {tentative} sur {max_tentatives} représente {tentative/max_tentatives*100}% du maximum"

'la tentative 5 sur 10 représente 50.0% du maximum'

Et si vous utilisez une version de Python antérieure à 3.6, vous pouvez bien sûr faire ceci aussi :

In [23]:
"c'est la tentative {} sur {}, votre score actuel est {} sur {}".format(tentative, max_tentatives, score, max_score)

"c'est la tentative 5 sur 10, votre score actuel est 30 sur 100"

In [24]:
"la tentative {} sur {} représente {}% du maximum".format(tentative, max_tentatives, tentative/max_tentatives*100)

'la tentative 5 sur 10 représente 50.0% du maximum'

Vous pouvez faire beaucoup plus avec le formatage des chaînes et les f-strings en Python. Si vous êtes curieux, vous pourriez rechercher des tutoriels en ligne. Personnellement, j'aime regarder la documentation Python, mais c'est assez technique, pas spécialement adaptés aux débutants. Mais c'est notre objectif : finalement, vous écrirez du code et voudrez utiliser une fonctionnalité de Python, et plutôt que de vous sentir bloqué, vous saurez exactement où trouver la documentation.

Pour l'instant cependant, essayez le quiz ci-dessous, et continuez à travailler jusqu'à la section suivante.

#### Questions
Voici quelques questions sur les chaînes. Si votre réponse est une chaîne, assurez-vous d'inclure les guillemets – vous pouvez utiliser des guillemets simples ou doubles, le script acceptera les deux.

In [None]:
from questions_interactives import run
run("1.4.1q.txt")