# Les chaînes de caractères – les strings
*Ce document est publié sous licence libre Creative Commons CC-BY-SA.*

---

Les programmes précédents ont majoritairement manipulé des nombres, mais un programme d'ordinateur peut également traiter des caractères alphabétiques, des mots, des phrases ou des suites de symboles quelconques. On appelle ces structures de données particulières des **chaînes de caractères** ou **string** en anglais.

## Le type `string`
Une donnée de type *string* ou *chaînes de caractères* peut être vue comme une suite de caractères. On délimite les débuts et la fin de la chaîne de caractères, soit par des apostrophes `'` (simples quotes), soit par des guillemets `"` (doubles quotes). Exemple :

In [1]:
phrase1 = 'Bonjour,'
phrase2 = "bienvenue"
phrase3 = 'dans le "monde" de Python.'
print(phrase1, phrase2, phrase3)

Bonjour, bienvenue dans le "monde" de Python.


---
> 🏆 **À vous de jouer** 🏆 – *Dans la cellule ci-dessous :*
    > + Créez 2 variables contenant le nom et le prénom d'un acteur ou d'une actrice célèbre.
    > + Affichez le contenu des 2 variables à l'aide de l'instruction `print()`.

In [2]:
nom = "Watson "
prenom = "Emma "
print(nom, prenom)

Watson Emma


---

## Les opérations élémentaires
Python intègre un grand nombre de fonctions et d'opérations très utiles pour traiter les *strings*.

### Le `+` pour concaténer
Nous avons vu précédemment qu'avec la fonction `print()` nous pouvions mettre bout à bout plusieurs chaînes de caractères. Il existe une autre manière de **concaténer** 2 chaînes de caractères ( c'est-à-dire les mettre bout à bout ) avec l'opérateur `+` :

In [3]:
phrase1 = "bienvenue "
phrase2 = "à "
phrase3="tous"

phrase = phrase1 + phrase2 + phrase3
print(phrase)

bienvenue  à  tous


Vous noterez que le résultat n'est pas exactement identique au précédent. Il manque des espaces entre certains mots. En effet, la fonction `print()` rajoute, par défaut, des espaces entre les différentes chaînes de caractères placées en paramètre. Dans notre dernier cas, pour avoir une phrase agréable à lire, il faut rajouter manuellement ces espaces en utilisant le `+` par exemple :

In [None]:
espace = " "
phrase = phrase1 + espace + phrase2 + espace + phrase3
print(phrase)

---
> 🏆 **À vous de jouer** 🏆 – *Complétez le code de la cellule ci-dessous :*
    > + Utilisez l'opérateur `+` pour concaténer le prénom et le nom de l'acteur ou actrice choisit précédemment.


In [5]:

acteur = nom + prenom         # compléter cette ligne
print(acteur)

Smith Will


---

### Le `*` pour dupliquer
L'opérateur `*` permet de dupliquer une chaîne de caractères plusieurs fois :

In [None]:
print("Super "*4)

---
> 🏆 **À vous de jouer** 🏆 – *Dans la cellule ci-dessous :*
    > + Afficher 10 fois votre prénom en 2 lignes de code.

In [6]:
print("Margot " * 10)

Margot Margot Margot Margot Margot Margot Margot Margot Margot Margot 


---

### La fonction `len()`
La fonction `len()` donne la longueur de la chaîne de caractères placée en paramètre.

In [7]:
mot = "anticonstitutionnellement"
print(len(mot))
string2 = "Ok !"    # l'espace compte comme un caractère
print(len(string2))

25
4


### Les fonctions de conversions `int()` et `float()`
Si la chaîne de caractères représente un nombre, elle peut être convertie en une variable numérique, c'est-à-dire :
+ en **entier** avec la fonction `int()` ;
                   ou
+ en **flottant** (réel) avec la fonction `float()`.

In [8]:
chaine1 = "12"
monNombre1 = int(chaine1)
print(monNombre1, type(monNombre1))

chaine2 = "12.3"
monNombre2 = float(chaine2)
print(monNombre2,type(monNombre2))

12 <class 'int'>
12.3 <class 'float'>


L'intérêt de ces conversions réside dans le fait qu'avec des variables numériques (*int* ou *float*), nous pouvons effectuer des calculs que nous ne pouvions pas faire avec des variables de type *string*. En voici un exemple :

In [None]:
print(chaine1*3)           # avec des variables de type string
print(monNombre1*3)        # avec des variables de type int

---
> 🏆 **À vous de jouer** 🏆 – Dans la cellule ci-dessous :
    > + Convertissez les variables `prixPain_str` et `prixCroissant_str` en variables numériques (pour les nombres à virgule, on utilise le type *float*); 
    > + Affichez le résultat de l'addition des 2 prix.

In [1]:
prixPain_str = "1.2"
prixCroissant_str = "1.34"

# Convertir les strings en nombres
prixPain = float(prixPain_str)                            # ligne à compléter
prixCroissant = float(prixCroissant_str)                       # ligne à compléter

# Afficher le résultat de l'addition
resultat = prixPain+prixCroissant                            # ligne à compléter
print("Le résultat de l'addition est",resultat)

Le résultat de l'addition est 2.54


---

## Plus que des variables, des objets !
Les variables de type **string** possèdent encore plus de fonctionnalités puisqu'elles font partie de la famille des **objets**. Dans les langages de programmation-objet, dont fait partie Python, un objet est une entité à laquelle est rattaché un certain nombre de propriétés et de fonctions (appelées dans ce cas **méthodes**). Voici un exemple qui utilise une méthode d'un objet `string` :

In [7]:
chaine = "sacha est un boss en python"
chaine_decimal = "12"
print(len(chaine))
print(chaine.find("bad"))
print(chaine.upper())
print(chaine.capitalize())
print(chaine.count("s"))
print(chaine.replace("s","d"))
print(chaine.isnumeric())
print(chaine_decimal.isnumeric())

27
-1
SACHA EST UN BOSS EN PYTHON
Sacha est un boss en python
4
dacha edt un bodd en python
False
True


Dans la cellule ci-dessus, l'objet `stringMin` possède la méthode `upper()` qui permet de passer en majuscule l'ensemble de son contenu. Pour appeler la méthode d'un objet, il faut utiliser le `.` :
```python
                                        objet.méthode()
```

Les objets de type `string` possèdent un grand nombre de méthodes très pratiques dont voici une liste non-exhaustive :
- **`.capitalize()`** passe en majuscule la première lettre de la chaîne de caractères.
- **`.upper()`** retourne la chaîne de caractères écrite en majuscule.
- **`.lower()`** retourne la chaîne de caractères écrite en minuscule.
- **`.count(substr)`** retourne le nombre d'occurrences de la sous-chaîne placée en paramètre (*substr*).
- **`.replace(old, new)`** retourne une copie de la chaîne de caractères avec les caractères *old* remplacés par *new*.
- **`.find(substr)`** détermine si la sous-chaîne de caractères *substr* (fourni en paramètre) est présente dans l'objet. Si oui elle retourne la position de la sous-chaîne.
- **`.isnumeric()`** retourne `True` si la chaîne de caractères ne contient que des chiffres.

---
> 🏆 **À vous de jouer** 🏆 – *Dans la cellule ci-dessous, complétez les lignes spécifiées afin de réaliser les tâches demandées.*

In [6]:
str1 = "bonjour à tous"
print(str1.capitalize())          # ligne à compléter – Mettre en majuscule la première lettre de str1.
print(str1.upper())          # ligne à compléter – Mettre en majuscule la totalité de str1.
str2 = "Quelle prétention de prétendre que l'informatique est récente : Adam et Eve avaient déjà un Apple !"
print(str2.count("en"))          # ligne à compléter – Compter le nombre d'occurences de la chaîne "en" dans str2
print(str2.replace("A", "a"))          # ligne à compléter – Remplacer dans str2 "A" par "a"

Bonjour à tous
BONJOUR À TOUS
4
Quelle prétention de prétendre que l'informatique est récente : adam et Eve avaient déjà un apple !


---

## La fonction `input()`
Un grand nombre de programmes informatiques interagissent avec un utilisateur. Ceci est rendu possible par la fonction `input()` qui réalise 2 choses :
1. Elle affiche le texte placé en paramètre de la fonction. 
2. Elle récupère la chaîne de caractères rentrée par l'utilisateur au clavier. L'utilisateur termine sa saisie en appuyant sur *Entrée*. 

In [8]:
monNom = input("Comment t'appelles-tu ?")
print("Bonjour",monNom)

Comment t'appelles-tu ?Pietro
Bonjour Pietro


## Extraire une partie d'une chaîne de caractères
Une fois la chaîne de caractères récupérée, il est fréquent de vouloir extraire seulement une partie de celle-ci. Pour ce faire, on utilise la technique simple du *slicing* qui consiste à préciser entre crochets les indices du début et de fin de la "tranche" que l'on souhaite extraire.

In [10]:
chaine = "effectivement"
print(chaine)
print(chaine[1:5])
print(chaine[5:])

effectivement
ffec
tivement


Pour faciliter la compréhension des indices, il faut se rappeler que les indices ne pointent pas sur les caractères,  mais **sur les espaces entre les caractères**, comme dans l'exemple ci-dessous :
![exSlicing.png](attachment:exSlicing.png)
Les indices peuvent être utilisés de différentes façons :

In [17]:
chaine = "Bonjour"
print(chaine[2:5])
print(chaine[3:])
print(chaine[-1])


njo
jour
r


---
> 🏆 **À vous de jouer** 🏆 – *Dans la cellule ci-dessous, complétez les lignes spécifiées afin d'afficher les morceaux de la chaîne de caractères demandés.*

In [22]:
str2 = "programmation"
print(str2[:6])                     # ligne à compléter – Afficher "progra".
print(str2[5:9])                     # ligne à compléter – Afficher "amma".
print(str2[-4:])                     # ligne à compléter – Afficher "tion" en utilisant des indices négatifs.

progra
amma
tion


---

## Les caractères spéciaux et échappements
Il arrive que certains caractères posent problème au niveau de la représentation. Par exemple, le `'` étant utilisé comme délimiteur de la chaîne de caractères comment écrire un mot contenant une apostrophe ?

In [None]:
print('L'étudiant')       # ce code génère une erreur car l'apostrophe est interprétée
                          # comme la fin de la chaîne de caractères

On a donc parfois besoin de demander à l'ordinateur d'interpréter certains caractères d'une manière différente. C'est le rôle du caractère d'**échappement** `\` qui demande une interprétation alternative du caractère situé après. Exemple : 

In [24]:
print('L\'étudiant')   # le caractère ' est cette fois interprétée comme une apostrophe grâce au \
print("l'information c'est \"fantastique\"")

L'étudiant
l'information c'est "fantastique"


Plusieurs autres caractères nécessitent des échappements, voici les principaux :

| Symbole | Tâche effectuée |
|----|---|
| `\'`   | apostrophe |
| `\"` | guillemets |
| `\n` | retour à la ligne |
| `\t`  | tabulation |
| `\\`   |   `\`|

Voici un exemple concret :

In [25]:
print("\tChers élèves,\nCe cours est bientôt terminé.\n\"Bravo\" ! ")

	Chers élèves,
Ce cours est bientôt terminé.
"Bravo" ! 


---
> 🏆 **À vous de jouer** 🏆 – Dans la cellule ci-dessous, afficher le message suivant à l'aide d'une seule instruction `print()`.

                                    Ceci est un exemple  
                                    trop "chouette"!

In [28]:
print("Ceci est un exemple\ntrop \"chouette\"")

Ceci est un exemple
trop "chouette"


---

## Code ASCII des caractères
Comme vous le savez sans doute, la mémoire d'un ordinateur est uniquement constituée de valeurs numériques **binaires** (des 1 et des 0). L'ordinateur doit donc trouver un moyen de stocker les caractères sous forme numérique. Pour se faire, il va utiliser une table de conversion, à chaque caractère sera associé un nombre. Voici une des premières tables de conversion utilisées, la table ASCII :
![tableASCII.png](attachment:tableASCII.png)

À chaque valeur décimale (0 à 127) la table associe un caractère.  

2 fonctions nous permettent d'avoir accès aux valeurs converties :
+ `ord()` qui donne la valeur décimale correspondante au caractère précisé dans les parenthèses.

In [None]:
maVariable = ord("A")
print(maVariable,"correspond à A")

+ `char()` qui donne le caractère correspondant à la valeur décimale précisée dans les parenthèses.

In [None]:
maChaine = chr(65)
print("Le code ASCII 65 correspond à",maChaine)

---
> 🏆 **À vous de jouer** 🏆 – Dans la cellule ci-dessous, à l'aide des fonctions `ord()` et `chr()` :
+ affichez le code ASCII de l'espace (" ") ; 
+ affichez la lettre correspondant au code ASCII 122.

---