# **Manipulation des Chaînes de Caractères en Python**

Les chaînes de caractères (ou *strings* en anglais) sont l'un des types de données les plus fondamentaux et les plus utilisés en programmation. Elles servent à représenter du texte. Que ce soit pour afficher des messages, lire des fichiers, interagir avec des utilisateurs ou traiter des données textuelles, savoir manipuler efficacement les chaînes est essentiel.

Python offre des outils très puissants et intuitifs pour travailler avec les chaînes.

## ***1. Création de Chaînes de Caractères***

En Python, vous pouvez créer des chaînes en utilisant des guillemets simples (`'`), doubles (`"`) ou triples (`'''` ou `"""`).

*   **Guillemets simples ou doubles :** Utilisés pour les chaînes sur une seule ligne. Choisissez l'un ou l'autre, mais soyez cohérent. Utile si la chaîne elle-même contient l'autre type de guillemet.

*   **Guillemets triples :** Permettent de créer des chaînes sur plusieurs lignes et sont souvent utilisés pour les docstrings (documentation des fonctions/classes).

In [None]:
chaine1 = 'Bonjour le monde!'
print(chaine1)

In [None]:
chaine2 = "Ceci est une autre chaîne."
print(chaine2)

In [None]:
# Utilisation de guillemets doubles quand la chaîne contient une apostrophe
chaine3 = "L'important c'est Python."
print(chaine3)

In [None]:
# Ou échapper l'apostrophe
chaine4 = 'L\'important c\'est Python.'
print(chaine4)

In [None]:
# Chaîne multi-lignes
poeme = '''Ceci est la première ligne.
Et voici la seconde ligne.
    Avec une indentation.'''
print(poeme)

## ***2. Opérations de Base***

Les chaînes supportent plusieurs opérations fondamentales.

### Indexation : Accéder à un caractère

Tout comme les listes, vous pouvez accéder à un caractère spécifique d'une chaîne en utilisant son **index** (position) entre crochets `[]`. L'indexation commence à **0** pour le premier caractère.

Les index négatifs sont aussi possibles : `-1` désigne le dernier caractère, `-2` l'avant-dernier, etc.

In [None]:
mot = "Python"

premier_caractere = mot[0]
print(f"Premier caractère : {premier_caractere}")

In [None]:
troisieme_caractere = mot[2]
print(f"Troisième caractère : {troisieme_caractere}")

In [None]:
dernier_caractere = mot[-1]
print(f"Dernier caractère : {dernier_caractere}")

In [None]:
avant_dernier = mot[-2]
print(f"Avant-dernier : {avant_dernier}")

In [None]:
# Tenter d'accéder à un index hors limites provoque une erreur
print(mot[6]) # IndexError: string index out of range

### Slicing : Extraire une sous-chaîne

Le *slicing* permet d'extraire une partie (une tranche) de la chaîne. La syntaxe est `chaine[start:stop:step]`.

*   `start` : Index de début (inclus, par défaut 0).
*   `stop` : Index de fin (**exclus**, par défaut la fin de la chaîne).
*   `step` : Pas (par défaut 1).

In [None]:
texte = "Programmation"

# Les caractères de l'index 3 (inclus) à 7 (exclus)
slice1 = texte[3:7]
print(f"texte[3:7] -> '{slice1}'")

In [None]:
# Du début jusqu'à l'index 5 (exclus)
slice2 = texte[:5]
print(f"texte[:5] -> '{slice2}'")

In [None]:
# De l'index 8 (inclus) jusqu'à la fin
slice3 = texte[8:]
print(f"texte[8:] -> '{slice3}'")

In [None]:
# Un caractère sur deux
slice4 = texte[::2]
print(f"texte[::2] -> '{slice4}'")

In [None]:
# Inverser la chaîne
inverse = texte[::-1]
print(f"texte[::-1] -> '{inverse}'")

In [None]:
# Copier la chaîne (équivalent à texte[:])
copie = texte[:] 
print(f"texte[:] -> '{copie}'")

### Concaténation : Combiner des chaînes

L'opérateur `+` permet d'assembler (concaténer) deux chaînes.

In [None]:
mot1 = "Bonjour"
mot2 = "Python"
espace = " "

message = mot1 + espace + mot2 + "!"
print(message)

In [None]:
dir(message)

### Répétition : Répéter une chaîne

L'opérateur `*` permet de répéter une chaîne un certain nombre de fois.

In [None]:
barre = "-" * 40
print(barre)

rire = "ha" * 5
print(rire)

### Longueur : Obtenir le nombre de caractères

La fonction intégrée `len()` retourne la longueur (le nombre de caractères) d'une chaîne.

In [None]:
phrase = "J'aime coder."
longueur = len(phrase)
print(f"La phrase '{phrase}' a {longueur} caractères.")

### Appartenance : Vérifier la présence d'une sous-chaîne

Les opérateurs `in` et `not in` permettent de vérifier si une sous-chaîne est présente dans une autre chaîne. Le résultat est un booléen (`True` ou `False`).

In [None]:
texte_long = "Python est un langage de programmation polyvalent."

contient_langage = "langage" in texte_long
print(f"Contient 'langage' ? {contient_langage}")

In [None]:
contient_java = "Java" in texte_long
print(f"Contient 'Java' ? {contient_java}")

In [None]:
ne_contient_pas_script = "script" not in texte_long
print(f"Ne contient pas 'script' ? {ne_contient_pas_script}")

### Exercice 1 : Opérations de base

1.  Créez une variable `ville` contenant la chaîne "Strasbourg".

2.  Affichez le premier et le dernier caractère de `ville`.

3.  Extrayez et affichez les 4 premiers caractères de `ville`.

4.  Extrayez et affichez les caractères de l'index 2 à l'index 5 (inclus).

5.  Affichez la longueur de la chaîne `ville`.

6.  Vérifiez si la sous-chaîne "bourg" est présente dans `ville` et affichez le résultat.

In [None]:
ville = "Strasbourg"
print(ville[0] , ville[-1])

four_letter = ville[:4]
print(four_letter)  

two_to_five = ville[2:6]
print(two_to_five)

print(len(ville))

print(f"{"bourg" in ville}")

S g
Stra
rasb
10
True


## 3. Méthodes Courantes des Chaînes

Les chaînes de caractères en Python sont des objets, ce qui signifie qu'elles possèdent des **méthodes** intégrées (des fonctions associées à l'objet) pour effectuer diverses opérations. Une méthode est appelée en utilisant la notation `objet.methode()`.

**Important :** Les chaînes sont **immuables** en Python. Cela signifie que les méthodes de chaînes ne modifient *jamais* la chaîne originale. Elles retournent toujours une *nouvelle* chaîne avec les modifications appliquées.

### Changement de Casse

*   `upper()`: Convertit toute la chaîne en majuscules.

*   `lower()`: Convertit toute la chaîne en minuscules.

*   `capitalize()`: Met le premier caractère en majuscule et le reste en minuscules.

*   `title()`: Met le premier caractère de chaque mot en majuscule et le reste en minuscules.

*   `swapcase()`: Inverse la casse de chaque caractère (majuscules -> minuscules, minuscules -> majuscules).

In [None]:
texte_original = "ExEmPle De TeXte"

print(f"original : '{texte_original}'")
print(f"upper() : '{texte_original.upper()}'")

In [None]:
print(f"original : '{texte_original}'")
print(f"lower() : '{texte_original.lower()}'")

In [None]:
print(f"original : '{texte_original}'")
print(f"capitalize() : '{texte_original.capitalize()}'")

In [None]:
print(f"original : '{texte_original}'")
print(f"title() : '{texte_original.title()}'")

In [None]:
print(f"original : '{texte_original}'")
print(f"swapcase() : '{texte_original.swapcase()}'")

### Suppression des Espaces Superflus

*   `strip()`: Supprime les espaces (ou autres caractères spécifiés) au début **et** à la fin de la chaîne.

*   `lstrip()`: Supprime les espaces (ou autres caractères spécifiés) au début (*left strip*).

*   `rstrip()`: Supprime les espaces (ou autres caractères spécifiés) à la fin (*right strip*).

In [None]:
texte_espaces = "   Beaucoup d'espaces   "

print(f"Original : '{texte_espaces}'")
print(f"strip() : '{texte_espaces.strip()}'")

In [None]:
print(f"Original : '{texte_espaces}'")
print(f"lstrip() : '{texte_espaces.lstrip()}'")

In [None]:
print(f"Original : '{texte_espaces}'")
print(f"rstrip() : '{texte_espaces.rstrip()}'")

In [None]:
# On peut aussi spécifier les caractères à supprimer
chaine_symboles = "***Nettoyage.!?!"
print(f"Original : '{chaine_symboles}'")
print(f"strip('*!?') : '{chaine_symboles.strip('*!?')}'") # 'Nettoyage.'

### Recherche et Comptage

*   `find(substring)`: Retourne l'index de la **première** occurrence de `substring`. Retourne `-1` si non trouvée.

*   `index(substring)`: Similaire à `find()`, mais lève une erreur (`ValueError`) si `substring` n'est pas trouvée.

*   `rfind(substring)` / `rindex(substring)`: Comme `find`/`index`, mais cherchent à partir de la **fin** de la chaîne.

*   `count(substring)`: Compte le nombre d'occurrences (non superposées) de `substring`.

In [None]:
phrase_recherche = "Le langage Python est un langage populaire."
sous_chaine = "langage"

premier_index = phrase_recherche.find(sous_chaine)
print(f"Première occurrence de '{sous_chaine}' (find) : {premier_index}")

In [None]:
non_trouve = phrase_recherche.find("Java")
print(f"Index de 'Java' (find) : {non_trouve}")

In [None]:
autre_sous_chaine = "Java"
premier_index_strict = phrase_recherche.index(autre_sous_chaine)
print(f"Première occurrence de '{autre_sous_chaine}' (index) : {premier_index_strict}")

In [None]:
autre_sous_chaine = "Java"
try:
    premier_index_strict = phrase_recherche.index(autre_sous_chaine)
    print(f"Première occurrence de '{autre_sous_chaine}' (index) : {premier_index_strict}")

except ValueError:
    print(f"'{autre_sous_chaine}' non trouvé avec index().")

In [None]:
dernier_index = phrase_recherche.rfind(sous_chaine)
print(f"Dernière occurrence de '{sous_chaine}' (rfind) : {dernier_index}")

In [None]:
nombre_occurrences = phrase_recherche.count(sous_chaine)
print(f"Nombre d'occurrences de '{sous_chaine}' : {nombre_occurrences}")

### Remplacement

*   `replace(old, new, [count])`: Remplace toutes les occurrences de la sous-chaîne `old` par `new`. Si `count` est spécifié, seules les `count` premières occurrences sont remplacées.

In [2]:
texte_a_modifier = "J'aime les chats, les chats sont doux."

# Remplacer toutes les occurrences
texte_modifie1 = texte_a_modifier.replace("chats", "chiens")
print(f"Remplacement total : '{texte_modifie1}'")

Remplacement total : 'J'aime les chiens, les chiens sont doux.'


In [None]:
# Remplacer seulement la première occurrence
texte_modifie2 = texte_a_modifier.replace("chats", "chiens", 1)
print(f"Remplacement partiel : '{texte_modifie2}'")

### Découpage et Jonction

*   `split([sep])`: Découpe la chaîne en une **liste** de sous-chaînes. Par défaut, découpe selon les espaces. Si un séparateur `sep` est fourni, découpe selon ce séparateur.

*   `separator.join(iterable)`: Combine les éléments d'un itérable (comme une liste) en une seule chaîne, en insérant la chaîne `separator` entre chaque élément.

In [None]:
# Split
phrase_a_couper = "Pomme Banane Cerise Orange"
liste_mots = phrase_a_couper.split()
print(f"split() : {liste_mots}")

In [None]:
donnees_csv = "Alice,30,Paris"
elements = donnees_csv.split(',')
print(f"split(',') : {elements}")


In [None]:
# Join
mots_a_joindre = ["Python", "est", "puissant"]
separateur_espace = " "
phrase_jointe1 = separateur_espace.join(mots_a_joindre)
print(f"join(' ') : '{phrase_jointe1}'")

In [None]:
elements_a_joindre = ["un", "deux", "trois"]
separateur_tiret = "-"
phrase_jointe2 = separateur_tiret.join(elements_a_joindre)
print(f"join('-') : '{phrase_jointe2}'")

### Vérification des Propriétés (retournent True ou False)

*   `startswith(prefix)`: Vérifie si la chaîne commence par `prefix`.

*   `endswith(suffix)`: Vérifie si la chaîne se termine par `suffix`.

*   `isdigit()`: Vérifie si tous les caractères sont des chiffres.

*   `isalpha()`: Vérifie si tous les caractères sont des lettres de l'alphabet.

*   `isalnum()`: Vérifie si tous les caractères sont alphanumériques (lettres ou chiffres).

*   `islower()`: Vérifie si tous les caractères alphabétiques sont en minuscules.

*   `isupper()`: Vérifie si tous les caractères alphabétiques sont en majuscules.

*   `isspace()`: Vérifie si la chaîne ne contient que des espaces blancs (espace, tabulation, nouvelle ligne...).

In [None]:
nom_fichier = "rapport_final.pdf"
print(f"'{nom_fichier}' commence par 'rapport' ? {nom_fichier.startswith('rapport')}")

In [None]:
print(f"'{nom_fichier}' finit par '.txt' ? {nom_fichier.endswith('.txt')}")

In [None]:
nombre_str = "12345"
print(f"'{nombre_str}' ne contient que des chiffres ? {nombre_str.isdigit()}")

In [None]:
lettres_str = "Bonjour"
print(f"'{lettres_str}' ne contient que des lettres ? {lettres_str.isalpha()}")

In [None]:
print(f"'Python 3' ne contient que des lettres ? {'Python 3'.isalpha()}")

In [None]:
alphanum_str = "Python3"
print(f"'{alphanum_str}' est alphanumérique ? {alphanum_str.isalnum()}")

In [None]:
print(f"'python' est en minuscules ? {'python'.islower()}")

In [None]:
print(f"'PYTHON' est en majuscules ? {'PYTHON'.isupper()}")

In [None]:
espace_str = "   \t\n"
print(f"'{espace_str}' ne contient que des espaces blancs ? {espace_str.isspace()}")

### Exercice 2 : Utilisation des Méthodes

1.  Créez une variable `phrase_test` avec la valeur "  apprentissage de python est amusant!  ".
2.  Nettoyez la phrase en supprimant les espaces au début et à la fin.
3.  Mettez la première lettre de la phrase nettoyée en majuscule.
4.  Vérifiez si la phrase originale (avec espaces) se termine par "amusant!".
5.  Comptez combien de fois la lettre 'a' (minuscule) apparaît dans la phrase nettoyée et capitalisée.
6.  Remplacez le mot "amusant" par "passionnant" dans la phrase nettoyée et capitalisée.
7.  Affichez tous les résultats intermédiaires et finaux avec des descriptions claires.

In [13]:
phrase_test = " apprentissage de python est amusant! "
phrase = phrase_test.strip().capitalize()
print(f"La phrase nettoyée et capitalisée est : {phrase}")

endwith = phrase_test.endswith("amusant!")
print(f"Le Resultat est : {endwith} la phrase ne contient donc pas \"amusant!\"")

print(f"La phrase : \"{phrase}\" possede {phrase.count("a")} \"a\" dedans ")

rephrase = phrase.replace("amusant", "passionnant")
print(f"Remplacement de : {phrase} par {rephrase}")

La phrase nettoyée et capitalisée est : Apprentissage de python est amusant!
Le Resultat est : False la phrase ne contient donc pas "amusant!"
La phrase : "Apprentissage de python est amusant!" possede 3 "a" dedans 
Remplacement de : Apprentissage de python est amusant! par Apprentissage de python est passionnant!


## 4. Formatage des Chaînes (f-strings)

Il est très courant d'avoir besoin d'insérer des valeurs de variables ou des résultats d'expressions dans une chaîne de caractères. Python offre plusieurs méthodes, mais la plus moderne, lisible et recommandée est l'utilisation des **f-strings** (chaînes formatées littérales).

**Syntaxe :**
Préfixez la chaîne avec la lettre `f` (ou `F`) et insérez les variables ou expressions entre accolades `{}`.

In [None]:
nom = "Alice"
age = 30
ville = "Paris"

# Utilisation de f-string pour créer un message
message = f"Bonjour, je m'appelle {nom}. J'ai {age} ans et j'habite à {ville}."
print(message)

# On peut aussi mettre des expressions dans les accolades
prix_ht = 50
tva = 0.20
message_prix = f"Le prix HT est {prix_ht}€. Le prix TTC est {prix_ht * (1 + tva):.2f}€."
# Notez ':.2f' pour formater le flottant à 2 décimales
print(message_prix)

# On peut même appeler des fonctions
message_longueur = f"Le nom '{nom}' contient {len(nom)} caractères."
print(message_longueur)

Les f-strings offrent de nombreuses options de formatage avancées (alignement, padding, affichage des signes, formats numériques spécifiques, etc.) que vous pouvez explorer dans la documentation Python si besoin.

### Exercice 3 : Formatage avec f-string

1.  Créez trois variables : `produit` (chaîne, ex: "Laptop"), `quantite` (entier, ex: 3), `prix_unitaire` (flottant, ex: 1200.50).
2.  Calculez le `prix_total` (quantité * prix unitaire).
3.  En utilisant une f-string, créez un message qui résume la commande, par exemple : "Commande : 3 x Laptop - Prix unitaire: 1200.50€ - Total: 3601.50€".
4.  Affichez le message. Assurez-vous que les prix sont affichés avec 2 décimales.

In [26]:
produit = "Laptop"
quantite = 3
prix_unitaire = 1250.99

prix_total = quantite * prix_unitaire
print(f"Commande : {quantite} x {produit} - Prix unitaire: {prix_unitaire} - Total: {prix_total:.2f}")

Commande : 3 x Laptop - Prix unitaire: 1250.99 - Total: 3752.97


## 5. Caractères d'Échappement

Parfois, vous devez inclure des caractères spéciaux dans une chaîne qui ont normalement une signification particulière (comme une nouvelle ligne, une tabulation, ou un guillemet lui-même).

On utilise pour cela la barre oblique inversée `\` (backslash) suivie d'un caractère spécifique. Voici les plus courants :

*   `\n` : Nouvelle ligne
*   `\t` : Tabulation horizontale
*   `\'` : Guillemet simple
*   `\"` : Guillemet double
*   `\\` : Barre oblique inversée elle-même

In [None]:
chemin_fichier = "C:\Utilisateurs\Nom\Documents"
print(f"Chemin incorrect interprété : {chemin_fichier}") # Le résultat peut être inattendu
# Aïe, \U et \N ont une signification spéciale ! Il faut échapper les backslashs.

In [None]:
chemin_correct = "C:\\Utilisateurs\\Nom\\Documents"
print(f"Chemin correct : {chemin_correct}")

In [None]:
# Alternative : utiliser une chaîne brute (raw string) avec 'r' devant
chemin_raw = r"C:\Utilisateurs\Nom\Documents"
print(f"Chemin raw : {chemin_raw}")

citation = "Il a dit : \"Bonjour !\""
print(citation)

lignes = "Première ligne.\nDeuxième ligne.\n\tIndentation."
print(lignes)

## Conclusion

Vous avez maintenant une bonne vue d'ensemble des opérations essentielles pour manipuler les chaînes de caractères en Python.

Vous savez comment :
*   Créer des chaînes.
*   Accéder à leurs caractères (indexation) et extraire des sous-chaînes (slicing).
*   Effectuer des opérations de base comme la concaténation, la répétition et la vérification d'appartenance.
*   Utiliser les méthodes intégrées pour modifier la casse, nettoyer les espaces, rechercher, remplacer, découper et joindre des chaînes.
*   Vérifier les propriétés des chaînes (commence par, finit par, type de caractères...).
*   Formater des chaînes de manière lisible et efficace avec les f-strings.
*   Gérer les caractères spéciaux avec l'échappement.

La manipulation de chaînes est une compétence fondamentale. N'hésitez pas à pratiquer ces opérations et méthodes, car vous les rencontrerez constamment dans vos projets Python !

---

**Réalisé par [Benjamin QUINET](https://www.linkedin.com/in/benjamin-quinet-freelance-dev-data-ia)**