## Travailler avec des chaînes de caractères

### Séparer une chaîne de caractères

On peut facilement décomposer une chaîne de caractères en une liste de mots à l'aide de la méthode `split`.

In [None]:
from pprint import pprint
pprint("Ceci est une longue chaîne de caractères composée de plusieurs mots!".split())

On peut préciser le caractère servant de séparateur, si on veut utiliser autre chose que les espaces blancs.

In [None]:
from pprint import pprint
pprint("Ceci_est_une_longue_chaîne_de_caractères_composée_de_plusieurs_mots!".split()) # Donnera un seul élément
print("-"*80)
pprint("Ceci_est_une_longue_chaîne_de_caractères_composée_de_plusieurs_mots!".split('_')) # Donnera le résultat voulu

On peut aussi spécifier un nombre maximal de coupures. Dans ce cas, on peut partir de la fin à l'aide de la méthode `rsplit`.

In [None]:
pprint("Ceci est une longue chaîne de caractères composée de plusieurs mots!".split(maxsplit=3)) # Donnera un seul élément
print("-"*80)
pprint("Ceci est une longue chaîne de caractères composée de plusieurs mots!".rsplit(maxsplit=3)) # Donnera un seul élément

#### Séparer une texte en lignes
On peut utiliser la méthode `splitlines` pour séparer un texte en utilisant le retour de ligne comme séparateur. 

In [None]:
texte = \
"""Voici un long texte.
Il est composé de plusieurs lignes.
On pourra le séparer en lignes par la suite.
En passant, on peut utiliser une barre oblique inversée
pour poursuivre une déclaration Python sur la ligne suivante.
Intéressant, non?
On peut aussi utiliser le triple guillement,
comme pour les docstrings, mais pour faire une longue
chaîne de caractères qui prend plusieurs lignes."""

pprint(tuple(reversed(texte.splitlines()))) # On affiche les lignes dans le mauvais sens, pour le plaisir

### Retirer les espaces blancs

Parfois, on veut retirer les espaces blancs d'une chaîne de caractères, pour en faciliter le traitement.

In [None]:
chaine = "              Allo le monde!               "
print("Ho!", chaine, "Hey!") # Les espaces peuvent nous déranger

chaine_sans_espaces = chaine.strip() # On retire tous les espaces inutiles au début et à la fin
print("Ho!", chaine_sans_espaces, "Hey!")


chaine_sans_espaces_a_la_fin = chaine.rstrip() # On retire tous les espaces inutiles à la fin seulement
print("Ho!", chaine_sans_espaces_a_la_fin, "Hey!")

chaine_sans_espaces_au_debut = chaine.lstrip() # On retire tous les espaces inutiles au début et à la fin seulement
print("Ho!", chaine_sans_espaces_au_debut, "Hey!")

# On peut aussi enlever d'autres caractères, et même plusieurs caractères
chaine_2 = "__.;;,,.,_;,Test!__;;;..,.,__;;,__"
print(chaine_2.strip("_,.;"))

### Les caractères d'échappement
Les caractères d'échappement sont des caractères spéciaux qui ont une signification particulière.
Les plus importants sont listés dans le tableau suivant.

<table>
    <thead>
    <style>
      table,
      th,
      td {
        padding: 8px 12px;
        border: 1px solid;
        border-collapse: collapse;
      }
    </style>
        <tr>
            <th><strong>Caractère</strong></th>
            <th><strong>Effet</strong></th>
        </tr>
    </thead>
    <tbody>
        <tr>
            <td><code>\n</code></td>
            <td>Crée un retour de ligne (un <i>enter</i>)</td>
        </tr>
        <tr>
            <td><code>\t</code></td>
            <td>Crée un espace horizontal (une tabulation)</td>
        </tr>
        <tr>
            <td><code>\'</code></td>
            <td>Ajoute un simple guillemet sans terminer la chaîne</td>
        </tr>
        <tr>
            <td><code>\"</code></td>
            <td>Ajoute un double guillement sans terminer la chaîne</td>
        </tr>
        <tr>
            <td><code>\r</code></td>
            <td>Ajoute un retour de chariot (efface toute la ligne)</td>
        </tr>
        <tr>
            <td><code>\b</code></td>
            <td>Efface le caractère précédent (un <i>backspace</i>)</td>
        </tr>
        <tr>
            <td><code>\\</code></td>
            <td>Affiche une simple barre oblique inversée (un <i>backslash</i> <code>\</code>)</td>
        </tr>
        <tr>
            <td><code>\0NN</code></td>
            <td>Affiche un caractère en fonction de son code NN, en octal (base huit)</td>
        </tr>
        <tr>
            <td><code>\xNN</code></td>
            <td>Affiche un caractère en fonction de son code NN, en hexadécimal (base seize)</td>
        </tr>
    </tbody>
</table>

In [None]:
print("Allo\ttoi!")
print("Allo\ntoi!")
print("Allo\"toi!\"")
print('Allo\'toi!\'')
print("Allo\\toi!")
print("Allo\rtoi!")
print("Allo\btoi!")
print("Allo\043toi!")
print("Allo\xF7toi!")

### Créer une chaîne à partir d'un itérable
Parfois, on veut lier les éléments d'une liste ou d'un tuple en une seule chaîne de caractères.

In [None]:
ma_liste = ["Oréo", "Vanille", "Chocolat", "Fraise", "Noisette"]

choix_creme_glacee = ", ".join(ma_liste)
print(choix_creme_glacee)

choix_creme_glacee_verticaux = "\n".join(ma_liste)
print(choix_creme_glacee_verticaux)


### Modifier la casse
Plusieurs méthodes des chaînes de caractères servent à modifier la casse (majuscules/minuscules).
Le tableau suivant les énumère.

<table>
    <thead>
    <style>
      table,
      th,
      td {
        padding: 8px 12px;
        border: 1px solid;
        border-collapse: collapse;
      }
    </style>
        <tr>
            <th><strong>Méthode</strong></th>
            <th><strong>Effet</strong></th>
        </tr>
    </thead>
    <tbody>
        <tr>
            <td><code>s.capitalize()</code></td>
            <td>Transforme la première lettre en majuscule</td>
        </tr>
        <tr>
            <td><code>s.lower()</code></td>
            <td>Transforme toute la chaîne en minuscules</td>
        </tr>
        <tr>
            <td><code>s.casefold()</code></td>
            <td>Transforme toute la chaîne en minuscules, en considérant certaines spécificités des langues. Plus agressif que <code>lower</code>.</td>
        </tr>
        <tr>
            <td><code>s.upper()</code></td>
            <td>Transforme toute la chaîne en majuscules</td>
        </tr>
        <tr>
            <td><code>s.title()</code></td>
            <td>Transforme la première lettre de chaque mot en majuscule, comme les titres en anglais</td>
        </tr>
        <tr>
            <td><code>s.swapcase()</code></td>
            <td>Transforme les majuscules en minuscules, et vice-versa</td>
        </tr>
    </tbody>
</table>

### Analyse de la chaîne
Les méthodes `startswith` et `endswith` peuvent servir à vérifier si la chaîne commence ou se termine par une sous-chaîne.
On peut utiliser la méthode `count` pour compter combien de fois une sous-chaîne se retrouve dans une chaîne. On peut donc aussi l'utiliser pour vérifier si une sous-chaîne est contenue n'importe où dans une chaîne.

In [None]:
chaine = "Allo le monde!"

print(chaine.startswith("All"))
print(chaine.endswith("monde"))
print(chaine.count("le") != 0)

### Substitution simple
On peut utiliser la méthode `replace` pour remplacer une partie d'une chaîne par une autre.

In [None]:
phrase = "Hey Eugène! Comment vas-tu, Eugène?"

print(phrase)
print(phrase.replace("Eugène", "Daphnée"))

### Le module `string`
Le module `string` contient des chaînes de caractères souvent utilisées dans différents contextes.

``

In [None]:
from string import (ascii_letters, ascii_lowercase, ascii_uppercase, digits, hexdigits, octdigits, printable,
punctuation, whitespace)

print(ascii_letters)
print(ascii_lowercase)
print(ascii_uppercase)
print(digits)
print(hexdigits)
print(octdigits)
print(repr(printable))
print(punctuation)
print(repr(whitespace))

In [None]:
# Exemple d'utilisation
def caractere(c):
    if c in digits:
        print("Mon caractère est un chiffre!")
    else:
        print("Mon caractère n'est pas un chiffre.")

caractere('1')
caractere('M')
caractere('\n')